阿里云通义大模型团队开源Qwen2.5-Coder全系列,打造全球最强开源代码模型
近日,阿里云通义大模型团队宣布正式开源其Qwen2.5-Coder代码模型全系列,共推出6款不同尺寸的模型,以满足不同开发者的需求。其中,旗舰模型Qwen2.5-Coder-32B-Instruct在十余项基准评测中均取得开源最佳成绩,成为全球最强开源代码模型,并在多项关键能力上超越了闭源模型GPT-4o。
Qwen2.5-Coder系列模型基于Qwen2.5基础大模型进行初始化,使用源代码、文本代码混合数据、合成数据等5.5T tokens的数据进行持续训练,实现了代码生成、代码推理、代码修复等核心任务性能的显著提升。该系列模型不仅强大且全面,还具备良好的通用和数学能力,展现出极高的实用性。
此次开源的Qwen2.5-Coder全系列模型覆盖了主流的六个模型尺寸,包括0.5B、1.5B、3B、7B、14B和32B等,每个尺寸都开源了Base和Instruct两种模型。其中,Base模型可供开发者微调,而Instruct模型则是开箱即用的官方对齐模型,所有模型在同等尺寸下均取得了最佳表现。
Qwen2.5-Coder的开源将推动AI大模型在编程开发领域的应用,无论是编程“小白”还是专业开发者,都可以基于该系列模型实现更高效的编程开发。同时,该系列模型还可适配更多应用场景,让AI大模型更好地协助开发者完成各类任务。
截至目前,阿里云通义大模型团队已开源100多个大语言模型、多模态模型、数学模型和代码模型,成为全球最大的生成式语言模型族群之一。未来,该团队将继续致力于推动AI技术的发展和应用,为更多用户提供更高效、更智能的解决方案。