阿里云通义大模型团队开源Qwen2.5-Coder全系列，打造全球最强开源代码模型

近日，阿里云通义大模型团队宣布正式开源其Qwen2.5-Coder代码模型全系列，共推出6款不同尺寸的模型，以满足不同开发者的需求。其中，旗舰模型Qwen2.5-Coder-32B-Instruct在十余项基准评测中均取得开源最佳成绩，成为全球最强开源代码模型，并在多项关键能力上超越了闭源模型GPT-4o。

Qwen2.5-Coder系列模型基于Qwen2.5基础大模型进行初始化，使用源代码、文本代码混合数据、合成数据等5.5T tokens的数据进行持续训练，实现了代码生成、代码推理、代码修复等核心任务性能的显著提升。该系列模型不仅强大且全面，还具备良好的通用和数学能力，展现出极高的实用性。

此次开源的Qwen2.5-Coder全系列模型覆盖了主流的六个模型尺寸，包括0.5B、1.5B、3B、7B、14B和32B等，每个尺寸都开源了Base和Instruct两种模型。其中，Base模型可供开发者微调，而Instruct模型则是开箱即用的官方对齐模型，所有模型在同等尺寸下均取得了最佳表现。

Qwen2.5-Coder的开源将推动AI大模型在编程开发领域的应用，无论是编程“小白”还是专业开发者，都可以基于该系列模型实现更高效的编程开发。同时，该系列模型还可适配更多应用场景，让AI大模型更好地协助开发者完成各类任务。

截至目前，阿里云通义大模型团队已开源100多个大语言模型、多模态模型、数学模型和代码模型，成为全球最大的生成式语言模型族群之一。未来，该团队将继续致力于推动AI技术的发展和应用，为更多用户提供更高效、更智能的解决方案。

本文由 32度域投稿发布，如需转载，请注明出处：https://32du.gbapo.com/moment/1341.html，如有侵权，可联系我们删除。

{{userData.name}}