通义最强代码AI模型Qwen3-Coder发布性能直追Claude Sonnet 4

来自: 和讯财经收藏邀请

凤凰网科技讯 7月23日，今日，通义Qwen系列大模型迎来了其在代码能力上的重要更新，专为Agent能力打造的全新代码模型Qwen3-Coder正式发布。此次率先亮相的是该系列中最强大的版本――Qwen3-Coder-480B-A35B-Instruct，这是一款采用混合专家（MoE）架构的大模型，旨在重塑AI在真实软件工程环境中的应用范式。

据介绍，Qwen3-Coder在核心能力上实现了多项突破。该模型原生便支持256K token的超长上下文窗口，并通过YaRN技术可扩展至1M token，使其能够轻松处理仓库级的代码库或复杂的动态数据（如Pull Request），这为其强大的代理能力奠定了基础。在性能方面，官方信息显示，Qwen3-Coder在多个关键的代理式任务评测中，包括代理式编码（Agentic Coding）、浏览器使用（Agentic Browser-Use）和工具调用（Agentic Tool-Use），均取得了当前开源模型的SOTA（业界最佳）效果，其综合表现甚至可以与业界顶尖的闭源模型Claude Sonnet 4相媲美。

为了充分发挥新模型的潜力，团队还同步推出了一款配套的命令行工具Qwen Code。该工具在Gemini Code的基础上进行了二次开发，通过深度的prompt和工具调用协议适配，能够最大化激发Qwen3-Coder在执行复杂编程任务时的代理表现。同时，模型本身保持了开放性，可以与社区中流行的编程工具（如Claude Code、Cline等）结合使用。

此次Qwen3-Coder在能力上的跃升，得益于其在训练方法上的深度创新。在预训练阶段，团队使用了总计高达7.5T token的海量数据，其中代码数据占比达到70%。更值得关注的是，团队并未沿用社区普遍聚焦于编程竞赛题的训练路径，而是选择了在更广泛、更真实的软件工程任务上，大规模应用强化学习（RL）。通过构建一个可同时运行两万个独立环境的庞大验证系统，模型得以在多轮交互中自主规划、调用工具并从反馈中学习，最终在衡量真实世界软件问题解决能力的SWE-bench Verified榜单上，实现了开源模型的最佳成绩。这一系列技术突破，标志着AI代码模型正从单纯的代码生成器，向能够自主解决复杂工程问题的“AI软件工程师”加速演进。

（责任编辑：董萍萍）

【免责声明】本文仅代表作者本人观点，与和讯网无关。和讯网站对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。邮箱：news_center@staff.hexun.com