通义最强代码AI模型Qwen3-Coder发布 性能直追Claude Sonnet 4

来自: 和讯财经 收藏 邀请

凤凰网科技讯 7月23日,今日,通义Qwen系列大模型迎来了其在代码能力上的重要更新,专为Agent能力打造的全新代码模型Qwen3-Coder正式发布。此次率先亮相的是该系列中最强大的版本――Qwen3-Coder-480B-A35B-Instruct,这是一款采用混合专家(MoE)架构的大模型,旨在重塑AI在真实软件工程环境中的应用范式。

据介绍,Qwen3-Coder在核心能力上实现了多项突破。该模型原生便支持256K token的超长上下文窗口,并通过YaRN技术可扩展至1M token,使其能够轻松处理仓库级的代码库或复杂的动态数据(如Pull Request),这为其强大的代理能力奠定了基础。在性能方面,官方信息显示,Qwen3-Coder在多个关键的代理式任务评测中,包括代理式编码(Agentic Coding)、浏览器使用(Agentic Browser-Use)和工具调用(Agentic Tool-Use),均取得了当前开源模型的SOTA(业界最佳)效果,其综合表现甚至可以与业界顶尖的闭源模型Claude Sonnet 4相媲美。

为了充分发挥新模型的潜力,团队还同步推出了一款配套的命令行工具Qwen Code。该工具在Gemini Code的基础上进行了二次开发,通过深度的prompt和工具调用协议适配,能够最大化激发Qwen3-Coder在执行复杂编程任务时的代理表现。同时,模型本身保持了开放性,可以与社区中流行的编程工具(如Claude Code、Cline等)结合使用。

此次Qwen3-Coder在能力上的跃升,得益于其在训练方法上的深度创新。在预训练阶段,团队使用了总计高达7.5T token的海量数据,其中代码数据占比达到70%。更值得关注的是,团队并未沿用社区普遍聚焦于编程竞赛题的训练路径,而是选择了在更广泛、更真实的软件工程任务上,大规模应用强化学习(RL)。通过构建一个可同时运行两万个独立环境的庞大验证系统,模型得以在多轮交互中自主规划、调用工具并从反馈中学习,最终在衡量真实世界软件问题解决能力的SWE-bench Verified榜单上,实现了开源模型的最佳成绩。这一系列技术突破,标志着AI代码模型正从单纯的代码生成器,向能够自主解决复杂工程问题的“AI软件工程师”加速演进。

(责任编辑:董萍萍 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com


鲜花

握手

雷人

路过

鸡蛋
相关推荐
实时动态
焦点话题
热门排行

在线客服(服务时间 9:00~18:00)

在线QQ客服
公司地址:广州市黄埔区康富路32号101房
客服电话:13326565461
电子邮箱:30376048757@qq.com

Powered by 广州丁冬科技有限公司 © 2025 aiwsw.com Inc.( 粤ICP备2024347580号-3 )