通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平

来自: 和讯财经 收藏 邀请

凤凰网科技讯 7月30日,阿里巴巴通义千问团队宣布推出Qwen3系列模型的最新版本 ――Qwen3-30B-A3B-Instruct-2507。这一非思考模式(non-thinking mode)的开源模型仅需激活3B参数,即可在多项核心能力上达到与Gemini 2.5-Flash(non-thinking)、GPT-4o等闭源模型相当的性能水平,同时在多语言覆盖、用户偏好对齐和长文本处理等领域实现突破性提升。目前,该模型已在魔搭社区(ModelScope)和HuggingFace平台全面开源。

作为Qwen3-30B-A3B模型中的新版本,Qwen3-30B-A3B-Instruct-2507延续了通义千问团队在架构创新上的优势,在大幅降低计算成本的同时,实现了与千亿级闭源模型的性能对标。官方数据显示,该模型在数学推理(AIME25测试得分61.3)、代码生成(LiveCodeBenchv6得分43.2)、研究生级物理和天文学问题(GPQA测试得分70.4)、人类偏好对齐(Arena-Hard v2得分69)、函数调用能力(BFCL-v3得分65.1)等关键基准测试中表现突出,部分指标甚至超越GPT-4o等。

在通用能力层面,模型全面强化了指令遵循、逻辑推理、数学、科学、编程及工具使用等多方面。在多语言的长尾知识覆盖方面,模型进步显著;在主观和开放任务中,新模型与进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答;长文本理解能力提升至256K。

通义千问是阿里巴巴达摩院自主研发的大语言模型系列,自2023年发布以来,已开源超200个模型,全球下载量突破3亿次,衍生模型数超10万个。

(责任编辑:郭健东 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com


鲜花

握手

雷人

路过

鸡蛋
上一篇:
广汽传祺向往M8乾系列正式上市:35.99万元起发布时间:2025-07-30
下一篇:
1000万Clips智驾与旧版有何不同?小米汽车详解发布时间:2025-07-30
相关推荐
实时动态
焦点话题
热门排行

在线客服(服务时间 9:00~18:00)

在线QQ客服
公司地址:广州市黄埔区康富路32号101房
客服电话:13326565461
电子邮箱:30376048757@qq.com

Powered by 广州丁冬科技有限公司 © 2025 aiwsw.com Inc.( 粤ICP备2024347580号-3 )