|
格隆汇12月12日|Investinglive分析师Adam Button表示,萨姆・阿尔特曼发布了GPT-5.2模型的思维能力测评结果,坦白说,这些数字简直令人震惊。这并非渐进式提升,而是质的飞跃。对于追求通用人工智能纯粹主义的研究者而言,ARC-AGI-2是关键指标。GPT-5.2在此项测试中的表现从GPT-5.1的17.6%跃升至52.9%。这标志着大语言模型在抽象推理与泛化能力这一长期短板上取得了巨大突破。GDPval是衡量模型经济价值的重要指标,分数从38.8%飙升至70.9%。这凸显了模型扩展能力与推理能力的同步突破,因为该测试模型已启用最大推理效能。近期OpenAI因Gemini模型的成功扩展而显得措手不及,但此次数据表明,其推理能力正在实现以往看似不可能的任务。
(责任编辑:宋政 HN002)
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com |
1 小时前
1 小时前
1 小时前
1 小时前
1 小时前