OpenAI开源浏览智能体评测基准BrowseComp - 全球财经 - 丁冬财经

登陆注册

返回顶部

OpenAI开源浏览智能体评测基准BrowseComp

收藏邀请

　　在丁冬财经看资讯行情，选丁冬财经证券一站式开户交易>>

　　当地时间4月10日，美国开放人工智能研究中心（OpenAI）宣布开源包含1266个挑战性问题的基准测试BrowseComp。OpenAI表示，一个高性能的浏览智能体应该能够定位那些难以查找、可能需要在浏览数十甚至数百个网站的过程中才能获取的信息。现有基准测试（如SimpleQA）主要衡量模型检索基本孤立事实的能力，这类测试已被具备快速浏览工具（如支持浏览功能的GPT-4o）的模型所饱和。为了衡量AI智能体在互联网上定位难以查找、相互关联信息的能力，现开源基准测试BrowseComp。

（文章来源：界面新闻）

上一篇：

社论丨美国滥施关税，忽略了其对中国供应链的深层依赖发布时间：2025-04-11

下一篇：

韩国KOSPI指数跌幅扩大至2%发布时间：2025-04-11

相关推荐

实时动态

23:21 12月22日东方财富财经晚报（附新闻联播）

In 资讯

23:21 美股三大指数集体上涨特斯拉、美光科技股

In 资讯

22:38 城市24小时 | 逐鹿万亿“游戏经济”，第一

In 股票

22:38 加科思拿下临床阶段小分子抗癌药金额最大授

In 股票

22:37 5万公里高铁冲刺：广东登顶，湖北赢了？

In 股票

22:21 黄金把预期吃得太满了吗？站上4400后，真正

In 全球财经

焦点话题

12月22日东方财富财经晚报（附新闻联播）

美股三大指数集体上涨特斯拉、美光科技股

3 天前

城市24小时 | 逐鹿万亿“游戏经济”，第一

3 天前

5万公里高铁冲刺：广东登顶，湖北赢了？

3 天前

黄金把预期吃得太满了吗？站上4400后，真正

3 天前

欧盟、丹麦、格陵兰岛总理表态！

3 天前

热门排行

1 12月22日东方财富财经晚报（附新闻联播）

　　热点聚焦　　“十五五”规划《纲要草案》：　　中共中央政治局常委、国务院总理李

阅读：10283|3 天前

2 美股三大指数集体上涨特斯拉、美光科技股

　　美东时间周一，美股三大指数集体上涨，截至发稿，道指涨0.24%，纳指涨0.57%，标普

阅读：10133|3 天前

3 城市24小时 | 逐鹿万亿“游戏经济”，第一

每经记者｜刘艳美每经编辑｜杨欢澎湃新闻、解放日报消息，在近日召开的2025年度中

阅读：8809|3 天前

4 5万公里高铁冲刺：广东登顶，湖北赢了？

每经记者｜刘旭强每经编辑｜刘艳美图片来源：中国铁路高铁第一省，再度易主。 1

阅读：7480|3 天前

5 黄金把预期吃得太满了吗？站上4400后，真正

周一（12月22日），现货黄金延续强势，北美时段交投4420美元附近，仍处于历史高位区间

阅读：10302|3 天前

6 欧盟、丹麦、格陵兰岛总理表态！

每经编辑｜黄胜央视新闻消息，当地时间22日，欧盟委员会发言人就美国任命驻格陵兰

阅读：4821|3 天前

7 三大指数继续反弹，超20只基金单日涨逾5%

每经记者｜肖芮冬每经编辑｜赵云 12月22日，市场高开高走，三大指数集体反弹，创业

阅读：2511|3 天前

8 智谱VS MiniMax：港交所“AI第一股”争夺战

　　近日，国产大模型厂商智谱华章（智谱）和稀宇科技（MiniMax）先后通过港交所聆讯

阅读：4609|3 天前

9 三花智控：预计2025年净利润38.74亿元

　　12月22日，三花智控(002050.SZ)公告称，公司发布2025年度业绩预告，预计归属于上

阅读：5139|3 天前

10 A股今年排第三！复盘近10年各大类资产回报

　　站在2025年年末，观察过去10年各大类资产表现，均在各自周期中轮动。2025年黄金以

阅读：4329|3 天前

← 返回全球财经

在线客服（服务时间 9:00～18:00）

QQ：30376048757

公司地址：广州市黄埔区康富路32号101房

客服电话：13326565461

电子邮箱：30376048757@qq.com

Powered by 广州丁冬科技有限公司 © 2025 aiwsw.com Inc.( 粤ICP备2024347580号-3 )