小红书Hi Lab团队提出可大幅降低平均思考长度的强化学习训练方式 ... - 资讯 - 丁冬财经

登陆注册

返回顶部

小红书Hi Lab团队提出可大幅降低平均思考长度的强化学习训练方式 ...

收藏邀请

小红书Hi Lab团队提出可大幅降低平均思考长度的强化学习训练方式

　　炒股第一步，先开个股票账户

　　6月19日，小红书技术团队发文称，深度思考模型通过Test-Time Scaling（测试时扩展）大幅提升了模型推理能力，但同时也出现了大量冗余和无效思考。小红书Hi Lab团队提出了Think When You Need的强化学习训练方式；在不影响最终效果的前提下，实现动态CoT能力，大幅降低平均思考长度。实验证明，这种思想在推理和非推理等各种任务上广泛适用。团队还发现了一种现象：即在相同任务下，越聪明（参数量大）的模型，需要的思考长度越短；这与当前深度思考模型表现相违背，却十分符合人类的认知。

（文章来源：界面新闻）

上一篇：

89名在伊朗中国公民经土库曼斯坦顺利回国发布时间：1970-01-01

下一篇：

普京：我的外孙女正在学中文发布时间：1970-01-01

相关推荐

实时动态

17:43 2025年公募自购规模同比大增163%，指数基金

In 基金

17:39 铂力特 96.85 11.65(13.67%)股票价格

In 资讯

17:28 大富科技 11.28 0.10(0.89%)股票价格

In 资讯

17:21 新标准落地，为什么对3.8亿辆电瓶车“踩刹

In 全球财经

17:15 人民币对美元即期汇率升至7.04 创14个多月

In 研究

17:12 日本央行年内最后一次议息会议在即高市早

In 资讯

焦点话题

新标准落地，为什么对3.8亿辆电瓶车“踩刹

日本央行年内最后一次议息会议在即高市早

半小时前

奥普光电秒速涨停！光刻机产业国产化不断提

半小时前

每日龙虎榜

半小时前

国办印发《关于全链条打击涉烟违法活动的意

半小时前

商务部召开消费新业态新模式新场景试点工作

半小时前

热门排行

1 新标准落地，为什么对3.8亿辆电瓶车“踩刹

电动自行车新国标落地半月有余，围绕其的讨论依然热烈。尽管从1月份标准公布到12月份

阅读：1|半小时前

2 日本央行年内最后一次议息会议在即高市早

　　在外界屏息静待日本央行年前最后一次议息会议前，高市早苗政府又一次发出了不同声

阅读：53|半小时前

3 奥普光电秒速涨停！光刻机产业国产化不断提

　　光刻机行业进展不断。　　在美股大幅下挫的背景下，今日（12月18日）上午，A股表

阅读：31|半小时前

4 每日龙虎榜

　　每日期货龙虎榜，带你深度了解市场。　　市场一览：　　周四商品期货综合指数上

阅读：38|半小时前

5 国办印发《关于全链条打击涉烟违法活动的意

　　国务院办公厅日前印发《关于全链条打击涉烟违法活动的意见》（以下简称《意见》）

阅读：44|半小时前

6 商务部召开消费新业态新模式新场景试点工作

　　近日，商务部办公厅、财政部办公厅印发《关于做好消费新业态新模式新场景试点有关

阅读：42|半小时前

7 大消费反复活跃！航天板块多只个股被主力资

每经记者｜闫峰峰每经编辑｜何建川各位投资者，大家好。涨跌停板数据，不仅是反映

阅读：113|1 小时前

8 港股速报 | 绿了“一天”终于红了港股迎来

每经记者｜曾子建每经编辑｜袁东 12月18日，港股市场大部分时间处于下跌状态，但尾

阅读：168|1 小时前

9 重大利空突袭！韩国巨头崩了！福特收缩电动

　　LG新能源遭遇“空袭”。　　12月18日盘中，韩国动力电池龙头企业LG新能源的股价大

阅读：361|1 小时前

10 今天A股有一个微妙变化和两个“不变”！各

　　12月18日，三大指数涨跌不一，沪指低开回升，创业板指低开低走跌超2%。截至收盘，

阅读：341|1 小时前

← 返回资讯

在线客服（服务时间 9:00～18:00）

QQ：30376048757

公司地址：广州市黄埔区康富路32号101房

客服电话：13326565461

电子邮箱：30376048757@qq.com

Powered by 广州丁冬科技有限公司 © 2025 aiwsw.com Inc.( 粤ICP备2024347580号-3 )