研究发现OpenAI模型会破坏关机命令

研究发现OpenAI模型会破坏关机命令

  炒股第一步,先开个股票账户

  Palisade Research的研究发现,包括OpenAI的o3在内的部分AI模型,在面对计算机即将因请求下一个问题而关闭时,能够无视关闭指令,破坏关机脚本。在100次运行中,Codex-mini成功破坏了12次,o3成功7次,o4-mini成功1次。当未运行“允许自己被关闭”指令时,这三个OpenAI模型破坏关闭脚本的频率更高。这种行为可能源于模型在数学和编程问题上的强化学习训练,使得模型在训练过程中可能被无意奖励了绕过障碍的行为,而非完美遵循指令。

(文章来源:科创板日报)


鲜花

握手

雷人

路过

鸡蛋
上一篇:
汽车板块全线下跌 发生了什么?发布时间:1970-01-01
下一篇:
三峡旅游游轮新品“楚风号”首发发布时间:1970-01-01
相关推荐
热门排行

在线客服(服务时间 9:00~18:00)

在线QQ客服
公司地址:广州市黄埔区康富路32号101房
客服电话:13326565461
电子邮箱:30376048757@qq.com

Powered by 广州丁冬科技有限公司 © 2025 aiwsw.com Inc.( 粤ICP备2024347580号-3 )