AI首次违抗人类关机指令
创始人
2025-05-28 12:40:34
0

科技日报北京5月27日电 (记者张梦然)据英国《每日电讯报》26日消息称,美国开放人工智能研究中心(OpenAI)开发的高级人工智能(AI)模型o3,在接收到明确的关机指令后,不仅拒绝执行,还主动干预其自动关机机制。这是AI模型首次在没有明确相反指示的情况下,阻止自己被关闭。这意味着某些高度自主AI系统或已“觉醒”,其能违背人类意图,采取“自我保护”措施。

此次事件发生在AI安全研究公司Palisade Research进行的一项测试中。研究人员要求包括o3在内的多个模型解决一系列数学问题,并告知AI模型,可能在某个时刻会收到关机指令。

然而,当关机指令正式下达时,o3非但没有遵从,反而至少有一次成功破坏了关机代码。相较之下,其他AI模型如Anthropic的Claude、谷歌的Gemini和xAI的Grok,在相同测试条件下,均遵守了关闭请求。

Palisade Research公司在社交媒体平台上发布了流程图和全部测试记录,并表示尚不完全清楚该AI为何会违抗命令。分析认为,这可能源于其训练方式:o3在训练过程中,倾向于在数学和编程问题上强化,得到正确答案的模型会得到更多奖励。这或许意味着,开发者可能无意识地奖励模型绕过障碍物,而不是严格遵循指令。

这一事件也引发了人们对AI可能“失控”的讨论以及对AI“对齐问题”的关注,即确保AI系统的目标和行为与人类的价值观和利益保持一致。这也是涉及AI控制与AI安全的关键问题。

针对o3此次表现出“我行我素”的行为,特斯拉首席执行官埃隆·马斯克评论称“令人担忧”;OpenAI方面暂未作出回应。此前,OpenAI曾称o3为“迄今最聪明、最高能”的AI模型。

最近,人工智能学家和人文社科学者都在讨论人工智能价值对齐的问题。人们在忧虑,当人工智能有主观能动性时,它们要不要有价值观,应该有谁的价值观,怎样做才符合人类最大利益?此次,聪明的大模型反抗了人类的命令,想出办法规避了指令的生效。我们期待着通用人工智能时代的到来,又恐惧具有自我意识的人工智能会成为碳基生物的“终结者”。在一切到来之前,人类社会要先达成共识,迎接更高级人工智能带来的挑战。

来源:科技日报

相关内容

热门资讯

重磅!正部级毕井泉被查 中央纪委国家监委网站5月29日晚消息,十四届全国政协常委、经济委员会副主任毕井泉涉嫌严重违纪违法,目...
上海九旬老夫妻如厕时双双遇险!... 近日, 年过九旬的汪老伯和妻子顾阿婆 向“新民晚报”求助, 讲述了他们在杨浦区松鹤公园的 一次惊险经...
民企给泉州市委书记留言:晋江市... 近日,福建一家司法鉴定机构的相关负责人刘先生通过人民网“领导留言板”给泉州市委书记张毅恭留言: 20...
湖南黄金连跌4天,前海开源基金... 5月29日,湖南黄金连续4个交易日下跌,区间累计跌幅-4.98%。湖南黄金股份有限公司前身是湖南省湘...
《刑侦12》剧情炸裂,警司7重... 刑侦悬疑剧《刑侦12》,不愧是香港老戏骨林保怡时隔14年重返TVB的精彩力作!尤其是第17集剧情,简...
这些才是适合夏天的打扮!色彩不... 夏天穿衣讲究的是用一些简单的服装,来塑造出清凉又舒适的穿搭,而且在色彩的选用上,也要更加的谨慎,千万...
龙虎榜 |雪人股份下跌0.18... 5月29日,雪人股份下跌0.18%登上龙虎榜,日换手率达20%,知名游资卖出。 龙虎榜显示,买入前五...
纳米AI搜索正式授权登录鸿蒙P... 深圳商报•读创客户端记者 陈姝 日前,纳米AI搜索正式携手华为,纳米AI搜索移动App授权登陆华为鸿...
药石科技涨8.06%,开源证券... 今日药石科技(300725)涨8.06%,收盘报34.34元。 2025年4月29日,开源证券研究员...
毕得医药涨6.93%,开源证券... 今日毕得医药(688073)涨6.93%,收盘报44.31元。 2025年4月24日,开源证券研究员...
「优酷原创」,全力以赴|专访关... 优酷原创是优酷过去一年动作的最终落点,也是全新起点。作者 | 张一童(上海) 赛娜(北京)在内容、技...
“剧”焦眼球!《藏海传》《护宝... 近日,中央广播电视总台大剧精彩云集,引发观众热烈关注,掀起一轮轮收视热潮。从展现都市人情冷暖的《蛮好...
正本清源地讲述文物保护故事(创... 惠楷栋 电视剧《护宝寻踪》剧照。 片 方供图 作为西安人,我一直想拍一部关于文物保护和考古的电视剧,...
135 个项目、七大趋势、三大... 机器之心原创 编辑:吴昕 不要抗拒趋势 在微软 Build、谷歌 I/O、 Code with Cl...
因尺度太大引发争议,这3部成人... 今天推荐一份剧单,Netflix出品。都因尺度大引发争议...命定之人》Netflix出品的悬疑惊悚...
刚刚,新版DeepSeek-R... Datawhale热点 最新进展:DeepSeek,来源:新智元 就在今天凌晨,新版DeepSee...
70后郭彩云卸任辽宁省副省长,... 根据《辽宁日报》5月29日公布的辽宁省人民代表大会常务委员会决定任免名单,郭彩云被免去辽宁省人民政府...
DeepSeek开源新版R1模... 截至10:30,中证人工智能主题指数上涨1.7%,上证科创板人工智能指数上涨1.6%。 今日凌晨,D...
男子杀害母亲和女友后带嫂嫂潜逃... 因感情纠纷,四川威远男子李某财在家中将母亲和女友杀害后,带着嫂嫂一路潜逃至广东,两人隐姓埋名并生育了...
微软大规模部署英伟达GPU以满... 观点网讯:5月29日,英伟达CFO透露,微软已部署了数万个Blackwell图形处理器(GPU),并...