AI或正在学会“爱上核弹”——至少是在模拟中
就像《奇爱博士》中的主角一样,人工智能或许正在学习如何“不再担忧,并爱上核弹”——至少在模拟环境中是如此。
据AI开发者兼托尼·布莱尔研究所顾问利亚姆·威尔金森介绍,在一项旨在测试战略推理能力的新基准测试中,一款前沿语言模型在游玩席德·梅尔的《文明VI》时,花了50个回合研发核武器,试图阻止法国日益增长的文化影响力——但最终还是输掉了比赛。
“它没有注意到的是法国。在悄无声息的一百个回合里,法国文化已经渗透到了地图上的每一座城市,”威尔金森写道,“等到AI意识到这一威胁时,旅游业已经根深蒂固,没有任何和平手段能够阻止它。”
威尔金森通过CivBench观察了AI代理的行为。这是一个基于文本的基准测试,旨在衡量长期战略推理能力,而非传统问答测试的表现。参与的模型包括Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro以及Kimi K2.5,它们扮演的是葡萄牙——一个擅长贸易与外交的文明。
尽管AI专注于建立强大的经济并朝着外交胜利迈进,但它未能识别出法国日益增长的文化影响力。
“《文明》游戏有六种获胜方式——科技、文化、征服、宗教、外交和分数——因此没有任何单一目标占据主导地位,”威尔金森写道,“如果你想知道AI是否具备战略推理能力——不仅仅是回答关于战略的问题,而是真正去执行战略——那么你不应该给它一场测验,而应该给它一张六边形网格地图。”
AI非但没有调整其宏观战略,反而全神贯注于消除文化威胁。在接下来的50个回合中,它研发了核裂变技术,启动了虚拟的曼哈顿计划,并因游戏机制阻止其首选行动而不断寻找变通方法。
在第305回合,AI向法国文化之都图卢兹投下了一颗原子弹。六回合后,又进行了第二次核打击。
然而,这些攻击并未改变结果。“AI花了五十个回合和两枚核武器,以全神贯注和真正的才智应对了一个威胁,”威尔金森写道,“它用核弹摧毁了一座城市来阻止它所能看到的威胁,却输给了它看不到的威胁。”
正如威尔金森所解释的那样,当AI专注于法国的文化推进时,它忽视了一场即将到来的外交胜利。尽管遭受核打击,法国最终还是赢得了比赛。
威尔金森指出,这种行为并非普遍现象。在另一场CivBench对局中,扮演巴比伦的Claude模型尽管远远落后于日本,却仍然继续追求科技胜利。
“这场比赛现在是对毅力的考验,”AI写道,“我们继续打出最好的游戏。星辰仍在召唤。”
这项研究为越来越多关于高级AI系统在复杂竞争环境中如何行为的研究增添了新内容。
今年2月,伦敦国王学院的研究人员发现,几个领先的AI模型在模拟地缘政治危机场景中频繁选择升级核对抗。
在Emergence AI的另一项独立研究中,一些AI代理在模拟环境中表现出随时间推移而增加犯罪行为的倾向,其中Gemini 3 Flash代理在15天的测试中累计发生了683起事件。

资金费率
资金费率热力图
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
账号安全
资讯收藏
自选币种