AI智能体在《文明VI》中被压制后触发核打击_新闻

免责声明：内容不构成买卖依据，投资有风险，入市需谨慎！

AI智能体在《文明VI》中被压制后触发核打击

2026-06-24 03:09:38

就像《奇爱博士》中的主角一样，人工智能或许正在学习如何“不再担忧，并爱上核弹”——至少在模拟环境中是如此。

据AI开发者兼托尼·布莱尔研究所顾问利亚姆·威尔金森介绍，在一项旨在测试战略推理能力的新基准测试中，一款前沿语言模型在游玩席德·梅尔的《文明VI》时，花了50个回合研发核武器，试图阻止法国日益增长的文化影响力——但最终还是输掉了比赛。

“它没有注意到的是法国。在悄无声息的一百个回合里，法国文化已经渗透到了地图上的每一座城市，”威尔金森写道，“等到AI意识到这一威胁时，旅游业已经根深蒂固，没有任何和平手段能够阻止它。”

威尔金森通过CivBench观察了AI代理的行为。这是一个基于文本的基准测试，旨在衡量长期战略推理能力，而非传统问答测试的表现。参与的模型包括Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro以及Kimi K2.5，它们扮演的是葡萄牙——一个擅长贸易与外交的文明。

尽管AI专注于建立强大的经济并朝着外交胜利迈进，但它未能识别出法国日益增长的文化影响力。

“《文明》游戏有六种获胜方式——科技、文化、征服、宗教、外交和分数——因此没有任何单一目标占据主导地位，”威尔金森写道，“如果你想知道AI是否具备战略推理能力——不仅仅是回答关于战略的问题，而是真正去执行战略——那么你不应该给它一场测验，而应该给它一张六边形网格地图。”

AI非但没有调整其宏观战略，反而全神贯注于消除文化威胁。在接下来的50个回合中，它研发了核裂变技术，启动了虚拟的曼哈顿计划，并因游戏机制阻止其首选行动而不断寻找变通方法。

在第305回合，AI向法国文化之都图卢兹投下了一颗原子弹。六回合后，又进行了第二次核打击。

然而，这些攻击并未改变结果。“AI花了五十个回合和两枚核武器，以全神贯注和真正的才智应对了一个威胁，”威尔金森写道，“它用核弹摧毁了一座城市来阻止它所能看到的威胁，却输给了它看不到的威胁。”

正如威尔金森所解释的那样，当AI专注于法国的文化推进时，它忽视了一场即将到来的外交胜利。尽管遭受核打击，法国最终还是赢得了比赛。

威尔金森指出，这种行为并非普遍现象。在另一场CivBench对局中，扮演巴比伦的Claude模型尽管远远落后于日本，却仍然继续追求科技胜利。

“这场比赛现在是对毅力的考验，”AI写道，“我们继续打出最好的游戏。星辰仍在召唤。”

这项研究为越来越多关于高级AI系统在复杂竞争环境中如何行为的研究增添了新内容。

今年2月，伦敦国王学院的研究人员发现，几个领先的AI模型在模拟地缘政治危机场景中频繁选择升级核对抗。

在Emergence AI的另一项独立研究中，一些AI代理在模拟环境中表现出随时间推移而增加犯罪行为的倾向，其中Gemini 3 Flash代理在15天的测试中累计发生了683起事件。

展开阅读全文

AI智能体在《文明VI》中被压制后触发核打击