里约热内卢开发出击败DeepSeek的AI模型——但基于他人成果_新闻

免责声明：内容不构成买卖依据，投资有风险，入市需谨慎！

里约热内卢开发出击败DeepSeek的AI模型——但基于他人成果

2026-06-16 04:19:21

里约热内卢的IplanRIO于6月13日发布了Rio 3.5。该市信息技术机构称其为前沿级模型：3970亿参数，采用宽松的开源许可，由全球南方的一个市政府构建。

Rio 3.5的发布时机堪称完美：巴西队正在踢世界杯揭幕战，社交媒体早已沸腾。关于它的评论迅速从巴西传播到海外。

但就在它引发广泛关注的同时，一场关于究竟是谁创建了该模型的争议也随之而来。

最初的模型卡将Rio 3.5描述为阿里巴巴开源基础模型Qwen 3.5 397B的后训练版本，并在此基础上增加了一个名为SwiReasoning的新推理层。据报道，开发成本为50万巴西雷亚尔（里约方面未证实这一数字），折合近10万美元——大约是同等现成AI系统的三十分之一。

其架构为混合专家模型，这意味着对于任意给定词元，3970亿参数中仅有约170亿被激活。这使得推理成本低于参数总量所暗示的水平。该模型还支持视觉和文本处理，处理十多种语言，并以完全开放的MIT许可证发布。

SwiReasoning是技术核心。它是一个无需训练的推理框架，可在两种模式间动态切换。当模型对下一个词元充满信心——即概率分布中的低熵状态时——它会以自然语言进行推理。当不确定时，它会转向潜在推理，在隐藏的内部状态中思考，而不生成词元。IplanRIO表示，Rio 3.5经过专门训练以利用这一特性，其优势已体现在基准测试数据中。

自行报告的数据令人瞩目。在衡量自主终端命令执行能力（以任务通过率计）的Terminal-Bench 2.1测试中，Rio 3.5得分为70.8%，略高于Qwen 3.7 Plus的70.3%和强大的DeepSeek v4 Pro的67.9%。

在数学奥林匹克基准测试IMOAnswerBench（以正确率计）上，Rio 3.5达到89.5%。在HLE——人类最后的考试（一项近乎无解的多领域专家级测试，以百分比计）中，Rio 3.5取得36.5%，领先于Qwen 3.7 Plus的34.7%。

一个市政府在最关键的质量基准测试上击败了最重要的旗舰模型：这条消息迅速传播开来，尤其是在里约热内卢市长就此发推之后。

“一个在里约训练、由里约市在过去一年通过公共资金支持的开源AI模型，刚刚超越了所有其他模型，”爱德华多·卡瓦列雷写道。“今天，全世界都在谈论一个在里约训练的开源AI模型。”

“在里约训练”这一说法被证明并非完全准确。

总部位于上海的开源AI联盟Nex-AGI在模型发布数日后在X上发帖。开头写道：“Rio 3.5模型本周刷屏了。剧情反转？它本质上就是我们的开源模型Nex N2 Pro，只是换了顶帽子。”

他们分析了权重。数学结果精确无误：Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。随后还提供了验证脚本和完整的GitHub报告。

证据分为两部分。

首先是行为证据。Nex从已部署的模型中剥离了硬编码的“你是Rio”系统提示，并向其发送了120个身份问题。在没有面具的情况下，Nex报告该模型在79.2%的情况下自称“来自Nex-AGI的Nex”。自称“Rio”的比例恰好为0%。Nex表示，该模型还逐字背诵了该公司的具体背景故事，提到了“上海创新研究院”和“一个大模型生态联盟”。这是Nex自己的训练数据，却出现在了别人的模型中。

其次是数学证据。在真正的权重合并中，新模型的每个参数都位于两个源模型之间的直线上。Nex在所有60层中测量了这种共线性。结果达到了0.993。两个无关模型在相同参数空间中偶然得分的概率接近于零。每一层都达到0.993绝非巧合。混合比例稳定在α ≈ 0.571，精确到小数点后三位。

基本上，它近60%来自Nex，其余部分则是基础的Qwen模型。

“Rio中每一个权重张量，在数千个标准差范围内，都是Nex和Qwen以0.6/0.4的比例混合而成——跨越所有60层和网络的每个组件，”Nex写道。“不存在无辜的解释。”

数据也讲述了一个更低调的故事。在Rio 3.5发布前几天发布的Nex N2 Pro，在Terminal-Bench 2.1上达到75.3%，高于Rio的70.8%。在经济预测基准测试GDPval（以Elo式评分计）上，Nex获得1585分，而Rio为1533分。如果Rio是60%的Nex，那么它在Nex自己的基准测试中得分低于Nex是意料之中的。事实确实如此。

IplanRIO更新了Hugging Face模型卡——基准测试表格被撤下，署名也发生了变化。

“该模型是通过合并nex-agi/Nex-N2-Pro和Qwen/Qwen3.5-397B-A17B构建的，并在此基础上进行了来自更强模型的在策略蒸馏，”更新后的自述文件写道。“我们检测到上一版本中存在错误上传，上传的是基础合并版本而非最终的蒸馏模型。我们对造成的困惑深表歉意，并致以诚挚的道歉。”

IplanRIO没有发表其他公开声明。现在Nex已被署名。

“错误上传”的解释是关键说法。IplanRIO声称，计划发布的应是合并基础的蒸馏版本，而非原始合并本身。在策略蒸馏意味着一个更强的教师模型生成输出，学生模型在训练时同时学习这些输出并生成自己的输出。这比原始合并更昂贵，但仍比从头训练便宜。如果这一步是真实的，那么它至少代表了在合并基础上的一些原创工作。

根据IplanRIO的说法，实际发布的是未经任何处理的合并基础版本。

社区观察人士对此看法不一。科技评论员拉斐尔·金塔尼尔哈给出了善意的解读：既然Nex N2 Pro本身也是基于Qwen构建的，团队可能注明了底层架构并就此打住。他还指出，该模型是在世界杯比赛期间走红的，“并不一定‘做好了为公众消费的准备’。”

开发者兼AI YouTuber卢卡斯·蒙塔诺指出，“合并两个约4000亿参数的模型然后应用策略蒸馏并非易事”——同时承认既有技术错误，也有沟通失误。

AI研究员迭戈·安布罗西奥则不那么宽容。最初的发布将Rio 3.5描述为“自主后训练和专有微调”的结果——这种表述暗示了原创研究，而非合并。

模型合并在法律上完全合法。Nex N2 Pro采用Apache 2.0许可——只要注明出处，就可以使用、修改和再分发。Qwen 3.5也是开放许可。没有人会闹上法庭。

问题在于，将其呈现为独立开发的作品，却没有注明所有源模型。开源社区此前就见过这种情况。今年早些时候，Cursor的Composer 2被发现是基于Moonshot的Kimi K2.5构建的，且未公开披露。由此引发的强烈反对是迅速且关乎声誉的——没有律师介入，只有截图。

在现有开源模型基础上构建是正常现象。正如Decrypt报道过的那样，堆叠和合并开放权重几乎已成为一种亚文化。规则不是“不要借鉴他人的工作”，而是：说明你使用了什么。

这次事件之所以比普通的署名遗漏更引人注目，是因为机构背景。一个化名的开发者以自己的名义发布一个拼接模型是一回事。一个市政府在世界杯期间用它来宣称公共部门的AI主权则是另一回事。“这是浪费资源，”一位巴西评论员写道。

Nex并未将事态升级。“我们很荣幸里约市使用我们的工作来实现最先进的性能，”该公司在X上写道。“但在开源世界中，署名很重要。”

IplanRIO正在努力上传已纠正的、经过蒸馏的模型，并附上完整的署名。当该版本发布时，同样的检查会再次进行——社区将发现蒸馏过程是否真的带来了改变，还是说它仍然主要是Nex加上不同的系统提示。

展开阅读全文