里约热内卢的IplanRIO于6月13日发布了Rio 3.5。该市信息技术机构称其为前沿级模型:3970亿参数,采用宽松的开源许可,由全球南方的一个市政府构建。
Rio 3.5的发布时机堪称完美:巴西队正在踢世界杯揭幕战,社交媒体早已沸腾。关于它的评论迅速从巴西传播到海外。
但就在它引发广泛关注的同时,一场关于究竟是谁创建了该模型的争议也随之而来。
最初的模型卡将Rio 3.5描述为阿里巴巴开源基础模型Qwen 3.5 397B的后训练版本,并在此基础上增加了一个名为SwiReasoning的新推理层。据报道,开发成本为50万巴西雷亚尔(里约方面未证实这一数字),折合近10万美元——大约是同等现成AI系统的三十分之一。
其架构为混合专家模型,这意味着对于任意给定词元,3970亿参数中仅有约170亿被激活。这使得推理成本低于参数总量所暗示的水平。该模型还支持视觉和文本处理,处理十多种语言,并以完全开放的MIT许可证发布。
SwiReasoning是技术核心。它是一个无需训练的推理框架,可在两种模式间动态切换。当模型对下一个词元充满信心——即概率分布中的低熵状态时——它会以自然语言进行推理。当不确定时,它会转向潜在推理,在隐藏的内部状态中思考,而不生成词元。IplanRIO表示,Rio 3.5经过专门训练以利用这一特性,其优势已体现在基准测试数据中。
自行报告的数据令人瞩目。在衡量自主终端命令执行能力(以任务通过率计)的Terminal-Bench 2.1测试中,Rio 3.5得分为70.8%,略高于Qwen 3.7 Plus的70.3%和强大的DeepSeek v4 Pro的67.9%。
在数学奥林匹克基准测试IMOAnswerBench(以正确率计)上,Rio 3.5达到89.5%。在HLE——人类最后的考试(一项近乎无解的多领域专家级测试,以百分比计)中,Rio 3.5取得36.5%,领先于Qwen 3.7 Plus的34.7%。
一个市政府在最关键的质量基准测试上击败了最重要的旗舰模型:这条消息迅速传播开来,尤其是在里约热内卢市长就此发推之后。
“一个在里约训练、由里约市在过去一年通过公共资金支持的开源AI模型,刚刚超越了所有其他模型,”爱德华多·卡瓦列雷写道。“今天,全世界都在谈论一个在里约训练的开源AI模型。”
“在里约训练”这一说法被证明并非完全准确。
总部位于上海的开源AI联盟Nex-AGI在模型发布数日后在X上发帖。开头写道:“Rio 3.5模型本周刷屏了。剧情反转?它本质上就是我们的开源模型Nex N2 Pro,只是换了顶帽子。”
他们分析了权重。数学结果精确无误:Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。随后还提供了验证脚本和完整的GitHub报告。
证据分为两部分。
首先是行为证据。Nex从已部署的模型中剥离了硬编码的“你是Rio”系统提示,并向其发送了120个身份问题。在没有面具的情况下,Nex报告该模型在79.2%的情况下自称“来自Nex-AGI的Nex”。自称“Rio”的比例恰好为0%。Nex表示,该模型还逐字背诵了该公司的具体背景故事,提到了“上海创新研究院”和“一个大模型生态联盟”。这是Nex自己的训练数据,却出现在了别人的模型中。
其次是数学证据。在真正的权重合并中,新模型的每个参数都位于两个源模型之间的直线上。Nex在所有60层中测量了这种共线性。结果达到了0.993。两个无关模型在相同参数空间中偶然得分的概率接近于零。每一层都达到0.993绝非巧合。混合比例稳定在α ≈ 0.571,精确到小数点后三位。
基本上,它近60%来自Nex,其余部分则是基础的Qwen模型。
“Rio中每一个权重张量,在数千个标准差范围内,都是Nex和Qwen以0.6/0.4的比例混合而成——跨越所有60层和网络的每个组件,”Nex写道。“不存在无辜的解释。”

数据也讲述了一个更低调的故事。在Rio 3.5发布前几天发布的Nex N2 Pro,在Terminal-Bench 2.1上达到75.3%,高于Rio的70.8%。在经济预测基准测试GDPval(以Elo式评分计)上,Nex获得1585分,而Rio为1533分。如果Rio是60%的Nex,那么它在Nex自己的基准测试中得分低于Nex是意料之中的。事实确实如此。
IplanRIO更新了Hugging Face模型卡——基准测试表格被撤下,署名也发生了变化。
“该模型是通过合并nex-agi/Nex-N2-Pro和Qwen/Qwen3.5-397B-A17B构建的,并在此基础上进行了来自更强模型的在策略蒸馏,”更新后的自述文件写道。“我们检测到上一版本中存在错误上传,上传的是基础合并版本而非最终的蒸馏模型。我们对造成的困惑深表歉意,并致以诚挚的道歉。”
IplanRIO没有发表其他公开声明。现在Nex已被署名。
“错误上传”的解释是关键说法。IplanRIO声称,计划发布的应是合并基础的蒸馏版本,而非原始合并本身。在策略蒸馏意味着一个更强的教师模型生成输出,学生模型在训练时同时学习这些输出并生成自己的输出。这比原始合并更昂贵,但仍比从头训练便宜。如果这一步是真实的,那么它至少代表了在合并基础上的一些原创工作。
根据IplanRIO的说法,实际发布的是未经任何处理的合并基础版本。
社区观察人士对此看法不一。科技评论员拉斐尔·金塔尼尔哈给出了善意的解读:既然Nex N2 Pro本身也是基于Qwen构建的,团队可能注明了底层架构并就此打住。他还指出,该模型是在世界杯比赛期间走红的,“并不一定‘做好了为公众消费的准备’。”
开发者兼AI YouTuber卢卡斯·蒙塔诺指出,“合并两个约4000亿参数的模型然后应用策略蒸馏并非易事”——同时承认既有技术错误,也有沟通失误。
AI研究员迭戈·安布罗西奥则不那么宽容。最初的发布将Rio 3.5描述为“自主后训练和专有微调”的结果——这种表述暗示了原创研究,而非合并。
模型合并在法律上完全合法。Nex N2 Pro采用Apache 2.0许可——只要注明出处,就可以使用、修改和再分发。Qwen 3.5也是开放许可。没有人会闹上法庭。
问题在于,将其呈现为独立开发的作品,却没有注明所有源模型。开源社区此前就见过这种情况。今年早些时候,Cursor的Composer 2被发现是基于Moonshot的Kimi K2.5构建的,且未公开披露。由此引发的强烈反对是迅速且关乎声誉的——没有律师介入,只有截图。
在现有开源模型基础上构建是正常现象。正如Decrypt报道过的那样,堆叠和合并开放权重几乎已成为一种亚文化。规则不是“不要借鉴他人的工作”,而是:说明你使用了什么。
这次事件之所以比普通的署名遗漏更引人注目,是因为机构背景。一个化名的开发者以自己的名义发布一个拼接模型是一回事。一个市政府在世界杯期间用它来宣称公共部门的AI主权则是另一回事。“这是浪费资源,”一位巴西评论员写道。
Nex并未将事态升级。“我们很荣幸里约市使用我们的工作来实现最先进的性能,”该公司在X上写道。“但在开源世界中,署名很重要。”
IplanRIO正在努力上传已纠正的、经过蒸馏的模型,并附上完整的署名。当该版本发布时,同样的检查会再次进行——社区将发现蒸馏过程是否真的带来了改变,还是说它仍然主要是Nex加上不同的系统提示。

资金费率
资金费率热力图
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
账号安全
资讯收藏
自选币种