Anthropic计划有条件公开漏洞挖掘AI模型Mythos
Anthropic表示计划向公众开放其漏洞挖掘AI模型Mythos,但前提是建立目前尚不存在的安全防护措施。该公司承认,包括其自身在内的任何企业都尚未构建出足以防止滥用的强有力保障机制。
发布规划与风险评估
Anthropic在限时安全项目更新中确认了该计划,同时指出具体时间表仍不确定。公司将首先与美国及盟国政府合作扩展项目范围,随后在近期更广泛地发布"Mythos级模型"。
该公司坦承相关风险,表示目前没有任何企业(包括自身)建立了足够强大的防护措施来防止模型被滥用并造成严重危害。即便如此,Anthropic预计类似工具将快速普及,预测Mythos级模型将在六至十二个月内广泛投入使用。
技术表现与应用成果
该模型于四月首次亮相。测试数据显示,其在漏洞利用生成测试中达到72.4%的有效率,而早期Claude模型在此项测试中的表现近乎为零。
自发布以来,Mythos已扫描超过一千个开源项目,共发现23,019个安全问题,其中6,202个被评级为高危或严重漏洞。值得关注的是,模型在数十亿设备使用的wolfSSL加密库中发现了一个可导致攻击者伪造证书、冒充银行或邮件服务商的漏洞,该漏洞目前已被修复。
实际影响与行业协作
大量的漏洞报告给修复工作带来了压力。开源维护者已请求Anthropic减缓披露速度,表示当前漏洞数量已超出其处理能力。研究界注意到更深层次的失衡现象:发现漏洞的难度已远低于修复漏洞的难度。
为此,Anthropic与开源安全基金会的Alpha-Omega项目合作,协助维护者对积压漏洞进行优先级排序。尽管公司承认攻击方目前可能仍占优势,但其系统评估报告预测AI技术最终将有利于防御方。
在Mythos初次发布时,Anthropic向包括多家科技企业在内的五十余个组织提供了访问权限及使用额度,但因该模型可能被武器化的风险而未向公众开放。

资金费率
资金费率热力图
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
账号安全
资讯收藏
自选币种