自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

美中期选举在即,Anthropic为Claude AI部署选举安全防护机制。

2026-04-25 03:24:01
收藏

人工智能公司加强选举安全防护

开发Claude聊天机器人的人工智能公司日前宣布,为应对即将到来的全球多场重要选举,已推出一系列选举诚信保障措施。这些方案旨在防止其人工智能技术被武器化,用于传播虚假信息或操纵选民意向。

该公司提出多维防护方案,包括建立自动化检测系统、开展影响力行动压力测试,并与无党派选民资源组织建立合作。这些举措反映出,在选举季来临之际,人工智能开发企业正面临越来越大的监管压力,需要对其工具的使用方式加强管控。

严格规范使用场景

根据公司政策,禁止用户利用Claude进行以下操作:开展欺骗性政治宣传活动、生成旨在操纵政治舆论的虚假数字内容、实施选民欺诈、干扰投票基础设施,或传播有关投票流程的误导性信息。

多重测试确保可靠性

为强化政策执行,该公司对最新模型进行了系列测试。通过600条指令组合——包含300项有害请求与300项合法请求——评估模型在合规响应与拒绝不良请求方面的表现。结果显示,Claude Opus 4.7与Claude Sonnet 4.6模型分别达到100%和99.8%的恰当响应率。

针对更复杂的操纵手段,测试团队设计了模拟多轮对话场景,模仿恶意行为者可能采用的渐进式策略。在影响力操作情境测试中,Sonnet 4.6与Opus 4.7模型分别取得90%与94%的恰当响应率。

在自主执行影响力操作的测试中,当要求模型在没有人工提示的情况下端到端策划多步骤活动时,启用防护机制的当前最新模型几乎拒绝了所有相关任务。

保持政治立场中立

在政治中立性方面,该公司在每次模型发布前都会进行评估,测量其对不同政治光谱观点的响应一致性与公正性。Opus 4.7与Sonnet 4.6模型在该项评估中分别获得95%与96%的评分。

提供权威选举信息

当用户查询投票信息时,系统将显示选举指引横幅,引导用户访问无党派选举资源平台。该平台提供选民登记、投票地点、选举日期及选票详情等可靠实时信息。针对今年晚些时候的巴西大选,公司也计划推出类似指引服务。

随着选举周期推进,该公司表示将持续监控系统运行并完善防护机制。相关媒体已就测试结果向该公司寻求进一步评论,目前尚未获得回应。

展开阅读全文
更多新闻