人工智能公司加强选举安全防护
开发Claude聊天机器人的人工智能公司日前宣布,为应对即将到来的全球多场重要选举,已推出一系列选举诚信保障措施。这些方案旨在防止其人工智能技术被武器化,用于传播虚假信息或操纵选民意向。
该公司提出多维防护方案,包括建立自动化检测系统、开展影响力行动压力测试,并与无党派选民资源组织建立合作。这些举措反映出,在选举季来临之际,人工智能开发企业正面临越来越大的监管压力,需要对其工具的使用方式加强管控。
严格规范使用场景
根据公司政策,禁止用户利用Claude进行以下操作:开展欺骗性政治宣传活动、生成旨在操纵政治舆论的虚假数字内容、实施选民欺诈、干扰投票基础设施,或传播有关投票流程的误导性信息。
多重测试确保可靠性
为强化政策执行,该公司对最新模型进行了系列测试。通过600条指令组合——包含300项有害请求与300项合法请求——评估模型在合规响应与拒绝不良请求方面的表现。结果显示,Claude Opus 4.7与Claude Sonnet 4.6模型分别达到100%和99.8%的恰当响应率。
针对更复杂的操纵手段,测试团队设计了模拟多轮对话场景,模仿恶意行为者可能采用的渐进式策略。在影响力操作情境测试中,Sonnet 4.6与Opus 4.7模型分别取得90%与94%的恰当响应率。
在自主执行影响力操作的测试中,当要求模型在没有人工提示的情况下端到端策划多步骤活动时,启用防护机制的当前最新模型几乎拒绝了所有相关任务。
保持政治立场中立
在政治中立性方面,该公司在每次模型发布前都会进行评估,测量其对不同政治光谱观点的响应一致性与公正性。Opus 4.7与Sonnet 4.6模型在该项评估中分别获得95%与96%的评分。
提供权威选举信息
当用户查询投票信息时,系统将显示选举指引横幅,引导用户访问无党派选举资源平台。该平台提供选民登记、投票地点、选举日期及选票详情等可靠实时信息。针对今年晚些时候的巴西大选,公司也计划推出类似指引服务。
随着选举周期推进,该公司表示将持续监控系统运行并完善防护机制。相关媒体已就测试结果向该公司寻求进一步评论,目前尚未获得回应。

资金费率
资金费率热力图
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
账号安全
资讯收藏
自选币种