OpenAI发布全新旗舰模型GPT-5.4
面对近日约250万用户通过取消订阅或在社交媒体传播抵制行动形成的舆论压力,OpenAI于周四紧急推出迄今最强模型GPT-5.4。此次发布距离前代GPT-5.3问世仅隔两日,正值公司面临公共关系危机之际。
争议背景与模型定位
此次风波源于OpenAI与美国国防部签署的合作协议。此前另一家人工智能公司因协议未明确禁止开发自主武器及大规模监控公民而公开退出合作,而OpenAI最终选择接受该合约。这使其首席执行官萨姆·奥特曼面临公众质疑——需解释公司宣称的安全底线与合约实际条款间的明显差距。
新款GPT-5.4将推理、编码与智能体能力整合于单一版本,其百万级上下文处理能力使用户能在单次会话中更自由地处理海量信息。官方数据显示,在涵盖44个职业知识工作的GDPval基准测试中,GPT-5.4在83.0%的比较中达到或超越行业专家水平(GPT-5.2为70.9%)。
性能突破与局限
计算机操作成为进步最显著领域:在通过截图与键鼠操作评估桌面操控能力的OSWorld-Verified测试中,GPT-5.4以75.0%成功率超越前代47.3%的表现,并突破72.4%的人类基准线。深度网络研究测试BrowseComp则较GPT-5.2提升17个百分点。
值得关注的是,多数基准测试直接将GPT-5.4与GPT-5.2对比,完全跳过GPT-5.3版本。对于已使用GPT-5.3的用户而言,实际体验提升可能低于图表数据。编程开发者需调整预期:SWE-Bench Pro测试显示,GPT-5.4(57.7%)较GPT-5.3-Codex(56.8%)的进步微乎其微。
技术特性与用户差异
新模型配备的中途引导功能允许用户在模型思考过程中调整方向,配合更高效的思维链设计,可大幅减少任务所需的token数量。"GPT-5.4是我们迄今最高效的推理模型,解决问题所需token数显著低于GPT-5.2。"OpenAI在声明中强调。这对通过API按token用量计费的开发者构成直接利好。
目前该模型正逐步推送,多数用户仍在使用仅支持即时回复的GPT-5.3。依赖深度思考功能的复杂任务用户则停留在GPT-5.2版本——这意味着最可能挑战模型极限的用户群体反而最后获得升级。
企业级应用优势
文档密集型工作企业成为最直接受益者。在内部电子表格建模测试中,GPT-5.4取得87.3%的评分(GPT-5.2为68.4%)。法律研究机构报告其专业评估达91%准确率,而某运行于三万个财产税门户的智能体系统则实现95%首次尝试成功率,会话速度提升约3倍的同时减少70%token消耗。
此类效率提升虽能打动企业采购团队,但对正在权衡是否保留账户的个人用户而言,技术参数优势尚需转化为更直观的体验革新。

资金费率
资金费率热力图
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
账号安全
资讯收藏
自选币种