自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

OpenAI发布GPT-5.5,智能体任务与14项基准测试超越Opus 4.7

2026-04-24 03:26:32
收藏

OpenAI发布GPT-5.5:面向自主多任务处理的新一代智能模型

4月23日,OpenAI正式推出代号为“Spud”的GPT-5.5模型,并将其定位为迄今最擅于自主执行多步骤任务的智能系统。

智能化编码能力的突破

此次发布恰逢Anthropic公司在一周前将Claude Opus 4.7全面开放使用,使得双方在智能体任务领域形成直接竞争。GPT-5.5被设计为能够自主规划任务、调用工具、检查输出结果并进行迭代优化,无需持续人工干预。公司总裁格雷格·布罗克曼在媒体沟通会上称其为“新一代智能形态”,认为这标志着向“更自主、更直观的计算模式”迈进。

该模型现已面向ChatGPT Plus、Pro、Business及Enterprise用户开放,同时推出了功能更强大的Pro版本。其API定价设定为每百万输入token 5美元,每百万输出token 30美元,上下文窗口容量达百万token级别。

与竞品的性能比较

根据OpenAI公布的数据,GPT-5.5在Terminal-Bench 2.0测试中达到82.7%的准确率,显著高于Opus 4.7的69.4%。在FrontierMath Tier 1至3级数学测试中,新模型取得51.7%的成绩,相较Anthropic旗舰模型的43.8%展现优势。

在计算机应用场景中,GPT-5.5在OSWorld验证测试中以78.7%的准确率略高于Opus 4.7的78.0%。其Pro版本在网页浏览任务中表现更为突出,达到90.1%的准确率,远超竞品的79.3%。不过评测者认为Opus 4.7在研究性文本撰写、指令遵循精度以及约375万像素的高分辨率图像识别方面仍具优势。

行业更新节奏持续加快。GPT-5.5距上一代GPT-5.4发布仅隔六周,而Anthropic在推出Opus 4.7之前已于二月发布Opus 4.6。与此同时,谷歌也持续在企业级市场推进Gemini 3.1 Pro模型的发展。

展开阅读全文
更多新闻