自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

Gemini 3.5 Flash:成本仅为Claude Opus 4.7三分之一,性能差距仅两分

2026-05-21 01:16:41
收藏

谷歌发布Gemini 3.5 Flash模型

在I/O大会上,谷歌正式推出Gemini 3.5 Flash模型。根据人工智能分析机构Artificial Analysis的智能指数评估,该模型综合得分为55分,与Anthropic及OpenAI的竞争产品性能极为接近。

定价策略

该模型已通过Gemini API、Google AI Studio、Antigravity、Vertex AI及搜索AI模式全面开放使用。其定价为每百万输入标记1.50美元,每百万输出标记9.00美元,约为GPT-5.5定价的三分之一。相较之下,Anthropic的Claude Opus 4.7每百万输入/输出标记收费分别为5美元和25美元,谷歌新模型的定价同样仅为约三分之一水平。

性能表现

独立基准测试机构Artificial Analysis给予该模型综合智能评分55分,较旧版Gemini 3 Flash提升9分。这一成绩使其与Claude Opus 4.7仅差2分,与GPT-5.5差距5分。该模型将作为默认选项在全球Gemini应用及AI模式中部署。

专业版前瞻

谷歌透露专业版本已在内部测试中,预计将于下月正式推出。当前Flash版本已达55分,专业版有望进入目前由Claude Opus 4.7和GPT-5.5主导的前沿领域。DeepMind首席技术官表示,Flash模型"在几乎所有基准测试中都超越了我们的前沿模型3.1 Pro"。据谷歌报告,该模型在Terminal-Bench 2.1获得76.2%得分,在MCP Atlas达到83.6%,GDPval-AA测试中取得1656 Elo评级,各项数据均超越今年二月发布的旗舰模型。

行业竞争态势

本次发布正值用户对高价旗舰产品产生抵制的行业背景。Anthropic于4月16日推出Claude Opus 4.7后,48小时内开发者即反馈其标记消耗量达前代产品的1.5至3倍,同时出现输出结果异常的报告。OpenAI在发布GPT-5.5时将旗舰API定价翻倍,也引发了客户类似批评。

2025年末至2026年初,谷歌开发者工具市场份额持续被Claude Code和OpenAI Codex侵蚀。尽管Gemini 3.1 Pro在理论测试中表现优异,但社区反馈褒贬不一。用户反映第三方平台使用体验不稳定,定性测试中对话风格趋于机械。

传统意义上"Flash"命名通常代表更经济的小型模型。然而3.5 Flash版本在编程与智能体测试套件中已超越前代专业旗舰,这标志着谷歌产品线的性能边界正在重新定义。

展开阅读全文
更多新闻