谷歌发布"TurboQuant"引发存储芯片股暴跌_新闻

免责声明：内容不构成买卖依据，投资有风险，入市需谨慎！

谷歌发布"TurboQuant"引发存储芯片股暴跌

2026-03-26 19:48:29

首尔亦难幸免——三星与SK海力士双双暴跌

2026年3月26日，冲击并未止步于华尔街。在首尔股市，市值分居KOSPI指数第一、第二位的三星电子与SK海力士同步暴跌，拖累大盘整体下行。

截至下午12时23分，KOSPI指数较前一交易日下跌163.58点（2.90%），收于5278.63点。SK海力士股价下跌5.63%至93.9万韩元，三星电子下跌4.55%至18.04万韩元。

韩国证券机构迅速指出了下跌原因。未来资产证券研究员徐相英分析称：“自谷歌发布TurboQuant技术后，市场对数据中心所用的DRAM与NAND等存储器需求放缓的忧虑加剧，美光股价下跌的余波持续扩散。三星电子与SK海力士随之走低，主导了KOSPI指数的下行。”

一日之内震撼存储器行业的“TurboQuant”

这场冲击的源头，是谷歌研究团队于前一日（当地时间3月24日）公开的一篇论文。这项名为“TurboQuant”的算法，声称能显著消除大型语言模型及向量搜索引擎在推理过程中出现的内存瓶颈。其核心主张明确：在将AI模型内存压缩至六分之一的同时保持精度无损，并能在相同GPU上实现8倍的推理速度。

KIWOOM证券研究员韩智英解释道：“TurboQuant公开后，市场形成了一种负面预期——由于相同内存可处理6倍长的对话，存储器需求或许低于此前预期。”但他同时指出：“目前仅是论文层面的算法公开，距离实际商用仍需时间。此外，在年初存储器暴涨行情后的市场疲劳尚未完全消散的背景下，这可能也成为了投资者进行额外获利了结的一个理由。”

TurboQuant技术解析

TurboQuant所针对的并非AI模型的“权重”，而是在对话过程中模型为处理中间运算结果而需存储的“键值缓存”。随着上下文窗口扩展至数百万令牌的规模，这种键值缓存已侵蚀了每会话数百GB的GPU内存，这构成了迄今为止AI推理的真正瓶颈。

谷歌研究提出的替代方案是“PolarQuant”。这是一种简化数据几何结构的技术，类似于将连续的小数表示为整数。为保持精度，研究团队应用了量化约翰逊-林登斯特劳斯变换技术，在保留原始数据与压缩数据间差异的同时，将每个结果向量表示为+1或-1的符号位，从而将内存占用降至最低。

谷歌表示，在将此项技术应用于Gemma、Mistral等开源AI模型后，在绝大部分数据得以保留的情况下，成功将键值缓存容量缩减至原来的六分之一。通过4位TurboQuant，更使英伟达H100 GPU的性能提升了8倍。

关键区别在于：与DeepSeek需从头重新设计模型架构以提升效率不同，TurboQuant完全无需重新训练或微调，可直接插入现有推理流程中。

社区验证——“确实有效”

谷歌研究的官方发布在社交平台X上获得了超过770万次浏览，引发爆炸性反响。技术分析师@Prince_Canuma已将TurboQuant移植至适用于Apple Silicon的本地AI库MLX，并对Qwen3.5-35B模型进行了直接测试。结果显示，在8500至64000令牌的上下文长度范围内，无论量化水平如何，输出结果均保持100%准确。应用2.5位TurboQuant后，键值缓存减少约五倍，且精度无损。

Cloudflare首席执行官马修·普林斯对此评论道：“TurboQuant是谷歌的DeepSeek时刻。”他分析认为：“这为优化AI推理速度、内存占用及功耗等领域开辟了更大空间。”