TurboQuant“横空出世”,科技圈高呼“谷歌版DeepSeek”,华尔街喊话“抄底内存股”

华尔街见闻03-26

谷歌AI内存压缩技术TurboQuant横空出世,宣称将大模型缓存内存缩减6倍、性能提升8倍,瞬间引爆市场恐慌——美光科技、闪迪等存储巨头盘中重挫逾5%。然而华尔街投行却高呼"抄底":有分析认为,历史经验表明压缩算法的存在从未从根本上改变硬件采购的整体规模,摩根士丹利援引杰文斯悖论指出,效率革命非但不会压缩硬件需求,反将激活更庞大的AI部署规模。

谷歌发布的一项新型AI内存压缩技术,不仅在科技界引发了对底层算力效率革命的狂欢,也让美股存储芯片板块经历了一场剧烈的估值重估,但华尔街机构却从这场恐慌中看到了买入良机。

周三,受该技术可能大幅削减AI硬件需求预期的冲击,美股存储芯片板块盘中遭遇重挫。截至收盘,存储芯片与硬件供应链指数下跌2.08%,闪迪美光科技等头部企业均显著收跌,凸显出市场对需求前景的防御性反应。

然而,在科技圈将这一突破性技术捧为“真实版Pied Piper”和“谷歌版DeepSeek”的同时,华尔街投行的表态却截然不同。多位分析师指出,该技术的实际影响被市场过度计价,并直言投资者应借机买入回调的内存概念股。

尽管实验室数据展示了惊人的压缩效率,但从宏观经济学与算力部署的真实演进来看,这项旨在打破AI内存瓶颈的技术,最终可能不仅不会摧毁存储需求,反而会成为推动行业进一步扩张的催化剂。

存储板块应声下挫

谷歌发布名为TurboQuant的内存压缩算法后,市场对存储硬件长期需求的担忧迅速蔓延,导致相关资产遭到抛售。

周三盘中,存储芯片板块集体下探。闪迪一度大跌6.5%,美光科技跌4%,西部数据希捷科技分别跌超4%和5%。随着市场情绪在尾盘有所消化,相关个股跌幅收窄。截至收盘,闪迪和美光科技均跌超3.4%,希捷科技收跌2.6%,西部数据跌幅收窄至1.6%。当日,存储芯片与硬件供应链指数报收于113.03点,盘中一度触及109点的日内低点。

引发市场恐慌的直接原因,是谷歌宣称TurboQuant可在不损失准确性的前提下,将大型语言模型运行时的缓存内存占用至少减少6倍。在高度依赖硬件规模扩张的AI军备竞赛逻辑下,任何可能削减物理内存采购量的技术进步,都足以让本已处于高估值的芯片板块面临抛压。

“真实版Pied Piper”与“谷歌版DeepSeek”

在科技业界,TurboQuant的发布被视为解决大语言模型高昂运行成本的重要里程碑。该技术专为解决AI系统中的键值缓存(KV Cache)瓶颈而设计,核心是将原本占用大量空间的缓存压缩至3比特。

据媒体报道,谷歌采用两步压缩法:先通过PolarQuant技术将数据向量转换为极坐标以消除额外的归一化开销,再利用量化算法QJL消除残差误差。

在采用Gemma和Mistral等开源模型的测试中,该算法不仅实现了6倍的内存缩减,在英伟达H100 GPU上的性能较未量化的32位方案更是提升了最高8倍。

这一惊艳的数据在互联网上引发热议,人们将其戏称为“真实版Pied Piper”——即HBO经典美剧《硅谷》中那家凭借无损压缩算法颠覆行业规则的虚构初创公司。Cloudflare首席执行官Matthew Prince等人则将其称为谷歌的“DeepSeek时刻”,认为其有望像DeepSeek一样,通过极高的效率收益大幅拉低AI的运行成本。

华尔街无惧冲击,高呼“抄底”

面对科技圈的狂热与二级市场的抛售,华尔街投行表现出显著的冷静,并认为市场反应过度。

Lynx Equity Strategies分析师KC Rajkumar对该技术的“颠覆性”提出质疑。他在给客户的报告中指出,媒体对该技术的报道存在夸大成分。

他表示,当前的推理模型早已广泛采用4比特量化数据,谷歌所谓的8倍性能提升是建立在与老旧的32位模型对比之上的。他强调,这些先进的压缩技术仅仅是为了缓解算力瓶颈,并不会破坏未来三到五年内因供应受限而依然坚挺的内存与闪存需求。为此,他维持对美光科技700美元的目标价及买入评级,并明确表示建议“在因谷歌消息引发的回调中买入”。

Wells Fargo分析师Andrew Rocha同样指出,尽管TurboQuant直击AI系统的内存成本曲线,但历史经验表明,压缩算法的存在从未从根本上改变硬件采购的整体规模,目前AI内存的需求基本面依然强劲。

杰文斯悖论再现,长期需求或受提振

除了指出市场反应过度外,机构还从更长远的经济学视角重新评估了TurboQuant的影响。

摩根士丹利在分析中指出,TurboQuant仅作用于推理阶段的键值缓存,完全不影响模型训练任务,也不影响模型权重所占用的高带宽内存(HBM)。该技术的核心意义在于提升单GPU的吞吐量,使相同硬件能支持更长的上下文或更大的批处理规模。

摩根士丹利进一步援引了“杰文斯悖论”(Jevons Paradox)来阐释这一现象:技术效率的提升往往会降低使用成本,从而激发出更庞大的总需求。通过大幅降低单次查询的服务成本,TurboQuant能够让原本只能在云端昂贵集群上运行的模型迁移至本地,有效降低AI规模化部署的门槛。

这意味着,效率提升将激活更多原本受制于成本而无法落地的AI应用场景。投行总结称,该技术重塑了AI部署的成本曲线,对算力与内存硬件的长期影响不仅不是利空,反而呈现出“中性偏正面”的积极信号。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment
1