所有人都在谈论石油,但世界真正短缺的或许是Token

华尔街见闻04-14

算力短缺正成为AI繁荣时代的核心瓶颈。OpenAI平台调用量半年内增长150%。Anthropic因频繁宕机被迫限流。供给端受制于芯片交货周期长、数据中心建设慢及电力预订告罄,短期内难以缓解。

算力短缺正成为AI繁荣时代最棘手的瓶颈。

过去几个月,随着"智能体"AI需求爆炸式增长,计算资源的供给已远远落后于消耗速度,从频繁宕机到价格飙升,裂缝正在这场技术热潮最脆弱的环节蔓延。

洛杉矶工程师兼科技投资人Ben Pouladian表示:

所有人都在谈论石油,但我认为世界真正短缺的是词元Token。

近期Anthropic旗下热门编程工具Claude Code频繁出现服务中断,该公司已开始在工作日高峰时段限制用户的token用量,但执行效果引发大量用户投诉。

与此同时,OpenAI为腾出算力支持新一代AI模型,选择关停旗下视频生成应用Sora。云计算供应商CoreWeave则将服务价格上调逾20%,并要求小客户签订至少三年的长期合约。

这场算力危机对AI行业的影响已清晰可见,就在数以百万计的企业用户将AI工具深度嵌入工作流程之际,这些工具的可靠性和可用性却同步下滑,由此引发的信任损耗,可能成为前沿AI公司在激烈用户争夺战中难以承受之重。

Token,新的稀缺资源

词元Token是AI领域衡量算力消耗的基本单位,直接对应每一次模型推理背后的计算开销。

OpenAI的API平台上,词元Token调用量从去年10月的每分钟60亿次,飙升至今年3月底的每分钟150亿次,不足半年增幅达150%。

推动这一增长的核心驱动力,是"智能体"(agentic)AI的快速普及。

这类工具能够自主执行任务,从编写软件代码到为房产中介安排看房日程,正深度替代此前由人工完成的工作流程。Ben Pouladian指出:

AI已经不再只是我们站在冰箱前问一道食谱的聊天机器人,它在编排任务,它在变得更聪明。

宕机与限流,Anthropic首当其冲

自今年2月中旬以来,Anthropic旗下服务中断事件愈发频繁,部分企业客户已开始将工作负载迁移至其他AI供应商。

截至4月8日,Anthropic的Claude API在过去90天内的正常运行率仅为98.95%。这一数字在互联网行业通行标准下远不达标,行业惯例要求软件服务商承诺99.99%的可用率。

AI推理初创公司Baseten联合创始人兼首席技术官Amir Haghighat直言:

AWS、数据库、支付平台都需要极高的可用性。但AI领域的现实并非如此,而这与你希望从为应用提供智能能力的公司那里获得的服务质量相差甚远。

软件开发平台Retool创始人兼首席执行官David Hsu表示,他原本偏好使用Anthropic的Opus 4.6模型驱动公司的AI智能体工具,认为其在企业场景中表现最佳,但近期已切换至OpenAI的模型。他说:

Anthropic一直在宕机。

面对压力,Anthropic在3月底宣布,将在工作日太平洋时间早5时至11时的高峰时段对token用量实施限制。此举迅速引发用户在社交媒体上的集中抱怨。一名用户在X平台写道:

我已经好几周没触达Claude Code的限额了,但这周大概45分钟就到上限了。

讽刺的是,宕机频发的背景,恰恰是Anthropic业务的超高速增长。该公司年化营收从2025年底的90亿美元,在短短两个月内跃升至140亿美元,此后再度翻倍至300亿美元。

价格飙升,GPU租金两个月暴涨48%

供给端的紧张同步推高了算力成本。

据纽约数据服务商Ornn发布的算力价格指数,租用英伟达最新一代Blackwell芯片的每小时费用目前为4.08美元,较两个月前的2.75美元上涨48%。

云基础设施公司Vultr首席执行官J.J. Kardwell将当前局面描述为"五年多来从未见过的大规模算力紧缺"。他解释道:

问题在于,为什么不直接部署更多设备?因为交货周期太长,数据中心建设周期太长,而且2026年之前可用的电力容量已经全部提前预订完了。

美国银行分析师上月底恢复对CoreWeave的评级覆盖,给予"买入"评级,并预计该公司的服务需求至少在2029年之前将持续超过供给。

OpenAI首席财务官Sarah Friar在近期一次公开投资者视频访谈中也坦言:

我确实花了大量时间试图寻找任何临时可用的算力。我们目前在一些本来想推进的事情上做出了非常艰难的取舍,原因就是算力不够。

历史周期,基础设施永远追不上需求

这场困境并非AI行业独有,而是一个贯穿技术史的经典命题。

从19世纪的铁路扩张,到21世纪初的电信与互联网泡沫,每一轮技术热潮都伴随着基础设施建设的滞后,需求增速始终快于资源获取与产能扩张的速度。

历史经验表明,价格上涨往往是缓解供给短缺的少数有效手段之一。

然而,对于眼下正在激烈争夺用户的前沿AI公司而言,这一选项格外棘手。涨价可能直接损害用户增长,而这恰恰是它们估值逻辑的核心支柱。

如何在维持服务质量、控制算力成本与保持竞争力之间找到平衡,将是AI行业在下一阶段必须正面作答的核心挑战。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment
1