算力“阶级森严”？大厂优先内供、小厂无米下锅，硅谷掀起新一轮GPU“断供潮”

华尔街见闻04-24

微软、亚马逊等云巨头优先英伟达GPU分配给内部及头部客户，导致AI初创企业陷入算力短缺与成本飙升困境。价格上涨、等待延长与严格准入并存，部分公司被迫转向自建算力。资源向头部集中虽提振云厂利润，却加剧创业生态分化，算力正成为AI竞争的核心门槛。

微软、亚马逊等云巨头正将英伟达GPU优先分配给内部团队及头部客户，中小AI初创企业陷入"一芯难求"困境，算力资源的争夺正在硅谷掀起新一轮结构性危机。

据The Information报道，此轮供应紧缺已波及多家获得红杉资本、Founders Fund、General Catalyst及Andreessen Horowitz等顶级机构支持的AI初创公司。General Catalyst管理合伙人Hemant Taneja已向其投资组合创始人发出调查问卷，询问算力获取情况，并在问卷中直言："我们听到很多人反映，算力——尤其是GPU访问——是今年面临的最大瓶颈之一。"

供应收紧直接推高了租用价格，云服务商的利润率因此获得提振，但初创企业的运营成本随之大幅攀升。与此同时，微软Azure已向内部员工明确表示，客户应预期漫长的等待时间至少将持续至2026年底，算力格局的重塑正在深刻影响整个AI创业生态。

历史重演，但烈度更甚

此轮GPU短缺与2023年初的情形颇为相似——彼时云服务商同样从云服务中抽调算力，优先支持内部团队及OpenAI等核心客户，Andreessen Horowitz和Index Ventures等风险机构最终不得不自行组建GPU资源池，以缓解投资组合公司的燃眉之急。

然而，当前局面的严峻程度有过之而无不及。The Information指出，AI编程工具的爆发式需求正在加剧这一短缺，Anthropic等大型AI开发商对算力的需求激增，进一步挤压了留给中小客户的空间。

另一个加剧短缺的结构性因素在于：大量AI初创企业此前签订的两至三年云服务合同正陆续到期，云服务商借此机会向客户开出更高价格，或直接将算力重新分配给出价更高的买家。

微软"用进废退"，分级制度明确排序

微软的算力分配机制已形成清晰的等级体系。据一名掌握内情的微软员工透露，Azure将客户划分为三个层级：

Tier 1为约1000家云支出最高的大客户，享有优先访问权；

Tier 2为支出规模次之、但仍配有专属销售代表的客户；

Tier 3则是规模较小的企业，其关系由CDW等微软经销商合作伙伴代为管理。

在芯片准入门槛上，微软近几个月开始要求希望获得英伟达Blackwell芯片的客户，至少承诺租用1000块芯片、期限不低于一年，合同金额至少达数千万美元。即便是租用旧一代英伟达芯片，客户也需等待数周乃至数月。

更值得关注的是微软的"用进废退"政策：对于按需付费获得GPU访问权限的客户，微软会追踪其使用率，一旦服务器闲置哪怕数小时，便可能撤销其访问权限。通过"微软初创企业计划"获得免费算力积分的初创公司同样面临这一规则——若未能充分利用芯片，将被取消GPU访问资格。

初创企业：涨价、被"鸽"、抢不过大客户

图像生成AI初创公司Krea的遭遇颇具代表性。这家成立四年、已从Andreessen Horowitz和Bain Capital Ventures等机构融资8300万美元的公司，六个月前以每小时每块芯片2.80美元的价格签下了数百块英伟达Blackwell芯片的六个月合同。

然而当Krea近期寻求更多服务器以从头训练新模型时，局面急转直下。联合创始人兼CEO Victor Perez表示，部分云服务商的销售代表直接不接电话；等到对方回电，不仅告知价格大幅上涨，还要求签订三年期合同才愿意洽谈。"有些直接消失，有些说没有货，还有些试图让我们接受极其苛刻的条款，"Perez说。

最终，Krea以每小时3.70美元的价格签下一年期合同，较上次合同价格上涨32%。与此同时，另一位寻求租用近1000块GPU紧密集群的初创企业创始人表示，英伟达销售人员上周告知他，在大型云服务商处找到此类集群极为困难——该集群每日租金将超过7万美元。

GPU云服务商Lightning AI的数据则从供需角度印证了这一紧张态势：

该公司目前在线GPU约4万块，但来自约40家客户的待处理订单合计需求约40万块。CEO Will Falcon表示，过去六个月价格已上涨逾25%，从每小时约1.60美元涨至逾2美元，部分情况下还要更高。

部分创始人选择"脱云自建"

面对漫长等待和不断攀升的租用成本，部分初创企业创始人开始考虑绕开云服务商，自行购买GPU。

AI代理初创公司Collide的创始人Collin McLelland表示，该公司正考虑花费约50万美元直接购买英伟达GPU自行运营。Collide去年完成1400万美元种子轮融资，专注于为油气行业开发AI代理产品。McLelland计划直接向数据中心或云服务商租用机房空间托管自购GPU，以规避租用模式下的等待时间和不确定性。

"对我们来说，在需要算力时却没有算力，是最大的风险，"McLelland说，"大多数人只是害怕硬件。我拥有过油井，所以对此已经麻木了。"

尽管短期内自购GPU的成本远高于租用，但他认为从多年维度来看，综合成本反而更低，且能彻底摆脱对云服务商的依赖。

云厂商利润受益，但生态隐忧浮现

对云服务商而言，此轮供应紧缺带来了久违的利润改善。此前部分云厂商在GPU业务上盈利承压，而当前的供需失衡使其得以提高租用价格，边际利润率随之回升。

然而，这一格局对AI创业生态的长期影响不容忽视。算力资源向头部客户高度集中，意味着中小初创企业在模型训练和产品迭代上将面临更高门槛和更大不确定性。General Catalyst正在研究通过建立共享算力池或代表初创企业直接谈判等方式，帮助投资组合公司获取GPU资源——这与2023年风险机构自建GPU池的应对思路如出一辙，折射出算力获取已成为AI投资生态中不可回避的结构性挑战。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.