AI推理基础设施市场正面临一轮显著的成本与供给冲击。
在美国知名风投机构Altimeter近期举办的活动上,AI推理基础设施服务商Baseten首席执行官Tuhin Srivastava透露,其云服务商已于今年5月提前通知,英伟达B200 GPU的每小时租赁单价将在10月合同续约时,从现行的2.63美元涨至5.10美元,涨幅约94%。
他强调,这一数字的关键不在于绝对价格水平,而在于其所折射出的供需失衡程度——云服务商提前数月主动报价,本身即表明在算力持续紧缺的背景下,需求方已几无议价空间。
与此同时,供给端紧张态势同样未见缓和。据Tuhin Srivastava介绍,当前采购1000块GPU的交付排期已普遍延至明年第二季度,等待周期长达12至15个月。交付瓶颈与租赁价格上涨形成叠加效应,企业即便加大投入,短期内亦难以通过采购途径补足算力缺口。价格上行与供给瓶颈双重挤压下,AI推理的成本正面临实质性抬升。
Baseten成立于2019年,总部位于旧金山,定位为生产级AI推理基础设施服务商,业务涵盖模型部署、管理、扩展与监控,提供多集群、多云环境的弹性扩展支持,并辅以性能研究与嵌入式AI工程服务。截至2026年1月,公司已完成D+轮融资,并获得英伟达战略投资。

Baseten首席执行官Tuhin Srivastava
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.
Comments