AI进入“按量付费与算力配给”时代--Anthropic和DeepSeek告诉我们的事

华尔街见闻05-23

Anthropic在一轮融资中向投资者展示的预测:公司一季度营收48亿美元,二季度预计升至109亿美元,6月当季有望实现5.59亿美元运营利润。此外,Anthropic一季度每赚1美元,Anthropic要在算力上花71美分;到二季度,这个比例预计降到56美分。去年它给投资者的口径还是至少要到2028年才可能实现全年盈利,眼下利润表先动了。推动这一轮变化的,是企业客户对Claude编程工具和智能体能力的需求。

需求暴涨的同时,AI的收费方式已经变了。

知名科技投资者Gavin Baker用了一句很形象的话来概括这件事:AI正在从“all you can eat”走向“pay by the drink”。他谈的是企业真实的使用场景:一个人同时放出几十个、上百个智能体,去跑代码、检索、分析和多步骤推理,平价包月越来越难覆盖背后的真实消耗。

对于企业,模型选择已经从工程偏好变成财务决策,最便宜和最昂贵的前沿模型之间,价格差可以拉到几十倍甚至上百倍。

供给侧也没给行业太多缓冲。桥水联合首席投资官Greg Jensen在一场访谈里说,现在世界上唯一比算力供应增长更快的,是算力需求;配给已经开始发生,方式包括提价、限制访问权限,甚至实验室内部暂停部分研究项目。算力、电力、存储和机架系统还在紧绷状态里,按量收费和访问限制开始同时出现,并不意外。

这背后是对市场最重要的命题:在“铲子”拿走了所有利润后,AI交易下一阶段是什么?

对此,高盛和SemiAnalysis有明显的分歧。高盛分析师James Covello盯着的是第一阶段的分账方式:过去两年最确定的一轮利润先留在了芯片、HBM、先进封装、数据中心和电力这些上游环节,云厂商先把资本开支背在自己账上,企业端ROI还没有大面积写进利润表。SemiAnalysis看的则是另一头:token已经不只是问答成本,代码、研究、建模、图表、财报分析这些工作,开始把token当成生产资料;如果高价值任务愿意为更强模型付费,缓存命中率、推理优化和硬件迭代又在持续压低单位成本,模型实验室这一层就会从烧钱层往利润层挪。

Anthropic的盈利说明顶尖模型厂并不只是在讲增长故事,代码、长链路智能体、复杂推理这些高价值任务,已经开始把收入和成本结构一起往前推。高盛原来最担心的是下游利润表还不够扎实,Anthropic至少给出了一个明确信号:在最前沿的那部分任务里,高价值token已经可以做出利润。

但Anthropic不是模型层的全部。

5月22日,DeepSeek宣布把V4-Pro API原本75%的折扣永久化。促销结束后,V4-Pro正式按原价四分之一计费:未缓存输入0.435美元/百万token,输出0.87美元;V4-Flash更低,分别是0.14美元和0.28美元。缓存命中价格也被一起压下去。报道特别提到,这种价格对agent、编程助手、客服和文档类工作流尤其敏感,因为这些场景天然依赖重复上下文和缓存。DeepSeek给开发者摆出来的也不是一个单一低价模型,而是一套更适合路由的产品梯度:Flash处理廉价日常负载,Pro处理更复杂的agent coding、长文档推理和高价值自动化任务。

这条路和Anthropic很不一样。

Anthropic代表的是美国顶尖模型厂的路径:先守住最难、最值钱、最敏感的任务,再让高端工作流去证明模型溢价。它争的是能力密度,是企业愿不愿意为更强的推理、更长的链路、更稳定的结果付更高价格。

DeepSeek更像另一条路。它没有去复制同样的高溢价闭源逻辑,而是把单位调用成本、产品层级和缓存友好度尽量做到更适合大规模部署。对很多应用来说,价格不再只是省下一点预算,而是决定某个功能能不能成立、某条工作流能不能跑进生产环境。

放到高盛和SemiAnalysis的争论里,这两家公司各自回答了问题的一半。

Anthropic证明的是,高价值token能赚钱。DeepSeek证明的是,低成本token能放量。前者抬高单次调用的经济价值,后者把总调用量的边界往外推。高盛最担心的,是下游赚不到足够多的钱,最后供不起上游已经吃到的利润和资本开支;Anthropic和DeepSeek同时出现以后,这个判断就不一样了。模型层开始出现两条不同的经营路径,而且两条路都在把蛋糕往外做。

这对上游是更偏正面的信号。原因并不复杂。Anthropic这条路证明,高价值工作负载愿意为更强模型买单;DeepSeek这条路证明,价格降到一定程度之后,大量原本做不通的调用会被放出来。只要算力和基础设施仍处在供给偏紧的状态里,上游吃到的就不只是“稀缺溢价”,还会叠加一层更大的总需求。Greg Jensen说的“配给”没有结束,反而让这件事更清楚:高价值token和低成本token都在长,供给约束还在,上游很难立刻退场。

变化更大的,可能是中间层。

当模型层不再只有一种玩法,企业真正要买的就不只是单一模型,而是调度能力:什么任务走Anthropic,什么任务走DeepSeek Flash,什么任务走DeepSeek Pro,什么任务需要高合规体系,什么任务可以大量缓存,什么任务该在高低配之间动态切换。模型分层越明显,路由、编排、工作流入口和预算控制就越值钱。

高盛的担心也没有消失。Anthropic证明的是顶尖模型厂在高价值场景里可以更早赚钱,DeepSeek证明的是低价会让更多产品成立,这两件事还不等于普通企业已经把AI成本稳定地变成利润表里的回报。DeepSeek自己的低价策略,也伴随着利润压力。这是一种用利润换触达、用规模换平台使用习惯的打法,能不能跑通,还要看架构效率、资金续航、开发者采用能不能沉淀成稳定平台使用,以及地缘和合规限制会不会拖慢全球企业渗透。

不过,市场的主问题已经变了。它不再只是问“谁卖铲子”,也不再只是问“模型厂什么时候才会赚钱”。Anthropic和DeepSeek把模型层拆成了两条路:一条把单个token做贵,一条把token总量做大。只要这两条路不是孤例,SemiAnalysis关于“利润池仍在扩张”的判断,就会比高盛那套“上游先赚满、下游供养不足”的框架更接近现实。上游还有空间,靠的已经不只是稀缺,也包括下游第一次开始用两种不同方式,把这门生意做大。

接下来几个季度,财报里最值得盯的会是几类数字:Anthropic这类高端模型的收入质量和毛利改善能不能延续,DeepSeek这类低价路线能不能把开发者采用变成稳定调用量,云厂商的资本开支能不能更顺畅地转进收入和合同,上游的内存、算力和机架瓶颈会不会继续把需求往前挤。

下一轮市场分歧,大概率就会沿着这些数字继续展开。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment