亚马逊AI翻身战:靠卖Claude Tokens,AWS利润率碾压微软和谷歌

华尔街见闻05-28

AI云业务普涨的时代,利润率成了真正的分水岭。AWS凭借一套将Claude token需求转化为经营杠杆的独特结构,正在与Azure、Google Cloud拉开差距。

最新数据显示,AWS在2026年一季度EBIT利润率环比提升213个基点,而同期Azure利润率走弱,Google Cloud利润率改善有限且存在会计口径差异。亚马逊是唯一一家将代币即服务 (TokenaaS) 作为其人工智能业务主要组成部分的云服务提供商 (CSP)。

研究机构SemiAnalysis分析师Jeremie Eliahou Ontiveros将这一分化归因于三点:"AWS在第三方模型API支出中的更高份额、Anthropic/Bedrock交易结构,以及Anthropic在2026年一季度ARR超预期。"这不是"AI需求强,所以利润好"的简单逻辑,而是一套从算力出租商向模型分销平台跃迁的结构性转变。

关键信号在于:Bedrock目前约为55亿美元run-rate规模,仅占AWS总收入约4%,却贡献了AWS同比新增毛利额的30%。只要Anthropic需求持续爆发,这一杠杆效应将继续放大。

结构差异:AI占比低,利润率反而更高

云厂商都在吃AI需求,但分化发生在利润率,而非收入增速。

从AI收入占总收入比例来看,AWS并不领先。测算显示,AWS的AI收入占比从2024年一季度的2%升至2026年一季度的10%,而同期GCP和Azure分别达到36%和27%。

但高AI占比没有自动带来高利润率。Azure和GCP的AI业务仍以AI IaaS为主,占各自AI业务组合超过80%。AWS的结构则在发生变化:Bedrock占AWS AI收入的比例从2025年一季度的9%,升至2026年一季度的37%。

这解释了一个表面矛盾——AWS的AI收入占比远低于竞争对手,利润率却跑出来了。问题不在"AI多不多",而在"AI收入是哪一种"。

Bedrock模式:从卖算力到拿分销权益

Bedrock是AWS的模型调用平台,客户可通过统一账单、安全合规框架接入Claude等前沿大模型。它的竞争对手包括Microsoft Foundry、Google Gemini Enterprise Agent Platform,以及TogetherAI、Fireworks等偏开源模型的平台。

这类平台的核心差异不在模型数量或延迟指标,而在能否接入前沿模型。前沿大模型贡献了AI API行业的大部分收入,AWS、微软谷歌相较其他endpoint平台的优势,正在于此。

但接入模型只是第一步。Bedrock对AWS利润率的真正意义,在于其交易结构。在AWS通过Bedrock分销Claude token的安排下,Anthropic作为seller of record确认完整的token销售收入;客户由AWS开票,模型部署在AWS基础设施上;AWS则获得两部分收益:类似EC2/IaaS的基础设施费用,以及分销或收入分成。

相比五年期take-or-pay式的IaaS合同,这类Token-as-a-Service(TaaS)业务收入锁定性更低,但利润率更厚。对Anthropic/Bedrock安排的测算显示,固定IaaS费用、收入分成与超量绩效门槛叠加,使Bedrock在2026年一季度实现了约55%的EBIT利润率。代价也很明确:若Claude token消费下滑,AWS承担的需求风险高于传统IaaS。

目前,亚马逊、微软、谷歌的TaaS业务ARR均已达到百亿美元以上量级,Oracle和neocloud在这一层几乎没有规模——这是超大云厂商与其他AI算力提供商差距被拉大的关键所在。

Anthropic爆发:AWS利润杠杆的核心燃料

Bedrock高度绑定Anthropic需求。测算显示,Bedrock 80%至90%以上的客户使用Anthropic模型,Bedrock实质上是一个由Claude需求驱动的业务。

Anthropic自身的增长数据极为突出。其2026年一季度净新增ARR为210亿美元,总ARR达到300亿美元;API收入同比约增长13倍,年底ARR有可能远超1000亿美元。Claude Code在企业客户中的快速铺开是重要驱动,消费者侧流量也开始向Claude迁移。

利润率同样大幅改善。Anthropic推理毛利率已升至60%中段,相比2025年的38%和2024年的-94%实现大幅修复。Anthropic越快增长,Bedrock上Claude token消费越大,AWS拿到的基础设施费和分销分成也越多。

这种借力关系在财务数据上已有体现。2026年二季度的路径假设更为激进:Bedrock占AWS AI收入比例有望升至53%,并为AWS总收入增长额外贡献9个百分点。

容量布局:提前锁电,才接得住TaaS需求

TaaS要做大,前提是有足够的推理算力按时交付。AWS在这一点上比多数同行更为激进。

数据中心模型显示,AWS在2025年至2027年的新增容量上持续领先;微软在2024年至2026年节奏接近,但到2027年被明显拉开。更重要的是,微软内部AI项目消耗的算力高于亚马逊,且大量AI算力通过长期合同锁定给了OpenAI——仅OpenAI相关积压订单规模,就是Azure全年收入的2.5倍。

AWS则更早将电力和容量当作市场份额问题处理,与Talen、Vistra、NiSource等独立电力生产商签下数十亿美元级PPA,并在印第安纳和密西西比推进接近2GW规模的建设。微软此前曾经历约一年的数据中心建设暂停,拉低了2027年容量预测;威斯康星大型AI集群进展也慢于AWS同类项目。若要追赶,微软只能从neocloud购买更多容量,成本更高,利润率也将承压。

AWS还在推进更高模块化和预制化比例的新数据中心设计。对AI推理业务而言,这直接关系到收入的交付能力。

自研芯片:在分销费之外压低底层成本

Bedrock模式对自研芯片天然友好——客户购买的是token,不关心底层跑的是英伟达GPU还是Trainium。这给了AWS一个额外的成本杠杆。

Trainium在高batch推理、强化学习等对内存带宽敏感的工作负载中具备较好的性能/总拥有成本表现。AWS CEO Matt Garman在2025年11月披露,Trainium已支撑超过50%的Amazon Bedrock token使用量。

CPU侧同样值得关注。前沿大模型训练和推理对CPU需求上升,尤其在强化学习和agentic工作负载中。AWS的Graviton4、Graviton5在性能/总拥有成本上具备优势,并将作为Trn3的head node集成,也可单独用于强化学习和agentic任务。AWS已与Anthropic、OpenAI、Meta签下大型CPU及Graviton相关合作,Bedrock客户基础越大,向其追加销售Graviton能力的摩擦越小。

同行落后:不是AI收入不够,而是结构没变

Azure的核心问题是AI收入仍高度IaaS化,Microsoft 365 Copilot和GitHub相关业务尚未形成同等规模的利润率拉动。

Google Cloud的Gemini API表现尚可,但没有复制Anthropic在编码市场的强势。更重要的是,Google Cloud存在会计口径差异——DeepMind的训练成本未计入GCP分部,导致其利润率与AWS不完全可比。

Oracle和neocloud的处境更为直接:主要在AI IaaS和算力租赁层竞争,TaaS几乎没有规模。一旦云业务利润低于预期,批发算力模式的脆弱性即刻暴露。

AWS这轮跑赢,依赖几条线同时成立:Anthropic需求爆发提供收入基础,Bedrock交易结构提供利润率,电力与数据中心容量提供交付能力,Trainium和Graviton压低底层成本。只要这几条线保持连接,AWS的AI业务逻辑就不只是"资本开支换增长",而是"模型需求换经营杠杆"。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment