从"Token竞赛"到"Token节流":月人均成本7500美元,天价账单倒逼巨头集体踩刹车

华尔街见闻06-19 20:04

企业AI支出正经历一场方向性逆转。曾用排行榜激励员工大量消耗Token的科技巨头们,如今已纷纷为AI使用设置上限,"tokenmaxxing"(极限消耗)迅速让位于"tokenminimizing"(极限节流),一轮席卷AT&T、Meta、Uber、沃尔玛亚马逊等Fortune 500巨头的AI预算管控浪潮正全面到来。

据The Information报道,AT&T已开始限制部分员工访问微软旗下GitHub Copilot的权限;Meta则在收紧员工在Anthropic及其他AI服务商上的支出,与数月前员工相互竞争、争相消耗Token的热闹景象形成鲜明反差。据彭博此前报道,Uber和沃尔玛已相继对AI编程工具的使用设置上限;据英国《金融时报》报道,亚马逊已废除按AI使用量为员工排名的内部排行榜。

驱动这一转变的是迅速膨胀的成本压力。AI使用强度最高的企业,每名员工每月AI支出已高达7500美元。即便各模型的单Token价格持续走低,反复调用模型的智能体(agentic)工具仍令企业AI账单较此前翻了三倍,成本压力已超出许多企业的预算承受范围。

这一转变正重新定义AI市场的受益方。能够帮助企业监控、限制和优化AI支出的"网关"(gateway)工具与模型路由器(model router)需求快速上升,微软、Databricks以及英伟达旗下投资的Factory等公司正迎来新的增长窗口,软件供应商PalantirSnowflake亦被视为这一结构性转变的潜在受益者。

账单触目惊心:成本失控重塑预算逻辑

成本压力的累积有迹可循。Uber是迄今最极端的案例——该公司在2026年4月就已耗尽全年AI编程预算,目前已将每位员工每款工具的月度使用上限调整为1500美元。沃尔玛对其内部AI智能体的使用设置了上限;亚马逊则在发现员工为争夺排名而大量消耗算力、推高成本后,直接废除了相关排行榜。

即便在个人层面,成本消耗也令人侧目。微软发现,部分工程师每月仅在Claude Code上消耗的Token费用就高达500至2000美元。

问题的根源在于,智能体工具的普及从结构上改变了Token的消耗模式。与用户手动发送单条指令不同,此类工具在完成一项任务的过程中会反复自动调用模型,大幅推高实际用量。这使得即便单Token价格已在持续下降,企业整体账单依然居高不下。

反应分化:踩刹车还是继续踩油门?

并非所有企业都选择收紧。Box首席执行官Aaron Levie对此颇为自得。"我们从未庆祝过tokenmaxxing,"他表示,"我们没有排行榜,所以我们没有走偏——没有去激励错误的行为。"

与此形成对比的是Databricks。该公司工程领域负责人Nikita Shamgunov上周在Nebius举办的活动上表示,Databricks对工程师的AI预算不设上限,"因此tokenmaxxing依然存在"。这一立场折射出一种观点:对于相信自身员工能够高效利用AI的企业而言,限制使用未必合算。

这一分歧揭示了Token节流政策内在的张力:控制使用量固然能压降成本,但也可能同步削减AI原本承诺带来的生产率提升——而后者恰恰是企业当初为这笔支出所作的主要辩护理由。

基础设施受益:成本管控工具迎来结构性需求

"Token节流"浪潮的另一面,是对成本管控基础设施的结构性需求上升。

越来越多的企业正将简单任务从高价前沿模型迁移至更廉价或开源的替代模型,以在不削减实际使用量的前提下控制成本。Palantir和Box的高管均表示,来自企业客户的此类需求正在快速增长。

基础设施层供应商正迅速填补这一空白。微软和Databricks已分别推出"网关"工具,可帮助企业监控员工的AI使用并实施支出上限。英伟达旗下投资、估值15亿美元的AI软件开发公司Factory则于本月初发布了新款模型路由器,旨在将低复杂度任务自动分配给成本更低的模型。

微软首席执行官Satya Nadella在上周末于X平台发布的一篇文章中对上述趋势有所呼应,主张AI模型应当像可随时替换的商品一样运作。他写道:"我们任何人都不希望看到这样一个世界——每家公司在每个行业都将价值拱手让给少数几个'通吃一切'的模型。"值得关注的是,这一表态出自一位旗下生产力软件正面临Anthropic和OpenAI竞争压力的科技巨头掌门人,其背后的战略意图同样耐人寻味。

微软两面作战:推出新定价,却主打"成本可控"

在积极呼应客户降本诉求的同时,微软本周揭示了新旗舰AI产品Copilot Cowork的定价结构,其计费逻辑与Anthropic此前推出的模式高度相似。

Copilot Cowork主要依托Anthropic的模型,旨在微软Office 365软件内自动完成复杂的多步骤任务——例如,用户可将一批收据截图发送给该工具,由其自动生成包含相应费用信息的电子表格。这远超现有365 Copilot所能处理的基础任务(如汇总邮件或在Excel中建立财务模型)的范畴。

定价方面,用户须先持有月费起价30美元的365 Copilot授权,再按照Copilot Cowork的实际使用量额外付费。这一"座位费+消耗量"组合计费模式,与Anthropic今年早些时候向企业客户推出的收费方式如出一辙。

面对企业客户对AI成本飙升的普遍担忧,微软执行副总裁Charles Lamanna在周二的博客文章中表示,客户"可以选择管控成本的方式",包括为员工设置Copilot Cowork的使用上限。与此同时,微软还预告了允许客户将Copilot Cowork中的Anthropic模型替换为来自OpenAI或微软自身的其他模型的功能,声称可在相近效果下实现更低成本;据一位知情员工透露,微软还在测试可在部分场景下替换Anthropic模型的开源模型选项。上述布局表明,在"Token节流"时代,如何在维持产品竞争力的同时缓解客户的成本焦虑,已成为企业软件市场新一轮竞争的核心命题。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment