当微软都烧不起Token了,“模型路由”成为企业AI的“核心需求”

华尔街见闻06-18 14:57

AI Token成本正在重塑企业AI的底层逻辑,而微软的一个内部决策,将这场变局推到了台前。

据华尔街见闻此前文章,微软正考虑将开源模型DeepSeek V4的微调版本引入其企业AI工具Copilot Cowork,作为OpenAI和Anthropic模型的低成本替代选项,并预计在未来数周内公布最终选择。

与此同时,微软已宣布将Copilot Cowork从无限制使用模式切换为按计算量计费。这一系列动作释放出一个清晰信号:即便是微软,也已无法承受无节制的模型调用成本。

这一消息在企业AI市场引发广泛共鸣。追踪AI Token价格的Silicon Data Token指数已连续13个交易日中有12个交易日下跌,直奔近期低点。成本压力正在从个别企业蔓延为行业性议题,而“用哪个模型”的问题,正在让位于“如何用得起模型”。

当“用得起”取代“用得强”成为企业的优先级,“模型路由”——根据任务复杂度动态匹配最经济模型的能力——不再是技术选型,而是决定AI项目能否算得过账的核心需求。

微软的成本困局:无限使用模式走到尽头

微软Copilot Cowork此前向企业用户提供无限制使用,但这条路已难以为继。

微软负责Copilot业务的执行副总裁Charles Lamanna直言:"有些用户每周完成数百项任务,效率很高——但代价是成本可以飙得非常高。"

为此,微软宣布将Copilot Cowork切换为按计算量计费的使用模式,并同步探索引入DeepSeek V4微调版本或其他开源模型,以大幅压低模型调用成本。背后的逻辑直接:中美模型在输入/输出Token定价上存在显著差距,开源模型的成本优势已无法忽视。

这一决策折射出整个企业AI市场的共同困境。前沿模型能力越来越强,但调用成本也水涨船高——以Fable 5为例,其输出Token成本较Opus 4.8在同类任务上高出约180%。更高的智能,正在带来更难以消化的账单。

Token经济学:下一个六到十二个月的主导议题

成本压力已经渗透进企业AI采购的每一个环节。

Mason Daugherty在社交媒体上表示,在他过去约两个月与客户的每一次对话中,全组织范围内的Token支出都被提及为一个令人担忧的问题。他预测,"Token经济学"将成为未来六到十二个月讨论AI采购与使用时的主导主题。

他指出,随着大型供应商的年度企业合同陆续进入续签周期,管理层已开始质疑是否还能以相同乃至更高的价格续约。与此同时,前沿API与自托管开源模型之间的成本差距正在持续扩大,这正是开源模型采购加速的直接驱动力。

Silicon Data Token指数的持续下行,印证了这一趋势的市场层面影响——Token定价的竞争压力已经在数据上留下痕迹。

架构才是护城河:模型路由成为企业AI的核心能力

在成本压力下,企业AI的竞争焦点正在发生根本性转移。

企业AI平台Glean的Arvind Jain指出,企业AI最大的瓶颈已不再是模型智能本身,而是"Token产出效率"——即系统每消耗一个Token能产出多少有效工作。他强调,企业AI的大部分成本并不在提示词本身,而在于模型周围的系统:检索、工具调用、记忆管理和多步推理。一个十一个词的请求,一旦系统开始收集上下文并逐步处理任务,可能扩展为数千乃至数万个Token。

Jain认为,真正的竞争优势不来自最激进地使用最强大的模型,而来自能够将正确的模型与正确的推理层级匹配到对应任务的AI架构——即具备强大路由能力、支出管控和治理机制的系统。"前沿智能正在变得充裕,高效执行却并非如此。"

这一判断与微软的实际动作高度吻合:引入低成本模型作为替代选项,本质上正是在构建一套模型路由机制,而非简单地"换一个便宜模型"。

纳德拉的警告:谁拥有学习循环,谁才拥有主权

微软CEO Satya Nadella近日提出了一个更宏观的框架,为上述趋势提供了战略注脚。

纳德拉表示,每家公司都必须构建他所称的"Token资本"与"人力资本"——前者指企业自有的AI能力与系统,后者指员工的知识、关系与判断力。他将两者定义为在AI经济中立足的核心资产,并强调人力资本的价值不会随Token资本的增长而下降:"没有人的方向,你只是让算力在原地打转。"

他明确指出,真正的机会不在于选择最强的模型,而在于在模型之上构建一个持续学习的循环,让人与AI的能力相互复利增长。关键的检验标准是:企业能否在更换底层基础模型的同时,不丢失自身积累的专有知识与能力。"这是你在未来时代掌握控制权与主权的核心测试。"

纳德拉同时发出警告,若所有价值最终集中于少数几个主导模型,将重演全球化掏空工业经济的历史。他表示:"没有任何社会许可,支持一个让整个行业空心化的AI未来。"这番表态,恰恰发生在微软自身正考虑引入开源替代模型、主动分散对少数头部供应商依赖的节点上,其内在张力耐人寻味。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment