高盛深度报告：即将到来的拐点——解码AI智能体经济

华尔街见闻05-06

智能体AI（Agentic AI）正在将人工智能行业从成本叙事转向利润叙事。高盛认为，随着token消耗量即将出现跃升式增长，而底层算力成本的下降速度已超过token定价的降幅，超大规模云厂商和大模型提供商的毛利率拐点或将在未来3至12个月内到来。

据追风交易台，高盛5月5日发布报告称，该行预计到2030年，消费端和企业端AI代理合计将推动全球token消耗量较2026年水平增长24倍，达到每月约120千万亿个token；若以2040年企业端代理达到峰值采用率计算，这一数字将进一步扩大至55倍。

与此同时，高盛的推断价格与成本曲线显示，主流大模型token定价已从此前每年约40%的降幅趋于稳定甚至小幅回升，而英伟达、AMD、谷歌TPU及Trainium等芯片驱动的每token算力成本仍在以每年60%至70%的速度持续下降，两条曲线的剪刀差正在为行业打开利润空间。AI基础设施的大规模资本开支，或将因利润率改善而获得更可持续的经济支撑。

Token经济学拐点：成本下降快于价格，利润空间正在打开

高盛报告的核心论点在于，AI行业正从"推理经济不确定、可能摊薄利润"的阶段，迈向"token增量以具吸引力的边际利润落袋"的新阶段。

在AI周期的第一阶段，投资者普遍将算力和token视为成本驱动因素——更多使用意味着更多推理负载、更多加速器、更多电力和更高资本开支。但高盛的推断价格与成本曲线表明，这一逻辑正在发生转变。

主流大模型token定价虽已大幅下降，但目前已趋于稳定，部分情形下甚至出现回升；与此同时，英伟达、谷歌TPU（博通）、AMD和Trainium（Marvell）的每token全成本仍在快速且持续地下降。若token定价稳定在高于token成本的水平，则智能体AI采用率的提升将带来正向利润扩张，而非仅仅是收入增长。

高盛进一步指出，智能体AI可能形成自我强化的经济飞轮：更低的每token算力成本催生更丰富、更复杂的代理；更丰富的代理通过更长的上下文、更多循环、更多验证和持续监控消耗更多token；更高的利用率改善AI基础设施的经济性，进而支持提供商持续投入模型质量和分发能力。高盛认为，这一飞轮与市场上"AI使用将带来不可持续成本负担"的主流叙事截然不同。

不过，高盛也提示风险：并非所有AI工作负载都能保证实现正向利润拐点。对于商品化程度较高的纯文本聊天机器人，竞争仍可能迫使token定价的下降速度快于算力成本。

消费端代理：从碎片化对话到"常驻"助手，token消耗将增12倍

高盛估计，到2030年消费端AI代理可将全球token消耗量提升12倍，每月新增约60千万亿个token。

报告将消费端代理分为两类：一是"按需型"代理，如OpenAI Operator、Claude Code等浏览器端代理，由用户发起任务后自主规划、执行并返回结果；二是"常驻型"代理，如持续在后台运行的邮件监控、日程管理或数字生活助手。高盛认为，最大的token消耗跃升将发生在代理从用户发起任务转向持续后台运行的阶段——代理持续监控上下文并在需要时主动行动。

从模拟数据来看，普通LLM聊天机器人每次会话消耗约1,000个token，嵌入式Copilot每天消耗超过5,000个token，而常驻型代理每天的token消耗量可超过100,000个。

高盛预计，到2030年每日AI查询量将从2025年的约50亿次增至约230亿次，其中最多30%将流向搜索、购物、旅行、邮件及个人生产力等领域的代理。与此同时，传统搜索引擎在查询量中的份额预计将从2025年的68%降至2030年的36%，LLM原生应用的份额则将从12%升至31%。

企业端代理：工作流复杂度驱动token强度，2040年消耗量或达55倍

高盛预计，企业端AI代理将成为最大的token乘数，到2030年推动全球token消耗量增长24倍，到2040年峰值采用时进一步增至55倍，届时企业端工作负载将占全球token总使用量的70%以上。

企业端代理之所以比消费端代理更具token强度，在于其工作流要求代理执行更复杂、更精确的操作——监控任务、检索上下文、推理异常、验证输出、更新系统并在整个工作日中持续上报问题。此外，企业代理往往涉及更重的多模态输入（语音、图像、文档、屏幕活动、应用数据、日志及结构化系统记录），这将显著提升token强度。

高盛通过构建模拟代理对不同职业的token消耗进行了量化测算。

结果显示，编程代理每天消耗约700万个token，API成本约为13美元/天，远低于人工成本，这解释了为何软件开发领域的代理采用速度最快；呼叫中心代理每天消耗约200万个token，但若依赖实时语音处理，成本可高达92美元/天，使全面语音自动化在经济上仍不具竞争力；数据录入代理每天消耗约2,500万个token，成本约为60美元/天，仍低于人工成本。

高盛指出，企业端代理的采用速度将取决于token量、API成本、模态组合和实施复杂度四个变量。以文本为主、工具生态成熟的工作流将率先规模化；以语音为主或深度集成后台系统的工作流则可能进展较慢。

从采用曲线来看，高盛认为企业端智能体AI最可能遵循S型曲线，预计峰值采用率约为35%至40%的知识工作者，达峰时间约为15年，快于历史技术扩散的中位数（29年）。

资本开支可持续性：利润改善为超大规模云厂商提供更大空间

高盛报告的一个关键投资结论是：超大规模云厂商利润率的改善，将使当前高企的基础设施投资更具可持续性，从而化解市场对AI资本开支回报的核心疑虑。

报告指出，目前运营商在满足当前及未来算力需求方面仍受供给约束，谷歌和Meta均已上调2026财年资本开支预期，亚马逊管理层在一季度财报后也重申了维持高资本开支的策略。高盛预计，随着利润拐点临近，投资者将越来越多地寻找回报可见性的证据。

在具体标的方面，高盛对亚马逊的核心逻辑在于AWS收入增速重新加速（一季度同比增长28%），并拥有3,640亿美元的收入积压订单；对谷歌的看法基于其云业务一季度同比增长63%、积压订单环比近乎翻倍至约4,600亿美元；对Meta的判断则基于其广告业务增速显著超越数字广告行业整体，以及AI算力在提升用户参与度和广告变现方面的持续贡献。

在软件领域，高盛认为更低的token成本使软件厂商更容易将代理嵌入现有产品而不显著影响毛利率，同时支持围绕成果、生产力或工作单元而非单纯席位数量进行定价，从而扩大软件可寻址市场。对于IT服务公司，随着代理将AI消费从独立工具转向企业级、高集成度的工作流改造，对集成、治理和托管编排的需求将大幅提升，Accenture被视为这一趋势的主要受益者。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

高盛深度报告：即将到来的拐点——解码AI智能体经济

Token经济学拐点：成本下降快于价格，利润空间正在打开

消费端代理：从碎片化对话到"常驻"助手，token消耗将增12倍

企业端代理：工作流复杂度驱动token强度，2040年消耗量或达55倍

资本开支可持续性：利润改善为超大规模云厂商提供更大空间

Comments