重磅GTC大会演讲之外,一文读懂黄仁勋本周向华尔街和互联网的讲话要点

华尔街见闻03-22

黄仁勋在GTC26抛出震撼弹:英伟达订单可见性已突破1万亿美元,增长仍在加速。他断言AI已进入第三拐点——智能体时代,"每个工程师将管理100个智能体";Token将成新型工资,不消耗Token的工程师形同荒废生产力。50万亿美元物理AI蓝海,正等待引爆。

在刚结束的 GTC26 期间,英伟达(NVIDIA)CEO 黄仁勋通过一场深度访谈与财务问答,向外界展示了这家市值巅峰企业的宏大蓝图。从“1万亿美元订单可见性”到“智能体(Agent)就是未来的个人电脑”,老黄不仅在卖芯片,更在重塑全球IT产业的分配逻辑。

华尔街见闻整理金句如下:

关于 Token 与价值:如果你的一名年薪50万美元的工程师,一年只花5000美元买Token,我会发疯的。如果那名50万美元的工程师没有消耗至少价值25万美元的 Token,我会深感不安。即使芯片是免费的,如果它不能跟上技术状态和我们运行的速度,它也依然不够便宜。

关于智能体与未来:每个工程师都将拥有100个智能体。在过去我们编写代码,在未来我们将编写想法、架构和规范。智能体系统是完成工作的系统,它们正在帮助我们的软件工程师完成工作。

关于Token经济学:计算机过去只是工具,未来的计算机是制造设备。人们购买这些计算机是为了生产Token,生产这些Token的有效性至关重要。你同时购买了最昂贵的计算机,并生产了成本最低的 Token。

关于市场需求与增长:我们对Blackwell加Reuben的需求、订单和需求有超过1万亿美元的强劲可见性。我们的增长率实际上正在加速。每一个软件公司、每一个公司都需要有一个OpenClaw策略。

关于竞争与架构:任何说‘我的芯片便宜 30%’的人,只是证明了他们不懂 AI。你只要呼吸空气,直到呼吸完为止。在那之后,我们将呼吸压缩液态空气,但在此之前,空气怎么样?它是免费的,我们已经用了很久了。”(注:此处指代对铜缆/电缆技术的使用极限)

财务核弹:1万亿美元的订单墙

黄仁勋在分析师会议上抛出了一个震撼数字:英伟达对 Blackwell 和 Reuben 架构的订单需求可见性已超过 1 万亿美元。

  • 增长背后的逻辑: 这一数字并非虚标,而是基于确定的采购订单和工厂建设流水线。老黄强调,英伟达的优势在于其交付周期远快于自研 ASIC 芯片的公司,甚至能实现“同季度下单、同季度出货”。

  • 毛利护城河: 面对“价值被英伟达抽走”的质疑,老黄直言:“TSMC 的晶圆全球最贵,但价值最高,所以我乐意付钱。”他认为,客户买的不是昂贵的电脑,而是全球成本最低的 Token 生产力

第三次拐点:从大模型到“智能体”

黄仁勋认为,AI 已经历了生成式、推理两个阶段,现在正处于第三个拐点——智能体系统(Agentic Systems)

  • Token 成为新工资: 未来企业雇佣工程师,发的不只是笔记本电脑,还有 Token 预算。如果一个年薪 30 万美元的工程师不消耗 Token,那他就是在荒废生产力。

  • 个人 AI 电脑的诞生: 以开源项目 OpenClaw 为代表的系统,被老黄定义为“人类历史上第一台个人人工智能计算机”。它拥有内存、调度、技能和 API,是未来 IT 产业的操作系统。

硬件新版图:Vera Rubin 与 Groq 的“联姻”

英伟达不再只是一家 GPU 公司,而是一家“AI 工厂”公司。

  • 解耦推理(Disaggregated Inference): 这是 Dynamo 操作系统的核心。通过将推理任务拆解,不同性能的芯片各司其职。

  • Groq 的角色: 英伟达收购并整合 Groq(LPX 系列)并非为了取代 GPU,而是利用其极低延迟的 SRAM 架构处理自回归推理的“最后一步”。

  • 三位一体架构: 英伟达是全球唯一能同时优化 HBM(高带宽显存)、LPDDR5 和 SRAM 的公司,这种“液冷机架化”的整机交付,让竞争对手的单点芯片显得像个“缝合怪”。

物理 AI:50万亿美元的蓝海

老黄特别看好物理 AI(Physical AI),认为其最终规模将超过数字 AI。

  • 重塑传统工业: 这是一个产值 50 万亿美元、过去 20 年几乎是科技荒漠的领域。从机器人手术、自动驾驶到智能基站,物理 AI 需要在边缘侧遵守物理定律。

  • 3-5年内的机器人爆发: 黄仁勋预言,未来 3 到 5 年机器人将随处可见。虽然中国在电机、稀土等硬件供应链上极具优势,但英伟达将提供大脑(训练、仿真、车载三台计算机)。

行业共生:英伟达是云服务商的“最佳销售”

针对云巨头自研芯片的威胁,老黄表现得极其自信:

  • 流量带货: “AWS、谷歌微软在 GTC 展位最大,是因为他们要向我的 CUDA 开发者推销服务。”英伟达通过 CUDA 生态将开发者引向云端,本质上是云服务商的获客引擎。

  • 不可替代性: 40% 的业务来自于非云巨头领域(区域云、企业私有云),这些客户买的是“全栈平台”而非“芯片”。如果没有英伟达的整机方案,这些市场根本无法触达。

以下为两场访谈的全文,由AI辅助翻译:

《All-In Podcast》访谈

主持人 (Jason Calacanis):

本周是特别节目,我们破例推迟了常规节目。通常我们只为三个人破例:特朗普总统、耶稣和黄仁勋。你可以自己排个序。Jensen,你这一年的表现太惊人了,这次活动也非常棒,每个行业、每家科技公司、每家 AI 公司都在这里。

主持人 (Chamath Palihapitiya):

去年最重大的宣布之一就是英伟达收购了 Groq。当你决定买下 Groq 时,你有没有意识到 Chamath 会变得多么难以忍受?

黄仁勋 (Jensen Huang):

我有这种预感(笑)。我们是他的朋友,每周都要应付他,我知道在结案的那六周里你得怎么对付他。

黄仁勋 (Jensen Huang):

实际上,我们的许多战略早在 GTC(英伟达 GPU 技术大会)上就已经公开展示了。两年半前,我介绍了 AI 工厂的操作系统,叫做 Dynamo。正如你们所知,Dynamo 是西门子发明的,目的是把水能转化为电能,它驱动了上一次工业革命。我觉得这是下一次工业革命“工厂操作系统”的完美名字。

在 Dynamo 内部,核心技术是 解耦推理(Disaggregated Inference)。Jason,我知道你技术很强,我让你来向观众解释一下。

主持人 (Jason Calacanis):

谢谢你没直接抢过话头。解耦推理意味着推理的处理流水线极其复杂,它是当今最复杂的计算问题。规模庞大,涉及各种形状和大小的数学运算。我们的想法是把处理过程拆解开,让一部分在某些 GPU 上运行,其余部分在不同的 GPU 上运行。这让我们意识到,甚至解耦计算也是有意义的。

这种思路引导我们收购了 Mellanox。如今,英伟达的计算分布在 GPU、CPU、交换机和网络处理器中。现在我们加入了 Groq,我们将把合适的工作负载放在合适的芯片上。我们已经从一家 GPU 公司演变成了一家 AI 工厂公司。

主持人 (Chamath Palihapitiya):

你在台上提到,高价值推理用户应该关注这一点。你说数据中心 25% 的空间应该分配给这种 Groq LPU 和 GPU 的组合。你能告诉我们,行业如何看待这种“预填充-解码解耦”的新型计算形式吗?

黄仁勋 (Jensen Huang):

退一步看,当我们加入这项技术时,我们正从“大语言模型处理”转向 “智能体处理(Agentic Processing)”。当你运行一个智能体时,你会访问工作内存、长期内存、使用工具,并对存储产生巨大的压力。智能体之间还会相互协作。

因此,数据中心内存在各种类型的模型。我们创建了 Vera Rubin 架构来处理这些极其多样化的负载。英伟达的潜在市场规模(TAM)因此增加了 33% 到 50%。其中很大一部分将是存储处理器(BlueField)、Groq 处理器、CPU 和网络处理器。这些共同构成了 AI 革命的电脑,也就是“智能体”。

主持人 (David Friedberg):

那嵌入式应用呢?比如我女儿在家里的泰迪熊想要和她聊天。里面装的是定制芯片,还是会有一套更广泛的、针对边缘侧开发的工具?

黄仁勋 (Jensen Huang):

在大规模层面上,我们认为这个问题涉及三台计算机:

  1. 第一台用于 训练 AI 模型

  2. 第二台用于 评估。比如机器人和自动驾驶汽车,必须在符合物理定律的虚拟实验室(Omniverse)中进行评估。

  3. 第三台是 边缘侧的机器人计算机。它可能是一辆车、一个机器人,或者是一只小泰迪熊。

我们还在做一件非常重要的事:将电信基站转化为 AI 基础设施的一部分。这是一个 2 万亿美元的产业,未来无线电基站、工厂、仓库都将成为 AI 的延伸。

主持人 (Brad Gerstner):

Jensen,去年你领先全球预言“推理不会只增长 1000 倍”。现在它是要增长 100 万倍还是 10 亿倍?当时人们觉得你太夸张了,因为大家都在关注训练。但现在推理需求爆炸了。

有人说你的推理工厂成本高达 400-500 亿美元,而定制芯片(ASIC)方案只要 250-300 亿,你会因此失去市场份额。你对此怎么看?为什么大家要付双倍的溢价?

黄仁勋 (Jensen Huang):

核心逻辑是:你不应该把“工厂的价格”等同于“Token 的成本”。我可以证明,一座 500 亿美元的工厂能为你产生 成本最低的 Token

因为我们的效率高出 10 倍。在 500 亿的预算中,有 200 亿是土地、电力和厂房,无论用什么芯片这些钱都要花。剩下的差额在整体成本中占比并不大。但如果我的数据中心吞吐量是别人的 10 倍,那么即便别人的芯片是免费的,他们也拼不过我们。

主持人 (Chamath Palihapitiya):

你管理着全球市值最高的公司,明年营收可能超过 3500 亿美元。你是如何决定“该做什么”的?你如何获得直觉,知道在哪里加倍下注,在哪里撤退?

黄仁勋 (Jensen Huang):

这就是 CEO 的工作:定义愿景和战略。我会被公司里优秀的科学家和技术专家启发,但我必须塑造未来。

我的标准是:这件事是不是 难到令人发指?如果很容易,我们就应该退缩,因为容易的事竞争对手会很多。我寻找的是那些从未被实现过、极其困难、且能发挥英伟达“超能力”的事。我们知道这会带来痛苦和磨难,但如果没有痛苦,也就没有伟大的发明。

主持人 (Brad Gerstner):

你能谈谈几个长线业务吗?比如空间数据中心、自动驾驶或是数字生物学?

黄仁勋 (Jensen Huang):

物理 AI 是一个巨大的类别。这是一个产值 50 万亿美元的产业,直到现在几乎还是科技的荒漠。我们 10 年前就开始布局,现在它正处于爆发点,每年为我们带来近 100 亿美元的收入。

数字生物学 正在迎来它的“ChatGPT 时刻”。我们正开始理解如何表示基因、蛋白质和细胞。在未来 5 年内,医疗行业将发生巨变。农业也是如此。

主持人 (Jason Calacanis):

英伟达最初是靠游戏玩家和发烧友起家的。你提到了“智能体”的革命,特别是开源智能体在桌面端的应用。这对于你来说意味着什么?

黄仁勋 (Jensen Huang):

过去两年有三个转折点:

  1. 生成式 AI:ChatGPT 让所有人意识到了 AI 的存在。

  2. 推理(Reasoning):像 O1 这样的模型让 AI 不仅能回答问题,还能进行推理。

  3. 智能体(Agents):最初是像 Claude Code 这样的企业工具,而 OpenClaw 将 AI 智能体带入了大众视野。

OpenClaw 之所以重要,是因为它重新定义了计算模型。它有内存、文件系统、技能(Skills)、资源调度和 API。这本质上就是人类历史上第一台 个人人工智能计算机。它是开源的,可以在任何地方运行。

主持人 (Brad Gerstner):

这种范式转移是否让现在的 AI 监管立法变得毫无意义?政治家们该如何应对这种快速变化?

黄仁勋 (Jensen Huang):

我们需要站在决策者面前,告知他们技术的真相:它不是生物,不是外星人,没有意识,它只是计算机软件。

我们不能让“末日论”影响政策。作为国家,最大的安全风险不是 AI 本身,而是当我们因为恐惧而停滞不前时,其他国家却在采用这项技术。我担心的是 AI 在美国的普及速度。

主持人 (Brad Gerstner):

关于 Anthropic 之前与国防部的风波,如果你是董事会成员,你会给他们什么建议来改变公众的恐惧感?

黄仁勋 (Jensen Huang):

Anthropic 的技术非常出色,我们也是他们的大客户。警示技术的潜力是好事,但“警示”不等于“恐吓”。

我们作为技术领袖,说话必须更加谨慎和谦虚。在没有任何证据的情况下散布“毁灭性”的言论,其伤害比人们想象的要大。现在技术对社会结构和国家安全如此重要,我们的言辞至关重要。

主持人 (Brad Gerstner):

美国公众对 AI 的支持率只有 17%。我们曾因为恐惧毁掉了核能产业,现在中国在建 100 座核反应堆,我们是零。

回到智能体,英伟达内部的生产力提升如何?大家都在讨论投资回报率(ROI)。你认为我们会看到营收像智能一样呈指数级增长吗?

黄仁勋 (Jensen Huang):

看这个会场的观众就知道了,99% 的东西都是 AI。 从生成式到推理,计算量增加了 100 倍;从推理到智能体,计算量又增加了 100 倍。两年内计算量翻了 1 万倍。

人们会为“信息”付费,但更愿意为“工作”付费。聊天机器人很好,但能帮我完成工作的智能体才真正值钱。智能体正在帮我们的工程师完成工作。我们现在还没到真正的大规模阶段,未来的增长将是百万倍级的。

主持人 (Jason Calacanis):

英伟达有 4.3 万名员工,其中 3.8 万是工程师。如果你的一名年薪 50 万美元的工程师,一年只花 5000 美元买 Token,你会怎么想?

黄仁勋 (Jensen Huang):

我会发疯的!如果一个 50 万美元年薪的工程师一年不消耗至少 25 万美元的 Token,我会非常担心。

这就像一个芯片设计师说他只要纸和笔,不需要 CAD 工具一样。这是一种范式转移,就像勒布朗·詹姆斯每年花 100 万美元保养身体一样。我们要给知识工作者“超能力”。

主持人 (Jason Calacanis):

未来两三年,这种“全明星”员工的工作效率会变成什么样?

黄仁勋 (Jensen Huang):

那些“这太难了”、“这需要太长时间”的想法将不复存在。就像工业革命后,没人会说“那个建筑太重了”一样。重力和规模不再是问题,剩下的只有 创造力

过去我们编写代码,未来我们编写“想法”、架构和规范。每个工程师未来都将管理 100 个智能体。

主持人 (David Friedberg):

我上周日晚上花了 90 分钟用智能体替换了一整套软件架构,原本这需要很多人手。这种加速感是前所未有的。

黄仁勋 (Jensen Huang):

这就是为什么 OpenClaw 如此不可思议。一些人认为企业软件行业会被摧毁,但我的观点相反:这个行业过去受限于“办公位上的员工人数”。未来将有 100 倍数量的智能体去敲击 SQL 数据库、Photoshop 和 Blender。这些工具是人类控制结果的最后途径。

主持人 (Chamath Palihapitiya):

关于开源,中国的一些开源模型非常强大。你认为 AI 的终局是去中心化的吗?

黄仁勋 (Jensen Huang):

我们需要“模型即产品(私有)”和“模型即开源”并存。 对于大多数消费者,我不想自己微调模型,我会用 ChatGPT 或 Claude。但对于垂直行业,他们需要控制自己的领域知识,这必须依靠开源模型。英伟达也在大力支持开源生态,因为这能让初创公司在第一天就拥有世界级的垂直能力。

主持人 (Brad Gerstner):

特朗普总统希望美国工业领先,希望美国 AI 走向世界。目前英伟达在某些市场(如中国)的市场份额从 95% 跌到了 0%。现在情况如何?

黄仁勋 (Jensen Huang):

特朗普总统希望我们重返战场。我们已经为许多请求采购的中国公司申请了许可证,并得到了批准。我们正在重启供应链进行发货。

如果美国不能主导 AI 技术的堆栈(从芯片到系统),那是国家安全的重大损失。我希望美国的计算堆栈占据全球 90% 的份额。

主持人 (Jason Calacanis):

全球冲突、台湾局势、甚至中东的氦气供应,这些供应链风险让你担心吗?

黄仁勋 (Jensen Huang):

在中东,我们有 6000 个家庭在那里,我们 100% 支持他们,100% 留在以色列。 关于台湾,我们要做的有三点:

  1. 尽可能快地实现美国本土工业化(如亚利桑那州的工厂)。

  2. 实现供应链多元化(韩国、日本、欧洲)。

  3. 保持耐心和克制。

主持人 (Jason Calacanis):

自动驾驶方面,你的策略是像 Android 那样的开源平台,而特斯拉更像 iOS。你如何看待这个棋局?

黄仁勋 (Jensen Huang):

我们的目标是让世界上每一家汽车公司都能制造自动驾驶汽车。我们提供三台计算机(训练、仿真、车载),并开发了最安全的操作系统。即便像马斯克和特斯拉这样拥有强大自研能力的客户,也会买我们的训练计算机。我们乐于提供任何层面的解决方案,我们不是来取代谁,而是来解决问题的。

主持人 (Brad Gerstner):

但像谷歌亚马逊这些大客户也在自研芯片(TPU、Trainium)。他们既是客户也是竞争对手,你如何应对?

黄仁勋 (Jensen Huang):

我们是世界上唯一一家与每一家 AI 公司都合作的 AI 公司。我不看他们研发什么,但我向他们展示我研发的一切。

信心来自于两点:

  1. 购买英伟达的产品仍然是目前最经济的选择。

  2. 我们是唯一的跨平台架构(云端、本地、车载、甚至空间)。

很多人没意识到,英伟达 40% 的业务来自于构建完整的 AI 基础设施,而不只是卖芯片。事实上,英伟达的市场份额正在增加,因为 Anthropic、Meta 都在用英伟达,开源模型的爆发也在英伟达之上。

主持人 (Brad Gerstner):

分析师们似乎不相信你的增长潜力。他们预测你明年增长 30%,后年 20%,2029 年只有 7%。他们觉得“大数法则”会限制你。

黄仁勋 (Jensen Huang):

他们只是不理解 AI 的规模和广度。过去数据中心的 CPU 市场一年只有 250 亿美元,而我们现在的体量已经完全不同了。英伟达做的不是芯片,而是 AI 基础设施,这个市场比人们想象的要大得多。

主持人 (Chamath Palihapitiya):

谈谈空间数据中心?

黄仁勋 (Jensen Huang):

我们已经在太空中了。挑战在于散热(只能靠辐射),但这并非不可解决。目前我们的芯片已经安装在卫星上处理影像。与其把数据传回地球,不如直接在太空处理。

主持人 (Jason Calacanis):

在医疗领域,AI 将如何产生真正的影响?

黄仁勋 (Jensen Huang):

三个方向:

  1. AI 生物学:预测生物行为,助力药物研发。

  2. AI 智能体:辅助医生诊断。

  3. 物理 AI/机器人手术:未来的超声、CT 仪器都会内置智能体。

主持人 (Jason Calacanis):

机器人技术经历了“失去的二十年”,现在马斯克的 Optimus 还有中国的机器人发展很快。我们离“机器人厨师”或“机器人管家”还有多远?

黄仁勋 (Jensen Huang):

大约 3 到 5 年。中国在电机、稀土、磁铁等硬件生态上非常强大,全球机器人产业都将依赖那个供应链。 最终,机器人将成为人类繁荣的最大推动力。它不仅能解决劳动力短缺,还能让每个人通过机器人开启自己的事业。甚至我们可以通过虚拟现实“附身”在机器狗身上,在出差时陪孩子聊天或遛狗。

主持人 (Brad Gerstner):

Anthropic 的 CEO 预测 2030 年 AI 模型和智能体将产生 1 万亿美元的收入。你觉得呢?

黄仁勋 (Jensen Huang):

我觉得他太保守了。Anthropic 的表现会远超这个数字。因为每一家企业软件公司未来都会成为这些 AI 模型的“增值经销商”。

主持人 (Brad Gerstner):

那这些公司的“护城河”是什么?

黄仁勋 (Jensen Huang):

深度专业化。不要只做一个通用的横向平台,而要深耕某个垂直领域,把你的专业知识注入智能体。谁先连接客户,谁就能获得数据飞轮。

主持人 (Jason Calacanis):

你三年前说过:“你不会被 AI 取代,但会被使用 AI 的人取代。”现在你对就业的看法有变化吗?

黄仁勋 (Jensen Huang):

我不是末日论者。虽然司机会减少,但“移动助手”会增加。就像飞机的自动驾驶增加了飞行员的数量一样。 我对年轻人的建议是:成为使用 AI 的专家。这需要艺术性,需要知道如何引导 AI 而不完全限制它。

主持人 (Brad Gerstner):

你曾在斯坦福建议年轻人要经历“痛苦和磨难”。现在你建议他们学什么?英语专业会比计算机专业更有前途吗?

黄仁勋 (Jensen Huang):

深厚的科学、数学和语言能力仍然关键。因为语言就是 AI 的编程语言。

看看放射科的例子:10 年前有人预言 AI 会让放射科医生消失。结果呢?放射科医生的需求量激增。因为 AI 让扫描变快了,医院能处理更多病人,收益更高。

一个增长更快的国家需要更多的老师、更多的专家,只是他们每个人都将拥有 AI 赋予的“超能力”。

主持人 (Jason Calacanis):

Jensen,祝贺你取得的成就。这是一场非常积极且令人振奋的对话。

黄仁勋 (Jensen Huang):

谢谢。我们不需要陷入恐慌,我们有自主权去选择如何创造未来。

英伟达 GTC26 财务分析师问答会

主持人:

大家早上好。希望你们喜欢昨天的演示。虽然时间长了一点,但我认为这是一个非常完美的总结。现在我们将时间留给你们,重点关注你们的需求和问题。我先把时间交给 Jensen(黄仁勋)。

黄仁勋 (Jensen Huang):

正如我昨天提到的,AI 近期经历了三个拐点:第一个是生成式 AI,第二个是推理(Reasoning),而我们现在正处于第三个拐点——智能体系统(Agentic Systems)

这些系统具备“自主行动能力”,所以被称为智能体。你可以给它们设定目标,它们不再只是回答问题,而是执行任务。最流行的应用之一就是编写软件。在你们公司,以及我的公司,工程师们整天都在使用智能体系统。

过去工程师入职发一台笔记本电脑,现在是发笔记本电脑和 Token(代币/令牌)。Token 预算现在成了实实在在的东西。如果你雇了一个年薪 30 万美元的工程师,但他在工作中不消耗任何 Token,你得问问他整天在干什么。

未来的计算机不再仅仅是工具,而是生产设备。就像 ASML 的光刻机一样,它们生产的是可以出售的产品。这和很久以前生产电力的发电机(Dynamo)没什么区别。能源效率和生产效率决定了你的收入。

每一个软件公司、每一个企业现在都需要一个“OpenClaw 策略”,就像我们当年必须有 Linux 策略、互联网策略和移动云策略一样。

黄仁勋 (Jensen Huang):

我想更新一下关于订单可见性的情况。一年前我说过,到 2026 年,我们的 Blackwell 和 Reuben 出货量有 5000 亿美元的强劲可见性。

现在是 2026 年 3 月,我们对 Blackwell 加 Reuben 架构拥有超过 1 万亿美元(1 Trillion Plus)的强劲需求可见性。这包括了确定的需求预测和采购订单。

请注意,这 1 万亿美元仅指 Blackwell 和 Reuben。我不包含 Groq、独立 CPU 或其他新产品,因为我要和去年的数据做对比。

而且,这个数字到 2027 年底还会继续增长。我们拥有库存和供应流水线,甚至可以在同一个季度内完成接单并出货。这是那些做 ASIC(定制芯片)的公司做不到的,因为它们的交付周期太长。

黄仁勋 (Jensen Huang):

去年(2025 年)是“推理之年”。我们让大家明白:计算机的价格和 Token 的成本之间只有微小的联系。人们买电脑是为了生产 Token。你买了一台昂贵的电脑,但它生产 Token 的速度极快,结果你反而拥有了成本最低的 Token。

这也是我们能保持毛利率的原因。我们每一代产品都提供更高的价值——即“每秒、每瓦特产生的 Token 数”。客户宁愿以更高的价格购买下一代产品,也不愿以低价买旧产品。安装 Vera Rubin 比继续买 Grace Blackwell 更聪明,因为价值更高。

黄仁勋 (Jensen Huang):

2025 年我们还扩大了平台支持。Anthropic 和 Meta SL 都成为了我们的新合作伙伴。目前 API 推理服务提供商的数据显示,开源模型(Open Models)已成为全球第二大流行的 AI 模型类别,仅次于 OpenAI。而英伟达是开源模型在全球最好的运行平台。

我们还与云服务商(CSP)紧密合作。我们在他们的云端拥有 CUDA,这吸引了所有开发者。我们是云服务商最好的销售力量,所以你会看到 AWS、谷歌、微软、甲骨文在我们的展厅里拥有最大的展位,因为他们想向我们的开发者推销服务。

此外,我们 40% 的业务来自于非 CSP 领域,如区域云、工业企业等。如果没有英伟达的全栈平台,你根本无法触达这 40% 的市场,因为他们买的是“平台”,而不只是“芯片”。

问答环节 (Q&A)

提问者 (Amelius Research, Ben Wright):

Jensen,大家最担心的推力是:这笔投资值吗?云服务商的收入增长能覆盖这些巨额开支吗?我们什么时候能看到他们的收入上修?

黄仁勋 (Jensen Huang):

我真希望那些 AI 公司已经上市了,这样你就能看到我所看到的。历史上从未有初创公司能像他们现在这样,每周增加 10 亿或 20 亿美元的收入。

2 万亿美元的 IT 软件行业正在整合 OpenAI、Anthropic 和开源模型。未来的 IT 行业将变成这些模型的“经销商”。我估计 IT 行业将从目前的 2 万亿增长到 8 万亿。

所有 IT 公司未来都会租赁或生产 Token。他们的商业模式将从软件授权转变为 Token 租赁。虽然这会引入销售成本(COGS),但提供的价值要高得多。OpenAI 和 Anthropic 的收入增长速度是在“一个月内长出一个完整的 IT 公司”。

提问者 (Caner Fitzgerald, CJ Muse):

物理 AI(Physical AI)会对你的业务构成什么样的变化?

黄仁勋 (Jensen Huang):

目前数字 AI 和物理 AI 的增长率差不多。但几年后物理 AI 迎来拐点,它必须在本地、在工厂边缘运行。由于全球 70 万亿美元的产业涉及物理原子(而非数字比特),物理 AI 最终会占据我们业务的 70%。

未来计算机将 24/7 全天候运行。我希望年薪 2000 美元一天的工程师每天能花 1000 美元的 Token 预算。我要让他管理一整支智能体舰队来替他工作。

提问者 (Bernstein, Stacy Rasgon):

Reuben 会和 Groq 一起发布吗?推理负载的演变如何?

柯莱特·克雷斯 (Colette Kress):

LPX(Groq 相关)预计在今年下半年。

黄仁勋 (Jensen Huang):

Vera Rubin 会比 Groq 更早出货。 关于计算架构,有低延迟(CPU)和高吞吐量(GPU)之分。Groq 是极端的低延迟架构,几乎整块芯片都是 SRAM。它不灵活,但非常快。

我们将 Groq 与 Vera Rubin 融合,用 Groq 处理语言模型自回归推理的最后阶段。对于免费或普通层级的推理,Vera Rubin 是无敌的。但对于极高端、极其聪明的模型,加入 Groq 后吞吐量会大幅提升。

这就像 iPhone 或汽车行业,市场扩大后就会出现分层:从免费层到极客层(每百万 Token 50 美元的高端层)。

提问者 (Bank of America, Vivek Arya):

1 万亿美元的市场里,CPU、存储等产品占比多少?Groq 会蚕食 HBM(高带宽显存)的需求吗?

黄仁勋 (Jensen Huang):

我们是唯一能跨 HBM、LPDDR5 和 SRAM 三种内存进行优化的公司。 如果 1 万亿的订单全部加上 Groq,规模会变成 1.25 万亿。存储是第二大支出,CPU 约占 5%。Vera Rubin 解决了“智能体”的计算需求——它不仅要推理,还要查内存、用工具、跑浏览器。

我们把这些功能全部和谐地整合进了一个液冷机架架构中,不再是“缝合怪”。

提问者 (Goldman Sachs, Jim Schneider):

Token 成本一直在下降,这会趋于平缓吗?

黄仁勋 (Jensen Huang):

Token 成本会持续下降。但与此同时,每个 Token 的“聪明程度”会持续上升。 评价 AI 工厂必须看“每瓦特产生的 Token 数”。任何不除以功耗的对比都是在误导。我们会不断推高帕累托前沿(Pareto Frontier)——即让工厂在同等成本下产出更多、更聪明的 Token。这是计算机科学中最难的问题。

提问者 (Evercore ISI, Mark Leatis):

SSM(状态空间模型)和 Neimotron 3 的混合架构对你们意味着什么?

黄仁勋 (Jensen Huang):

英伟达的架构美妙之处在于它支持一切:Transformer、扩散模型、SSM 等。Groq 跑不了扩散模型,但我们能跑。 Neimotron 3 旨在处理超长上下文。我们希望推进 AI 技术,而不是单纯竞争。

提问者 (UBS, Tim Aruri):

有人担心英伟达拿走了生态系统太多的价值,毛利率无法持续。你怎么看?

黄仁勋 (Jensen Huang):

如果你继续提供数倍的生产力提升,客户会很高兴与你合作。 这就像 TSMC(台积电)的晶圆是全球最贵的,但价值也是最高的,所以我乐意付钱。ASML 也是如此。 那些说“我的芯片便宜 30%”的人根本不懂 AI。他们不懂 AI 工厂的整体经济学。

提问者 (Redburn, Tim Schultzander):

你们的员工人数增长很慢,但任务量增长极快,如何平衡?

黄仁勋 (Jensen Huang):

我有 60 个直接下属。我们的公司架构反映了我们的产品架构。 为了每年更新一代产品,你必须完全拥有整个软件栈、存储和网络。你不能靠拼凑别人的技术来实现一年一更。我们拥有从芯片到操作系统(Dynamo)的一切,这让我们在第一天就能让旧软件在全新系统上完美运行。

提问者 (最后一位提问者):

训练的需求会如何演变?

黄仁勋 (Jensen Huang):

训练经历了预训练(幼儿园)到后训练(学技能)。后训练需要强化学习、工具使用等,其计算强度可能是预训练的百万倍。 未来的预训练将主要使用“合成数据”。我希望未来 99% 的算力都用于推理,因为推理是将 Token 转化为经济效益的过程。

这就是为什么英伟达去年全方位押注推理。推理就是“思考”和“工作”,怎么可能容易呢?推理只会变得越来越难。

黄仁勋 (Jensen Huang):

谢谢大家来到 GTC。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment