📋 【国泰海通海外科技】 NVDA 27Q1 业绩会翻译 【声明:内容由公司业绩会议翻译而来,可能存在记录误差,具体表述请以官方电话会议原文为准】 【链接】 https://events.q4inc.com/attendee/345403167 【国泰海通海外科技团队】 秦和平 qinheping@g


【国泰海通海外科技】NVDA 27Q1业绩会翻译

【声明:内容由公司业绩会议翻译而来,可能存在记录误差,具体表述请以官方电话会议原文为准】

【链接】

https://events.q4inc.com/attendee/345403167

【国泰海通海外科技团队】

秦和平qinheping@gtht.com

高翩然gaopianran@gtht.com

刁云鹏diaoyunpeng@gtht.com

龚浩 gonghao2@gtht.com

曾天 zengtian2@gtht.com

张馨月 zhangxinyue2@gtht.com

【CFO发言】

我们实现了一个出色的季度,收入、营业利润和自由现金流都超过了此前的纪录。总收入为 820 亿美元,同比增长 85%,环比增长 20%。这是我们连续第三个季度实现同比增速加快,也是连续第十四个季度实现环比增长。考虑到我们制造运营的庞大规模和复杂性,这是一项重大成就。135 亿美元的环比收入增量也创下纪录。

我们抓住了推理需求拐点,在多元终端客户群中推进 Blackwell 系统爬坡,客户覆盖 hyperscaler、模型开发商、AI 云服务提供商以及主权客户。第一季度,我们也在研发、生态系统投资和股票回购之间有效配置资本。我们向股东返还了创纪录的 200 亿美元,同时在上游供应链和下游 go-to-market 生态系统中进行战略投资。这对市场发展和我们的长期地位至关重要。

数据中心收入为 750 亿美元,同比增长 92%,环比增长 21%,主要由 Blackwell 架构的持续强劲需求推动。GB300 和 NVL72 的需求尤其强劲,来自前沿模型构建者和hyperscaler。每一类客户都已经累计部署了数十万颗 Blackwell GPU,标志着我们公司历史上最快的产品爬坡。Grace Blackwell 是最快的训练系统,也是推理中token 生成成本最低的系统。

Spectrum-X 是我们专为 AI 打造的端到端以太网平台,现在规模已经超过所有以太网网络同业的总和。InfiniBand 本季度也非常强劲,同比增长超过 4 倍,主要由我们下一代 XDR 技术在前沿模型中的部署推动。数据中心计算收入为 600 亿美元,同比增长 77%;数据中心网络收入为 150 亿美元,同比增长接近 3 倍。

在深入讨论数据中心之前,我们想向大家介绍一下新的报告框架,这一框架能更好反映我们当前和未来的增长驱动因素。我们有两个市场平台:Data Center 和 Edge Computing。在 Data Center 中,我们将报告两个子市场:Hyperscale 和 ACIE。ACIE 包括 AI clouds、industrial 和 enterprise。Hyperscale 将包括来自公共云以及全球最大消费互联网公司的收入;ACIE 对应我们在跨行业、跨国家的多元化 AI 专用数据中心和 AI factories 中的增长机会。Edge Computing 突出面向 agentic AI 和 physical AI 的设备,包括 PC、游戏主机、工作站、AI-RAN基站、机器人和汽车。

供您参考,我们已经在网站上发布了按新平台划分的过去九个季度收入拆分。回到我们的 Data Center 业绩,Hyperscale 收入为 380 亿美元,约占 Data Center 收入的 50%,环比增长 12%。ACIE 收入为 370 亿美元,环比增长 31%,其中 AI cloud 收入同比增长超过 3 倍。

我们的客户已经实现了 AI 计算容量的快速建设。超过 10 兆瓦的合作伙伴数据中心数量在仅仅一年内几乎翻倍,现在已经超过 80 个站点。主权收入同比增长超过 80%。NVIDIA AI 基础设施现在已经部署在近 40 个国家,这些国家代表着 50 万亿美元 GDP。从我们第一季度业绩可以看出,我们的客户基础是多元化并且正在增长的,这背后有我们庞大的生态系统和装机基础、CUDA 加速应用的广度,以及我们作为最低 token 成本提供者的能力支持。我们处于有利位置,可以服务一个远远超过任何其他 AI 计算平台的市场机会。

AI 基础设施需求继续以前所未有的速度扩张。AIfactories 的建设正在加速。NVIDIA AI 基础设施的价值正在上升。H100 的租赁价格年初至今已经上涨 20%,A100 云定价也上涨了近 15%。

受益于我们平台的通用性,以及软件栈增强带来的持续性能提升,我们的客户正在 GPU 折旧寿命之外继续产生盈利收入。NVIDIA Compute 庞大且受信任的市场,是生态系统为数十亿美元 AI 基础设施支出提供融资的关键基础。AI 基础设施加速建设背后有两个主要驱动因素。第一,从搜索和广告,到推荐系统和内容理解,最大的 hyperscale 工作负载继续从 CPU 转向基于 GPU 的加速计算。第二,AI-native 产品和服务的采用正在迎来拐点。自 ChatGPT 出现以来,我们看到主流 AI 从一次性推理,转向 reasoning,现在又转向 agentic。

AI 已经不再是锦上添花。AI 现在是提升所有行业和所有岗位生产力的必要条件。这正在推动 AI stack 所有层级的收入加速,包括能源、芯片、基础设施、模型和应用。模型层的增长,尤其是 Anthropic 和 OpenAI 的增长,令人难以置信,势头仍在继续加速,其中包括 OpenAI 的 Codex 在 GPT-5.5 发布后的突破性增长。分析师现在预计,2027 年 hyperscale CapEx 将超过 1 万亿美元。随着 agentic AI 开始在所有行业扩散,到本十年末,AI 基础设施支出有望达到每年 3 万亿至 4 万亿美元。

我们的 Blackwell 架构无处不在,已经被每一家主要 hyperscaler、每一家云服务提供商以及每一家主要模型开发商采用和部署。上个月,我们庆祝 OpenAI 发布 GPT-5.5。GPT-5.5 是为 Blackwell 共同设计的,在 Blackwell 上训练,并由 Blackwell 提供服务,目前位于 Artificial Analysis 排行榜顶部。微软的 Fairwater,也就是全球最强大的 AI 数据中心,现在已经提前上线,由数十万颗Blackwell GPU 驱动。从今年开始,AWS 将增加超过 100 万颗 Blackwell 和 Rubin GPU,并正在与我们合作推进 Spectrum 网络。在 Google,Blackwell 将在云端提供给客户,包括 confidential computing 能力,这是安全、高性能 AI 的新基础。

我们在前沿 AI 计算中的份额正在提升。我们已经深化了与 Anthropic 的合作,并且很高兴成为其战略合作伙伴,帮助其扩大算力容量。我们将通过 AWS、Azure、CoreWeave、xAI 等支持该公司的增长轨迹。现在,随着 Anthropic 加入 OpenAI、Gemini、xAI、Meta、Mistral、Microsoft AI、TML、Reflection、Perplexity、Cursor 以及其他已经在 NVIDIA 上构建的主要前沿实验室,我们在前沿AI 模型中的份额将显著增长。

今天的数据中心是能够产生收入的 AI factories,同时受到电力和资本约束。AI factory 运营商必须选择正确的架构。通过我们的极致协同设计方法,我们提供行业最低 token 成本、最高 token 吞吐量和最高 ROI。MLPerf 推理结果已经出炉,我们再次横扫所有基准测试。Blackwell Ultra 在广泛的模型和部署场景中提供了最高吞吐量。全栈创新使 GB300 相比仅仅六个月前实现了 2.7 倍吞吐量提升,并使每 token 成本降低 60%。

NVIDIA Compute 不只是性能最高的 AI 基础设施,它也是最具经济性、最容易融资的。客户购买的不是 GPU,他们建设的是 AI factories。正确的经济指标不是 GPU 的采购价格,而是一座 AI factory 在整个生命周期内生产智能的成本:每瓦 token、每美元 token、正常运行时间、利用率、投产时间、软件耐久性和资产寿命。NVIDIA 在所有这些方面都表现出色。

Agentic AI 和强化学习为 CPU 带来了新的增长机会。在 Grace CPU 成功的基础上,Vera 将及时到来,以满足这一拐点。Vera基于定制 Arm 核心,并与 Rubin GPU 和 NVLink 进行端到端协同设计。与基于 x86 的替代方案相比,Vera 将实现最高 1.5 倍的每核心性能、2 倍的每瓦性能,以及 4 倍的每机柜密度。

Vera CPU 为 NVIDIA 打开了一个全新的 2000 亿美元 TAM,这是我们此前从未进入过的市场。每一家主要 hyperscaler 和系统厂商都在与我们合作部署它。我们今年对 CPU 总收入的可见度接近 200 亿美元,这使我们有机会成为全球领先的CPU 供应商。

我们每年一代产品的节奏无人能及,仍然是支撑我们市场地位的关键支柱。我们正按计划在今年下半年开始 Vera Rubin 的量产出货,从第三季度开始。通过在五个加速机柜中集成七颗专用芯片,VeraRubin 将比 Blackwell 实现最高 35 倍的推理吞吐量,以及最高 10 倍的 AI factory 收入。作为早期采用者,Google 的 A5X bare metal instances 可以在多个站点支持最多 960,000 颗 Rubin GPU,使客户能够在 NVIDIA 优化的基础设施上运行他们最大的AI 工作负载。

虽然美国政府已经批准向中国客户出货 H200 的许可证,但我们尚未产生任何收入,也不确定中国是否会允许任何进口。因此,与上一季度一致,我们的展望中不包含任何中国数据中心计算收入。

接下来我讲 Edge Computing。我们的 Edge Computing 市场平台实现收入 64 亿美元,环比增长 10%,同比增长 29%。强劲的 Blackwell 工作站需求是增长的重要贡献因素;同时,由于内存和系统价格上涨,消费需求小幅下降。我们的 physical AI 继续获得动能,过去 12 个月收入超过 90 亿美元。我们与 Uber 的合作将为其 robotaxi 车队提供动力,到 2028 年覆盖近 30 个城市和四大洲。在机器人领域,工业、外科手术和人形机器人等一系列应用中的领先公司,都在基于 NVIDIA 技术进行规模化开发和部署。我们继续积极保障充足供应,以支持客户增长。

第一季度,我们把总供应规模,包括库存、采购承诺和预付款,提高到 1450 亿美元。虽然我们并非不受供应挑战影响,但我们仍然有信心支持前方的增长机会。我们高度专注、具备规模,并且与关键供应商长期合作,这些仍在很好地服务我们。

接下来讲利润表其余部分。GAAP 毛利率为 74.9%,非 GAAP 毛利率为 75%。由于 Blackwell 系统继续占我们出货的大部分,毛利率环比基本持平。GAAP 和非 GAAP 运营费用环比增长 12%,主要由于薪酬提高,以及计算和基础设施成本增加。我们的非 GAAP 有效税率为 16%,略低于此前展望,原因是地域结构有利。

资产负债表方面,由于收款时点有利,应收账款周转天数为 45 天。我们预计第二季度将回到 50 天中段。我们产生了创纪录的 490 亿美元自由现金流,高于第四季度的 350 亿美元。

现在我想更新我们的资本配置计划。首先重申,我们的意图是优先投资研发和战略投资。两者都将帮助我们培育生态系统、推动市场增长,并强化我们的市场地位。作为 AI 的关键赋能者,我们将进行必要投资,以交付行业最低的每 token 成本和最高的 token 吞吐量,这将帮助我们的客户和合作伙伴扩展并扩大 AI frontier。

我们的股东回报计划是资本配置战略的另一个关键组成部分。鉴于我们对长期自由现金流前景的信心,以及我们与股东分享成功的承诺,我们将季度股息从每股 0.01 美元提高到每股 0.25 美元。随着业务继续扩大,我们计划定期审查股息。我们还宣布新增 800 亿美元股票回购授权,这是在当前计划剩余 390 亿美元之外新增的授权。正如我们在 GTC 所表示的,我们计划今年向股东返还 50% 的自由现金流。

接下来谈第二季度展望。我们预计总收入为 910 亿美元,上下浮动 2%。我们预计环比增长主要由数据中心推动。我们正在继续大力推进供应链生态系统,以应对我们看到的巨大需求。这让我们对 2025 年至 2027 日历年 Blackwell 和 Rubin 收入达到 1 万亿美元的可见度充满信心。GAAP 和非 GAAP 毛利率预计分别为 74.9% 和 75%,上下浮动 50 个基点。全年我们仍预计毛利率处于 70% 中段。GAAP 和非 GAAP 运营费用预计分别约为 85 亿美元和 83 亿美元。全年我们现在预计运营费用同比增长大约处于 40% 高位区间,驱动因素包括更高的研发投入,以及加速使用 AI 工具来提升生产力。2027 财年全年,我们预计 GAAP 和非 GAAP 税率在 16% 至 18% 之间,不包括税务环境重大变化带来的任何一次性项目。这低于我们此前 17% 至 19% 的预期,原因是地域结构变化。

【Q&A】

Q:我想问一下,分部披露变化的驱动因素是什么?以这种方式给我们数字背后的思路是什么?另外,能否谈谈这两个分部之间是否存在什么竞争差异,以及你们刚才谈到的这个有些令人意外的 CPU 数字?你们如何看待 CPU 在这两个分部中的分布?谢谢。

A:首先,Colette 想说的是,我们把季度股息从 0.01 美元提高到 0.25 美元。我想额外的 0.05 美元对大股东会很有意义。无论如何,Joe,我们来谈分部披露和业务描述。我们希望你们更好理解我们的业务。AI 非常多元,计算也非常多元。它们在几个方面都很多元。首先,AI 当然包括语言模型;而根据不同产业,它可能是制造和工业机器人中的 3D 图形。它可能是生命科学中的蛋白质。它可能是生命科学或材料科学中的小分子化学。它可能是物理科学中的物理,无论是在能源部门,还是当然在科学实验室、高等教育等领域。因此,AI 是多元的。

第二,应用是多元的。它可能在企业中。它可能在能源行业、制造行业等。它运行的位置也是多元的。它可能在 hyperscale cloud 中。它可能在 AI natives 中。全球正在出现一整个 AI natives 网络。企业本地部署,工业工厂和生产设施,一直到超级计算中心和边缘。边缘当然包括多数人看到的自动驾驶汽车、机器人,但也包括制造工厂内部一个大型且不断增长的计算机网络,无论是芯片工厂、封装工厂、计算机工厂,还是各种不同类型的制造工厂。然后当然,在未来,每一个基站、每一个无线网络都将成为 AI 驱动的无线网络。所以这是它运行在哪里的问题。

最后,是它如何被治理。它可以由公共云运营,但也可能因为工业监管原因,不能运行在受监管云中。可能是因为 confidential computing。可能是因为国家安全原因。不同的数据中心必须以不同方式建设。

NVIDIA 非常独特,因为我们是唯一一家构建所有技术组件的公司。我们以极致协同设计的方式、完整端到端的方式、全栈方式构建这些技术。然后,我们当然会开放平台,使其能够集成到各种不同环境中。但有些环境,比如企业,需要一家拥有所有协同工作技术的公司,这样他们不需要自己构建。他们希望购买并运营它。

因此,数据中心市场存在许多不同细分领域。在这些领域中,NVIDIA 的完整解决方案、完全集成的解决方案,以及全栈但仍然开放的解决方案,这种生产或交付产品的方式非常非常重要。因此,如果看我们的不同分部,我们把它拆成三个大分部。你把我刚才说的所有内容拿来,试图找到最简单的拆分方式,那就是 hyperscale clouds。这会是一个大分部。

在这个分部中,我们有三种不同的运作方式。第一种方式是帮助 hyperscale clouds 加速其数据处理和机器学习工作负载。我们加速并支持它们内部的 AI 处理。当然,我们也把很多业务,也就是 NVIDIA 生态系统业务,带到它们的公共云上。这是一个分部。第二个分部是 AI natives、enterprise on-premise、industrialon-premise 和 sovereign AI。这个分部增长非常快,因为每个人都需要 AI。我们将看到 AI 被每一个行业、每一个国家、每一家公司采用。因此,每个人都想以不同方式构建 AI。而我们提供完整解决方案,这使事情容易得多,也使人们能够真正构建这些东西。然后当然是 robotic edge。以往的计算主要是关于 personal computing。未来,它将关于 personal AI。而这种 personal AI 的一个例子就是自动驾驶汽车。它是一辆车,是一个机器人系统,本质上是你的 personal AI。当然,还会有各种不同类型的机器人系统,甚至包括我刚才提到的基站无线网络,它本质上会成为一个机器人系统。

所以,这就是我们以这种方式拆分的原因。这是理解我们业务最简单的方式。每个分部在很多方面都有不同的 stack。它们有不同的操作系统,以不同方式运行。我们在每个分部中的 go-to-market 方式也非常不同。

最容易的 go-to-market 当然是 hyperscaler,因为只有五六家公司。但其他部分,也就是行业其他部分,代表全球约 250,000 家公司。那个 go-to-market 非常复杂,非常多元。你对 AI 的理解也必须非常多元。

正如你们知道的,NVIDIA 拥有全球最大的加速库套件,从计算光刻,到流体动力学,到粒子物理,到分子动力学,清单还可以继续。这些库对于我们参与代表第二类和第三类的垂直行业都至关重要。无论如何,这实际上是因为我们的业务现在已经演进并成长到如此大的规模。对它进行分部披露,有助于你们更好理解我们的业务如何运作。

Q:我想问 Jensen,想问你关于增长的理念。你们的数据中心业务,不包括中国,本季度增长大约 120%,然后你们给出的指引大约是 100%。许多人,包括我自己,预计 hyperscaler 的 CapEx 今年会增长 90% 到 100%。你们也谈到,到本十年末,数据中心仍在通往 3 万亿到 4 万亿美元的路径上。我只是想问,公司目标是否是增长快于 hyperscaler CapEx?你是否愿意认可这种观点?另外,你是否仍然认为今年之后 hyperscaler CapEx 仍会以非常快的速度增长?非常感谢。

A:首先,我们应该增长快于 hyperscale CapEx。原因可以通过我刚才描述的分部来说明。我们的数据中心业务有两个大部分。它其实不止这些部分,但为了简单起见,我们把它合并成两个大部分。它比两个大部分复杂得多,但我把它合并成两个,这样至少更容易理解,好吗?因此,如果你看第一部分,就是 hyperscalers,也就是你刚才谈到的 hyperscale CapEx。它们今年是 1 万亿美元。我完全预期它会从这里继续增长,原因是非常基本且合理的。这就是未来计算运作的方式。如果它们没有计算能力,就不会有收入。这一点非常清楚:计算就是收入,计算就是利润。所以世界正在变化。

软件过去并没有使用这么多计算,SaaS 过去并没有使用这么多计算,但 AI 需要巨量计算。当然你也可以做多得多的事情,这就是为什么我们听到 AI frontier、AI 公司,也就是 Anthropic 和 OpenAI,都在以惊人的速度增长。它们能在一个月内实现一些 SaaS 公司可能需要十年才能实现的增长,这说明了一些事情。所以第一类是 hyperscale,CapEx 是 1 万亿美元,并且正在向 3 万亿到 4 万亿美元增长。

第二类是所有 AI-native clouds。它们是区域性的,遍布各地。世界各地都有支持这些公司的初创公司。它们也是企业,全球有 250,000 家企业公司,其中很多会不得不建设,或希望为自己建设和运营 AI factories。很多工业公司别无选择,只能把计算机放在 context 所在的地方,也就是 action 所在的地方。你不能把它放在云端。它每一次都必须可靠、快速地响应。很难想象一个芯片厂、一个晶圆厂连接到云服务提供商,这没有任何意义。

所以第二类,以及 sovereign AI clouds,构成了整个一类数据中心。在这些数据中心中,semi-custom chips 并不适用,因为这些数据中心希望购买系统、运营系统,不想自己设计,也不想自己构建。

因此,第二类极其多元。第一类由五六七家公司代表相关收入。第二类则是数百、数千家公司,未来会是数十万家公司,其中大量公司拥有相对较小的安装规模。这个类别将继续以惊人速度增长。我谈 physical AI 时,谈到过去 30 年没有被 IT 影响的其余 100 万亿美元产业即将被 AI 影响,我说的就是这个分部。

第二个集群正在以惊人速度增长。我们在其中的份额当然非常非常大。我们在服务这个行业方面相当独特。我们的平台构建方式像是垂直集成的,因此所有东西都能运作。然后我们再把它拆解,使人们可以按照自己想要的配置来构建和购买,并按自己喜欢的方式组装。

所以第二类被理解得相当不充分,因为有太多小公司,或者说有太多公司,每一个安装规模相对于 hyperscaler 来说都比较小。因此,如果你看分部以及每个分部的规模,你可以看到,事实上我们在 hyperscaler 中也在获得份额,因为我们现在获得了 Anthropic 更大的支持。Anthropic 是我们的新合作伙伴,我们正在帮助他们在未来几年大幅扩展容量。然后第二类方面,很少有公司因为我们拥有的平台解决方案而能够切入这个第二类市场。

Q:你们很快将推出Vera Rubin,而且显然对前沿模型即将出现的更新,以及围绕多元 AI 工作负载进行优化的新技术有很好的洞察。投资者非常关注你们在推理市场中的份额。展望 2026 年末和 2027 年,你们如何看待 Vera Rubin 以及你们的极致协同工程对推理市场份额的影响?

A:我们在推理中的份额正在增长。而且我们在推理中的份额增长得非常非常快。原因是今年前沿模型公司的数量增加了。有Cursor 和 Perplexity,也有一些新的模型公司,TML 和 Reflection,清单还可以继续。因此,前沿模型公司的数量增加了。今年我们还把 Anthropic 加入了我们的合作关系。他们扩张速度非常惊人。我们已经与他们合作,通过 Azure、AWS、CoreWeave 来保障计算容量。我忘了我们还宣布了哪些其他公司,但我们正在为他们上线一整串其他资源。今年和明年我们将为 Anthropic 上线的容量会非常可观,非常显著。到最近之前,我们对 Anthropic 的覆盖基本为零。所以我们在推理中正在非常快地获得份额。

从现在来看,Vera Rubin 将比 Grace Blackwell 更成功。每一家,我想不出任何一家例外,每一家前沿模型公司都会从一开始就采用 Vera Rubin。而这在 Blackwell 之前并不是事实。因此,Vera Rubin 的开局非常强劲,它肯定会比 Grace Blackwell 更成功。

所以我认为,你问题的答案是,我们正在推理中获得份额。让我再回到 Ben 刚才问的问题。请记住,到目前为止,我在推理问题中解释的一切,实际上主要聚焦于 hyperscale。请记住,还有一整个第二类 AI 数据中心,几乎只有我们在服务。这个分部非常碎片化,需要一个相当集成的、真正良好集成的平台解决方案,以及非常大的 go-to-market。这个分部中,所有推理,其中绝大多数都是 NVIDIA。然后当然,physical AI 方面,NVIDIA 实际上是今天唯一服务 physical AI 的公司。我们已经在 physical AI 上投入了很长时间。所以这一块也在增长。

因此,我们在推理中的份额正在非常快地增长。

Q:我想问一下你们在一些custom merchant 产品上的进展,比如 CPX 和 LPX。我只是想问问,因为你之前谈过 Groq,我记得你说它可能是市场的 20%。所以我想象你们在 LPX 上应该获得了相当不错的进展。能否谈谈这一点,也谈谈它如何融入你们更广泛的平台战略?谢谢。

A:LPX 是为低延迟和高 token rate 设计的,但它的吞吐量较低。它的吞吐量较低。它的模型尺寸容量较低,它的上下文处理能力,也就是吸收大量上下文的能力,比如用于软件编码、用于 agentic 工作负载时吸收大量上下文的能力较低。

所以挑战很简单。我之前解释过,LPX 的用例并不广。它的目标是服务于某些拥有相当大组合、提供不同类型 token 服务的客户。对于高 token rate 场景,也许这些服务非常高端,客户数量并不多,但 token rate 非常高。这仍然和我此前说的完全一致。我仍然这样预期。

因此,我预计 LPX 以及其他基于 SRAM、专注 decode token、专注高 token rate 生成的加速器,在相当一段时间里都会是一个 niche 产品(小众垂类赛道)。正如你们知道的,Grace Blackwell 和 Vera Rubin 支持 AI 的整个生命周期,从数据处理、训练准备,也就是数据处理,到预训练,到后训练强化学习,再到推理。Grace Blackwell 是全球最适合完成所有这些工作的最佳平台。如果在某些情况下,只要客户,也就是服务提供商,已经有可以提供的高 token rate 服务,那么我们可以附加一个 LPX,他们就可以把这项服务交付得更好。所以这是我对市场的看法。我认为无论是 20% 还是 10%,只取决于 AI 发展到什么阶段。我认为今天远远低于 20%。未来某一天,这些高端 token 可能会达到 20%。我们已经准备好与服务提供商合作,启用这种能力。我对此感到兴奋。

Q:Jensen,围绕用于 agentic 应用的 CPU 有很多兴奋点,也有很多关于 CPU 数量实际上会超过 GPU 数量的讨论。我希望你能谈谈你的看法。首先,这是否是一个增量工作负载?还是它会 cannibalize GPU 本来会做的工作?其次,你们给出的 200 亿美元数字,是针对 standalone Vera CPU,还是已经包含在Vera Rubin 中作为 Vera 的一部分?所以,希望你能帮助我们理解 CPU 与 GPU 的角色。它是 cannibalistic,还是 incremental?然后,这 200 亿美元数字如何与通常你们销售的内容放在一起理解?你们通常是把 CPU 作为 GPU 的一部分销售。谢谢。

A:这 200 亿美元是 standalone CPU。请记住,Vera 有四种使用方式,Vera 用作 standalone CPU,有四种方式。

让我先从你们已经知道的一种说起。第一种是 Vera Rubin。我们会销售数百万颗 Rubin,每两颗 Rubin 连接到一颗 Vera。当然,我们也会给这些定价。而且它们会被合理定价。这是第一个用例。第二个用例是 Vera standalone CPU。第三个是 Vera 搭配 CX9 以及用于存储的软件栈。第四个是 Vera 搭配 CX9,以及用于安全、计算隔离和 confidentialcomputing 的软件栈。

所以每一种用例都是基于 Vera。我的感觉是,在 Vera Rubin 的整个生命周期中,我们都会受到供应限制。它有四种不同的用例。无论如何,你问题的答案是,200 亿美元是单指standalone这一类场景。

关于 CPU 使用,agent 本质上就是人们所说的 harness。agent 有一个 harness,它做相关工作。这个 harness 可以是 OpenClaw,也可以是 Hermes。Claude Code 本质上是围绕 Claude、围绕 Opus 模型的一个 harness。OpenAI 的 Codex 是围绕 GPT-5.5 模型的一个 harness。所以这些都是 harness。这些 harness 提供 IO、orchestration、memory management、tool use,也就是连接工具,比如浏览器之类、C编译器、Python 编译器。因此,harness 运行在 CPU 上,tool use 运行在 CPU 上。例如,如果 AI 要进行搜索或使用浏览器,那会运行在 CPU 上。世界上有 10 亿个人类用户。我的感觉是,世界将会有数十亿个 agent。不是今天,我是说我们会逐步走向那里,但最终会有数十亿个 agent。而这些数十亿个 agent 都会使用工具。这些工具可以像 PC 一样,就像我们人类今天使用 PC 一样。未来,你会有 agent 使用 PC。

所以,如果你沿着这个思路想,在未来,你可以选择你当下喜欢的 agent 数量,当下可以说是几十万个,但未来最终可以说是数十亿个。我可以想象它们实际上都会拥有可以使用的 PC。因此,每一个 agent 都会派生出 sub-agent。每当它们派生这些 sub-agent,就需要进行推理。那就是 thinking 发生的地方。

所有 thinking 都发生在 GPU 上。所有 orchestration 本质上运行在 CPU 上。sub-agent 被派生出来后,当它们进行 thinking 时,它们使用 GPU。每当 agent 使用 simulator,这些 simulator 可以运行在 CPU 或 GPU 上。这就是为什么我们正在与Cadence 和 Synopsys 紧密合作,以加速世界上所有工具。我们正在加速世界上所有工具、数据处理引擎和数据库引擎,因为 agent 使用这些工具,而且它们的耐心容忍度比人类更低,它们希望事情快速发生。所以我们正在加速世界上所有工具,使其运行在 CUDA 上。你们可以看到我们正在这样做。当我与 Cadence、Synopsys、Siemens、Adobe 等公司合作时,就是因为我们试图让世界上所有工具都运行在 GPU 上,因为它们已经有 GPU,而且速度快得多。所以我们会需要更多 CPU。

Vera 被设计为 agentic CPU。过去的 CPU 被设计成拥有很多核心,以便容易出租。人们租用 core。而 agent 并不租用 core。它们只希望工作被快速完成。过去的经济学是 dollars per core。这是过去云计算的经济学。未来 AI 的经济学是 tokens per dollar,或者 dollars per token。所以我们未来需要做的是尽可能快地生成 token、处理 token。这正是 Vera 极其擅长的事情。所以我们预计 Vera 会非常成功。

但归根到底,我们正在做的是为 AI 构建基础设施。它需要极其出色的存储,这就是为什么我们构建 STX。它需要极其出色的网络,这就是为什么我们有 Spectrum-X。它当然需要极其出色的 GPU,以及推理能力。这就是为什么有 NVLink 72。它需要极其出色的安全和 confidential computing,这就是为什么 Vera Rubin 是全球第一个具备端到端 confidentialcomputing 的平台。它也需要出色的 CPU。我们全部覆盖了。

Q:我想回到分部披露。首先,我很好奇,Neo clouds 在这两个分部中放在哪里?它们是在 hyperscale,还是在 AI cloud?我有点假设是后者,但我不太确定。然后只看它们的规模,我的意思是,现在两个分部规模差不多。听起来你似乎在暗示,你认为后者,也就是 AI cloud,未来可能会比hyperscale 增长更快。你是想表达这个意思吗?还是你认为两个分部都会有类似的增长?

A:首先,你是对的,Neo Clouds属于AI native clouds。AI-native clouds 不构建芯片,也不设计自己的芯片。它们并不想这样做。它们实际上也不能把互不相关的部件拼在一起,组装成一座 AI factory。它们对 time-to-first-token 的时间、耐心和容忍度都极低。它们需要一种拥有大量 offtake 的架构,使它能够运行每一个模型,拥有来自各处的客户。这种需求极高。因此,NVIDIA 的架构非常适合它们。我们提供每一个组件;我们不提供的部分,由我们的合作伙伴生态系统提供;而且这一切都是完全集成的,都能协同工作。能够从 AI-native 云租用它的客户数量非常高。基本上包括全球每一家 AI builder、每一家 AI-native startup、SaaS 公司、企业公司、工业公司。因此,我们的计算,我们的架构,是全球最容易出租的计算平台。所以它性能最高。它最容易组装。它最容易出租,拥有最佳 TCO,也最容易融资。因此,所有这些特性都非常独特地匹配 AI-native 的需求。它属于第二类。它们与 OEM 等也非常相似。大型企业等也是如此。所以我们把它放在第二类。

如果你看这个分部,它是在 AI 生态系统在 hyperscale 中发展起来之后才开始增长的。Hyperscale 首先发展 AI 有很多原因。它们拥有出色的计算机科学能力。它们拥有优秀的数据中心能力。它们也主要聚焦于消费应用,而消费应用即使不完美,也不是世界末日。只要它增强了服务即可。因此,对于许多其他应用,也就是工业应用、企业应用,在 AI 变得非常有能力、能够真正做有生产力的工作,并且安全地做到这一点之前,它并不会真正被使用。它需要以能够真正产生影响和收入的方式工作。因此,你会预期第二类的发展慢于 hyperscale。你可以在数字中看到这一点。

然而,从长期看,如果你看工业和企业,很明显未来经济会在那里,因为它代表全球经济中的约 50 万亿到 80 万亿美元。而且由于 AI,它还会变得更大。因此,我预计第二类会随着时间推移变得更大。二者在近期,也就是未来几年,我预计第二类仍会增长更快,但二者都会增长得非常快。然后我希望在未来五年内,physical AI 和 robotics 分部会开始非常快地增长。

Q:在 GTC 上,我记得你们谈到Blackwell 和 Rubin 平台收入有 1 万亿美元可见度,但我认为这不包括 LPX、Rubin CPX 和 Vera CPU 机柜之类的内容。能否让我们了解一下,Vera CPU 是否会成为超出这 1 万亿美元之外最大的增量来源?你们是否正在考虑其他产品组合,包括 CPU,以便在总 TAM 中获得更大的份额?谢谢。

A:就 1 万亿美元之外的增量而言,我会说,第一,是我们在前沿 AI 模型中继续提升份额。我预计会获得更多份额。所以我预计这会增长。第二,我们没有把任何 Vera CPU,也就是 standalone CPU,纳入那个数字。所以我预计这会是第二大增量来源。当然,在 agentic systems 中,TAM 非常大。我们的所有客户都对 Vera 非常兴奋。我们会卖出大量 Vera。第三会是 LPX,因为正如我前面解释的,LPX 因为它的 SRAM 架构,具有非常低延迟、非常高交互性的优势。但它的吞吐量、上下文处理能力也相当有限。这就是基于 SRAM 的系统的性质。但通过组合,我们将能够覆盖 AI 的整个 spectrum,从预训练,到后训练,到推理,到 agentic systems,依靠 Vera、Vera Rubin 和 LPX 的组合来实现。

Q:我记得你在准备好的发言中提到,GB300 算是公司历史上最快的爬坡。我们应该如何用这个 benchmark 来思考 Vera Rubin?它显然在硅层面是新架构,但机柜是类似的。这是否意味着我们应该预期 Vera Rubin 的爬坡斜率与GB300 类似?还是由于新硅片,它应该更渐进一些?谢谢。

A:是的,我们已经有一段时间表示,会在下半年推出 Vera Rubin。我们会在第三季度开始。那会是我们的初始系统组合。然后一旦到第四季度,我们很可能会开始看到爬坡继续。目前很难说哪个会是更快的爬坡,但我们已经有了规划好的需求。我们已经拿到了 PO。几乎所有主要客户都已经准备好了。这些都是非常复杂的系统,非常复杂的系统,需要我们把它们组装在一起。所以我认为这只是关于我们把产品推向市场所需要的时间。除此之外没有别的因素,关键就是让我们已经可以下单的各种不同系统进入生产。因此现在说还有点早,但没错,我们会在第三季度开始,并在第四季度继续爬坡。明年第一季度当然也会非常大。

【管理层总结】

在我把电话会交给 Jensen 之前,请注意,Jensen 将于 6 月 1 日在 Computex 期间的 GTC Taipei 发表 keynote。我们也将参加 5 月 28 日的 TD Cowen TMT Conference,以及 6 月 4 日的 Bank of AmericaGlobal Technology Conference。

我们讨论 2027 财年第二季度业绩的电话会计划于 8 月 26 日举行。下面请 Jensen 作结束发言。

这是一个非凡的季度。需求已经呈抛物线式增长。原因很简单:agentic AI 已经到来。AI 现在能够完成有生产力、有价值的工作。Token 现在是盈利的。因此,模型开发商正在竞相生产更多 token。在 AI 时代,计算容量就是收入和利润。NVIDIA 是这个时代的平台。在世界上所有平台中,NVIDIA Compute 支持最丰富、最多元的需求。让我强调我认为最重要的五点。

第一,NVIDIA 是唯一运行每一个 Frontier AI 模型的平台。随着 Anthropic 加入我们现有合作伙伴 OpenAI、xAI、Meta、Mistral、Gemini 以及许多其他伙伴,我们在 Frontier AI 中的份额正在增长。

第二,我们进入了每一家 hyperscale cloud,支持它们的核心数据处理和机器学习工作负载、内部 AI 服务,同时也支持它们在公共云服务中来自 NVIDIA 用户的需求。

第三,我们的全栈完整 AI factory 解决方案和庞大全球生态系统,使我们能够独特地服务新的 AI 数据中心分部。新的 AI-native clouds、sovereign AI clouds,以及本地部署的企业和工业基础设施。这就是我之前谈到的第二类。

第四,NVIDIA CUDA 一直延伸到边缘。机器人、自动驾驶汽车、嵌入式医疗仪器、AI-RAN电信基站。下一波浪潮是 physical AI,数十亿个自动化和机器人系统将在物理世界中运行。这就是我们之前谈到的第三个分部。

第五,我们有一个重大的新增长驱动:Vera CPU,这是全球第一款专为 agentic AI 打造的 CPU。Vera 为 NVIDIA 打开了一个全新的 2000 亿美元 TAM,这是我们此前从未进入过的市场。每一家主要 hyperscaler 和系统厂商都在与我们合作部署它。

世界正在为 agentic AI 和 robotic physical AI 重建计算。NVIDIA 处于这些转型的中心。我们用三十年构建了NVIDIA Compute Platform。一个架构、庞大生态系统,以及在芯片、系统、网络和软件之间的极致协同设计。我们在这个时刻到来之前就已经构建好它,所以当 agentic AI 到来时,NVIDIA 已经准备好了。它已经到来了。

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。