NVIDIA headquarters building in Santa Clara, California
深度分析

NVIDIA:从游戏芯片到 AI 核心——历史上最快的价值创造

一家图形芯片公司如何在 Denny's 餐厅的一次创业后,成为地球上最重要的半导体公司。从 2023 财年 270 亿美元营收到 2025 财年 1305 亿美元,75% 毛利率,以及历经 15 年构建的 CUDA 软件护城河——NVIDIA 的 AI 超级周期是公开市场历史上最快的价值创造。

·20 分钟阅读·财经
文章
NVIDIA headquarters building in Santa Clara, California

NVIDIA 总部,加利福尼亚州圣克拉拉——这家公司成为了 AI 革命的核心支柱

史上最快的价值创造

在上市公司的历史上,没有任何先例可以匹配 NVIDIA 过去三年所做的事情。

2023 年 1 月,NVIDIA 是一家市值 3600 亿美元的半导体公司,为游戏玩家制造图形芯片,并在 AI 领域押下了一个有趣但尚未被验证的赌注。到 2025 年 1 月,它成为了地球上第二最有价值的公司——市值 3.4 万亿美元,曾一度短暂超越苹果——在 24 个月内创造了历史上任何公司都未曾有过的市值增幅。营收从 2023 财年的 270 亿美元增长到 2025 财年的 1305 亿美元。净利润从 44 亿美元增长到 729 亿美元。毛利率从 57% 扩张到 75%。

做个对比:NVIDIA 2025 财年 729 亿美元的净利润,超过了苹果、微软或谷歌在 2024 财年的净利润。NVIDIA 实现这一成就所用的员工人数约为微软的五分之一,营收历史约为微软的十分之一。

这是黄仁勋 1993 年在一家 Denny's 餐厅创立的公司,如何成为 AI 淘金热中的铲子卖家的故事——以及它所构建的护城河,为何可能是自 1990 年代微软主导 PC 操作系统以来,科技领域最难以防御的技术垄断。

无人认真对待的游戏根基

NVIDIA 的起源故事不是 AI,而是《雷神之锤》。

在 1990 年代初,3D 游戏是消费技术中计算需求最高的工作负载。实时渲染三维环境需要专用硬件——图形处理器——能够以每秒数百万次并行浮点运算的速度执行计算。NVIDIA 的第一款产品 NV1 于 1995 年推出,表现平平。NV3——RIVA 128——足以维持生存。1999 年推出的 GeForce 256 才是真正重要的产品:它是第一款以 GeForce 品牌销售的芯片,也是第一款以 GPU 而非图形加速器来营销的产品。

使游戏 GPU 在技术上令人感兴趣的正是三十年后使其对 AI 具有变革意义的同一特性:并行性。CPU 被设计为极快地执行单个复杂任务。GPU 被设计为同时执行数千个更简单的任务。渲染 3D 帧需要并行计算数百万像素的颜色——完美适配大规模并行架构。这一架构需求塑造了 NVIDIA 整个芯片设计理念,而这一理念恰好正是深度学习所需要的。

到 2022 财年,NVIDIA 的游戏部门营收 124.6 亿美元——彼时最大的部门,占总营收的 46%。GeForce 以约 80% 的市场份额主导离散 GPU 市场。AMD 在性能上已追赶上来,但从未在软件生态系统上实现同等地位。英特尔尝试进入独立 GPU 市场,但基本上以失败告终。游戏护城河是真实的,但 AI 护城河才是真正重要的那个。

CUDA——历经 15 年构建的技术护城河

2006 年,NVIDIA 做了一件看起来昂贵而多余的事:推出了 CUDA。

CUDA——计算统一设备架构——是一个编程框架,允许开发者编写可在 NVIDIA GPU 上运行的通用程序。CUDA 解决的问题是:GPU 尽管拥有强大的原始并行处理能力,却几乎无法为图形以外的任何用途编程。CUDA 提供了 API、编译器工具链和库,让研究人员和工程师能够将任意并行计算以 NVIDIA 硬件可执行的形式表达出来。

研究界起初缓慢地采用 CUDA。高性能计算是早期用例——物理模拟、分子动力学、流体动力学。然后,2012 年,一件改变了深度学习和 NVIDIA 轨迹的事情发生了:AlexNet。

Alex Krizhevsky 使用 CUDA 在 NVIDIA GPU 上训练的卷积神经网络赢得了 ImageNet 图像分类竞赛,错误率远低于竞争对手,迫使机器学习研究界重新审视其对深度学习能力的假设。AlexNet 证明了 GPU 加速训练使深度神经网络在不可能用 CPU 训练的规模上变得实际可行。全球每一个主要 AI 实验室都去了同一个地方购买他们所需的硬件:NVIDIA。

关于 CUDA 的关键洞察不在于它是更好的 API,而在于 NVIDIA 花了十五年时间围绕它构建生态系统。cuDNN——CUDA 深度神经网络库——优化了每个神经网络都使用的基本操作:卷积、矩阵乘法、激活函数。深度学习社区在此基础上构建了框架——TensorFlow、PyTorch、JAX——以使用 cuDNN。这些框架现在驱动着全球几乎所有严肃的 AI 研究和生产部署。从 CUDA 切换不仅意味着更换芯片,还意味着移植整个框架栈、重写优化代码,并可能失去多年积累的性能调优成果。

AMD 拥有有竞争力的 GPU 硬件(MI300X 在纸面上与 NVIDIA 的 H100 竞争),并在其 ROCm 软件栈上进行了大量投资。谷歌有定制 TPU。英特尔有 Gaudi 加速器。但没有一家拥有 CUDA 生态系统的深度。NVIDIA 在 2006 年至 2020 年间建立的软件护城河,是为什么当 AI 超级周期到来时,只有一家公司能够大规模供应它的原因。

数据中心的转型

NVIDIA 从 2018 财年开始单独披露其数据中心营收部门。那一年为 19.3 亿美元——有意义,但被游戏部门的 55.1 亿美元相形见绌。即将到来的第一个信号出现在 2021 财年:数据中心首次超越游戏,以 67.0 亿美元对 55.2 亿美元。

转折点是 ChatGPT。

OpenAI 于 2022 年 11 月 30 日推出 ChatGPT。五天内拥有 100 万用户,两个月内拥有 1 亿用户——历史上最快的消费者应用采用速度。更重要的是,它向全球每一家大型企业和政府证明了大型语言模型的商业可行性,以及训练和运行它们需要大量 GPU 算力。

每一家主要科技公司同时发动了 AI 军备竞赛。微软向 OpenAI 承诺 100 亿美元,并承诺在其整个产品组合中部署 AI。谷歌匆忙以 Gemini 回应。Meta 宣布仅 2025 年就投入 650 亿美元的 AI 资本支出。亚马逊、苹果、甲骨文以及每一家主要云服务提供商开始以超出 NVIDIA 制造能力的数量订购 NVIDIA H100——以及后来的 H200 和 Blackwell 架构。

NVIDIA 2024 财年数据中心营收为 475 亿美元——较 2023 财年的 150 亿美元增长 217%。2025 财年,数据中心营收达到 1152 亿美元,占公司总营收的 88%。曾经是 NVIDIA 核心业务的游戏贡献了 114 亿美元——相比之下几乎可以忽略不计。

Blackwell 架构——构建下一个护城河

2024 年 3 月,NVIDIA 发布了 Blackwell——其下一代 GPU 架构,继承 Hopper(驱动 H100 的架构)。命名惯例本身就传递了黄仁勋的雄心:他以计算和数学领域的先驱命名架构。图灵。伏特。安培。霍普尔。Blackwell(以统计学家 David Harold Blackwell 命名)。

Blackwell B200 GPU 提供 20 petaflops 的 FP4 AI 性能——是 H100 4 petaflops FP8 性能的 5 倍。但更重要的创新是连接大规模集群中 Blackwell GPU 的 NVLink 交换机结构。单个 Blackwell 机架级系统——NVL72——通过 NVLink 连接 72 块 GPU,使整个集群在训练最大规模前沿模型时表现为单一逻辑加速器。

升级周期已经启动。NVIDIA 报告 Blackwell 在第一个生产季度就创造了 110 亿美元营收——公司历史上最快的产品爬坡速度。

黄仁勋——创始人 CEO 因素

并非每家公司都能执行一个长达三十年的技术押注。NVIDIA 能够做到的原因是黄仁勋。

黄仁勋于 1993 年共同创立了 NVIDIA,并持续领导至今。他今年 61 岁,没有任何接班计划的迹象——也不需要有。一位对技术路线图和资本配置决策都有深刻理解的创始人 CEO 的复利价值,在大市值科技公司中极为罕见。贝佐斯建立 AWS 是因为他明白亚马逊的物流基础设施可以被泛化为云服务。黄仁勋建立 CUDA 是因为他明白并行计算是一种通用资源,而不仅仅是图形渲染工具。

他 2006 年在 CUDA 上的赌注——当时没有近期收入依据——反映了一种模式:在市场需求它之前,对平台基础设施进行重投入,然后在需求到来时拥有市场。同样的逻辑适用于 NVIDIA 的 DGX 系统——NVIDIA 从 2016 年开始向研究实验室出售的专用 AI 超级计算机——在商业需求存在之前,与 AI 研究社区建立了深厚的关系。当 OpenAI 和每一家主要 AI 实验室需要扩大规模时,这些关系成为了采购决策。

十年财务表现(FY2020-FY2025)

数字讲述了一个不需要任何叙事装饰的故事:

财年

营收($B)

净利润($B)

毛利率%

自由现金流($B)

EPS($

FY2020

10.9

2.8

62.3%

3.6

0.45

FY2021

16.7

4.3

62.3%

5.0

0.70

FY2022

26.9

9.8

64.9%

7.3

1.56

FY2023

27.0

4.4

56.9%

3.8

0.72

FY2024

60.9

29.8

72.7%

27.0

1.19

FY2025

130.5

72.9

74.6%

60.8

2.94

注:EPS 按 2024 年 6 月 10:1 拆股后调整显示。2023 财年净利润和 EPS 受 13.5 亿美元 Arm 收购终止费和 12.2 亿美元库存费用影响。毛利率从 2023 财年低点(56.9%)扩张至 2025 财年(74.6%),提升 17.7 个百分点,由数据中心组合转变驱动。

毛利率故事最为重要。NVIDIA 数据中心 GPU 的毛利率远高于公司平均水平——行业分析师估计 H100/Blackwell 毛利率在 70-80%+。随着数据中心从 2022 财年占营收的 46% 增长到 2025 财年的 88%,整体利润率结构在结构上得到改善。这不是削减成本——而是产品组合向更高毛利率产品的转变驱动的永久性利润率扩张。

自由现金流转化率卓越:NVIDIA 在 2025 财年将约 47% 的营收转化为自由现金流。对比:微软转化约 30%,苹果约 25%。这反映了轻资产模式——NVIDIA 设计芯片,台积电制造,NVIDIA 在不拥有晶圆厂的情况下获取知识产权利润。

资本回报机器

NVIDIA sign at company headquarters in Santa Clara

NVIDIA 园区标牌——黄仁勋 1993 年在 Denny's 餐厅共同创立的公司,如今市值超过 3 万亿美元

NVIDIA 于 2024 年 6 月 10 日完成了 10 比 1 股票拆分——公司自 1999 年 IPO 以来的第六次拆分。拆分前,股价曾超过 1200 美元。

股息方面:NVIDIA 支付每股 0.01 美元的季度股息(拆后)——在当前估值下几乎是象征性的。这不是收益型股票。

回购方面:NVIDIA 在 2025 财年通过回购向股东返还了 154 亿美元,并于 2024 年 8 月宣布 500 亿美元的回购授权。以 NVIDIA 当前的自由现金流产生速度(每年 600 亿美元以上),该公司理论上可以在约五年内回购其全部流通股。

总股东回报是头条:NVIDIA 股票在截至 2025 财年的五年内回报约 2400%——年化复合增长率 88%。以此对比:2020 年 1 月投入 NVIDIA 的 10000 美元,到 2025 年 1 月价值约 250000 美元。标普 500 中没有其他大市值股票接近这一数字。

风险——什么可能打破这台机器

出口管制与地缘政治风险

NVIDIA 最直接的结构性风险来自美国政府。拜登政府对先进 AI 芯片的出口管制——最初针对 A100 和 H100,随后在 2023 年 10 月和 2024 年进一步收紧——禁止 NVIDIA 向中国销售其最先进的芯片。

在管制收紧之前,中国约占 NVIDIA 数据中心营收的 17%。NVIDIA 开发了专为合规出口限制设计的中国特供版本(H800、L40S),但连续的规则收紧实际上也封堵了这些渠道。失去的中国营收代表着真实的逆风——但更重大的风险是升级。如果中美技术脱钩加速并延伸至台积电为 NVIDIA 芯片的生产,整个半导体供应链将面临压力。

台积电集中风险

NVIDIA 不拥有晶圆厂。每一块先进 NVIDIA GPU 都由台积电在台湾以其 4nm 和 3nm 制程节点制造。台湾面临来自中国领土主张的持续地缘政治风险。台海冲突——即使是非动能升级——也将扰乱 NVIDIA 的全部生产能力。

需求集中与资本支出周期风险

在 2025 财年,四家超大规模云服务商——微软、谷歌、亚马逊、Meta——可能占 NVIDIA 数据中心营收的 50% 以上。对于一家 1305 亿美元营收的业务来说,这是非同寻常的客户集中度。

超大规模云服务商的资本支出遵循周期。当前 AI 基础设施建设是科技史上最陡峭的资本支出周期。如果 AI 模型回报令人失望——如果企业 AI 采用比预期慢,如果杀手级应用在消费者层面没有出现——超大规模商的资本支出可能急剧放缓。NVIDIA 的营收将随之而来。

开放生态系统的挑战

每一家主要科技公司都在投资 NVIDIA 的替代品。谷歌的 TPU v5 在其自身训练工作负载上具有竞争力。AMD 的 MI300X 提供有竞争力的性价比。英特尔的 Gaudi 3 针对推理工作负载。定制硅的趋势——减少 NVIDIA 依赖——是未来十年真实的竞争力量。


结论

NVIDIA 是投资领域最罕见的事物:一家竞争护城河在加深的同时市场空间也在扩大的企业。

CUDA 软件生态系统历经十五年构建,复制它需要十年。NVLink 互联架构在集群级别创造了超越单个芯片决策的转换成本。NVIDIA 的硬件、软件栈与 AI 研究社区之间的关系是共生的——每一代新架构的发货、每一次 cuDNN 的新优化、每一个在 NVIDIA 基础设施上训练的新模型,都在加深生态系统优势。

财务结果只是那个护城河发挥作用的输出。1305 亿美元营收、75% 毛利率、47% 自由现金流转化率,不是偶然——这是垄断供应商面对计算历史上最资本密集型基础设施建设所产生的无限需求时会发生的事情。

风险是真实的。地缘政治风险是结构性的,无法定价。客户集中度创造了周期性敞口。竞争不会停滞不前。

但核心论点很简单:训练和运行前沿 AI 模型需要大量 GPU 算力,NVIDIA 的 CUDA 生态系统使其 GPU 成为默认选择,而前沿 AI 需求不是一种趋势,而是全球计算资源分配方式的永久性结构转变。未来十年在 AI 基础设施上花费的每一美元,都以某种有意义的比例流经 NVIDIA 的损益表。

黄仁勋在 Denny's 餐厅下的赌注刚刚兑现了。而且是大规模兑现。

继续阅读