论 NVIDIA 的崛起
英伟达(NVIDIA)的股价屡创新高,其市值在短短几年内相继突破了 1 万亿、2 万亿,直至目前的 3.2 万亿美元大关。这家以 GPU 起家的公司在人工智能领域正发挥着越来越重要的基础设施作用。
回顾英伟达的发展历程,可以发现它几乎与 GPU 技术的发展同步。作为图形处理器的领头羊,英伟达通过不断创新和升级,推动了 GPU 从专业图形显示向计算领域的拓展。尤其是在 AI 技术突飞猛进的背景下,GPU 的高性能并行计算能力为深度学习提供了坚实的支撑,使得英伟达成为这一领域不可或缺的角色。
什么是 GPU
GPU,即图形处理器(Graphics Processing Unit),最早诞生于 20 世纪 90 年代初。随着计算机技术的飞速发展,游戏行业开始从 2D 向 3D 转变。相比 2D 游戏,3D 游戏能够提供更加逼真的体验,但也对计算能力提出了更高的要求。为此,GPU 被发明出来,用于专门处理图形计算任务,以减轻 CPU 的负担。
最初,GPU 的任务主要集中在图形渲染方面。例如,在早期版本的 DirectX 环境启动测试中,就有一个经典的旋转立方体演示。在计算机图形学中,实现立方体的旋转通常需要用到矩阵变换。在三维空间,旋转操作可以通过 3×3 或 4×4 的旋转矩阵来表示。一个立方体包含 8 个顶点,每个顶点通过旋转矩阵的乘法来计算其位置,计算的复杂度为 O(8×n²),这里的 n 表示矩阵的维数(3 或 4)。
然而,处理简单的旋转立方体只是 GPU 的一部分功能。在实际应用中,3D 游戏还需要进行复杂的计算,如面片的处理、纹理的映射以及光照效果的模拟等,这些操作都会进一步增加计算的复杂度。这些操作显著增加了计算复杂度,也会消耗大量的 CPU 计算资源。
在设计初期,CPU 和 GPU 被赋予了不同的任务领域。CPU 擅长的是串行任务处理,比如复杂的控制逻辑和优化电路,计算只是其众多功能之一。而 GPU 则以其并行计算的优势脱颖而出,利用大量简单的计算单元,完成海量计算任务。
第一代 GPU
1995 年 5 月,英伟达(NVIDIA)推出了第一代产品 NV1。这款产品不仅具备完整的 2D 和 3D 图形显示核心,还开创性地在显示芯片中集成了声卡功能和 I/O 控制器。在当时,3D 技术标准尚未统一,每个显示卡厂商都有自己独特的 API 接口:3dfx 有 GLIDE、PowerVR 有 PowerSGL、ATI 有 3DCIF,而 NVIDIA 却没有属于自己的 3D API。这也意味着它未能获得图形开发者的广泛支持。
随后的发展中,微软在 Windows 95 中制定了 Direct3D 立体标准。然而,由于 NV1 不兼容 Direct3D,其商业表现并不如人意,这主要是因为英伟达的 NV1 系统使用的是四边形,而大多数 3D 产品的基本单位是三角形。这一失败教会了英伟达在硬件领先的同时,兼容性也是决胜市场的重要因素。
鉴于此,英伟达做出了一个关键决定,全力支持微软的 Direct3D 标准。通过这一策略的调整,公司在 1997 年推出了 RIVA 128。不仅完全兼容 Windows 95,而且是当时唯一一款同时具备 2D 和 3D 显示能力的 AGP 显卡。RIVA 128 大获成功,在上市后的四个月内销量达到 100 万台。
继续乘胜追击,1998 年 10 月,英伟达发布了新一代显卡 RIVA TNT,这款产品成功击败了当时的主要竞争对手 3Dfx Voodoo 2,并成为推动英伟达于 1999 年 1 月在美国纳斯达克成功上市的重要动力。
1999 年 8 月,英伟达发布了具有跨世纪意义的 GeForce 256(NV10)。这不仅是业界第一款 256bit 的 GPU,也是全球首个集成 T&L(几何加速/转换)、动态光影、三角形设置、剪辑和四像素渲染等 3D 加速功能的图形引擎。通过将硬件变换和光照(T&L)功能集成到 GPU 中,GeForce 256 大大提高了 3D 图形处理能力,使复杂的几何计算从 CPU 转移到 GPU,显著提升了系统整体性能。
GeForce 256 的推出标志着真正 GPU 时代的开始,也为图形处理技术注入了强大动力,它不仅是英伟达从追随者转变为行业领导者的里程碑,更开启了一个全新的 3D 图形时代。英伟达首创性地提出了 GPU(Graphics Processing Unit)这一概念,以推广其 GeForce 256 芯片,这一创举奠定了其在业内的领导地位。
第一个增长曲线:游戏
千禧年初期是一个商业结构巨变的年代,这段时期见证了市场的整合与巩固,游戏产业也因此经历了深刻的重塑。1995 年前后,由 PlayStation 和 Nintendo 64 领衔的第五代游戏主机取得了百万级销量的成功,大大拓宽了游戏玩家的受众群体。
到 2000 年,PlayStation 2 率先上市,带领第六代主机再次打破销量记录,最终成为有史以来最畅销的游戏主机。精美的 3D 画面需求持续提升,推动了对图形处理能力的进一步渴求。然而,微软和索尼在游戏主机市场的激烈竞争为这一时期蒙上了一层阴影。
索尼凭借 2000 年发布的 PS2 抢占了市场先机,而微软则因供应商问题推迟到 2001 年才发布 Xbox。为了应对后发的劣势,微软采取了压低价格的策略,希望提升竞争力。然而,由于要求供应商英伟达降低 GPU 供货价格遭到拒绝,微软将价值 2 亿美元的订单转给了 ATI。同时,微软在发布新的 DirectX9 标准时未提前通知英伟达,导致英伟达在 2002 年发布的 GeForce FX 因兼容性差和发热问题表现不如 ATI 的 Radeon 9700。
面临复杂的竞争格局,英伟达迅速做出战略调整,认识到过度依赖大型电脑企业可能带来巨大的经营风险,必须通过持续领先的产品性能才能在市场中掌握话语权。创始人黄仁勋决定大幅提升产品性能,加大研发投入,并要求研发团队每六个月将显卡性能翻倍。
英伟达的 GPU 的性能增长,已经远远超过了摩尔定律所讲的增长速度了。
2024 年时,GPU 显卡的算力对比 2016 年 GPU 的算力,增长了 1000 倍,而如果按照摩尔定律,每 2 年翻一倍来算,应该是 2 的 4 次方,也就是只有 16 倍,1000 倍已经是摩尔定律的 62.5 倍了。
第二个增长曲线:分布式计算
2008 年,中本聪的神秘人物发布了比特币,通过结合强大的密码学理论,这一加密货币改变了金融世界的格局。在 2010 年,一位早期持有者用 1 万个比特币兑换了两个披萨,这一交易让比特币第一次有了明确的市场定价(10000 BTC=$25)。
他是比特币的早期核心开发者之一。通过挖矿,他意识到 GPU 在并行计算上的巨大优势,可以显著提升挖矿速度。从此,他编写的第一个 GPU 挖矿程序,推动整个社区迅速转向 GPU 挖矿,以其碾压 CPU 的效率成为主流。
到 2021 年,比特币价格飙升至新高,市场几乎所有 NVIDIA 显卡都被抢购一空,其中以 3070 为代表的显卡成为了挖矿界的「金矿」,尽管英伟达坚持否认显卡销量与挖矿的直接关系,显卡业务却成为其重要营收来源。
第一次矿潮(2016 年)
- 英伟达推出了专为挖矿设计的无输出接口版 GTX 1060 6GB,首批出货达到 30 万块。
- 随后一段时间,GTX 1060 3GB 的出货也以这种去掉输出的矿卡为主,甚至暂停了正常显卡的销售。
- 到 2017 年底,英伟达推出了专门优化的驱动程序,并基于此推出了 P106 和 P104 系列专业矿卡,强化算力但不支持游戏的 IO 输出,90 天的保修期同样低于普通显卡,价格更为实惠。
第二次矿潮(2021 年)
- 在全球芯片短缺背景下,面对游戏玩家的呼声,英伟达依然为矿工提供 CMP 系列专业矿卡,这些卡去掉了图形处理功能,核心峰值电压和频率更低。
- 英伟达宣称从 2021 年 5 月起推出的 GeForce RTX 30 系列将限制挖矿性能(LHR 版),但矿工们依旧找到了破解的办法,显卡价格因此并未回落。
与此同时,英伟达创始人黄仁勋在公开场合宣扬加密货币的持久价值,并认为这一热潮会长期存在。
第三个增长曲线:加速运算
2006 年,英伟达的首席科学家 David Kirk 思考着一个远大的目标:让 GPU 的应用超越 3D 渲染,将其通用化。如果能在 GPU 中提供合适的编程模型,那么每台 PC 都可以变成一台大规模高性能计算机,处理多样化的任务。
为实现这一愿景,英伟达决定开发通用目的的 GPU,即 GPGPU(General-Purpose GPU)。这种 GPU 能够像 CPU 一样进行通用编程,从而利用超多核心提升计算效率。
2007 年,英伟达推出了基于通用计算的 GPU 软件平台——CUDA(Compute Unified Device Architecture)。CUDA 不仅是一个并行计算的软件接口,还为需要大规模并行计算的科学应用提供了运行平台,实现了 GPU 的加速功能。
英伟达投入了大量资源打造 CUDA 生态系统,在软硬件领域构筑了强大的发展壁垒。通过 CUDA,开发者可以使用 C/C++、Fortran 等编程语言进行并行编程,加速多种应用程序的运行速度。这项突破为 GPU 从游戏拓展到航天、生物医药、AI 等领域奠定了基础,并将英伟达的发展推向新高度。
实施这一计划并不容易。由于每款 GPU 产品在设计中需增加 CUDA 逻辑电路,从而增大芯片面积、散热和成本,同时还需保证软件兼容性,这对工程师来说是巨大的挑战。这期间投资人也以怀疑眼光看待 CUDA,但是英伟达没有放弃。
在 2012 年,AI 领域的关键转折之一发生了。AI 三巨头之一 Hinton 团队利用 CUDA 编写的程序,以革新性的 GPU 加速技术赢得了 ImageNet 竞赛,彻底改变了 AI 研究的速度和效率。
自 2015 年起,英伟达全力投入 AI 领域。2015 年推出 JetsonTX1 超级计算机,支持深度学习和计算机视觉应用。随后,2016 年推出的 DGX-1AI 超级计算机凭借 8 个 Tesla P100 GPU,大幅加速 AI 研究和开发,并支持到 OpenAI。
- 当年,谷歌的人工智能软件阿尔法狗击败了围棋冠军李世石,引发了全球对 AI 的关注,这款软件中搭载了 170 个英伟达 GPU。
- 当时黄仁勋把世上第一台「DGX-1 AI 超级电脑」捐赠给 OpenAI。
英伟达持续创新,在 2017 年推出 Volta 架构,2018 年发布 Turing 架构,引入实时光线追踪技术,随后在 2020 年推出的 Ampere 架构,特别是在 AI 应用中表现出色。
2020 年,自动驾驶技术成为各大车企的竞争焦点,英伟达迅速成为这一领域的重要参与者,其 DRIVE 平台被全球超过 370 家公司采用。
2022 年发布的 Hopper 架构及 H100 GPU,性能大幅提升,再次展示了英伟达在加速计算领域的强大实力。英伟达的每一步创新不仅引领了行业的发展,也不断定义着高性能计算的未来。
2023 年,之后英伟达在数据中心的映射迅猛增长。
显卡军备竞赛
截止目前,世界五大科技公司的 2024 年拥有的算力,以及 2025 年的预测:
2024 年算力 | 2025 预测 | |
---|---|---|
微软 | 75 万 -90 万 | 250 万 -310 万 |
谷歌 | 100 万 -150 万 | 350 万 -420 万 |
Meta | 55 万 -65 万 | 190 万 -250 万 |
亚马逊 | 25 万 -40 万 | 130 万 -160 万 |
xAI | 10 万块 | 55 万 -100 万 |
等效到 H100
英伟达一家撑起了整个 AI 行业的显卡。
中国反垄断
2024 年 12 月 9 日,中国国家市场监督管理总局宣布对美国芯片巨头英伟达公司展开反垄断调查,指控其涉嫌违反中国《反垄断法》以及 2020 年收购以色列科技公司迈络思(Mellanox)时与中国监管部门达成的协议。
2020 年,英伟达以 69 亿美元收购迈络思。中国监管机构在批准该交易时,要求英伟达遵守公平、合理、无歧视的原则,继续向中国市场供应相关产品。然而,随着美国对华芯片出口限制的加强,英伟达无法向中国提供其最先进的 GPU 产品。为绕过限制,英伟达曾为中国市场推出降级版芯片,但美国随后进一步收紧管制,使这些产品也无法进入中国市场。
分析人士认为,中国此举可能是对美国近期加强对华芯片技术出口限制的回应。美国于 2024 年 12 月 2 日出台新一轮出口管制措施,进一步限制中国获取先进芯片技术。作为回应,中国对英伟达展开调查,可能意在表达对美国政策的不满,并展示其在国际科技竞争中的立场。
根据中国《反垄断法》,如果英伟达被判定违反相关规定,可能面临上一财年在中国销售额 10% 以下的罚款。以英伟达 2024 财年在中国的营收 103.1 亿美元计算,罚款金额可能高达 10 亿美元。英伟达表示,将配合调查,并致力于在各地区履行其承诺。
此次调查反映了美中在高科技领域的紧张关系加剧。中国通过反垄断调查等手段,试图在国际科技竞争中维护自身利益。然而,专家指出,这类措施可能是一把双刃剑,需谨慎行事,以避免对自身经济和国际关系造成不利影响。
彩蛋
英伟达名字由来
在开发第一代芯片时,团队内部将其命名中包含了「NV」这两个字母,代表「next version」,意指不断追求创新,他们的第一代芯片是 NV1。然而,当他们试图为公司找到一个包含「NV」的英文词汇时,发现并没有合适的选择。
于是,黄仁勋将目光转向了拉丁语,最终找到了「invidia」这个词,这个词在拉丁语中意为「嫉妒」。他希望让同行业的人们嫉妒自家公司的成就,而不是去嫉妒他人。他们决定去掉首字母「I」,于是「NVIDIA」这个名字便诞生了。
莎士比亚在其悲剧《奥赛罗》中,将嫉妒比作「绿眼怪物」。剧中,伊阿古对奥赛罗说:「哦,我的主人,请当心嫉妒!它是绿眼睛的怪物,只会愚弄自己的盘中肉。」西方人认为强烈的嫉妒会使人的面色或眼睛变成青绿色。
Reference
- GPU简史兼论NVIDIA的崛起
- 英伟达:从为「玩物丧志」添油加醋到为AI开山铺路
- 历史上10款显卡见证NVIDIA起伏15年
- 挖矿热潮该降温了!老黄祭出最后手段,但游戏玩家才是受害者?
- 英伟达挖矿史:「把这一代最优秀的工程师聚在一起,然后研究挖比特币」
- 2024年英伟达成长启示录:保持远见、不断奔跑,用心打好逆风球
The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.
由WhyLiam创作并维护的Why·Liam·Blog采用创作共用保留署名-非商业-禁止演绎4.0国际许可证。
本文首发于Why·Liam·Blog (https://blog.naaln.com),版权所有,侵权必究。
本文永久链接:https://blog.naaln.com/2024/12/NVIDIA-grow-up/