黄仁勋:危机感从未远离

作者: 陈洋

黄仁勋:危机感从未远离0

英伟达创始人兼CEO黄仁勋。图/视觉中国

“时间机器”狂欢的气氛早早燃起。

当地时间2023年8月22日,2024财年第二财季财报发布前夕,英伟达的股价飙升8.47%,创下自5月25日以来的最大单日涨幅。据芝加哥期权交易所的数据,2023年截至8月中旬,投资者已向英伟达相关期权注入超1000亿美元,其中约60%的资金涉及可用于押注股价持续走高的看涨期权。除特斯拉外,还没有其他股票曾收获如此热捧。

投资者的狂热没有踏空。8月23日发布的财报显示,英伟达期内实现收入135.1亿美元,同比上涨101%,高于预期的111.9亿美元;净利润61.9亿美元,同比上涨843%;非美国通用会计准则(non-GAAP)每股摊薄收益为2.70美元,同比上涨429%,高于预期的2.08美元。

分业务来看,AI芯片所在的数据中心业务贡献突出。2024财年第二财季,数据中心业务营收达到创纪录的103.2亿美元,环比增长141%,同比增长171%。相比分析师预期的79.8亿美元高出了29%。英伟达表示,这部分收入主要来自云服务商和大型消费类互联网公司。

“全球已经安装了价值约1万亿美元的数据中心,而这个上万亿美元的数据中心市场正在从通用计算向加速计算和生成式人工智能转型,” 60岁的英伟达联合创始人兼CEO黄仁勋在财报电话会议上宣称,“一个新的计算时代已经开启。”

2023年5月底,上一财季财报发布后,高涨的股价已将英伟达推上神坛,使其成为美国第七家市值破万亿美元的公司。3个月后,它再度刷新纪录且增势不减。作为这轮生成式人工智能浪潮中重要的基建公司,英伟达正在成为这个“新时代”的主要受益者和推动者。

时间回到大半个月前。8月8日晚,洛杉矶,穿着标志性的黑色皮夹克、黑色T恤、黑色牛仔裤,黄仁勋时隔5年再度登上计算机图形界顶级会议SIGGRAPH的舞台,宣布推出新一代GH200 Grace Hopper超级芯片(以下简称GH200)。

与2022年3月发布的H100相比,GH200专为人工智能大模型的训练和推理需求而打造。H100的架构以GPU(图形处理器)为主,GH200则将Nvidia Grace CPU(中央处理器)与 Hopper GPU 架构结合起来,并配备了当前全球最快的内存HBM3E,不仅极大提升了带宽,还显著降低了互连功耗,将为运行TB级数据应用提供高达10倍的性能。

黄仁勋:危机感从未远离1
2023年8月8日,在美国洛杉矶的SIGGRAPH大会上,英伟达发布新一代GH200 Grace Hopper超级芯片平台。图/NVIDIA

据悉,已投入量产的GH200将于本季度发货,采用HBM3e内存的第二代版本预计将于2024年第二季度发货。在此之前,H100仍是市场需求最大的GPU产品。虽然老牌芯片巨头AMD和英特尔接连加码AI芯片,陆续推出对标H100的产品,但当前英伟达在AI芯片领域的市场份额仍超过八成。

三十年前,因为看到游戏市场对3D图形处理能力的需求,黄仁勋和其他两位合伙人共同创建了英伟达。创立初期,公司的主要营收是向游戏玩家出售能提升画面清晰度的显卡。2003年,英伟达开始对传统GPU进行优化设计,旨在利用GPU的计算能力在非图形处理领域进行更通用的科学计算。一场更广泛的创新革命的齿轮由此开始转动。

黄仁勋将深度学习和GPU的相遇形容为“命运撞上了一点运气”,“创立英伟达是因为我们相信人类对计算速度的要求会越来越高。我们开发了一种非常擅长处理数据且有高通量计算能力的处理器,这恰恰使深度学习成为可能。”

2016年4月,英伟达发布了首款深度学习超级计算机DGX-1,其中搭载了8块专为深度神经网络打造的GPU产品P100。4个月后,黄仁勋亲自将一台DGX-1送往旧金山一家成立不足一年的非营利性人工智能研究机构。捐赠仪式上,他用记号笔在这款售价12.9万美元的机箱上写道,“为了计算和人类的未来,我捐出世界上第一台DGX-1。”这家受赠机构就是日后赫赫有名的OpenAI。正是基于 NVIDIA DGX 系统,OpenAI训练出了ChatGPT。

算力是机器学习得以不断突破极限的基础。据黄仁勋介绍,在2021年推出的A100上需要7天完成的训练,在H100上仅需20个小时。随着英伟达GPU在运算性能和能效上的逐代提升,以此为算力支撑的大模型得以在参数上实现质的飞跃。公开数据显示,OpenAI于2018年推出的GPT参数为1.17亿个,而到2023年发布的GPT-3.5,参数规模已超过1750亿个。

黄仁勋喜欢把GPU比作“时间机器”,“如果我们能让某件事加速100倍,研究人员、医生和艺术家就能看到未来”,“帮助这个时代的爱因斯坦和达芬奇们完成他们的事业就是我们公司的价值。”

“军备竞赛”

通用性、易用性和高性能是衡量AI芯片好坏的三个维度。英伟达能成为行业在AI算力上的首选,其护城河既体现在硬件性能,也在软件生态。

黄仁勋很早就意识到协同完善的软硬件生态是创造价值及压制对手的关键。2006年,为了推广GPU通用计算,英伟达开发了用于加速并行计算的软件开发平台CUDA,CUDA可以帮助开发人员更便捷地利用GPU加快计算应用程序的速度。

CUDA平台投入巨大,一度严重拖累了英伟达的利润。最初的几年里,黄仁勋背负了很大的压力,“股东希望我们专注于提高盈利能力,但我们坚信加速计算的时代即将来临。”黄仁勋将承受苦难视作追求愿景路上的必经之痛。

十几年来,CUDA逐渐渗透到包括AI在内的各个通用计算领域,实现了从硬件层到软件层的打通,且基于海量客户,不断实现性能优化。如今,英伟达的软硬件生态已经形成“比较成熟的市场、标准和护城河”。竞品要打开市场,短期内只能兼容CUDA生态,长期则很可能因此而被限制创新潜能,沦为夯实CUDA生态的砖瓦。

2022年底,ChatGPT展现出的强大内容生成能力震惊全球,成为现象级的消费类AI应用。科技巨头应势而动,争相布局大模型领域,其示范效应引发了AI领域的军备竞赛。生成式人工智能的繁荣建立在算力基础上,训练大模型无疑是昂贵的,特别是在供不应求的状况下。据硅谷风投巨头a16z测算,一家企业若要构建并运行自己的数据中心,每年需要花费在基础设施上的支出将超过5000万美元。一些大模型初创公司前脚筹集了数十亿美元的风险投资,其中的八九成转身便被投入购买算力。

错失大机会的恐惧让算力成为科技圈的“最硬通货”。市场对英伟达芯片的需求激增,远远超过了供应。“H100的供应自2023年4月初起便日益紧张,哪怕现在立刻下单,到货也要等到来年一二季度,” CoreWeave负责人8月初在接受《巴伦科技》采访时表示。CoreWeave此前的主要业务是加密货币挖矿,如今面向市场提供GPU租赁服务。

就连最初掀起这波热潮的公司OpenAI也无法获得足量的英伟达高性能GPU。2023年5月,在参加美国参议院司法委员会听证会时,OpenAI CEO萨姆·奥特曼就表示并不希望人们过多地使用ChatGPT,因为“我们没有足够的GPU”,这也影响了ChatGPT的持续优化。

芯片行业是个由一系列瓶颈构成的相互依存的网络。英伟达的主营业务是设计和销售图形处理器和系统芯片,并提供开发环境、工具和系统。以H100为例,其中使用到的高带宽内存(HBM)由韩国企业SK海力士供应,后者是目前唯一量产HBM3的供应商。H100的制造则被委托给台积电。除了HBM3供应吃紧,台积电的CoWoS封装产能同样是关键瓶颈。据悉,台积电正在积极扩大CoWoS封装产能,其2024年产能的四成已被英伟达提前预订。

黄仁勋:危机感从未远离2
2016年,黄仁勋将率先推出的DGX-1单机箱人工智能超级计算机赠予OpenAI。OpenAI 研究团队在计算机上签名。图/NVIDIA

除硅谷巨头外,中国的大型互联网企业是AI芯片的另一大去向。据英国《金融时报》8月初的报道,中国互联网巨头今明两年AI芯片的订单价值达50亿美元。针对这一数据,英伟达向第一财经回应称:“消费互联网公司和云服务提供商每年在数据中心组件方面投入金额达数十亿美元,通常都会提前几个月下订单。”

“过去两年的降本增效中,一些云计算平台减少了GPU采购,储备不足。此外,谁也不敢保证,今天能买的高性能 GPU,明天会不会就受到新的限制。”2023年6月,一位业内人士在接受《晚点 LatePost》采访时表示。

2022年8月,美国商务部对英伟达的最新两代GPU A100和H100实施出口管制,禁止向中国企业销售。同年10月,美国商务部正式出台了针对中国大陆的半导体出口管制新规,对先进芯片、软件以及用于生产先进芯片的各种半导体制造设备的对华出口提出了许可限制。

英伟达数据中心业务收入的20%至25%来自中国市场。为了降低政策影响,英伟达迅速推出了A100的替代产品A800和H800。根据公开资料,特供版的单卡算力几乎不变,但集群卡间高速互联的带宽分别下降了四分之一和一半左右,会限制AI模型的训练速度。按照彭博社的说法,同样的 AI 任务,H800要比H100多耗费10%到30%的时间。

《华尔街日报》6月底曾援引知情人士消息称,美国正在考虑对向中国出口人工智能芯片实施新的限制,将禁止在没有许可证的情况下对华销售A800芯片,并将一些低算力芯片纳入限制范围。包括英伟达在内的美国半导体行业曾多次就政府的对华限制政策发声。在最近的财报电话会议上,英伟达首席财务官科莱特·克雷斯就强调,“中国市场是全球最大的市场之一。一旦GPU禁售政策实施,美国半导体行业将永久失去在这里竞争和领先的机会。”

“数据、算法、算力是人工智能的三大核心要素。中国拥有海量数据,近年在算法上突飞猛进,美国卡不了这两块,就卡算力。算法是基于算力的,把算力卡下来,算法就难以进一步优化,数据再多也没用。”一名熟悉中美半导体政策的资深人士在接受《财新》采访时表示。

在管控可能持续加码的阴霾下,半导体芯片国产替代的需求凸显。虽然在通用GPU赛道上,过去数年国内也陆续涌现出一批初创企业,但在产品的成熟度和性价比、商业化的验证和落地、客户基础和软件生态等方面,这些企业仍与英伟达差距明显。

在《芯片战争》的作者、美国塔夫茨大学副教授克里斯·米勒看来,虽然中国企业取得了一些有意义的成功,但几乎每一项重大进步都会遭到美国新的出口管制,“这使得中国推动半导体自给自足的努力更加重要,但也更加困难和昂贵。”

神话与变数

2017年,创业第24个年头,为庆祝股价突破百元,黄仁勋在左臂文上了公司的标志“绿眼睛”。此后的5年间,英伟达的股价从每股100美元飙升至超451美元(截至2023年9月11日)。2023年以来,英伟达的股价已上涨两倍多,持股3.5%的黄仁勋也成为全球科技行业财富增长最快的人之一。

上一篇 点击页面呼出菜单 下一篇