英伟达的GPU长跑
作者: 金泰
黄仁勋知道,单凭技术参数并不能卖出图形芯片,营销和品牌几乎同样重要。
他的竞争对手采取不同方法来定位自己的产品。有些采用夸张的、超男性化的品牌,以迎合游戏玩家,如3dfx的巫毒女妖(Voodoo Banshee)、ATI的暴怒 Pro(Rage Pro);其他产品则采用更技术化或工业化的命名,如Matrox G200或Verite 2200。
英伟达则倾向于折中,其芯片命名方式既传达技术的卓越,又能引发情感共鸣,例如RIVA TNT,RIVA代表实时交互视频和动画加速器,TNT则指双纹理单元。正如一位工程师所说,对普通消费者而言,这显然是一个“与爆炸有关”的名字。
在这样一个拥挤市场中,英伟达决定打破规则,脱颖而出,GPU由此横空出世。
绝妙命名
1999年,英伟达推出RIVA TNT2系列的迭代产品GeForce 256。
毋庸置疑,GeForce 256代表传统图形处理能力的重要进步,这是英伟达每一代新芯片的典型特征,也符合市场对英伟达每一代新芯片的预期。
它具有4个图形渲染管线,可同时处理4个像素任务;还集成了一个硬件光影转换引擎,这意味着它可以承担移动、旋转和缩放3D物体所必需的计算任务,这些任务以往通常由CPU完成。GeForce 256减轻CPU的计算负载,使整台计算机运行得更快。
英伟达的管理团队认为,其技术性程度太高,很难向客户推介,内部典型的命名公式(首字母缩略词 + 数字)行不通。英伟达需要更大的名头来推出这款新产品。
“我们必须找到一种方法,把这个产品定位成比其他产品都更好的3D图形处理器,为其收取高价。”时任英伟达营销主管的丹·维沃利说,他激励产品营销团队想出一些绝妙的点子。
产品经理桑福德·拉塞尔开始研究潜在的创意,他找高管迈克尔·哈拉进行30分钟的头脑风暴,商讨如何更有效地营销GeForce 256。
两人都记得,在走出房间时他们产生这样一个想法:把新的芯片命名为全新产品类别的第一款产品——图形处理器(GPU),它在图形渲染方面的作用,就像计算机的CPU在所有其他计算任务中的作用一样。
为图形芯片进行特殊命名,并明确将其与CPU进行比较,这将使图形芯片首次脱颖而出,成为一款真正出类拔萃的产品。
没过几天,营销团队就决定使用GPU这一名称。这不仅帮助英伟达在众多图形芯片中脱颖而出,还使其更容易获得溢价。全世界都知道,CPU的价值可达数百美元。
尽管英伟达的芯片与CPU一样复杂,且拥有更多晶体管,当时批发价却不到100美元。公司将所有芯片都标记为GPU后,这种价格差距就大大缩小了。
首次应用于GeForce 256的GPU名称,还是在英伟达工程师中引发了争议。
该芯片缺乏“状态机”(一种专用处理器,可以转换不同状态来执行和获取指令,就像CPU执行编程指令一样),不具备可编程功能。这意味着第三方开发者无法轻松自定义图形样式和特征。相反,开发者必须依赖英伟达定义的一组固定硬件功能。
此外,GeForce 256没有自己的编程语言。
营销团队辩称,下一代图形芯片已经计划采用这些功能,即使没有这些功能,GeForce 256在性能上的飞跃也是显而易见的,全世界的游戏玩家和电脑爱好者都能感受到这一点。他们不顾工程师的反对,坚持使用GPU这一名称。
当黄仁勋在1999年8月发布GeForce 256时,他毫不避讳地“夸大其词”。
“我们正在推出世界上第一款GPU,”他在新闻稿中宣称,“GPU是行业的一次重大突破,将从根本上改变3D媒体。”
维沃利决定不注册“GPU”商标,因为他希望其他公司也可以使用这个术语,意在表明英伟达开创了一个全新的产品类别。最终,“夸大”变为现实:GPU这一名称后来成为行业标准,并帮助英伟达在接下来的几十年里销售了数亿张显卡。
英伟达的一名营销人员,在一条通往竞对3dfx总部的高速公路的立交桥上设立了一个广告横幅。该横幅宣称,英伟达的GPU将改变世界并击垮竞争对手。州警迅速移除了这个非法设立的横幅,英伟达也因此收到了正式警告。
然而,这一举动至少达到了它主动威慑对手的目的。“这就是战争的艺术。我们想让他们失去士气。”维沃利说。
不计成本
现代图形芯片通过所谓的图形渲染管线进行计算,将带有对象坐标的几何数据转换为图像。
该过程的第一个阶段被称为几何阶段,通过缩放和旋转计算来转换虚拟3D空间中对象的点和线;第二个阶段被称为光栅化阶段,确定每个对象在屏幕上的位置;第三个阶段被称为片元阶段,负责计算颜色和纹理;在最后第四个阶段,把图像组合起来。
早期的图形渲染管线包含一些固定的功能阶段,每个阶段都执行一小部分固定的运算。英伟达及其竞争对手(显卡制造商)各自定义了其芯片如何处理图形渲染管线中的所有阶段,第三方开发者无法改变芯片渲染内容的方式,只能根据芯片设计师设定的选项来创建视觉效果和艺术风格。
结果是,市场上的每个游戏看起来都大同小异——没有任何一个游戏能够仅凭借视觉效果脱颖而出。
英伟达首席科学家大卫·柯克希望,通过发明真正的GPU来改变这一状态。
他的想法是引入一种名为可编程着色器的新技术。这将使图形渲染管线向第三方开发者开放,使其能够编写自己的渲染函数,并更好地控制游戏呈现的视觉效果,这些着色器将允许开发者实时生成视觉效果。
他认为,开发者会很快在游戏中采用可编程着色器,因为他们比芯片设计师更了解如何创造最先进的视觉效果。这反过来又会吸引游戏玩家选择英伟达的显卡,因为它们将成为市场上唯一支持这种先进图形技术的显卡。
这个想法的唯一问题是,只有修改英伟达芯片的设计方法,才能实现可编程着色,从而实现真正的GPU。这将是一项既昂贵又耗时的工作,即使是对于老牌厂商也不例外。
柯克知道,黄仁勋清楚这项技术的好处显而易见,且拥有最终决定权。他也知道黄仁勋会聚焦于成本:英伟达需要投入多少资金来创造这种技术,市场是否已经准备好接受这种技术,以及这种技术能带来多少额外收入。
黄仁勋最初看起来很热情,柯克不确定这是不是一个好兆头。“黄仁勋有一个特点,就是在他决定扼杀你的项目之前,他和你谈论时看起来很乐观。”柯克说。
为了确保他的项目能够存活,柯克激发了黄仁勋对被竞争对手超越的恐惧。他指出:英伟达在固定功能图形加速方面的领先地位,将不可避免地被侵蚀;传统图形芯片的固定功能操作总有一天会变得足够微型化,以至于英特尔能够将其集成到CPU的某个部分或主板芯片中,从而完全不需要独立显卡。
他还表示,可编程着色器未来可能会打开游戏之外的其他市场。“好吧,”在听到柯克的想法后,黄仁勋说,“好,我会同意的。”
2001年2月,英伟达发布GeForce 3,其可编程着色器技术和对第三方开发者核心图形功能的支持,使其成为第一款真正意义上的GPU。
柯克的分析得到了证实,GeForce 3获得了轰动性的成功。2001年,英伟达的年销售额已达到10亿美元,比美国任何其他半导体公司都更快地实现这一里程碑。
其年底的市值是IPO当天的20倍,这要归功于公司的战略远见、不懈的执行力,以及黄仁勋及其管理团队的“偏执狂精神”——时刻警惕来自四面八方、每时每刻都可能发生的威胁。
征服苹果
英伟达业务的持续多样化,推动它与苹果直接达成了合作。
在21世纪初,英伟达赢得了一小笔合同,给面向消费者的iMac G4提供图形芯片。这款计算机是彩色一体机iMac G3的迭代产品,而后者标志着史蒂夫·乔布斯于1998年重返苹果。
曾成功赢得微软Xbox业务的克里斯.迪斯金,被任命为英伟达与苹果整体销售关系的负责人。他与丹·维沃利一起制定了一项策略,将英伟达的GeForce芯片植入更多的苹果电脑中。
关键的突破,得益于一部皮克斯的经典动画短片。当时,英伟达向个人电脑制造商推销的核心是图形演示,即展示其芯片的先进特性和原始计算能力。
维沃利知道,只有英伟达充分了解其受众,图形演示才能产生最大的影响,于是决定投入更多的时间和资源,为销售团队制作更好的图形演示。他甚至聘请硅图公司的前同事马克·达利,专门改进英伟达的演示。
在GeForce 3开发过程中的一次头脑风暴会议上,达利找到了展示英伟达新芯片的最佳方式。
皮克斯的2分钟动画短片《小台灯》是电脑动画的分水岭。这部关于跳动的台灯的影片在1986年首次发布时,展示了当时计算机生成图像的能力。制作这部影片需要强大的计算能力,每一帧都在克雷超级计算机上构建,需要3个小时来渲染。
达利认为,英伟达应该制作一个关于《小台灯》的演示,其团队完成了演示,效果看起来与他设想的一样令人印象深刻。维沃利心想:“如果我们把演示给史蒂夫·乔布斯看呢?”他认为,展示实时渲染版本的《小台灯》会有很好的效果,这将触及乔布斯本人职业生涯的一个里程碑时刻。
维沃利和迪斯金前往苹果总部与乔布斯会面。在演示的第一部分,英伟达团队使用了与原版相似的镜头和角度展示《小台灯》。乔布斯说:“看起来不错。”
然后,他们再次运行演示,维沃利开始在演示中改变摄像机的位置或角度。摄像机的移动表明,与静态视频不同,英伟达的芯片可以实时渲染整个场景。用户可从任何角度以逼真的光照与阴影效果变换和观看场景。
这下,乔布斯震惊了。英伟达的GPU能够实时渲染动画,不仅与皮克斯的超级计算机花费几周生成的视觉效果的清晰度相当,还提供实时交互功能。乔布斯决定在Power Mac G4电脑上提供GeForce 3作为高端选项。
大约20分钟后,乔布斯准备离开,他给英伟达团队留下了一些临别建议。
“你们真应该在移动设备领域下功夫,因为ATI正在笔记本电脑领域打败你们。”3dfx倒闭后,英伟达的主要竞争对手就是ATI。迪斯金毫不犹豫地回答:“事实上,史蒂夫,我认为你错了。”
全场顿时鸦雀无声。乔布斯紧盯着迪斯金说:“告诉我,为什么?”迪斯金感觉到,没有多少人敢质疑史蒂夫·乔布斯,显然乔布斯期待一个好的答案。
迪斯金确实有一个好答案。他解释说,英伟达芯片确实更耗电——比大多数笔记本电脑的耗电量还大——因为它们提供台式电脑用户所需的更高性能。但是,英伟达可以很容易地降低芯片的性能和功耗,以满足笔记本的规格要求,其旗舰产品线的降频版本就足以胜任。
乔布斯又盯了他一会儿。“好吧。”他只说了这一句,会议就结束了。30分钟后,迪斯金接到苹果高管菲尔·席勒的电话。
“我不知道你对史蒂夫说了什么,但我们需要你们整个笔记本电脑团队明天到这儿来,待上一天,审查你们的芯片。”席勒说。在几年内,英伟达在苹果笔记本电脑上的份额,从零增长到占据苹果计算机产品线的约85%。这不仅归功于迪斯金的演示,还要归功于他敢于挑战科技行业中最令人生畏的人物之一的胆量。
通用计算
马克·哈里斯是来自北卡罗来纳大学教堂山分校的一名计算机科研人员,他希望找到一种方法,能利用计算机更精确地模拟复杂的自然现象,如流体运动或大气云层的热力学过程。
2002年,哈里斯观察到,越来越多的计算机科学家,开始在非图形应用中使用GPU,例如英伟达的GeForce 3。运行模拟的研究人员报告称,与使用只依赖CPU的计算机相比,使用GPU的计算机在速度上显著提升。