微软vsGoogle:AI技术的王权更迭

Google出拳

2023年2月3日星期五,Google云业务部门宣布了对人工智能初创公司Anthropic价值3亿美元的投资,约占这家公司股权的10%。这项投资有一个很现实的回报是:Anthropic今后将从Google采购更多的云计算服务。换句话说,Google这笔投资,主要是以它为一家人工智能公司长期提供云计算服务的方式来兑现。

对于每年要为算力烧掉上亿美元的人工智能公司来说,这样的安排并不罕见。3年多前,微软正是通过向OpenAI投资10亿美元,换得后者选择微软Azure作为独家云服务供应商,双方也就此完成了战略绑定。

事实上Google与Anthropic的这笔交易,在去年年底就已私下完成。选择在眼下这个时间点正式发布消息,反映出Google愈加迫切的心情:它急需将公众的注意力从微软、OpenAI还有ChatGPT那里夺回来。

这家在过去五六年间不断以“人工智能优先(AI First)”构筑公司技术创新形象的硅谷巨头,忽然间发现自己在长期引以为傲的人工智能领域,竟然失去了聚光灯下的位置。

现如今,每个人都在讨论OpenAI和ChatGPT,讨论这是不是人工智能界的“iPhone时刻”,很少有人记得GPT技术的理论基础—Transformer模型算法,是Google Brain的研究团队最先提出的。

Google投资的Anthropic公司,由OpenAI原研发副总裁达里奥·阿莫迪(Dario Amodei)于2020年年底在“对公司的发展方向存在分歧之后”,带领团队脱离OpenAI后创立,据称当时产生分歧的核心就在于阿莫迪不满于OpenAI逐渐成为微软的附庸。

阿莫迪在OpenAI工作过5年,领导了GPT-2和GPT-3的技术研发,属于项目最核心的成员之一。在加入OpenAI前,他还是Google Brain团队的一员。

微软vsGoogle:AI技术的王权更迭0
OpenAI CEO萨姆·奥特曼(左)与微软CEO萨蒂亚·纳德拉(右)。

微软的回击

Google希望尽快夺回公众的注意力,但微软瞄准Google要害的一击已经在来的路上。2月7日星期二上午10点,与Google宣布投资Anthropic仅仅隔了一个周末,在位于美国华盛顿州雷德蒙德的微软总部,CEO萨蒂亚·纳德拉宣布将OpenAI的最新技术集成到Bing搜索引擎和Edge浏览器的下一个版本中。他对外展示了一个能够与用户对话的搜索引擎:你只要提出问题,Bing在检索相关网页信息后直接以回答问题的方式将结果告诉用户。

“互联网搜索的范式在过去十多年间从未变化,但人工智能会让获取信息的方式更快更流畅,”纳德拉带着他一贯的和善笑容总结道,“这是搜索领域新的一天。”

微软这一招戳到了Google的命门。搜索是Google赖以为生的核心业务,搜索广告带来的收入占到公司总营收约57%。过去十多年来,Google垄断了全球搜索市场,份额始终保持在90%以上。相比之下,排名第二的Bing市场份额只有3%。Google太久没有感受到过威胁了,它只能仓促应对。

2月8日星期三晚间,Google在巴黎召开了发布会,推出一款类似ChatGPT的产品:Bard。对比前一天的微软发布会,Google的发布会处处显露出仓促—地点选择在地球另一边的巴黎,美国观众只能观看线上直播;发布会现场简陋又局促,看起来像是某个创业公司临时包下的一家咖啡馆;一位演讲者遗失了演示用的手机;发布会后有人指出Bard在演示中错误地回答了问题。

事实上,Bard并没有看起来那么糟糕,毕竟ChatGPT也常常满口胡话。但资本市场对于Google的应对并不买账,究其原因是Google在过去十余年里一步步在人工智能领域塑造出的独占鳌头的形象突然崩塌了。投资人发现,Google建立的技术壁垒并非高不可攀。

资本市场对于这场失败的发布会给出的负面反馈,直接掩盖了人们对于Bard的产品能力的正常讨论:Google股价在次日开盘后暴跌超7%,市值蒸发1000多亿美元。

这听起来像一幕新的英雄挑战恶龙的故事。有趣的是,这样的故事不止一次在微软与Google这两家公司之间上演过,只不过,上一次扮演恶龙的公司是微软。

曾经的恶龙

时间拉回到2008年,曾任微软首席AI科学家的邓力在神经信息处理系统大会(NIPS)上遇见了后来被誉为人工智能教父的杰弗里·辛顿(Geoffrey Hinton),得知后者正在研究的一种神经网络的思路,可有效提高语音识别的效果。这个消息让邓力很心动,因为他大学时研究的就是神经网络。但他在微软的上司对这个思路并不感兴趣,邓力只好调动自己手头不多的经费买来3块GPU开展实验,隔年邓力又邀请辛顿到微软访问,二人进一步推进了神经网络的研究。

遗憾的是,这场合作在2010年终止。原因是卡内基梅隆大学计算机系原系主任PeterLee加入微软,开始负责整个雷德蒙德研究院的运营,他评估邓力的项目后表示这个神经网络的方法“非常荒谬”,在这个方向投入经费“纯属浪费”。

Peter Lee代表了当时大部分微软科学家的态度。人工智能自1960年代以来,诞生了很多流派,目前最具影响力的就是统计机器学派和神经网络学派,前者崇尚严谨的推理证明,后者提倡先假设后验证。不过,神经网络流派曾经长期处于被严重打压的状态。

微软vsGoogle:AI技术的王权更迭1
年3月,微软发布由GPT-4模型驱动的Microsoft 365 Copilot应用。

微软虽然早在1990年代就开始组建研究院从事人工智能方面的前沿研究,但此时刚好是神经网络学派最低谷的时期,在微软把持着关键岗位的科学家们基本上都将神经网络视作异端。即使邓力在2012年最终证明了神经网络在语音识别上是有效的,Peter Lee依然固执地认为那只是撞大运而已。这样的判断,让微软错过了将辛顿和他的博士生们纳入麾下的最好机 会。

不过,无论微软态度如何,人工智能新时代的大门已经打开—2006年,辛顿在神经网络的基础上提出深度神经网络的概念,也就是后来的深度学习;2007年,英伟达推出基于CUDA架构的GPU,为深度学习提供了武器;2010年,斯坦福教授李飞飞举办首届ImageNet挑战赛,为深度学习提供了弹药和擂台;2012年,辛顿最终与他的两个学生一起扣动了扳机,采用基于深度学习的AlexNet模型,在当年的ImageNet大赛上彻底击败了传统的人工智能算法。

AlexNet的大获全胜被看作是深度学习卷土重来的标志性事件,技术巨头们也开始了熟悉的操作—买。当年9月,百度表示愿意以3年共计1200万美元的薪酬雇用辛顿与他的学生们,不过辛顿在犹豫后决定采用拍卖的方式来实现自己的价值。他成立了一家只有3个人的公司DNNresearch作为标的,微软、Google、百度和DeepMind是参与竞拍的4家公司,每个人都知道竞拍的真正标的其实就是DNNresearch这3位科学家。

竞拍通过Gmail进行,每次报价提升100万美元,当时还是初创公司的DeepMind是最早退出的,还没彻底理解深度学习价值的微软也在竞价被抬升至2200万美元时放弃了,最终辛顿本人在Google报价440 0万美元后主动按下了暂停键,他没有给百度继续举牌的机会。事后辛顿表示,在他眼里Google是深度学习研究最合适的归宿。

微软vsGoogle:AI技术的王权更迭2
被誉为人工智能教父的杰弗里·辛顿(右一)和他的两个博士生在2012成立DNNreserach,后被Google以4400万美元竞拍收购。

2012年的Google确实够酷。美国加州山景城的Google总部有几十间餐厅,供应着各种美食,各个角落都有免费的零食饮料,园区里随处可见穿着牛仔裤彩色T恤、脚踏滑板或者手推着自行车的员工,这里像是一个理想中的校园,尤其是与细雨绵绵的西雅图相比,加州一年四季灿烂的阳光不停地为这里的每个人注入着朝气。

而最能够打动辛顿的,是Google是美国技术巨头中第一个愿意在深度学习研究上砸钱购买算力的公司。

2010年,还在斯坦福大学执教的吴恩达需要算力来验证深度学习的研究成果,但他寻遍了美国各个高校和公司,只有Google愿意提供足够的算力。于是他选择加入刚刚成立的Google X秘密实验室(2015年更名为X),并在2012年与Google首席工程师Jeff Dean一起,用1.6万个CPU组成当时世界上最大的神经网络,建立了Google Brain的雏形。

2014年年初,Google花5亿美元收购了DeepMind。这家公司在当时刚刚发表了被认为是深度强化学习开山之作的论文《使用深度强化学习玩雅达 利》。

内有孵化的Google Brain,外有收购的DeepMind,在这一轮席卷整个人工智能圈的深度学习浪潮中,Google的两位创始人—拉里·佩奇和谢尔盖·布林大可说一句“天下英雄入吾彀中矣!”。

Google的技术光环的笼罩之下,微软这个曾经被整个技术行业视作恶龙的公司,丧失了对人工智能人才的吸引力。微软研究院的科学家们不断被Google、Facebook等等更有活力的后辈公司挖走;在中国,大批微软科学家选择了创业,以致于微软亚洲研究院被赋予了“中国人工智能领域的黄埔军校”这个不无嘲讽意味的称呼。

科技公司围绕前沿技术层面的竞争,也会时刻反映在各自股价的变化上:在Google成立后的15年(1998年至2013年)内,微软的股票一点都没有增值,并且在2013年公司市值首次被Google超越。

表面上看,当年的微软是陷入了很多大企业都会遇到的瓶颈:企业文化保守、预算投入有限、管理层缺乏眼光等等。这些判断或许都有一定的道理,但如果究其根本原因,2012年的微软缺少让深度学习释放潜力的业务形态。

当时的微软几乎什么产品都有,个人的、企业的、消费的、商用的、移动的、云端的。微软为自己塑造了技术巨无霸的名头却又困于这个名头,执拗地要在技术领域里的每个地方都插上一脚。但如果扒开层层包裹的外壳,其内核还是一家古老的以销售软件授权作为盈利模式的公司。

深度学习与其他人工智能路线的最大区别,就是它需要海量的算力作为支撑,这就使得微软科学家们几乎无法将产品落地到业务上。比如邓力的研究,就算证明了深度学习能够提高语音识别的效果,但在当时的微软,这样的研究成果很难产生商业回报。以产品为导向的研发文化,会阻碍科学家们对研究课题的长期探索。

再回头,已无酷少年

Google作为一家诞生于互联网时代的公司,核心业务本身就需要庞大的服务器来支撑,因此天然与需要海量算力支持的深度学习相契合。Google可贵的一点,在于它较早地认知到深度学习驱动的人工智能技术不会落地为一款软件,它应该是一种服务。

Google Brain围绕深度学习所做的研究,第一个合作项目就是Google语音搜索,且很快就提升了语音识别的准确率。此后,不断有新的产品找到GoogleBrain团队寻求帮助。无论是自然语言处理、图像识别、语音转文字、机器翻译,Google Brain的每项研究都能够快速在产品端得到验证。

上一篇 点击页面呼出菜单 下一篇