如何投资人工智能的终极赢家
作者: 埃里克·J·萨维茨不到一年前,OpenAI发布的ChatGPT在一夜之间改变了整个世界。2022年11月ChatGPT推出以来,美国科技行业、风投领域和华尔街纷纷调整了投资重点,几乎所有公司——不只科技公司,都开始优先考虑生成式人工智能的开发和采用。
人工智能的概念自冷战以来就一直存在,生成式人工智能之所以成了一个新鲜事物,是因为它能够回答简单自然语言请求所提出的问题,并以文本、音乐、视频、图像甚至诗歌等形式提供丰富、有创意的内容。
生成式人工智能有助于推动大数据的民主化,人们和企业查找信息、创建内容和分析数据会变得更容易。不过,表面看起来人工智能很神奇,其实并不是这样。
这项技术引发了有关个人信息被盗用、受版权保护的内容被滥用以及虚假和误导性数据的广泛担忧。一些人甚至认为人工智能对地球生命的未来构成威胁——最近,《时代》杂志封面文章提出这样一个问题:人工智能是否最终会导致“人类末日”到来?
为了解人工智能的前景、运作方式、风险所在以及谁将引领未来,《巴伦周刊》于2023年8月初举办了以人工智能为主题的投资圆桌会,邀请了五位从不同角度研究人工智能的专家。他们分别是:IBM研究主管达里奥·吉尔(Dario Gil),几十年来,IBM一直在研究人工智能软件和硬件;人工智能模型、数据集和软件初创公司政策主管艾琳·索莱曼(Irene Solaiman);风险投资公司Sapphire Ventures合伙人凯茜·高(Cathy Gao),该公司已承诺向人工智能初创公司投资至少10亿美元;拥有计算机科学和人工智能博士学位的伯恩斯坦研究(Bernstein Research)软件分析师马克·莫德勒(Mark Moerdler);高盛(Goldman Sachs)投资组合经理布鲁克·戴恩(Brook Dane),戴恩最近调整了投资策略,专注于人工智能股票。
《巴伦周刊》:生成式人工智能的重要性毋庸赘言,这可能是自互联网、iPhone,甚至电力和车轮问世以来最重要的事物。达里奥,IBM研究人工智能已经有几十年了,自从IBM的超级电脑Watson在“Jeopardy!”节目上战胜人类选手已经过去了12年,现在人工智能发生了哪些变化?
达里奥·吉尔:IBM实际上从1956年就开始涉足人工智能,那一年我们和其他公司共同主办了一场著名的大会,名为达特茅斯人工智能夏季项目。IBM计算机科学家亚瑟·塞缪尔(Arthur Samuel)在人工智能领域做了开创性的工作,他在1959年创造了“机器学习”一词。所以,是的,人工智能的概念已经存在了很长时间。过去十年左右是深度学习和神经网络的时代,我们发现,如果你能标记足够多的数据,你就能达到超人般的准确度。
《巴伦周刊》:但后来事实证明深度学习和神经网络的成本非常高。
达里奥·吉尔:是的,只有少数机构能够真正积累足够多的标记数据从而创造价值和合理的投资回报。目前人们之所以对人工智能如此兴奋,根本原因在于人工智能正在朝“自监督学习”转变。
《巴伦周刊》:请解释一下。
达里奥·吉尔:基础模型(生成式人工智能的基础)问世后,我们可以获取大量未标记的数据,并创建语言、代码、化学、材料甚至图像的非常强大的模型表示(model representation)。因此,一旦你训练了这些模型,你就可以在下游用例中对它们进行微调、提示或者设计,所需花费的精力和资源只占过去的一小部分,提高了生产率。
《巴伦周刊》:比尔·盖茨说,Chat-GPT是他1980年第一次看到图形用户界面以来最令人印象深刻的技术,它与微处理器、个人电脑、互联网或移动电话的发明一样重要。英伟达首席执行官黄仁勋称,人工智能正在迎来自己的“iPhone时刻”。凯茜,Sapphire Ventures刚刚宣布将向人工智能初创公司投资10亿美元,你认为目前这个时刻真有那么重要吗?你的公司看到了哪些机会?
凯茜·高:我们投资于人工智能的各个领域,从通信机制到数据再到应用。我们正处在爆发式发展的早期阶段,人工智能最终将无处不在。
《巴伦周刊》:但为什么是现在?是什么促成了目前这个时刻的到来?
凯茜·高:这是由很多因素驱动的,其中一个关键因素是人工智能已经抓住了消费者的想象力,ChatGPT的用户数量在短短两个月的时间里就突破了一亿。你可以从中看到一个未来,人工智能将变得无处不在,以至于公司不再把自己标榜为“人工智能公司”,因为它们都变成了人工智能公司。从某种程度上来说,这和使用的便捷性有关,即通过API(应用程序编程接口)和利用基础模型的能力,因此不必每次从头开始构建大型语言模型。另一个因素是终端用户体验,这将把我们带到人工智能无处不在的下一个阶段。
《巴伦周刊》:马克,几十年前你获得了人工智能的博士学位,现在人工智能和过去有什么不一样的地方?
马克·莫德勒:我获得博士学位感觉已经是一百年前的事了,那时我们学习的是如何用人工智能做一些非常基本的事情,在那以后,技术出现了巨大进步,底层计算能力得到了大规模扩展。过去没有今天这些学习模型,因为那时计算机无法处理这种能力,我们使用的电脑要小得多,内存很小,带宽也没有普及。
对话式人工智能是目前的关注焦点,现在,我们可以像与人交谈一样与软件对话,系统会做出响应,可能是一份报告,或者创建一个图像,或者仅仅是正在进行的对话。
《巴伦周刊》:这一切都是由Chat-GPT和一种消费者体验——自然语言聊天带来的。消费者以及广告最终会成为这项业务的收入来源,还是说更多会成为企业应用程序的一个不断增长的市场?
马克·莫德勒:世界上一些最大的公司,包括微软(MSFT)和Alphabet(GOOGL)都在开发消费者和企业人工智能软件。消费者软件领域会被颠覆,也就是搜索。但更大的价值创造将是解锁企业内部的数据,利用这些数据来提高组织内部的效率,帮助企业更快地做出决策,或者在某些情况下得出以前无法得出的结论。
凯茜·高:生成式人工智能在消费者端和B2B(企业对企业)端的运用是高度共生的,它们相互依存。如今企业软件公司面临着巨大的机遇,这就是为什么你会看到大量的投资。生成式人工智能是一把终极“双刃剑”,一方面,它代表着巨大的变革潜力,是未来增长的关键,但它也可能带来新的竞争,在某些情况下会给老牌企业带来生存风险。
生成式人工智能可以为许多公司和行业扩大潜在市场。以ERP等电子病历系统或ADP等薪酬服务系统为例,它们存储了大量有价值的数据。在很多情况下,现有的客户接口层限制了许多潜在的用例,而生成式人工智能可以用来重新构想和重塑工作流程,以一种重要的方式打开潜在市场。
艾琳·索莱曼:退一步思考我们正在讨论的系统非常重要,因为现在有太多语言模型了。当我们谈论生成式人工智能时,进行研究或将其用于特定应用的方式会因模型而异。现在有很多关于聊天机器人的讨论,但也有很多关于图像、音频甚至视频的研究,机会太多了。
此外,这些基本系统通常不是为特定用例开发的,它们可能是为了优化比如代码生成等任务。但总的来说,它们可以应用于许多不同领域,当然也有风险,我们得弄清楚需要什么保护措施。
我们有近30万个不同的模型,超过10万个应用程序,以及超过5万个数据集。并不是所有模型都专注于自然语言处理。还有更具体领域的模型,比如生物医学人工智能。关于像OpenAI的GPT4这样的高级模型有很多讨论,但并不是每个人都会使用它们,运行大语言模型的成本很高。通过Hugging Face的用户我们了解到,许多研究人员使用更小的模型,调整和微调这些模型的成本更低。
《巴伦周刊》:布鲁克,你的工作是发掘人工智能领域的赢家,你认为价值会流向拥有数据的公司,还是应用程序供应商,或是其他公司?你是如何寻找人工智能相关投资标的的?
布鲁克·戴恩:对人工智能的投资还处于非常早期的阶段。目前最受市场关注的是英伟达(NVDA)等半导体和网络基础设施供应商,英伟达在用于训练模型的图形处理器方面几乎处于垄断地位。除了基础设施,我们还花了很多时间研究拥有数据的公司,随着时间的推移,哪些公司能够创造价值并获取价值。另一个问题是,与过去的一些重大技术转型不同,你不必重写整个软件栈,换句话说就是,我想知道市场领头羊面临的颠覆是否会像之前的转变一样大。过去,向移动和互联网的转变创造了一个全新的公司类别,它们崛起并取代了当时存在的一些公司。我在想这一次老牌企业是不是会借机增强自己的实力,因为它们已经拥有数据。
马克·莫德勒:我同意。建立模型的速度非常快,几个月就能建好,而不是几年,这只是资金的问题。差异化将创造可持续的价值,公司可以根据独特的数据和能力创造一些东西,而且这种独特性是可持续的。在传统软件中,护城河的建立是因为公司花费了大量的时间来创造技术,竞争对手要赶上来需要很长时间。现在,所有公司都在建设产能,如果做不到差异化,就无法从中盈利。
《巴伦周刊》:关于模型和数据集我们已经谈了很多,这二者的区别是什么?
马克·莫德勒:当人们谈论模型时,他们谈论模型分几类,比如在非常大的数据集上训练的通用模型,目的是回答一般性的问题,比如ChatGPT和必应(Bing)。对于更具体的问题,比如化学或材料科学,有专门的模型。此外,一些公司内部有大量的数据,它们可能会选择使用更通用的模型,并将其与公司数据结合起来。
凯茜·高:我来举个例子吧。我们公司的投资对象之一MoveWorks是一个人工智能聊天机器人,它不仅涉及信息技术、服务管理和人力资源等企业应用,还添加了公司特定的数据。例如,如果一个客户有一间名为“泰勒·斯威夫特”(Taylor Swift)的会议室,你问一个公共聊天机器人“泰勒·斯威夫特上午9点是否有空”,这个模型肯定会感到困惑,但如果这个聊天机器人被注入了公司会议室名称的信息,它就能给出准确的答案。