利用人工智能提升想象力

机器会想象吗？我们通常认为计算机是通过我们给它的指令进行计算，得出结果的。我们不认为计算机具备我们所定义的想象能力：感受意外、形成反事实思维，或探索全新的可能性。然而谷歌人工智能团队中一名杰出的科学家布莱斯·阿古拉·伊·阿卡斯（Blaise Ag era y Arcas）进一步突破了运算的边界，他开创的一种算法可以让电脑做出极富想象力的事情，这令人大开眼界。（参见副栏“谷歌人工智能绘制的小鸟图片”）

阿古拉·伊·阿卡斯及其团队开发了一个识别鸟类的算法，然后让它按照自己对鸟类的理解创造出一些关于鸟的新图片。在采访他的时候，我们请教他这一切与想象力有何关联。用他的话说，人工智能在开拓一种“流型空间”，即一个集合了所有可能被我们称为“鸟”的概念空间，类似于我们的想象力对不太荒诞的反事实可能性进行探索的方式。“这些神经网络按照我们给它的训练材料找到某种事物的流型空间，然后它可以畅游其中，生成许多看起来完全有道理的事物。”

近来人工智能似乎正在逐步攻陷我们所说的想象力领域，这就提出了一个问题：计算机是否最终会在想象力的领域内也取代人类呢？

我们是否会被取代

如今的人工智能所输出的某些东西看起来似乎就是想象力的产物，这是否意味着人工智能将取代我们的想象力呢？回答这个问题之前，不妨先来看一些例子。

艺术家马里奥·克林格曼（Mario Klingemann）要求一个名为“生成预训练转换器-3”（Generative Pretrained Transformer-3， GPT-3）的人工智能文本生成器，用英国讽刺文学作家杰罗姆·杰罗姆（Jerome K. Jerome）的文风写一则关于推特的故事。他仅为GPT-3输入了标题、作者名以及故事开篇的第一个字，而这个人工智能写出来的内容说是人类大脑的产物也不为过：“让人意想不到的事实是，最后仅存的一种还能引起伦敦人民社交兴趣的形式竟然是推特。我像往常一样前往海边度假时，被这一奇怪的现象惊呆了，我仿佛置身于一只八哥笼中，四处都是鸟儿‘推特、推特’的叽喳声。”

在智能写作领域之外，人工智能还被用于创造一些世间全新的事物。2019年，数字设计与传媒公司AKQA通过人工智能创造出一种全新的体育运动。它让算法学习了400多种运动的规则，在此基础上，这个算法给出了1，000种全新的运动概念。虽然其中很多想法比较离谱，不过团队把名单缩减到10个，并对其中3个做了实地测试，最后从中选出了一个被计算机命名为“速度之门”（Speedgate）的运动（参见副栏“人工智能创造的体育运动”）。

这项运动的某些方面看起来并不陌生，但总体来讲，它具有极高的原创性。速度之门所用的球有点像英式橄榄球，运动员可用手传或用脚踢。每支队伍必须让球穿过中心球门，才有资格在两端球门得分。球穿过两端球门（两边任意一个）可以得两分，如果一名运动员在队友进球后接住它并把它踢回去，则可以得三分。

AKQA真正开展了这项运动，并进行了推广活动，还协助举办了速度之门联赛，现在世界各地都已有这项运动的队伍了。AKQA称其为“世界上首个由人工智能想象出来的运动项目”。

这个例子似乎蕴含了人工智能具有想象力的意味：机器生成许多新的想法，其中一个从反事实假设逐渐变成了现实世界中一个有价值的新事物。这种情况在其他领域也出现过。人工智能已经逐渐开始常规性地执行一些在我们眼中属于“创造性”工作的商业任务了。

自然语言生成工具还被用于专为不同客户定制不同的市场营销内容。在新闻界，彭博新闻社有一个名为“Cyborg”的人工智能工具，它可以通过财务报告数据写出文章的初稿。《华盛顿邮报》通过自主研发的人工智能算法“Heliograf”在一年的时间内创作出850篇报道。

人工智能还被用于药理学，去寻找应对纤维化与癌症的新型分子结构。相比于发明体育运动或创作绘画作品，我们或许觉得药物发明不大能算得上富有想象力的工作，但其实它们的底层实现形式是一样的，都是人工智能从广阔无垠的反事实空间所蕴藏的无限可能中挑选出那些有价值的选择。

从这些例子中我们能得出什么结论呢？软件在产出类似人类创造物的领域中正在大踏步地向前迈进，有些情况下已经创造出了不容小觑的经济价值。因此人类与机器之间的界限的确正在发生变化，而且我们应当预见这一趋势还会继续。

然而，计算机还远远达不到处理想象力的某些基本能力的水平。首先就是因果关系思维模型。GPT-3所谓的神经网络构建在互联网与书籍中的海量信息基础之上（维基百科中的600万篇文章仅占它所学习数据的0.6%）。从表面来看，GPT-3是一种以现实世界中的信息为依据的思维模型，能够生成不太离谱的新奇事物。但GPT-3是一种语言模型，它仅能够表现一串文本接在另一串文本后出现的概率。

人工智能研究人员盖瑞·马库斯（Gary Marcus）与欧内斯特·戴维斯（Ernest Davis）观察了类似GPT-3的系统后表示：“它们学习的并不是这个世界——它们学习的是文本以及人们把不同词语关联起来使用的方式。它所做的事类似于大型的剪切与粘贴工作——在它所见过的文本中将需要变化的地方进行缝补，而不是去深挖这些文本背后的底层概念。”

人工智能还缺乏想象力中另一种最基本的部分：想象的动机。动机指的不仅是推动一个流程启动的动力，而且是对于应当为什么而想象所做的引导——什么是重新思考的重要部分。

人工智能也无法把文字与这个世界关联在一起。正如哲学家大卫·查尔默斯（David Chalmers）所写，GPT-3“做着很多需要了解人类才能做的事，但它从来没能真正把语言与感知和行动联系在一起”。正如我们所见，没有重新聚焦、进入真实世界、经过试验与沟通的想象不过只是个人的憧憬。前文提到的关于体育运动、艺术创作以及新闻媒体的几个例子，都是由人类在计算机运算与真实世界中发挥着桥梁作用。

因此，我们可以得出结论，如果人工智能在没有人类介入的前提下就无法建立因果模型、连通感知与行动，也无法产生渴望或挫败，那么它在短期内便也无法取代人类的想象力。

不过我们能够看到的是，人工智能所创造的东西为人类的思考提供了极有价值的素材，人类可以把机器的输出变成一个有用的结果。这就是另一种看待问题的角度，也是谷歌的阿古拉·伊·阿卡斯向我们强调的一点：“你一定要知道，把人工智能与人类割裂开来的想法是有问题的。如果你把画面推远一点，放眼去看一个更大的社会技术体系，你会发现人工智能只是人类的另一种表达方式。在这个由人类以及人类所发明的一切所组成的巨型机器中，人工智能只是其中的一个部分。”

相比于我们是否会被取代这样的问题，更有意义的问题或许应该是这种庞大的协作体系将如何向前发展。人工智能会以什么样的方式与人类合作并促进我们的想象力呢？

人工智能可以帮我们进行想象吗

为了对人工智能与人类协作的各种可能性有一个整体的了解，我们可以参考计算机科学家及商业领袖李开复在他的《AI新世界》（AI Superpowers）一书中所示的框架结构图（参见副栏“不同类型的人工智能与人类的协作方式”）。

横轴的两极表示的分别是更偏向于要求效率的职业（充分开发已知领域）与更偏向于要求想象力的职业（探索可能性）。纵轴的两极表示的分别是共情程度（意识到别人的思想状态并做出回应）与系统化程度（建立一套规则体系或在这样的体系下工作）。副栏“人工智能与人类协作中的各种具体角色” 展示的是各种不同的职业在此框架下的分布。

左下象限中主要是在基于规则的体系下对工作效率有要求的职业，比如卡车司机、厨师、会计、机械师或市场分析员。人工智能极有可能接管这些工作。左上象限中的职业需要在熟知的领域内有较强的共情能力，比如护士、售货员、记者或全科医生。这些角色会在核心操作中运用到人工智能，但对结果做出解释以及与人接触等环节将依然由人类完成，比如说人工智能写出的体育报道需要由人类进行修改调整，或高度依赖于人工智能进行数据分析的医生会关注与病患的人性化沟通。

右下象限中的职业处在规则体系下，但需要有反事实思维，比如程序员、工程师、活动策划师或士兵。这些职业将在想象力上与人工智能开展广泛的合作。比如平面设计师，他们对人工智能工具的运用就好像音乐家玩乐器一般。再比如士兵，他们的信息世界由人工智能构建，但他们需要应对各种不可预知的实际情况。最后，右上象限中的职业高度依赖于正确解读他人的能力，同时还要依赖自身的想象力——需要为应对特殊情况去创造新事物，或是对未来的可能性进行探索。这些职业在很大程度上将依然由人类主导，辅以人工智能的支持，例如心理治疗师、职业咨询师、政治家、首席执行官或企业家。

从这个图中，我们可以看到人工智能与人类进行协作的几种方式。人工智能可以把我们从常规性的活动中解放出来；它能够执行许多核心任务，并在此基础上叠加人类的共情能力；或者它可以为想象力提供持续的刺激。

通过人工智能诱导想象人工智能可以将我们从枯燥的分析工作中解放出来，尤其是异常监测工作，它能够帮我们找到有利于激发想象的意外因素。如自动化分析公司Inspirient的首席执行官格奥尔格·威滕伯格（Georg Wittenburg）所述：“有的东西对算法来说太简单了，就比如异常现象或数据异常值的检测。我们的系统会告诉我们‘该数据集存在14个异常值或14个异常事件——不多也不少——异常清单在此’。”

但算法要服从的一项限制在于，人类依然处于整个框架的核心位置：对某个思维模型来说什么算是异常，这是由人类来设定的。人工智能长于发现，但做不到关切。对系统的设计要把我们认为要紧的事物考虑进去。不过威滕伯格的算法可以通过反复的人机交互与有针对性的分析，去学习掌握人类会对什么感兴趣。

通过人工智能充实想法人工智能让想象力如虎添翼，它能够推动思维模型的发展进程。有一种类型的人工智能工具叫作“混合主动”交互系统，人工智能通过提出自己的建议对人类的决策进行引导与深化。这类工具目前应用于翻译与客户服务领域。不过我们可以想象这种工具在我们重新思考时会有何作用：当我们想把有关新型医疗保健公司的想法写出来或绘制出来时，人工智能可以用相关数据、类似案例参考、各种图像以及趣闻轶事为我们的想象力提供参考。

通过人工智能与世界碰撞与人工智能的交互可以是一种介于与人聊天和探索世界之间的活动。我们可以拿着一个早期想法告诉人工智能：“这是我关于新型银行的一个想法，请按照这些要点给我一个财务分析人员可能给出的反馈”或是“……科幻小说作家可能给出的反馈”。当你拿到它给出的结果时，再加码别的要求，比如“现在让它更刺激一点”，或是“现在再增加一点批判性”。

通过人工智能进行传播想象力所面临的一个核心挑战在于思维模型的沟通比较困难。而人工智能可以通过把抽象的思维模型转化成图像或故事，轻松地帮我们解决这个问题。例如，英伟达公司开发了一种工具，它能够把人类宽泛的、概念性的涂鸦转变成照片级的风景图（参见副栏“人工智能延伸作画”）。