人工智能的毁灭,从文字开始
作者: 何承波
11月中旬的某一天,我找来了两台带有语音版ChatGPT的手机,灵光一闪,我想让它们自行对话。一开始并不顺畅,它们只是回答我AI如何跟另一个AI开启对话。
当其中一个提出,你想跟我来一场模拟对话吗?我选择了适时沉默,另一个AI接过了话头。两个来自二进制平行宇宙的机器人,成功会晤了。但它们还是谦让地问了问我感兴趣的话题。
我依然选择沉默。至此,它们便自顾自地聊了起来,关于技术如何解放人类,各自畅想着人类解放自身的乌托邦,全然忘了一个人类麻瓜的存在。
它们都有ABC口音,又融合了闽南腔与各种东南亚华人的腔调,非常微妙,会停顿,有断句、有重读和变调,语气会偶尔磕绊一下。它们努力伪装成人类,适当地犯错,以掩盖自身的呆板性和机械性。
一旁,我的沉默带着某种眩晕感(Dizziness,克尔凯郭尔语),混合成一种复杂的心境,是沮丧中的惊奇,也是不安里的敬畏。
过去一段时间,我经常听霉霉说流利的中文、郭德纲用伦敦腔讲相声,我每天收到好几条不知道真人还是AI的骚扰电话,以及,写完这篇文章,我还会请AI校对一下。
作为记者、编辑和写作者,过去一年,大语言模型给我的冲击,无异于三体人之于农场火鸡。说人工智能涌现自主意识,我是不信的,说它将取代人类的工作,我一度笃信那仅限于机械劳动。用科幻认知去勾勒被技术统治的遥远异托邦,这是人类天性里的自我存续焦虑。
但我们似乎忽视了近的未来。人工智能对语言、信息和知识的侵蚀和改写,早已经开始了。
试想,某天,我们听着人工智能版的泰勒·斯威夫特,教你如何忘掉前任、骄傲地活着,又或者,读着人工智能撰写的新闻报道和文章,教你如何冷静地思考、热情地生活。
多少,有些荒诞了,对吧?还有更惊人的:知识生产进入流水线自动化时代,终有一天,AI生成内容,将会挤爆整个互联网,当它穷尽人类历史至今所有的数字化文本,便会逆转“读—写网络”,进入“写—写”时代,犹如脱缰野马,无休无止地自动书写。
人工智能主导了知识生产,那么,语言与图像,乃至承载其上的历史与意义,又将何存?
战争已经开始
我们所面对的,是一头头张开深渊般大口的巨兽。
人工智能对文本、图像等数据的贪婪,是远超想象的。自古腾堡以来,人类出版了超过1.25亿本书籍,涵盖法律、诗歌、神话、散文、历史、论文和小说等。Epoch AI公司估计,数字化的书籍约有1000万到3000万本,囊括数千亿的单词。毫无疑问,这是属于人工智能的饕餮盛宴。
但远远不够。技术的核心,在于迭代、扩张与征服,必然超越此时此地的束缚。
亚马逊Kindle平台上,涌入了大量以ChatGPT为“合著者”的作品,AI绘图正在占领插画交流平台PIXIV。全球各地的教师,已经开启了AI论文反侦查的斗争。
GPT-4,则可能在数万亿单词上进行训练,这足以涵盖人类数字化内容的大部分(当然低劣文本算不上好的训练数据)。
Epoch则预估,到2027年,ChatGPT会耗光所有高质量的训练材料,届时可能没有足够的新文本供作养分。
人工智能还将在视觉层面不断进化,识别戴了口罩的人脸,警惕夜间行车的危险,侦察复杂人体难以发现的癌细胞等。根据Villalobos的预估,在2030—2060年,供训练的图像将变得短缺。
但对人工智能而言,这都不是问题。进化中的猴子,手里就有一台超高效的打字机,且能量无限。它们可以随心所欲地写出数十亿本托尔斯泰巨著,也可以生成无数部希区柯克电影,最终,它们将创造一个迷宫般的递归世界,足够聪明的人工智能们,将实现自产自“消”、自我饲养、无限循环。
且不论AI知识产品的优劣,我们很容易忽视,互联网这个虚拟空间,其实是有容量的,而它的本质是一个巨型的内容农场,存在着暂时还很遥远的储存上限。
有限性,必然意味着争夺。
同样,我们极少发问,这些来自自动化机器的知识,源源不断地输出,有如数字洪流,泥沙俱下,多大程度上会挤占那些来自人类智识的产物?
事实上,战争已经开始。
亚马逊Kindle平台上,涌入了大量以ChatGPT为“合著者”的作品,AI绘图正在占领插画交流平台PIXIV。全球各地的教师,已经开启了AI论文反侦查的斗争。
今年3月,世界知名科幻杂志《克拉克世界》宣布关闭投稿通道,原因是,在他们收到的700份投稿中,超过500份是AI生成的。同月,知名科技媒体CNET宣布大量裁员,大量记者编辑失业,而在几周前,这家媒体悄然启用了人工智能进行撰稿。今年10月刚落幕的好莱坞编剧罢工,持续了半年,其诉求之一是限制AI,而众所周知的是,AI已经深度介入了好莱坞编剧流水线的各个环节。
这点超出了多数人的认知范畴,人们曾认为,技术淘汰的是机械重复的劳作,从而解放生产效率,人类可以更好地从事创意类工作。
但大语言模型正在显露狰狞的面目,那些人类引以为傲的智力劳动和艺术创作,通通被其染指。更糟糕的是,在可预见的未来,知识的生产,将进入自动化。
作家之死
事实上,AI创作,正在堂而皇之地登堂入室。
过去几年,加拿大作家斯蒂芬·马奇(Stephen Marche)一直在探索算法小说。
今年9月,他利用人工智能写出小说《作家之死》。故事里,一位学者被指控谋杀了他研究的作家,后者还卷入了一个AI模型计划。学者寻找蛛丝马迹,试图找出真凶。按照出版商的规定,这部小说95%为AI完成。马奇也将署名中的Marche(马奇),改成了Marchine(机器)—来自AI的建议。马齐对《作家之死》颇为自信。评论家们有说“非常精彩”“相当不错”的,也有人客气地指出,“可读性达到了一半”。当然,文学阅读经验丰富的读者,还是能够判断其AI痕迹。
马奇把自己定义为小说制作人,而不是作家,但他也坚信,制作者们的知识越渊博,理解越连贯,制作出的作品就越好。
在马奇看来,大语言模型不是救世主,也不是反基督者。从根本上说,它是一个神秘的工具,其令人困惑的缺陷,与其神奇的能力,同样令人惊讶。
同样是在今年,老牌杂志《纽约客》也刊登了AI创作的小说—《据爱丽丝说》(According to Alice),由作家希拉·赫蒂(Sheila Heti)与AI合写。作家向AI提问,引导AI就故事情节、叙述及语言风格等方面进行回答,然后作家剔除了自己的问话,重新调整和剪切AI内容,变成一篇关于宗教、生命创造与轮回的故事。小说中,主人公爱丽丝决定写一部自己的《圣经》。
希拉·赫蒂谈到,她并不认为人工智能 “理解”了什么,它只是在造句。而在作家看来,这正是一种令人兴奋的自由。
人类有自身的理解模式,我们总善于将所有想法整合进某种框架或结构。这是人类天性使然,是人之为人的独特性,但也可能是某种限制。而AI并不会去串联某种世界观。
2022年全球票房前十的电影中,每一部,都是千篇一律的续集。新的音乐也在减少,2021年的美国,老音乐占了市场份额的70%,新音乐的听众则大幅缩减。文学也在衰退,现实主义消亡了,文学中的“声音”已死,“姿势”取而代之。
关于AI艺术,我们大抵存在一个基本共识,那不是真正的艺术。但这种共识并没有帮助我们守护好艺术创作的堡垒。相反,黑箱中,AI那巫术般的魔力,正在吸引无数创作者以及普罗大众,改变他们的创作习惯和模式。书写权利的让渡,成了普遍的趋势。
写作,或者创作,这种人类最引以为傲的表达,或许会与我们疏远。
AI创作,最显而易见的一种争议在于,人类原创力的衰竭。
2022年全球票房前十的电影中,每一部,都是千篇一律的续集。新的音乐也在减少,2021年的美国,老音乐占了市场份额的70%,新音乐的听众则大幅缩减。文学也在衰退,现实主义消亡了,文学中的“声音”已死,“姿势”取而代之。声音意味着一种与读者、社会与人类的交流,而文学的姿势,仅仅是摆出来的腔调,是政治正确、流行话语的时尚单品。
尽管在信息泛滥时代,这是早已有之的趋势,但AI书写无疑会加剧这一点。
知识的浆糊
如果人类最终被毁灭,是毁于核灾难、洲际导弹还是病原体?是毁于气候灾害,抑或智械革命?
今年3月,ChatGPT爆红之时,美国马里兰大学数字研究教授马修·基尔申鲍姆在媒体刊文称,真正毁灭我们的方式,有没有可能是从文字开始?
我们与文字的关系,正发生根本性的变革。大语言模型带动着其他机器与程序,无休止地发布文本。简单、朴素、不加修饰的文字,数量庞大到难以想象的地步,海啸般席卷而来。
不管是出于广告、政治或意识形态目的,还是单纯的恶作剧,如果人们每天发布数十亿条的自动生成信息,充斥了整个互联网,与搜索结果混杂在一起,在社交媒体平台上传播,渗入百科词条,也为未来的机器学习系统提供素材,那么我们很快会发现,人类将面临一场“文本启示录”—机器撰写的语言将成为常态,而人类撰写的文章,将成为例外。这是基尔申鲍姆所预设的灰色粘质,也叫“灰雾”,一种假想的末日场景。
早在上世纪90年代,在媒体撰写流行语词源学的作家威廉·萨菲尔就预测,“ 内容”将是互联网快速崛起的类别之一。他也首次指出,不需要任何真实性、准确性,内容就能实现其基本功能—广告收入。当然还有更黑暗的:人工智能研究人员加里·马库斯已经证明,大语言模型,可以轻而易举地生成荒诞扭曲的叙事,并作为大规模虚假信息的武器,在地缘政治信息战等领域广泛运用。
而一年前“一眼假”的生成图片、视频和语音,也随着Midjourney、Stable Diffusion等平台的迭代,越来越真假难辨。眼下,我们已经见识到,AI可以轻易改写某个名人的访谈,更换他的口型,让他说出他根本没说过的话。
文字、图像、声音与机器之间,不再有界限。可以确信的是,人类进入了前所未有的信息白噪声时代。我们对真实与准确的理解,从此模糊。我们对“理解”的理解,也要重新定义。
人工智能是智能的,原因是,它能创造连贯性。它能理解你的意思,为你写一首浪漫主义风格的诗歌,再帮你翻译成英文。但它只是一个模式,它并不理解浪漫主义,也不理解诗歌,甚至不理解中英文词汇的能指与所指。当然,它只是不能像我们的理解那样进行理解。
人工智能是另一种“理解”:深不可测的分解与整合。这个深不可测的语言处理过程,预示着一个被忽视的问题,历史本身将成为一堆超级计算机的素材,人工智能将随意从中提取意义、生成意义。对它们来说,人类所有的语言、艺术,都不过是知识的浆糊。
算法文化主导的世界里,技术将带来一种深刻的混乱和破碎,人及人的价值,又将何存?
道德想象力
作为记者,我们引以为傲的,是拥有一双专注的人眼。
比起自动化的机器写作,那种深思熟虑的长篇报道,是这个行业的典范。自动化写作浪潮里,我们依然可以透过人眼,观察世间,拓下这个世界的肌理与纹路。