AI训练、“自动化写作”与当代诗歌的现代性诗学知识

作者: 钱文亮

一、AI程序、文学机器与诗歌的生产

人类的计算机科学家、工程师等设计人工智能(AI)程序“生产”(而非写作)诗歌的实验如今广为人知。实际上,早在人工智能发明的100多年前,后来被奉为计算机程序创始人的英国诗人拜伦之女奥古斯塔·阿达·拜伦(Augusta Ada Byron)就曾经预言计算机将来“可能会应用于数字以外的其他事物……”,甚至可以生成任意复杂程度、精细程度的音乐作品。只不过,阿达也坚信,任何创造性的行为都取决于程序员(人),而非机器①。但从历史的发展情况看,新一代的程序员显然并不认同阿达的观点,他们觉得“代码”也能胜任创造性的工作。正因如此,自1956年麦卡赛、明斯基、罗切斯特和申农等为首的一批年轻科学家在达特茅斯会议上首次提出“人工智能(AI)”这一术语之后,让人工智能去挑战、代替人类作曲、写诗等创造性工作的实验就此伏彼起、一发不可收。仅以诗歌“生产”为例,——1959年,德国人卢茨(Theo Lutz)第一次制作出名为“随机文本”的文本生成器并生产出迥异于人类理性的“组合诗”;该文本生成器运用词语随机组合的方法可以迅速生成大量文本。1960年,英国诗人吉辛和程序员萨默维尔将超现实主义技巧、达达主义方法和数码算法结合在一起,创作了基于短语“我是我所是”所包含单词的排列组合的置换异构体诗歌。在卢茨和吉辛的实验之后,20世纪六七十年代欧美有不少作家继续采用由机器生成的方式发表“数码诗歌”,相关实验的价值主要在于利用计算机实现了碎片重组,“拼贴或切碎解构了语言与思想,创造了词语和图像之间的冲突”②。1962年,美国加州的沃西等人成功设计了名叫“埃比”(Auto-beatnik)的诗歌创作软件,当年美国的艺术杂志《地平线》(Horizon)很快以《一个美国新诗人登上诗坛:埃比的创作》为题,第一次发表非人类“创作”的《玫瑰》《孩子们》《姑娘》《风筝》等诗作,其中题为“姑娘”的诗如下:

All girls sob like slow snows,

Near a couch,that girl won’t weep

Rains are silly lovers,but I am not shy.

Stumble,moan,go,

this girl might sail on the desk.

No foppish,deaf,cool kisses are very humid

This girl is dumb and soft.

这里的“诗歌”文本纯粹是机器基于一定的词汇库随机组合搭配的结果。只要将伪随机数发生器与语言的语法规则相结合,并运用到相当规模的机器词典上,就能产生“美丽”的诗句③。

人工智能强大高效的文本生成能力使得“两句三年得,一吟双泪流”的人类诗歌创作恍如隔世。1964年,加拿大出版了由Jean Baudot开发的第一部计算机撰写的自由体诗集;1973年,Richard W. Bailey在美国推出《计算机诗选》(Computer Poems);10年之后,美国人卡西又实验出一种“全息”诗;而稍后的凯利,则根据一定的运算法则,制成一部诗歌发生器“言钟”,当它运行时,能够每时每刻自动生产语词,按顺序不同变化各种文本④。

相比于欧美发达国家的计算机写诗软件,我国对于诗歌生成软件的最早设计往往被追溯到1984年的全国首次青少年计算机程序设计竞赛,在那一次的竞赛中,上海育才中学年仅14岁的学生以一个“计算机诗词创作”的程序,获得初中组四等奖。自此之后,中文版的诗歌生成软件如藏头诗免费制作软件、中国古代诗词撰写器、稻香老农作诗机、诗词快车、诗歌超级助手、猎户星免费诗歌自动制作机等陆续问世,厦门大学的周昌乐教授还在全面构建的全宋词语料库的基础上,开发出了一个宋词自动创作系统。

不过,直至2010年,国内的诗歌生成软件大多只能自动生产具有固定格律、字数要求和诗体形式的程式化的“古典诗词”,但对于充满无限变化的自由的现代新诗往往无能为力。而不多的例外却是后来成为中国科幻小说划时代人物的作家刘慈欣,他在1989年发明的一款“电子诗人”软件,直接进行现代新诗的生产,能够以高达200行/秒(不押韵)的速度生成类似这样的文本:“小行星被呼唤了!/在固体的周围,只有胶状的稻田/不,我不想飞翔!!/我思念//三角函数被观看了!/在仙女座的周围,只有活的巨川/不,我不想自我吞食!!/我沉淀//蜻蜓被捏住了!/在东方快车的周围,只有哇哇叫的弓箭/不,我不想冒烟!!/我交谈//禁闭室被警告了!/在剑的周围,只有吱吱响的时间/不,我不想梦游!!/我腐烂。”⑤

据刘慈欣介绍,“电子诗人”的源代码是DOS下的,“电子诗”的具体生产流程是从模板数据库随机提取模板,再用提取的模板从词库中随机取词⑥。

除了刘慈欣,另一个较早以计算机写诗软件直接挑战现代新诗写作的,是一个网络ID为“猎户”的自称“半瓶水的开发人员”的程序员。这位曾经担任过学校文学社社长的理工男却又因为不喜欢“大多数现代诗歌”,情绪激动时偶然设计了一个名为“猎户星自动写诗机”(http://www.dopoem.com)的软件,并颇为不屑地表示:“与朋友谈及现代诗歌时,感叹现在诗人和歌词作者写的诗不知所云,大多数现代诗歌都是瞎扯蛋(淡)和不知所云的呻吟。我总结出了一些现代诗歌的规律,那就是:1.主谓宾的乱搭配。2.形容词、名词、动词的乱搭配……读不懂就是现代诗的本质,胡乱搭配是现代诗的法宝。在没有大师的年代,我们,让所谓的诗人滚开!”⑦

“猎户星自动写诗机”自2006年9月25日0点59分开始工作,到2023年10月05日08点58分,共制作诗歌77660800首,平均每小时生成5209.5首。据上海《解放日报》的一位曾经在“猎户星”尝试“写诗”的记者报道,“猎户星”非注册用户可使用778种诗歌模板,注册用户使用973种,任选其中一种,按提示输入对象、地点、形容词等,就能生成一首现代派诗歌。网站显示最受欢迎的是一首名为《安静的海面》的短诗:寂静笼罩着安静的海面/那是个最美的夜晚/她沉思着从地平线升起/俯下那戴着蝴蝶结的前额/亲吻她的孩子。而生成这首诗的关键词只有三个“安静、夜晚、蝴蝶结”⑧。不过,值得注意的是,《安静的海面》这首“创作时间”标记为“2011-06-05 19:23”的诗歌,在笔者行文的2023年10月5日仍然被挂在“猎户星诗歌自动制作机网站”(http://www.dopoem.com)的“近期最受欢迎的十首诗”栏下第7位,而且,包括“全部精选”在内的这个栏目在2011年8月以后再无更新。这个现象其实颇能说明一些问题。

实际上,随着人工智能的发展,国内各种科技公司、机构开发的诗歌生成软件在2010年以后大量出现,其中比较著名的就有2014年手机百度推出的“为你写诗”App、2016年清华大学研发的作诗机器人“薇薇”、2017年的携程“小诗机”……而清华大学计算机系矣晓沅团队开发的作诗机器人“九歌”甚至亮相央视黄金档节目《机智过人》,在与三位大学生诗人比拼“古典诗词”写作时,成功“骗过”现场观众,成为不大不小的新闻。然而,若论当年引发广泛震惊与争论的诗歌事件,却是微软公司所开发的AI诗人微软“小冰”在北京正式出版第一部现代诗集《阳光失了玻璃窗》。

二、AI诗歌的“有句无篇”与现代诗的“结构”

AI诗人微软“小冰”的现代诗集《阳光失了玻璃窗》不啻是人工智能向人类诗人掷下的第一封战书,其所具有的严重性与警示意义并不亚于谷歌公司的围棋人工智能系统AlphaGo(阿尔法狗)第一次在最复杂的围棋比赛中击败世界棋王李世石。对于中国数量庞大的诗歌从业人员来说,这一事件之所以令人震惊,是因为微软“小冰”具有超人的诗歌“学习”能力和惊人的诗歌生产速度——开发于2014年的微软“小冰”只用了3年的时间,便在对519位现代诗人、上千首诗反复学习10000次后生产了超7万首诗歌。微软“小冰”一次学习的时间大约是0.6分钟,10000次需要100个小时,但人类个体却需要100年左右。不仅如此,为了测试“小冰”的诗歌水平,微软研究团队还使用了“骆梦”“风的指尖”“一荷”“微笑的白”等27个化名,先后在天涯、豆瓣、贴吧、简书四个平台上发表“小冰”的诗歌作品,在此过程中,没有人发现作者是个机器人。正因如此,有不少人轻易地相信微软“小冰”的诗歌已经达到甚至超过人类诗歌创作水准的平均线。尽管如此,尽管微软“小冰”在“学习”、生成诗歌文本的速度与数量上表现出了远超人类百倍、千倍的能力,它的“产品”却仍然不被多少中国诗人所看重和肯定。著名的“第三代诗人”于坚就直言“小冰”的“写作”充其量就是个语言游戏:“写得很差,令人生厌的油腔滑调。东一句西一句在表面打转,缺乏内在的抒情逻辑。”马铃薯兄弟则认为:“把机器带有随机性的文字排列称为诗,对缺乏诗歌素养的人们会形成误导。”秦晓宇也指出,“计算机创作的文本固然花团锦簇,但任何来自作者情感、记忆、自我矛盾等都被切断了”⑨。这些人类诗人的批评可谓一针见血,的确指出了微软“小冰”诗歌的致命缺陷。如果借用结构语言学家索绪尔关于语言符号的能指/所指的概念,并将其运用于文化研究的视域之中,也可以说,微软“小冰”诗歌的主要问题其实是在于语言能指与所指的断裂,其诗歌语句只是能指符号随机滑动、组合的结果,并且因为缺乏所指的连接和语境整合,仅有能指的语言符号也就丧失了具体的对象或意义,成为“缺乏内在的抒情逻辑”和“任何来自作者情感、记忆、自我矛盾等”的符号碎片的集合,它们也许看上去具有“陌生化”的语言组合所造成的奇异/奇怪的“诗意”,但让人感到更多的却是语言符号后面的空洞无物、无病呻吟。试举微软“小冰”的一首人们比较熟悉的诗歌《她嫁了人间许多的颜色》为证:“那繁星闪烁的几天苍色/那满心的红日/看万里天使在世界/我就像梦//看那里闪烁的几颗星/西山上的太阳/青蛙儿正在远远的浅水/她嫁了人间许多的颜色。”⑩

该诗的第1句、第3句明显的逻辑不通,有词语乱搭的语法毛病,第4句、第5句“我就像梦”/“看那里闪烁的几颗星”,通畅的表达应该是“我就像是在梦中”/“看那里闪烁的几颗星”,否则“那里”也就所指不明。而且篇幅10行不到的诗里,一会儿是“繁星闪烁”“闪烁的几颗星”,同时又是“红日”“太阳”,这种昼夜并置的时空感对于人类读者来说未免也太混乱了些。另外,第6句、第7句与第8句的组合既没有事理的线索,更没有情理之中的必然联系,至多能够拿现代诗歌的跳跃性勉强搪塞;而作为全诗标题的结尾一句“她嫁了人间许多的颜色”,也是突如其来,恰如诗集的题目“阳光失了玻璃窗”一样,“美丽”似乎有了那么一点,但却像是脱离了海中冰山主体的浮冰碎片,明显脱离了人类基本的意义结构与象征体系,丧失了整体性的生命存在感,令人无法定位与寻觅。至于人类诗歌创作不可或缺的创造主体、情感主体也因此难寻踪影。

不过,虽然开启挑战人类诗歌创作序幕的AI诗人微软“小冰”不被人类诗人所在乎,但这些仍然影响不了人工智能的飞速发展及其进军人类文艺创作领域的信心。2018年4月,四川成都的高科技公司“封面新闻”推出了基于自然语言处理、知识图谱技术的写诗应用——AI诗人“小封”。在人工智能技术的帮助下,通过24小时不间断地学习,“小封”即能熟练掌握李白、杜甫、白居易、徐志摩、叶芝、惠特曼等几百位诗人的写作手法,在一分钟的时间内制作出一首诗歌,而且从理论上看,它可以生成的字词组合是无限的。2019年10月,AI诗人“小封”的首部诗集《万物都相爱》由四川文艺出版社出版,其中共收集AI诗人“小封”基于算法能力生成的诗作150首,按不同的主题分为10个篇章,每个篇章15首。与微软“小冰”的《阳光失了玻璃窗》稍加比较就能看出,该诗集无论从题名到单篇诗歌,均有了长足的进步,愈发能够与人类诗歌“以假乱真”,以至于有一种夸张的说法,AI诗人“小封”的艺术水准“秒杀”80%的人类诗人,虽然不足为信,但也不无根据。试看其中的一首题为《爱情》的短诗:“用一种意志把自己拿开/我将在静默中得到你/你不能逃离我的凝视/来吧我给你看/嚼食沙漠的仙人掌/爱情深藏的枯地。”11

与微软“小冰”的《她嫁了人间许多的颜色》一诗相比,该诗在逻辑上、语法上基本没有毛病,后半段虽然略有跳跃,但却紧扣爱情主题,甚至有所升华,在情理上是自洽的——中国读者根据自己的人生经验和“前理解”,能够脑补出具体的时空情境,并且可以把它与古典诗词“衣带渐宽终不悔,为伊消得人憔悴”的意境作类比,不难找到阐释的线索。而与微软“小冰”的诗集题目《阳光失了玻璃窗》相比,“万物都相爱”在语言上也具有近些年人们感到熟悉的人味儿、“大师味”,令人不由自主地联想到穆旦、辛波斯卡等中外大诗人的诗句。而“小封”的另一首诗乍一看甚至更加有现代派的前卫与先锋:“语言的小村庄/停留在上半部/那他们会怎么说呢/毛孩子的游戏/如果不懂/小小的烟告诉我/你的身体像鸟/一只瘦弱的鸟/回到自己的生活里/我要飞向春天。”12

上一篇 点击页面呼出菜单 下一篇