陈楸帆:用AI创作科幻小说

作者:艾江涛
“暂时不太会(替代),但是你也要用发展的眼光来看,DeepSeek开始写小说,也就两三年的时间对吧?那么再过两三年,再过10年、20年呢?你要知道20年对文学来说不是个多长的时间,对不对?它现在已经达到这样的高度了,你用发展的观点去看,从理论上说,它是完全可以替代科幻作家的。因为在我看来,科幻作家包括其他的人类作家,他身上并没有什么东西,最终是不能被机器所替代的。”在刚刚结束的2025中国科幻大会上,科幻作家刘慈欣面对记者这样说。一起参会的科幻作家陈楸帆告诉我,刘慈欣对他说,自己的很多发言稿都是用AI写的。

从2022年11月上线的ChatGPT,再到今年春节期间火爆出圈的DeepSeek,所谓生成式大语言模型,由于其在写作方面的优异表现,引起了人文学界的广泛讨论和忧虑:如何利用大语言模型进行创作?未来什么样的写作才无法被AI替代?如果说被替代的命运不可避免,写作对人类来说还意味着什么?

作为最早一批用AI创作科幻小说的作家,陈楸帆对此体会更深。那还是在市面上各种大语言模型出来之前,2017年底一直关注AI发展动态的陈楸帆,找到他在谷歌工作期间的同事王咏刚,希望对方为他训练一个AI模型辅助他进行科幻写作。王咏刚那时刚刚离开谷歌,担任创新工场的CTO兼人工智能工程院执行院长。本就是科幻迷的王咏刚爽快地应承下来,他改进了开源的深度学习模型,用陈楸帆以往的十几部小说,还有赫胥黎、阿瑟·克拉克、威廉·吉布森、尼尔·斯蒂芬森等人的科幻小说作品作为训练数据,生成了一个简陋的模型“陈楸帆2.0”。

“我当年给他做了一个很简单的界面,就是填空。页面有一个输入框,你先写开头几句话,然后按一下续写按钮,可以选择续写100字到500字,续写的内容如果不满意,可以再给你写一段。那时我的训练数据和今天的相比,就是海里的一粒沙子。之前的模型参数大概也就几万个,今天是几千亿、上万亿个,效果能比吗?但从结构设计上来说跟现在的大模型是相似的,等于说当年非常雏形的东西,发展到今天这样。”王咏刚说。两年前,王咏刚离开创新工场,做了一个叫Mootion的AI视频创业项目。在办公室,他谈及当年与陈楸帆最初的AI写作尝试,充满感慨。“除了危险,作为这样的真神,我们什么都没有。他们在最后的物质和痛苦、自然、最死的时间、文字、变的、金钱与宇宙、看似遥远的世界中移动,重重追逐着人类发现的触觉,以及即将看清左右的囚笼。”这段被陈楸帆写入小说《恐惧机器》中分裂者的对白,正是出自“陈楸帆2.0”模型,用陈楸帆自己的话,“很粗糙,支离破碎,有先锋派诗歌的感觉。基本没法用,我在小说里加了一个外星人,让他说出这些话,就把它合理化了”。

八年过去了,AI写作何以发展得如此迅猛,以至于让人类写作者普遍产生了一种被替代的焦虑?革命性的变化来自谷歌在2017年发表的论文“Attention Is All You Need”,这篇论文提出的基于自注意力机制的transformer架构(转换器架构),成为后来各种大语言模型的基础。

1950~1990年的漫长时间里,人们认为人工智能的核心是理解人类语言,而人类语言基于各种语法法则,所以那时的人工智能是用计算语言学的方法,让计算机理解这些法则。王咏刚说:“比如说‘今天我来开会’这句话,拆分以后,有主语、谓语,谓语可能又是一个状态从句,从句又由动词和名词组成,那时候搞的所谓人工智能,就是让计算机去标注、理解这玩意。1990年出现了一个特别明显的拐点,大家做了大量工作,发现人工智能在这条路上根本实现不了。1990~2010年,出现一种截然不同的处理方法——统计学的数学方法。对于‘今天我来开会’这句话,我只让计算机理解一件事:通过分词,每个词在我见到的中文句子里出现的概率是多少?这件事特简单,变成数数了。从初步的统计学再到稍微高级点的统计学,不是统计每个词独立出现的次数,而是统计它在某个字之后出现的次数。如果单只统计没有任何上下文的一个词,在数学上是零阶,当时用这个方法最牛做到了六阶。2005年,谷歌翻译用这套原理,已经做得非常好。这套统计语言学的逻辑和今天的类似,不管怎么统计,真实任务是什么,本质是猜后续或者更直白地说就叫填空。”王咏刚告诉我,2010年以后出现的深度学习,不过是换掉统计方法中间的数学模型,将每个词元(token)投射到一个高维空间的向量,然后将向量转化为一个数字。在这个数学模型中,每个计算都有一个参数。“2010年,早期的神经网络有三层上千个参数,就不得了了。谷歌那篇论文的厉害之处,就是将1000个参数变成今天的7000亿个参数,结构设计变成模块化的单元结构的连接关系。GPT-3的参数规模已达百亿级别,当时我们所有人都认为GPT-3已经证明人工智能是可实现的,但它没有出圈,为什么?因为GPT-3的输出比较随机。ChatGPT是在GPT-3的基础上增加了非常薄的一层,现在叫强化学习层,给它做了一个人类老师的校准,校准之后一下子就变聪明了”。

这套大模型的机器学习方法,一般被分为三个阶段:第一阶段是海量阅读,把互联网上的海量数据拿来给它学;第二阶段,由人给它一些指定的题目和答案,通过反复刷题,让它学会答题,这一步也被称作“对齐”(alignment);第三个阶段是从反馈中学习的过程,让模型参加一些模拟考试,先不告诉它标准答案,只告诉它对错,使其从做错的反馈中进一步学习。人类老师的校准,主要体现在第二和第三阶段。清华大学计算机科学与技术系长聘副教授刘知远,长期从事计算机自然语言处理的研究,他说:“第二阶段到第三阶段的意义在于,让模型自己回答问题,然后由人评判,一定程度上可以让模型在现有风格的基础上,进一步明确自己的价值观到底是什么。”

刘知远说:“2018年以后出现的大语言模型,最核心的思想,其实是把互联网上所有的文本数据,当成学习对象,这在人类历史上是从来没有过的。”经过人类老师的进一步校准,学习海量数据之后的大语言模型,模仿人类写作已不是问题。

陈楸帆能在大语言模型尚未出现的2017年,便尝试用AI辅助写作,与他的个人经历有关。陈楸帆自幼就是科幻迷,高中时期便在《科幻世界》上发表了第一篇小说。2004年从北大中文系毕业后,他曾短暂在房地产企业工作。2007~2017年,他先后在百度、谷歌等互联网大厂工作。在那段时期,他创作了许多短篇小说,也写了首部长篇小说《荒潮》,后者曾斩获第四届全球华语科幻星云奖最佳长篇科幻小说金奖。获奖的经历坚定了他成为职业科幻作家的决心。回忆起那段大厂岁月,陈楸帆说:“科技公司很多工程师都是科幻迷,他们知道我写科幻,经常在吃饭的时候找我聊天。在那种氛围中,我能够接触到最前沿的技术与产品团队,与一般作家坐在书房里空想,完全是两码事。”

正因如此,他对AI写作有一种早于他人的预判:“开始的时候没人用,但我觉得这个东西迟早会来。与其等着它来,还不如先去拥抱它,提前了解适应,总比它来了你啥都不知道强。”陈楸帆用AI进行科幻写作的过程,基本同步于大语言模型的各个发展阶段。陈楸帆多次讲到他用AI写作的“斯普特尼克时刻”。2019年1月,《思南文学选刊》办了一个AI文学榜,用AI作为评委,对2018年发表在所有主流文学刊物上的小说打分排名。结果,陈楸帆发表在《小说界》上的一部短篇小说《出神状态》,以0.00001分的微弱优势打败莫言发表在《十月》杂志的《等待摩西》,获得第一。4月1日,在北大新媒体创意写作课上,陈楸帆再次谈到那个非常科幻的时刻:“现实已经开始超越了科幻的想象,我觉得这才是真正的科幻,科幻只是现实的一个低配版本。”

《出神状态》描写的是一种让人意识崩塌的全球性流行病,主人公在意识涣散前,前往上海图书馆还书。如同《恐惧机器》一样,陈楸帆依然用嵌入式的办法,将AI生成的内容,赋予一个更大的智能体的对白。这种选择,多少与当时他所使用的模型依然比较粗糙有关。

伴随模型的不断进步,陈楸帆的尝试一直没有中断。2020年,陈楸帆担任创新工场组织的一个大学生训练营项目“共生纪”的导师,他邀请了小白、飞氘、顾适等10位新锐科幻作家,一起使用AI写作,之后还在知乎上发布作家们的作品,让网友猜测那些标注出AI写作内容的小说到底是哪位作家的创作。“共生纪”所用的模型“AI科幻世界”,使用300GB左右的网络语料进行了预训练,参数规模相当于GPT-2,达到十几亿级别。

尽管这个模型已能写出更为流畅的句子,但由于缺乏大语言模型中人类老师的校准,并不好用。一位作家在使用后写道:“和AI的互动是艰难的。一开始的新鲜感很快就被AI的无逻辑性所冲淡。要想将AI的一段段文字整合在一起,并放入我自己的思维中,需要的不是技巧,而是疯狂的想象力。AI完全不理会我的文字,它确实能写出一些有意思的字句,但这是在制造了大量没有意思的字句的基础上,而且这种有意思之间是没有联络的,AI还不具备思辨能力,以及情感的渗透。”知乎上的反应也颇为冷淡。显然,在真正的大语言模型出圈之前,AI写作只停留在少数人的实验中。

2022年11月30日上线的ChatGPT,是AI写作的一个分水岭。破圈效应带来大众化的冲击,让更多人尝试用AI写作。我曾问陈楸帆ChatGPT出现后,最希望用它来做什么?相比其他担心被替代的作家,他的态度显得格外开放:“肯定最希望用它写出水平比较高的文学作品,最好能按照我的风格来写,其实说实话一直没能做到,距离我的预期还比较远,后来就觉得还是让它做一些更基础的工作,比如资料收集、头脑风暴。”

陈楸帆告诉我,在实际写作中,由于不同大模型各有所长,很难期待一个模型包打所有事情,他经常综合多种大模型,将其作为一个协作完成的智能体。“ChatGPT的deep research(深度研究)功能,在各个模型中做得最好。DeepSeek非常发散,适合用来做头脑风暴,不适合写具体文字,它的文字有种网文风格:油滑、抖机灵。但不论是ChatGPT还是DeepSeek,上下文窗口比较有限,输出三四千字,就会失去前面对话的记忆窗口,又要重新来,比较麻烦。Claude的长上下文做得比较好,适合处理长文章,可以在文本中直接进行编辑。Gemini也是长上下文,使用NoteBookLM工具,可以生成给定主题的两个AI聊天的博客,比较自然。”

进入写作,陈楸帆往往会先让ChatGPT就自己关注的问题方向,生成一个研究报告,然后进一步提炼有用的信息。围绕这些信息构造故事时,他又会将这些信息丢给DeepSeek进行头脑风暴。有时候,陈楸帆会刻意避开模型提供的思路,逼迫自己进一步思考,进行所谓“对抗性写作”。今年春节,他写作的具有元小说意味的短篇小说《神笔》,就是这种写作过程的反映:写了一个科幻作家,因为卡壳了然后借助AI写作,但是AI又不按他想的去写,互相角力的一个过程。最后AI写的现实就是另一个版本的历史,现实跟虚构互相融合在一起。

美籍华裔科幻作家刘宇昆,同时也是刘慈欣、陈楸帆等科幻作家的英文译者,不久前在哈佛大学的一次讲座上,谈到当前AI写作存在的普遍误区:“如果你去Youtube或者B站搜索‘如何用AI写小说’,你会找到成百上千的教程。但如果你搜索‘这是一本我很喜欢的AI写的小说’,却几乎找不到任何结果。”个中缘由,刘宇昆认为这是因为建立在transformer架构基础上的大语言模型,本质上是在模仿人类,他更愿意将这些大模型视为一种思维捕捉器的新媒体,AI生成的作品很无聊,但生成的过程很有趣。因此,他和陈楸帆一样,更多将AI作为一个头脑风暴的编辑和助手来使用。

可是,这一切都是基于目前大语言模型的能力而言,在不远的未来,AI是否真如刘慈欣所言,会替代人类作家,或者说,在写作这件事上,人类作家无法被替代的地方究竟是什么呢?AI时代,写作往何处去?

对一个人类作家来说,我们喜爱他的原因无外乎那些由遣词造句、叙述节奏、叙事模式所综合形成的独一无二的风格。AI能够理解这些风格,写出具有上述鲜明风格的作品吗?

回答这个问题前,我先请教了刘知远,如何理解ChatGPT与DeepSeek这两个大模型在生成文本上具有明显不同的风格。他认为区别主要产生于对齐阶段:“ChatGPT比较平实,DeepSeek的风格明显更灵动一些。原因在于通过对齐,OpenAI刻意让ChatGPT不带有任何个性,避免其作为一个工具所产生的伦理问题。比如让用户对助手产生情感依赖,显然不是OpenAI愿意看到的。”

DeepSeek在写作上呈现出的辞藻华丽、风格夸饰,对真正的写作者来说,无疑是个缺陷。这种发散的特点,常被概括为:想象力很强,逻辑性不够。王咏刚说:“原因非常简单,对齐阶段,设计的问答存在问题。我猜测,DeepSeek团队里面的理工科思维远超文科思维。后期的测试数据和训练方法,可能重点集中在解数学题、编程这样理工科的东西,文科东西比较少。”

无论如何,作家的写作风格,对大模型来说,仅仅是一些数字,完全可以通过计算复制。刘知远告诉我,由于完全模仿人类,目前很难让大模型独立创造出前所未有的风格,但可以根据其习得的知识,进行某种组合式的创新。“譬如说我们学到了凡·高的绘画风格,但凡·高从没画过计算机,可以让大模型形成一幅凡·高风格的计算机的画。最近GPT-4用吉卜力风格画的各种各样的画,很多是吉卜力历史上没有画过的,本身就是一种组合式创新。如果我们让它用莫言和余华组合的风格去写一篇文章,也是如此。创新分为不同层面,这种简单的组合应该最先被攻克。再往后走,需要一些顿悟、灵光一现的能力,可能与我们所说的幻觉有一些关系,应该说现在还远未解决。”刘知远说。

目前大模型的写作风格,由于没有创作主体,更多的是一种滤镜式的伪风格。人类作家的写作风格,与他的个人经历、情感体验高度相关。正如我们如果不了解颜真卿《祭侄文稿》的写作背景,就只能欣赏其书法本身,无法理解作者写下它时的沉郁悲愤。只是,即使在当下,多数人已不得不承认,AI完全可以写作工整规范的公文、演讲稿、日常报道,乃至多数相对平庸的文学创作,那么在可以想见的未来,写作将走向何方?

“对于不挑食的人来说,以后可以根据几个关键词,让大模型变成一个永远在线的、量身定做的故事机。我觉得以后小孩子肯定会有这样的东西,它还可以变成歌曲、变成视频、变成动画,变成任何东西,这肯定是未来的趋势。”陈楸帆说。

陈楸帆目前在香港都会大学担任驻校作家,教授创意写作。在课堂上,他经常跟学生讲,别想着成名成家,发表出版,而是将写作作为梳理思维情绪、了解自我与世界关系的工具。他让学生讲述自己的人生故事,向内拓展。20世纪初面对飞速发展的现代科技,现代文学开始向内探索人类的意识与非理性。与之相比,未来的写作也将普遍向内探索。用陈楸帆的话说,“进入一个本体论的阶段,文学不仅虚构现实,而且创造现实,它所创造的现实,与我们所谓的物理现实是等效的”。

或许,人类始终无法被替代的正是我们的感受力,这种感受力不仅指向外部世界,同样指向细腻敏感的内心。在这样一个时代,留给人文学者的位置绝不应该是大模型对齐阶段的标注工作,更应该走向内心,走向感性,从日神精神走向酒神精神。在北大演讲的结尾,陈楸帆在PPT上打出他最近反复阅读的李泽厚在《美学四讲》中的一段话:“于是,回到人本身吧,回到人的本体、感性和偶然吧。从而,也就回到现实的日常生活中来吧!不要再受任何形而上观念的控制支配,主动来迎接、组合和打破这积淀吧。……于是,情感本体万岁,新感性万岁,人类万岁。”

陈楸帆在北京的几天,我陪着他穿梭于与出版商、策展人、投资人、学生们不间断的会面中。他笑着告诉我,作为最后一代人类作家,他要抓紧机会多出版几本小说。同时,他重新回到手写,用手在一个电子墨水笔记本上随时记录自己的想法。“手写的动作,和敲键盘不同,激活你的大脑的脑区也不同,思维过程也不同,能产生一些不同的东西。AI有多模态,人也需要多模态,我们得找各种各样的方式开拓自己的写作潜能。”

(感谢吴岩老师对采访的帮助) 人工智能科幻AI写作