当人类开始向AI租赁想象力

作者: 李静

当人类开始向AI租赁想象力0

春节过后,作家止庵收到不少朋友发来的“诗”、“小说”,还有“古文”、“旧体诗词”、仿某位知名作家文体的“文章”,让他品鉴,全部为人工智能对话模型DeepSeek所作。DeepSeek是春节期间,在爆款电影《哪吒2》之外的另一个最热门话题。

无论诗歌还是文章,它的写作时间仅以秒来计算,其中不乏高水准作品,更难得的是,它在对话中不像旧有模型那般AI腔,而是显示出了一丝“人味”。例如,有人问DeepSeek:“听说你会算命?”它回答:“哈哈,虽然我不会真正的算命……但如果你对某些事情感到好奇……我可以帮你理清思路或给出一些意见。”并在结尾加上了一个脸红的微笑表情。

此时,文生图应用Midjourney更新到了第六代,对标Sora的视频生成大模型可灵已经在视频领域被广泛应用,AI主播“0失误率”。图片、影像、文字……内容创作者们无一幸免,必须面对人机共存的现实。去年下半年,麦肯锡的一则研究报告预测,在2030年至2060年之间,全球将有50%的现有职业被AI取代。

许多人开始产生“存在主义危机”:AI会取代人类创作者吗?它会成为我们的“伙伴”还是“敌人”?我们是被它替代还是因为有了它的辅助而效率更高?可见的未来和更远的未来,似乎都正以加速的方式到来。

在“平庸”里做到上乘

止庵看了朋友们发来的AI“大作”,觉得“一概都是勉为其难”。例如一首网络上有人叫好的“旧体诗”《七律·黄鹤楼怀古》——昔年仙迹杳难求,独上危阑瞰九州。千秋鹤影随云逝,万里江声入海流。芳草萋萋鹦鹉渡,烟波渺渺楚客舟。日暮登临谁共语,西风吹尽古今愁。“全‘诗’处处空泛不着调。”止庵对《中国新闻周刊》说,“唯一落实的二句‘独上危阑’和七句‘日暮登临谁共语’,一个意思说两遍。莫非已经上了一趟,又上一趟,好在黄鹤楼装有电梯,上下方便。”

虽然看不上这首诗的“文学造诣”,但止庵听说它的理解和逻辑分析能力已经迭代,于是试着在生活里使用。止庵已经喂了一阵子猫,他需要一些科学喂猫的书籍,DeepSeek迅速推荐了6本,且列有出版社信息、出版时间和链接,但止庵查阅后发现其中5本书都不存在,所谓链接打开后是其他书籍,有一本虽然存在但是书名写错了。

“一本正经地胡说八道”,在专业领域,这被称为AI幻觉。既受制于AI理解能力欠缺等天然缺陷,也由于生成式AI基于大量数据训练而成,如果没有向其“投喂”客观、准确的数据,就很难保证其会“反刍”出符合常理的回答。网络上的信息本就真真假假、充斥偏见,在并不见得有多干净的池子里打捞内容,污染自身在所难免。而当前AI的训练数据几乎不包含“我不知道”这样的表述,因此它们天生不会谦逊。

在一切以准确为前提的创作中,不允许“瞎说”,但在虚构的故事里,“瞎说”有时却可以成为工具。科幻作家陈楸帆在春节期间刚刚完成一个新作品《神笔》,里面写到“控制论之父”美国数学家诺伯特·维纳在中国的一段经历,但作为科幻小说,陈楸帆假设了一个平行时空,20世纪30年代中期,维纳短暂地在清华大学任教一年后,并没有像真实历史中那样离开,而是留在了中国,而且受到中国文化的影响,于是,他的控制论思想,包括后世现代计算机的发明和人工智能的走向完全改变了。

要了解这段历史的细节,再到关键的时间节点上做改写,是工作量巨大的一件事,但如果利用AI梳理历史并改写,就可以迅速完成,改写的历史也不怕所谓“瞎说”。“我要的就是这个‘胡说八道’,因为我故事里这段历史本来就是不存在的。所以,当你理解了它的幻觉特质后,对写虚构的人来说,我觉得反而是一个好处,关键在于你怎么操控它的幻觉,如果利用得好,其实蛮有意思的。”陈楸帆告诉《中国新闻周刊》。

在作家圈,陈楸帆是最早与AI一起工作的作家。2017年,他在谷歌的前同事、人工智能专家王咏刚帮他编写了一个基于深度学习技术的写作程序,从一些无厘头的句子到出乎意料的“神转折”,陈楸帆发现与AI共同写作这件事变得越来越有惊喜。他和AI共同创作的作品《出神状态》,在2019年中国的文学杂志《思南文学选刊》设立的“AI文学榜”评选中,甚至打败了莫言当时的新作《等待摩西》。

几天前,陈楸帆和“阅文”的编辑朋友聊天,听这位朋友抱怨说,春节后工作量剧增,因为接到大量DeepSeek生成的投稿。现在AI“写”的小说,会被这些有经验的编辑一眼看出来,但是如果未来它们多次升级迭代,再“写”东西还能不能被编辑看出来,就成了未知数。陈楸帆觉得,那种日更几千字的网文未来完全可以由AI生成,毕竟网文的阅读习惯和商业模式都与传统文学不同,对于那样一种在碎片化时间里仅仅追求情节发展迅速、冲突体验频繁的阅读,大模型的水平可能就够用了。

这和止庵的感受差不多,他觉得以目前DeepSeek的水平,写请假条、邀请函乃至工作中其他应用文应该是可以的,未来,也许它还能模仿知名作家写出小说,但它所能做到的最好的应该也就是“替代人类感情、思想、智慧中相对平庸或循规蹈矩的那一部分,它甚至在这一范围之内,可以达到上乘”,如果要给AI定位,它应该就在这个位置上。

而一切经验性、总结性、按部就班的内容被取代,并不是今天才发生。随意走进一家书店,旅游类图书、生活类图书大都已不见踪迹。“它们早被短视频取代了。”止庵告诉《中国新闻周刊》,“比如你想做一个菜,以前我给你写个菜谱,现在还不如直接给你拍个视频,所以这一类书籍不大多见了。”

平庸的诗词如今被如此大范围地欢呼,反而让止庵忧虑另一件事:“是不是今天我们的水平太低了呢?”这些年的文化教育、文学教育(包括古文、古诗词教育)跟不上,让我们不知道什么叫作“好”。如果能多加强点这方面的教育(包括自我教育),也就不至于这般欢呼人工智能写的“古文”和“旧体诗词”。

止庵觉得,突然大火的DeepSeek让一件事“水落石出”了——是我们人类整体的不创造,让我们越来越懒惰,越来越固守,循规蹈矩,而后平庸,以至于看什么都觉得好,这才是值得悲哀的事情。

封闭的行业壁垒被打破了

一只小猫的眼睛里,映出朝阳下故宫的殿堂楼阁,而后,它轻盈地跃上屋顶,路过热气腾腾的早点铺子,路过下象棋的人,跃入古画、屏风、试卷,走在北京街头……这是“首届北京城市形象AI创作征集”活动的获奖作品《故宫猫猫上班记》,在各个平台都获得不错的流量。

和朋友海辛一起做出《故宫猫猫上班记》的设计美学博主、设计师阿文曾在一年前和《中国新闻周刊》谈起AI给予设计行业的巨大帮助,在一片“设计师将要被AI抢走饭碗”话题喧嚣的两三年间,他们这些努力学习使用AI的人并没被抢走饭碗,反而获得更多饭碗。去年春节前,阿文和海辛开始一起尝试制作AI动画视频,不过一年时间,曾以平面设计和幻灯片演示设计为主业的他,已经几乎转型为视频短片制作者。“这完全得益于技术的发展。”他对《中国新闻周刊》说。

由于部分影像过于真实,再加上有影棚“实拍”的花絮片段,总有人来问阿文:《故宫猫猫上班记》中,是否有真人实拍镜头?答案是:几乎全部由AI生成,仅有一个镜头由PPT制作。

平面设计师成为短片作者,且编剧、导演、分镜、剪辑、配乐……全部由二人小组完成,原本封闭的行业壁垒被打破了。上海大学上海温哥华电影学院副院长陈晓达认为,这是目前“生成式人工智能AIGC”的最大价值。“大家都知道,在影视圈想拍一部片子有多难,要动用到多少资本、工具、资源。现在,我们的学生一个人就可以制作自己的科幻短片,换成几年前,这种类型片得搭建一个多么大型的团队?”

传统影视制作如同一台精密运转的工业机器,从剧本创作到后期特效,每个环节都需要专业团队数月乃至数年的打磨。AI为这一领域带来了成本结构的巨大变革,无论制作成本还是制作周期,都实现了数量级的压缩。中小制作团队甚至个人创作者都能够以极低门槛参与生产,影视创作的基本单位被重新定义,距离“创意即生产力”的目标越来越近。

2023年2月,OpenAI发布ChatGPT不久,上海大学上海温哥华电影学院开设了AI课程,这是当时沪上电影院校的首个AI电影课。学生学习利用AI软件,为自己的短片作品生成美术概念图、选角参考图、分镜图等,不光节约创作时间、提供创作灵感,也可以在未来参与影视节创投、吸引投资人时提供可视化依据。

“比如,导演说想找个伊斯特伍德类型的中国演员,选角导演怎么找?”陈晓达对《中国新闻周刊》举例说,有了AI工具,迅速就可以生成导演想象中的“中国版”伊斯特伍德形象,虽然他不是现实中的人,但有了清晰的依据,效率就会高得多。编剧过程中的对话撰写,也是AI擅长的,至少可以帮助一个20出头的年轻人模拟上岁数的老人或是年过中年的父母。

去年6月,国产视频生成大模型可灵的上线更是重塑了电影学院学生们的创作工具和流程。谁也没想到,在Sora的60秒视频震荡了影视界几个月后,可以应用的国产视频生成大模型就出现了。“可灵非常惊艳,你上传任何一张照片或是有设计风格的图片,它都能让图自然地动起来,而且非常写实,像实拍一样。去年视频生成大模型中角色一致性无法保证这样的共性‘短板’,新的工具都在不断弥补,这一年AIGC发展变化快得有点夸张了。”阿文告诉《中国新闻周刊》,也正是可灵的出现,让他换了赛道。

以去年6月为界,在那之前,阿文也尝试做视频,但大多是“转绘”,也就是利用AI将普通视频转化为具有特定艺术风格的视频,例如把真人视频转化为油画、水彩画、素描、动漫等,相当于二次创作,在自媒体平台,不少博主发布这样的视频,一些修图软件也提供类似的“转绘”服务。

6月之后,伴随可灵上线,即梦、混元、Vidu等一系列国产视频生成大模型都冒了出来。整个2024年下半年,阿文的创作进入了第二阶段——不停测试这些视频模型的生成能力,借由它们“做一些天马行空的事情”,设计一些夸张梦幻的场景。当然,图片生成模型也在不断精进,这让用来制作视频的静帧图在有限的像素里有了更复杂逼真的细节,因为信息量足够丰富,间接提升了视频的真实度,在视觉上,分辨率也显得更高。很快,他们制作出了一个在社交媒体成为爆款的小视频——比富士山还要高的卡比兽,倾倒了一桶雪在富士山顶。这个只有几秒的视频迅速火遍了各个视频网站,不少博主开始模仿这个风格,制作各种巨型宝可梦视频。

随后,阿文和海辛接到了《北京日报》的邀请,参加“我AI北京——首届北京城市形象AI创作征集”活动。这一次,是长达1分50秒的视频,可灵的首尾帧功能给了他们很大帮助:“我们自己决定一个片段第一帧和最后一帧长什么样,然后把这两张图片上传上去,AI就能非常自然地让两张图片进行过渡。我只准备两张图就行了,中间过程由AI补,它补得非常好。”于是,故宫里的猫猫们从一个屋檐跳上另一个屋檐,从一幅画跃入另一幅画。

“猫猫”的视频做完没多久,Pika又出了新功能,它可以把任何物件加入一个视频片段里。海辛用它制作了一段皮卡丘等宝可梦成员来家里做客的视频,动漫人物和现实生活融合得毫无违和感,这意味着,在真人电影里加入卡通角色,再也不是难事。

当然,无论哪一款视频大模型,目前稳定生成的视频多为5秒,最多在10秒,要制作长片还不太现实。AI生成视频的清晰度普遍也只有1080P,但陈晓达认为,以目前大模型的更新迭代速度,实现一个人拍出一部电影,并不会是太过遥远的事。

可灵AI大模型产品经理陈马克对《中国新闻周刊》说:“在AI的辅助下,我们可以预见到一个全新的影视制作时代。从剧本创作到场景设计,从特效到后期制作,影视内容生产的多个环节都可以借助AI的力量,实现更加高效、精准的创作。随着技术的不断迭代和突破,以可灵AI为代表的视觉大模型及产品将逐渐成为视觉行业的新基建和新工具。构建个人可创作电影/影视剧的视频生成能力一直是我们努力的方向之一。”

经典小说推荐

杂志订阅