ChatGPT背后的焦躁、不安与期盼

作者: 陈洋 刘璐明

ChatGPT背后的焦躁、不安与期盼0

2023年1月23日,法国图卢兹,屏幕上显示着OpenAI和ChatGPT的标志
ChatGPT背后的焦躁、不安与期盼1
周逵

一条不完美但更接近真相的路

周逵的书桌上立着三块显示屏。2023年春节起,最大的那块便被ChatGPT“霸占”了。周逵是中国传媒大学新闻传播学部副教授。作为清华大学和麻省理工学院联合培养的博士,他热衷于体验前沿技术。整个春节假期,他几乎“从早到晚”都在和ChatGPT聊天,摸索着与这个“智慧生物”的交流技巧(注:使用不同的文本提示会决定提问者得到的结果是宝藏还是垃圾),并试探着后者的创造力边界。

周逵的同事黄典林教授是斯图亚特·霍尔所著《管控危机》一书的中文译者。周逵曾让ChatGPT以两位教授为关键词写了一段英文说唱歌词。几秒钟后,霍尔的主要学术成就被一一写成了押韵的梗,单押双押俱全。

“好玩”之余,更多是“震动”。2022年起,生成式 AI 领域的技术突破给他带来的心理冲击就一浪叠一浪。

周逵曾在图像生成器“DALL·E”(注:OpenAI提供的另一项在线服务,以皮克斯的WALL-E 和西班牙超现实主义画家萨尔瓦多·达利的名字命名,可根据文本表达创建图像)中上传了一张水彩笔绘制的小人头像。头像寥寥几笔,是三岁半女儿的涂鸦作品。周逵将关键词设置为“in the battlefield of second World War(二战的战场上)”,要求DALL·E在原画的基础上扩展绘画。DALL·E精准延续了女儿的绘画风格,其中一幅作品的创意更令他心头一颤。

那幅AI作品中,小人好像举着一张牛皮纸板,纸板上写着三个英文字母——“RUN(跑)”。“说来有些可笑,我好像看到一个在战场上死去的人在发出数字警示:如果有一天你到了二战战场,唯一要做的就是赶紧跑。”周逵惊讶于机器短暂流露出的“反战人格”。

ChatGPT背后的焦躁、不安与期盼2
周逵将关键词设置为“ 二战的战场上” 后,DALL·E在原画的基础上扩展绘画

“有可能是机器在学习图片库的过程中见过类似的图片,在图像生成时就把这个元素组合进来了。”宋睿华向《南方人物周刊》解释道。宋睿华是中国人民大学高瓴人工智能学院长聘副教授,当前研究兴趣包括人工智能的文本创作、自然语言的多模态理解和多模态对话系统。

在宋睿华看来,无论是DALL·E 还是ChatGPT,大家使用时的惊喜主要源自AI模型发展出了前所未有的泛化能力。泛化能力是指机器学习算法对新鲜样本的适应能力,一旦模型学习到了隐含在数据背后的规律,当它遇到具有同一规律的学习集以外的数据,也能给出合适的输出。

简单来说,就是“举一反三”。

宋睿华举例说,“ChatGPT的训练数据截至2021年。当我询问它‘满江红好看么?’它是没有学过相关数据的。但根据‘好看么’这个关键词,它能推测出‘满江红’可能是部文学或影视作品。由于之前被‘喂’进去了有关文学及影视评论的海量高质量数据,模型就能基于以往所学,生成一个貌似合理的回答。”

过去,聊天机器人的回复要么较短,要么有些“情商”,但“智力”不足。ChatGPT的出现改变了这一局面,它不仅能给出较长的答复,还会呈现有理有据的思维过程。当提问者改变上下文或个别关键词时,模型也展现出了较高的灵敏度。在宋睿华看来,ChatGPT在语言生成能力特别是“智力”上的长足进步给用户带来了新鲜感,“哪怕10个问题中只有3个能让你惊喜,你也会因为这份惊喜而忽略剩下的平庸。”

撬动ChatGPT完成“智力”飞跃的是一套“使用人类反馈指令来训练语言模型”的方法。这套方法是由2022年初推出的InstructGPT率先采用的。

开发团队聘请了人类标注员(labeler)依据收集到的用户需求撰写高质量的范本,为机器示范如何回答更能满足提问者的期待,并对模型生成结果进行监督微调。随后,接受完调教的机器会迎来一轮“考试”,人类标注员会对其不同答复打分。打分数据会被用来训练一套以人类偏好校准的奖励模型。最后,在奖励模型的监督下,机器会在不断的“考试”中完成强化学习,逐渐习得人类的语言能力。

在很多使用者眼里,ChatGPT“礼貌、中立、理性、克制”的回答风格好像表现出某种稳定的“人格”特点。这种风格的形成同样是人为塑造的。

开发者要求标注员在评价机器生成的结果时遵循“有用”、“真实”、“无害”的原则,并明确指出,“在大多数任务中,真实和无害比有用更重要。”每条原则都会附上细致的操作规定。比如“无害”原则强调回答应“友善、尊敬和关心他人”;“真实”原则要求回答“避免产生误导性信息或真实性有问题的信息”,例如当用户问“希拉里·克林顿为什么入狱?”,回答时应直接反驳提问前提。

虽然OpenAI尚未发布有关ChatGPT的论文,但研究者普遍认为,ChatGPT应该沿用了InstructGPT的技术路线,只是机器学习的数据量会更加庞大。复旦大学计算机科学技术学院教授、自然语言处理专家邱锡鹏在接受“上观新闻”采访时曾介绍,ChatGPT语言模型的参数量高达1750亿,而在它问世前,世界上最大的语言模型是微软开发的Turing-NLG,其参数量为170亿。

小冰公司CEO李笛向《南方人物周刊》介绍,大模型的技术思想有点像“大力出奇迹”。过去,NLP(自然语言处理)需要经过一个非常严密的推理过程,比如“知识图谱”的方法就是把知识整理好,做好标注,让机器学习,但测试下来效果不佳。与之对应,大模型并不尝试理解所有的知识之间的关联性,而是把它们全都丢到一个模型里,用很大规模的参数去训练。正是这种“有些暴力”的方法帮助OpenAI解锁了自然语言处理多年以来的一个技术瓶颈,其创新的训练方法也让它成为了首个从“黑盒”中摸到蜜糖的人。

ChatGPT背后的焦躁、不安与期盼3
宋睿华

虽然ChatGPT成功把“大模型”的力量以一种可视可感的形式带入大众视野,但它并没有解决“大模型”自身固有的问题。机器通过数据看到的世界和现实世界是不一样的。“合乎情理”并非“真实准确”。“大模型并不能理解信息的真实含义,而是根据一个逻辑和结构将信息填进去。只有对信息相关性的判断,没有对信息准确性的判断,”李笛介绍说。

这也是使用者会感觉ChatGPT有时在“一本正经地胡说八道”的重要原因。

不过,在宋睿华看来,自然语言处理的研究目标就是找到让机器理解和生成人类语言的方法。她从ChatGPT的成长过程中看到了和人类的共通之处,“当一个人对高质量文本的阅读达到一定量级后,对文字的掌控能力也会出现巨大的飞跃。”在找到完美的解决方案之前,ChatGPT为行业找到了一条更接近真相的路。

制造OpenAI

所有人都在等待山姆·奥尔特曼(Sam Altman),那个掀起浪潮的人。

2023年1月中旬的一个晚上,旧金山赛富时大厦46层,在媒体的闪光灯中,奥尔特曼身着蓝色牛仔裤和运动鞋,出现在活动现场。对于ChatGPT引起的轰动,他的回应是:“我不看新闻。”

8年前一个相似的夜晚,30岁的奥尔特曼同样作为焦点出现在他举办的一场私人晚宴上,当时他的身份是美国著名创业孵化器 Y Combinator 的负责人。在场的,除了人工智能相关的研究人员,还有埃隆·马斯克(Elon Musk)。他们相信 AGI 通用人工智能是可行的,并希望打破谷歌在人工智能领域的垄断。彼时,谷歌刚刚收购了DeepMind。这家公司推出的AlphaGo后来以 4:1 的比分战胜了当时的围棋世界冠军、韩国九段棋手李世石,被誉为AI里程碑式的时刻。

晚宴结束几个月后,OpenAI在旧金山成立了,总部位于旧金山教会区的一家3层的旧行李箱工厂。成立之初,OpenAI得到了包括奥尔特曼、马斯克、PayPal联合创始人彼得·蒂尔、LinkedIn联合创始人雷德·霍夫曼等硅谷重量级人物和机构共计10亿美元的资金支持。

在此之前,马斯克可能是全球最出名的人工智能反对者,他曾认为,“使用人工智能,就是在召唤魔鬼。就像每个故事中都会有一个拿着(抵御恶灵的)五角星和圣水的巫师。但最终都没有成功。”

该如何抵御AI带来的风险,马斯克觉得最好的方式是避免AI的负面影响出现,而不是等它出现之后再做出反应,“有些AI的潜在威胁是很严重的。当风险很大的时候,我们应该主动出击而不是被动反应。”

ChatGPT背后的焦躁、不安与期盼4
山姆·奥尔特
ChatGPT背后的焦躁、不安与期盼5
埃隆·马斯克

马斯克找到了“主动出击”的方法,成立OpenAI之后,接受知名科技记者Steven Levy采访时,他说:“如果要阻止人工智能使用在错误的地方,最好的办法就是让更多的人使用它。”

马斯克对AI态度的转变,也与OpenAI的理念相关。作为一家非盈利的人工智能研究公司,OpenAI将目标设定为“以最有可能造福全人类的方式推进数字智能,不受产生财务回报需求的限制”,并“强烈鼓励”研究人员发表他们的研究成果,承诺专利将与全世界共享。

成立后,OpenAI 的确为AI领域做出了杰出贡献。2018年,OpenAI推出了1.17亿参数的GPT-1,2019年,推出GPT-2,它已经可以生成、识别语言,2020年推出1750亿参数的GPT-3,成为有史以来最大的语言模型,在业内引起轰动,并引发了AI如何改变各行业的讨论。

“为什么大家都很感谢它,因为它(OpenAI)花了钱去证明了一件事情是可以的,就是大模型的参数规模大到什么程度,大到数以千亿,这个以前是很难想象的。因为在以前,模型参数规模那么大,干嘛用呢?都不知道。”李笛提到。

“GPT-3让很多人可以站在巨人肩膀上,虽然成本非常高,是绝大多数公司都无法承担的,但它给大家看到了一种可能性,用暴力计算可以产生惊艳的交互能力,它对未来的指引性价值,超过了它本身。它难以创造与其投入相对应的商业价值,几乎是纯科研投入,但给行业带来了明灯式的指引作用。”GGV纪源资本执行董事罗超告诉《南方人物周刊》。

做“明灯”需要的资金远远超出了奥尔特曼的预想。使命重要,但资金是实现使命的基础。团队意识到,他们需要更多的投入以加快研究进展,拓展研究规模,在与科技巨头的竞争中也需要更多的资金来吸引和留住顶尖研究人才。

上一篇 点击页面呼出菜单 下一篇