ChatGPT开启AI新纪元

作者: 杨智杰 霍思伊

ChatGPT开启AI新纪元0

美国东部时间3月28日,未来生命研究所发表一封公开信,呼吁所有AI实验室立即暂停研发比GPT-4能力更强大的AI系统,时长至少为6个月。截至4月9日,这封公开信已收到超过5万个签名。

这次发布的公开信指出,近几个月,全球人工智能实验室“陷入一场失控的竞争”,以开发更强大的AI大模型,开发者乃至所有人都无法理解、预测或可靠控制这个AI系统。AI开发人员必须与政策制定者合作,以显著加快开发强大的AI治理系统。

4月11日,中国国家网信办就《生成式人工智能服务管理办法(征求意见稿)》征求意见,提出提供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗。

ChatGPT在2022年11月推出后,在全球掀起热潮,谷歌、亚马逊及国内百度、阿里等一众大厂展开一场AI军备竞赛,致力于开发自己的大模型。OpenAI今年3月推出更高级别的大模型GPT-4,同时也在研发GPT-5。

4月10日下午,搜狗创始人王小川正式投身AI大模型的竞赛,创办公司百川智能,并称 “年底前发布对标GPT-3.5的大模型”。同一天,商汤科技公布“日日新SenseNova”大模型体系。更早前,美团联合创始人王慧文创办光年之外。以ChatGPT为代表的大模型产品是否是AI发展的未来,又是否是通往通用人工智能的路径?面对人工智能的全面来袭,我们该恐慌吗?

欧盟正制定《人工智能法案》

“让我们享受一个漫长的AI之夏,而不是毫无准备陷入秋天。”公开信的结尾这样写道。公开信中,研究者们担心,AI生成的谎言将充斥信息渠道,自动化替代所有工作,进化中的AI未来可能会超越乃至取代人类的思维,甚至让人类失去对文明的控制。

未来生命研究所是位于美国马萨诸塞州的非营利组织,致力于推动AI负责任地发展,2018年,这一组织曾让SpaceX创始人埃隆·马斯克、谷歌旗下AI实验室DeepMind等一众AI从业者与机构签字承诺,永不开发杀手机器人。这次公开信获得的签名支持,包括2018年图灵奖得主、“深度学习三巨头”之一的约书亚·本吉奥,“AI领域最好的教科书”《人工智能:现代方法》的联合作者斯图尔特·罗素,以及曾是OpenAI创始人的马斯克等。

中科院自动化研究所人工智能伦理与治理研究中心研究员曾毅也在公开信上签了名,他告诉《中国新闻周刊》,呼吁者最担心两点,一方面,技术将对社会产生哪些潜在影响,人类对此还没有做好准备;另一方面,AI大模型生成的一些内容仍具有偏见和危害,不少AI大模型在开发时缺乏伦理安全框架。

曾毅强调,“AI末世论”不是当下需要担心的重点。OpenAI并没有表明目前GPT-4是通用人工智能,但“并非通用人工智能真正到来时,人类的文明才会失控”。在他看来,ChatGPT成为用户获取知识的一种工具。开发者为大模型投喂互联网级别的数据,输出端面对的又是开放性提问,这意味着不确定性大幅增加。多位业内人士认同,目前AI技术带来了巨大风险,但人类对此准备不足。面对数学、编程、归因等各类问题时编造与事实无关的答案,产生“幻觉”,是GPT-4等大模型最受诟病的缺陷,更关键的是,机器在呈现错误答案时仍看上去非常“自信且具有说服力”。

大模型生成内容时,“幻觉”并不都是坏事,但代价是,如果没有小心审查,错误的信息将在互联网上蔓延。人工智能公司小冰CEO李笛向《中国新闻周刊》举例,假如大模型生成内容中,编造的信息只有10%,如果一天中有一亿次的并发(单位时间内系统同时处理的请求数),便会产生1000万条假消息,如果被一些自媒体或个人不加审核就投放到市场,几轮转发后,人们便难以追溯假新闻来源。目前AI大模型的问题,不在于它会不会出错、它的能力比人类强,而是并发太高,加上AI极强的说服能力,会造成更严重的后果。

近期,大模型开始被指控侵犯个人数据隐私。3月30日,韩国有媒体报道,三星内部发生三起涉及ChatGPT误用与滥用案例,包括两起“设备信息泄露”和一起“会议内容泄露”,三星公司担心,在ChatGPT输入内容后,可能会让敏感内容外泄。当地时间3月31日,意大利宣布禁止使用ChatGPT,起因是一周前,多名ChatGPT用户表示看到其他人与ChatGPT对话记录的标题。意大利官方认为,OpenAI没有提前告知、非法收集用户个人信息,对OpenAI立案调查,并要求公司作出回应。4月初,德国、爱尔兰、加拿大等相继开始关注ChatGPT的数据安全问题。

当地时间4月5日,OpenAI在官网发布文章,详细介绍了公司在AI安全上的部署,回应相关争议,措施包括模型发布前构建完整的AI安全体系,从用户实际使用中积累经验以改善安全措施,保护儿童,尊重隐私,提高事实准确性等。文中特别提到,公司将努力在可行情况下,从训练数据集中删除个人信息,对模型微调以拒绝有关使用者个人信息的请求等。

这封公开信呼吁暂停对超过GPT-4能力的大模型的研发,换句话说,目前绝大多数大模型研发者并不会面临上述挑战,OpenAI仍是众矢之的。

ChatGPT开启AI新纪元1
4月10日,OpenAI CEO山姆·阿尔特曼在东京会见日本首相岸田文雄后接受媒体采访。图/视觉中国

并非所有人都同意公开信的内容。当地时间3月30日,当前人工智能和机器学习领域最顶级的学者之一、谷歌大脑的缔造者吴恩达连发4条推特,表达反对意见,他认为呼吁暂停研发的行为是“一个可怕的想法”,围绕大模型开发过程中的透明度和审计方式,制定法规,才是更实用且有效的做法。当地时间4月7日,2018年图灵奖另一位得主、Meta首席科学家杨立昆在一场直播中表达了相似的观点,支持监管相关AI产品,但不应该监管研究和开发。

多位受访AI从业者认为,公开信建议的措施都难以落地。比如说,对AI生成的内容加水印。吴恩达表示,对于想利用AI生成的内容伪装、造假的行为,增加水印会构成一定阻碍,但他对这一方案广泛应用并不乐观。这可能会让提供商在激烈的竞争中落后——用户更倾向于使用没有水印的AI系统,从而影响企业的积极性。

此前,OpenAI在相关AI伦理安全领域做了许多工作。媒体曾报道,OpenAI在非洲肯尼亚雇佣工人,对AI输出的暴力、性别歧视和种族主义言论进行标注,尽管这一做法被视为对当地人造成极大心理创伤,却能清洗不少大模型输出的有害数据。此外,GPT-4在2022年8月已完成训练,OpenAI对其安全风险进行了6个月调整,引入50多名专家测试,同时加入人类偏好训练提示、奖励模式等。

公开信发布后,针对大模型的伦理安全问题,曾毅所在的中科院自动化研究所人工智能伦理与治理研究中心等在国内发起线上调查,截至4月4日,全国超过500人参加,90%参与者认为,为社会服务的每一个AI大模型,都必须实现伦理安全治理框架。“这不应是一个可选项,而是大模型赋能社会前必须要做的工作。”曾毅建议,每个AI开发机构都应构建一个可技术落地的、有关人工智能安全自动化检测的系统或平台。多位受访者表示,这不能仅靠机构自律,AI在应用阶段仍需有更完善的法律、法规的监管。

4月11日,中国国家网信办起草的《生成式人工智能服务管理办法(征求意见稿)》,开始向社会公开征求意见。围绕近期生成式AI最受质疑的内容不准确、侵犯个人隐私等问题,《办法》要求开发者采取措施,对训练数据来源的合法性负责,不得非法留存能够推断出用户身份的输入信息等。

曾毅向《中国新闻周刊》介绍,目前,国内在人工智能领域顶层设计上有治理原则,但没有相关法律,对于AI的伦理安全只是非强制性约束。此外,他参与国内一些人工智能相关管理文件制定时注意到,一些管理办法只是限制研究行为,在应用层面的治理却是空白。因此,国内对人工智能的监管在法规和实施管理上仍需要加强。

一直在AI立法方面走在前列的欧盟正在制定一项《人工智能法案》,该法案正在欧洲议会讨论,预计将于4月26日投票,其核心是基于人工智能的风险等级进行分类监管。但有分析指出,如何定义“高风险AI系统”是一个复杂而困难的决策过程。

AI的“iPhone时刻”?

2018年起,清华大学人工智能研究院常务副院长、清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)负责人孙茂松带领团队开始研究大规模语言模型。THUNLP是国内最早开展自然语言处理研究且极具影响力的科研机构。

这一年,谷歌推出预训练模型BERT,OpenAI推出GPT-1,预训练语言模型成为自然语言处理任务的主流范式。开发者靠不断扩大参数规模,提升AI的能力,比如2019年OpenAI推出参数为15亿的GPT-2,2020年推出GPT-3,将参数提升到了1750亿。

“当时我们在讨论这条路能走多远,即数据和模型规模的增大,会不会达到一个饱和点,能力趋于极限。结果不但没有饱和,反而出现了质的提升。”孙茂松告诉《中国新闻周刊》。大模型的能力在2020年GPT-3推出时已经显现,但仍主要是完成特定任务,缺乏随机应变的能力。直到ChatGPT出现,在性能上有了一个质的飞跃,显示出了某些通用人工智能的特质。

ChatGPT发布后,孙茂松在一次测试中让ChatGPT写一首五言绝句,ChatGPT写得并不完全合乎对仗、押韵的要求。但是让孙茂松惊喜的是,当他问道,“你觉得哪一句写得好?”机器回复,第二句,并分析因为其中两个词表达了什么情感,两者之间的关联。孙茂松进一步表示,“我认为第四句更好”,ChatGPT随后对第四句进行了赏析。2015年起,他曾研发过一个人工智能诗歌写作系统“九歌”,2017年面世。想要让AI写诗,他先要设计好一个小模型,输入诗歌类数据时,需要详细标注出一首诗每句的顺序,之后在向AI提问时,它才会挑出某一句来分析。

“现在不用教它,它能回答出来。我们测试ChatGPT的能力,不用多,只要两三个例子就知道,国内现在AI大模型做不出这一效果。”在孙茂松看来,ChatGPT的诞生,意味着人工智能迎来拐点,也将是未来5~10年人工智能发展的必然趋势。

2016年,AlphaGo打败围棋世界冠军李世石,让公众为人工智能深度学习的能力感到振奋,但之后,AI的发展陷入寒冬。多位受访者表示,ChatGPT展现的能力与AlphaGo有本质差别。国内人工智能公司出门问问CEO李志飞告诉《中国新闻周刊》,AlphaGo的表现,是在有清晰的规则、不涉及与复杂世界交互、相对简单的环境下发生的。但ChatGPT背后的大模型,展现了语言、知识、逻辑推理等人类通用的技能,并让人们亲身感受到。

“ChatGPT展现的能力非常实用,与每个人的生活与工作密切相关,这是人工智能发展70多年来从未达到过的时刻。”THUNLP副教授刘知远告诉《中国新闻周刊》,但最终ChatGPT是人们生活中必不可少的工具,还是会诞生另一种形态的产品,有待商榷。

当地时间3月21日,英伟达CEO黄仁勋在春季开发者大会上,公开了两款为AI大模型提供动力的新款芯片,并三次激动地说,“我们正处于AI的‘iPhone时刻’”。

李笛对AI大模型的看法更为冷静。他认为,过去5年自然语言处理技术的发展面临很大压力,比如机器难以理解人的意图,知识图谱的效果不理想,AI大模型解决了这些瓶颈。但尝试将它与某个时代对标,“或多或少处于各自(商业或事业)发展的考量”。

在李笛看来,相比GPT-3.5,GPT-4并没有涌现新的能力,比如突破GPT-3.5时期逻辑思维的方式等。依据AI过去每一轮浪潮的发展,他判断,“目前的AI大模型已经面临瓶颈,行业很快会基于(ChatGPT)的创新,进入到焦灼的竞争状态,直到下一次创新到来。”

上一篇 点击页面呼出菜单 下一篇