70年,图灵没通过的测试
作者: 徐乃帅
1954年6月7日,艾伦·麦席森·图灵(Alan Mathison Turing)于家中床上去世,年仅42岁。此前,图灵接受了长达一年的雌激素注射“治疗”。他的床边,放着一个被咬了一口的、涂满了氰化物的苹果,被警方认定为自杀。
当时保守的英国社会,终究是容不下一位被指控为同性恋的“异端”,唯有图灵的科学界同僚铭记了他的贡献,循着他提出的“图灵机”构想继续求索,终而开拓了如今电子计算机领域的广阔疆域。
图灵逝世70年后的今天,早已变成现实的“图灵机”(电子计算机),彻底改变了世界的面貌,新兴的AI领域亦是爆发了前所未有的生机。而图灵的遗产中,当前最引人瞩目的,是那道名为“图灵测试”的关卡。
近期,美国的加利福尼亚大学圣迭戈分校(UCSD)研究团队宣布,GPT-4通过图灵测试:在54%的情况下,GPT-4会被认定为人类—这个概率,基本上和抛硬币猜对错没什么区别。
实际上,自从ChatGPT问世后,关于AI通过图灵测试的消息可谓是数不胜数。尽管,此次UCSD的研究报告确实比以往更具有可信度,或许我们更应该在意的是,为何直到今天,图灵测试还如此令人欲罢不能?
思考的幻觉
音乐、绘画、文学……此类文艺领域的创作和审美,一直以来被人类视为自身独有的能力,但现在AI证明了它们完全能够胜任其中的诸多工作,这无疑引发了人类内心深处的担忧。或许其更重要的意义在于,图灵的著名疑问—“机器能思考吗?”在当下被重新提了出来。
1950年,图灵发表了一篇划时代的论文《计算机器和智能》(Computing Machinery and Intelligence),提出了著名的图灵测试。
此前,尽管图灵曾作出诸多尝试,都还是无法彻底解决“智能该如何定义”这个问题。于是,图灵决定绕开它,先假定智能可以被机器所模拟,然后再由人对机器是否拥有智能进行侧面判定,即“如果人类无法分辨和自己对话的是人类还是机器,就可以认定机器存在智能”。
图灵测试被提出后,或许就连图灵本人,都不曾想到会对后世造成如此深远的影响。在诸多有关AI的科幻作品宣传下,图灵测试为大众所熟知,也成为了大众对AI最为浅显易懂的理解—从某种意义上来说,这像是一场面向全社会的思想实验。
图灵的遗产中,当前最引人瞩目的,是那道名为“图灵测试”的关卡。

综上所述,ChatGPT通过图灵测试,的确是一件值得称道的成就,不久后或许会有更多大语言模型通过图灵测试。但这实际上引发了一个问题,倘若说这意味着AI能够“思考”,无疑是违背人类直觉的,更对传统语言哲学中“语言是思维的载体”这一观念造成了巨大挑战。
当前所有大语言模型,所进行的运算都是基于自然语言文本层面的,并不存在更深层次的足以称为“思维”的架构。假设这种颇为微妙的AI形态能够“思考”,就等同于仿佛在告诉人类“语言即思维本身”,又或者说,人类自以为是的所谓语言之上的“思考”,只是脑海中的“幻觉”。
实际上,“思维即语言”这样的观点其实并不新奇,著名的美国语言学家,95岁的乔姆斯基·AN·近期因病危而备受关注。早年,他曾在语言学界掀起过一场“乔姆斯基革命”。
他认为,人类天生具备一种语言学习的能力和结构,语言是思维的塑造者,也是思考的先决条件—如果认可这种观点,先有语言结构才有成体系的思维,那么,当今以大语言模型为中心的多模态AI,是否真的可能走在了那条正确的道路上?
想要探索问题的答案,或许还得回到一切的原点,即“图灵机”上面。
找到获取“智能”的途径
1936年,图灵前往普林斯顿大学进修,见到了被后世称为“计算机之父”的约翰·冯·诺依曼(John von Neumann)。两年后,图灵离开普林斯顿之际,冯·诺依曼邀请图灵担任自己的助手,但后者没有接受。
时间来到1949年,世界上第一台依托于冯·诺依曼架构的计算机EDVAC问世,它被认为是所有现代计算机的“鼻祖”。尽管如此,冯·诺依曼多次强调,图灵在其中的贡献是不可或缺,倘若说冯·诺依曼架构是计算机的“躯体”,那么“图灵机”理论便是计算机的“灵魂”。
“图灵机”被提出之前,现代意义上的“计算机”这一概念是不存在的,只有为某些特定工作特别设计的“计算机器”。比如说一台专门用于求解微积分的机器,就无法用于店铺账单的制作。而图灵打破了当时被认为坚不可摧的壁垒,提出了真正的通用计算机。

识破AI的关键在于考察对方的社会角色,这是AI最难以模仿的人类特征。
在《论可计算数及其在判定问题上的应用》这篇论文中,图灵把所有的“计算”过程,拆解为两个简单动作的不断重复:在纸上写上或者擦除某个符号;把注意力从纸的一个位置移动到另一个位置。
图灵证明,只需有一个潜在的无限长的纸带,这台机器就能模拟人类所能进行的任何逻辑推理和计算过程。
此前,“计算”的能力是被视为与“思考”相似的,属于人类仅有的抽象能力。许多人一时间都难以接受,“计算”可以被如此简单的模型所概括。可以说,正是从“图灵机”开始,潘多拉魔盒被打开了—在此之前,或许工厂车间里的工人、店铺里的收营员都认为,自己的工作是具有独创性的。
这种“图灵式”的思维方式,贯穿了他的所有学术思想。
1942年,图灵被秘密派往美国,交流破译德国加密信息的成果。机缘巧合之下,图灵和另一位计算机领域的先驱克劳德·艾尔伍德·香农(Claude Elwood Shannon)见面,两人展开了一段长久以来为人津津乐道的讨论。
他们讨论的主题是,既然人类的逻辑和计算能力能被机器所模拟,那么更进一步,所谓的“思考”是否也可以被一个机器模型所模拟呢?真正的通用型“人工智能”是否可以实现?
于是,图灵给出了一种实现人工智能的构想:模拟人类大脑的思维,让机器不断学习直至产生智能。对此,他解释说,新生儿的大脑是不具备智能的,因此一定存在某种内在的机制来产生智能,只要找到人类大脑获得智能的途径,应用于机器上,就可以让机器也产生智能。
毫无疑问,这场讨论给双方都带来了深刻的启发,后来香农成为了“信息论”的奠基人,解决了AI发展过程中的另一个难题。回到英国的图灵,则开始就“何谓智能”进行了终极意义上的探索。
人体也即机器?
就“机器能思考吗”这个问题,图灵首先消除了“思考”一词在哲学上的定义,将其简化,仅仅指一种可以在外部观察到的,机器通过学习获得技能并将其表现出来的能力;更进一步来说,是指机器依靠学习进化,而最终通过图灵测试的可能性—从这个角度上来讲,当前的ChatGPT是基本符合标准的。
同时,图灵反驳了诸多对立观点,其中最具代表性的,也正是许多人坚信的“思维来源于情感和意识”这一说法。图灵强调,一个通过图灵测试的机器,将意味着它可以在所有的外在表现上和人类行为一致,又怎么能唯心地去判定它“没有思维”呢?用中国古话来讲,即“子非鱼,安知鱼之乐”?
违背直觉的理论,可能更接近真相—这是已在物理和数学等领域多次被验证的一个事实。
在图灵测试中,图灵是以人类自身作为标准,来判断AI是否拥有智能的。也正因此,对图灵的观点最具分量的质疑,来自数学领域的哥德尔不完备性定理。
该定理对人工智能的限制是:无论人类造出多么完美的机器,都必然存在某一个人类能解决而机器不能解决的问题。这就意味着,在进行图灵测试时,只要找出那个问题,就没有任何机器能通过测试。
哥德尔不完备性定理,让图灵测试变成了悖论。对此,图灵干脆利落把问题抛回了人类:没有证据说明人类智能就不存在这种局限性。
提出哥德尔不完备性定理的库尔特·哥德尔(Kurt Godel),曾在一次演讲中说:“要么无论机器多么复杂,人类的思维都将在理论上无限地超越任何机器;要么对人类而言,也一定存在着一个人类绝对无法解决的问题。”哥德尔本人更倾向前半句,认为人类的智能是无法被机器模拟的。
这个问题在哲学界、科学界的争论经久不衰,至今没有答案。
时间回到1922年,当时年仅10岁的图灵得到了一本课外书,书名为《每个儿童应该知道的自然奇观》。根据图灵自述,书中一段关于人与机器关系的阐述,对他的思想产生了深刻的影响。

“它是一台极其复杂的机器。显然比任何手工制作的机器都要复杂千万倍,但其本质上仍然是一台机器。”图灵接受了这种观念,他曾直言不讳地表示:“人体也是一台机器。”
在生命中的最后几年,图灵转向了“人工生命”领域的研究。规整的雏菊花瓣、螺旋状的杉木纹理、复杂的人类大脑结构……这一切都是如此令人着迷,自然界的有机生命和人为设计出的机器,仿佛成了镜子的表里两面,图灵迫不及待地想要透过表象,去探索关于“生命”深层逻辑。
但这一切都迅速戛然而止。1952年,被指控为同性恋之际,图灵为继续研究,在牢狱之灾或接受化学阉割间选择了后者,随即于两年后“自杀”。
图灵测试的本义是“模仿游戏”,指机器模仿人类的行为。曾参与图灵测试的研究员普遍认为,识破AI的关键在于考察对方的社会角色,这是AI最难以模仿的人类特征。
当图灵面对警察的讯问时,或许他只要撒个谎否认同性恋的指控,模仿成“正常人”,就有机会摆脱罪名—应该没有人会刻意刁难一位社会地位较高的大学教授。
但最终,图灵自身,未能通过这场“图灵测试”。
倘若说,人体只是一台更为复杂的机器,和人类所创造的机器并无本质区别,那这场悲剧,显然是对人类自身“哥德尔不完备性”的一次充分验证。
为人类指明未来的图灵终究未能获得善待,那么他所带给人类的计算机和AI,将指引人类走向何方呢?这仍是一个未知的命题。
责任编辑吴阳煜 [email protected]