

刘云浩:具身智能,AI融入物理世界的“下一步”
作者: 谢玮从早期只能进行简单计算的程序,到如今能够与人类流畅对话、战胜顶级棋手的智能系统,人工智能的每一次突破都震撼着世界。具身智能作为人工智能向物理世界的进一步延伸,正逐步展现变革性潜力,成为学界和产业界共同关注的焦点。
清华大学全球创新学院院长、自动化系教授兼博导刘云浩在其新书《具身智能:人工智能的下一个浪潮》中,以通俗易懂的方式解读人工智能的“前世今生”,并深入剖析具身智能的内涵、前沿创新、科技成果转化和超级场景。
近日,围绕具身智能相关话题,《中国经济周刊》记者独家专访了刘云浩教授,请他深入剖析人工智能的发展阶段、具身智能的关键意义,以及将如何重塑我们的世界。
《中国经济周刊》:当前的人工智能发展到了什么阶段?为什么越来越多的人开始担心人工智能的安全?
刘云浩:人工智能概念正式定义于1956年的达特茅斯会议。根据MIT教授Alex Pentland发表于美国CACM杂志的《Perceptual Intelligence》(感知智能),学术界通常把人工智能划分为三个阶段,第一个阶段是计算智能,即机器像人一样计算和处理海量数据。经过半个多世纪的发展,AI在算力和存储方面已经超越了人类。第二个阶段是感知智能,先是机器通过模仿人类的视觉、听觉、嗅觉、味觉等感知能力理解物理世界,进一步可能会超越人类的感知维度,当前人工智能正处于这个阶段。尚未到来的第三个阶段是认知智能,学术界正在进行从感知智能迈向认知智能的路径探索。
人们对人工智能的担心很正常。事实上,人类历史上每一次重大技术突破——无论是电力、火车、核能,还是今天的AI——都伴随着争议、担心乃至恐慌。例如1960年生产自动化给人们带来了巨大担忧,《科学》(Science)期刊发表了一篇文章,写道“机器可能脱离人类的控制,威胁人类生存”。
AI的这次飞跃和之前的技术爆发相比还有很多新特点。
首先,我们正亲历AI在迅速掌握那些人类曾引以为傲、视为与其他物种根本区别的核心能力。如历史上两次有名的“AI战胜人类”——1997年“深蓝”战胜国际象棋世界冠军卡斯帕罗夫;2016年,AlphaGo 击败围棋顶尖选手李世石——都曾引发全球性的震动。2022年 ChatGPT 走进大众视野,大模型在语言理解和生成方面展现出令人惊叹的能力。维特根斯坦曾说过:“语言的边界就是世界的边界。”因此越来越多的人开始相信,AI走进了我们的工作、生活与思维体系,替代我们的职业,人们难免产生本能的不安。
其次,与传统技术革新相比,AI的推广速度之快前所未有,其潜在影响之广也远超预期。而在其背后,关于AI的可靠性、安全性与伦理机制的研究却慢了一个节拍,引发了外界对AI可能失控、被滥用的深层次担忧。

这件事情要辩证解读,担忧,并不意味着恐惧;谨慎,也不等于退却。真正决定技术走向的不是技术本身,而是人类如何理解它、掌控它、引导它为人所用。
《中国经济周刊》:对人工智能来说,为何“身体”如此重要?
刘云浩:具身智能中“具身”是指凭借在物理世界中的实体感知能力,实现更高级别的人工智能。
早在1950年,人工智能之父——图灵在他的经典论文《计算机与智能》中就展望了人工智能可能的两条发展道路:一是专注于抽象计算所需的智能,我们称之为“离身智能”;二是为机器配置最佳的传感器,教机器说话,使其可以与人类交流并像婴儿一样“成长”,我们称之为“具身智能”。
过去几十年,“离身智能”一直是人工智能的主流,目前火热的大语言模型也属于这一范畴,尽管已经大获成功,但是人工智能被困于“莫拉维克悖论”——AI做计算甚至下棋是容易实现的,但是要让AI有如几岁小孩般的感知和行动能力,却相当困难,甚至是不可能的。其中的原因是人工智能还没有与物理世界直接交互的能力,只能与预设数据进行互动。因此,人工智能要继续向前发展,必须通过获得实体感知能力,在物理世界中学习和进化。
《中国经济周刊》:具身智能会带来一个怎样的世界?
刘云浩:具身智能是人工智能发展的新阶段。随着具身智能逐渐深入人们的生产、生活,它带给我们的变化可以总结为三个层次,第一层次可以称为“科学显微镜”。具身智能会为世界打造一副新的“显微镜”,揭示我们可能忽视或者无法可视的对象和过程。第二个层次可以称为“灵感的源泉”。具身智能能够从海量环境数据中发现规律,找到其中隐藏很深的数据关联,为人类决策提供“灵感”。第三个层次可以称为“科学理解的工具”。机器能够协助人类获取新的科学理解,并清晰地解释这些理解。终极目标是在某些方向上协助人类突破当前认知局限。

《中国经济周刊》:当前大热的人形机器人产业处于怎样的发展阶段?中国有哪些优势?
刘云浩:具身智能和人形机器人不能简单地画等号。实现具身智能的路径大概会有多条,人形机器人的突破毫无疑问是其中一条,其他可能的路径还包括大模型加实体进行强化学习,以及通过万物智联实现智能涌现。可能还有其他路径,学术界正在探索。全球人形机器人产业过去10年聚焦原型验证(注:指将初步设计或设想制作成实物模型或样品,并测试功能和效果),如今已进入“小批量交付 + 场景试点”窗口。中国在该领域核心优势很多,例如完整的制造链、良好的成本控制、积极的政策拉动,以及手机、车企跨界带来的规模化能力等。亟待进一步提升的方面也有很多,比如高端减速器、微特电机、具身大模型、控制软件栈、统一的安全标准等。

书名:《具身智能:人工智能的下一个浪潮》
作者:刘云浩
出版社:中信出版集团
作者简介:
刘云浩
清华大学全球创新学院院长,清华大学自动化系教授、博导,曾任清华大学软件学院院长和美国密歇根州立大学计算机系主任。
本刊首席摄影记者 肖翊I摄
责编:杨琳 [email protected]
美编:孙珍兰