刘云浩:具身智能，AI融入物理世界的“下一步”

从早期只能进行简单计算的程序，到如今能够与人类流畅对话、战胜顶级棋手的智能系统，人工智能的每一次突破都震撼着世界。具身智能作为人工智能向物理世界的进一步延伸，正逐步展现变革性潜力，成为学界和产业界共同关注的焦点。

清华大学全球创新学院院长、自动化系教授兼博导刘云浩在其新书《具身智能：人工智能的下一个浪潮》中，以通俗易懂的方式解读人工智能的“前世今生”，并深入剖析具身智能的内涵、前沿创新、科技成果转化和超级场景。

近日，围绕具身智能相关话题，《中国经济周刊》记者独家专访了刘云浩教授，请他深入剖析人工智能的发展阶段、具身智能的关键意义，以及将如何重塑我们的世界。

《中国经济周刊》：当前的人工智能发展到了什么阶段？为什么越来越多的人开始担心人工智能的安全？

刘云浩：人工智能概念正式定义于1956年的达特茅斯会议。根据MIT教授Alex Pentland发表于美国CACM杂志的《Perceptual Intelligence》（感知智能），学术界通常把人工智能划分为三个阶段，第一个阶段是计算智能，即机器像人一样计算和处理海量数据。经过半个多世纪的发展，AI在算力和存储方面已经超越了人类。第二个阶段是感知智能，先是机器通过模仿人类的视觉、听觉、嗅觉、味觉等感知能力理解物理世界，进一步可能会超越人类的感知维度，当前人工智能正处于这个阶段。尚未到来的第三个阶段是认知智能，学术界正在进行从感知智能迈向认知智能的路径探索。

人们对人工智能的担心很正常。事实上，人类历史上每一次重大技术突破——无论是电力、火车、核能，还是今天的AI——都伴随着争议、担心乃至恐慌。例如1960年生产自动化给人们带来了巨大担忧，《科学》（Science）期刊发表了一篇文章，写道“机器可能脱离人类的控制，威胁人类生存”。

AI的这次飞跃和之前的技术爆发相比还有很多新特点。

首先，我们正亲历AI在迅速掌握那些人类曾引以为傲、视为与其他物种根本区别的核心能力。如历史上两次有名的“AI战胜人类”——1997年“深蓝”战胜国际象棋世界冠军卡斯帕罗夫；2016年，AlphaGo 击败围棋顶尖选手李世石——都曾引发全球性的震动。2022年 ChatGPT 走进大众视野，大模型在语言理解和生成方面展现出令人惊叹的能力。维特根斯坦曾说过：“语言的边界就是世界的边界。”因此越来越多的人开始相信，AI走进了我们的工作、生活与思维体系，替代我们的职业，人们难免产生本能的不安。

其次，与传统技术革新相比，AI的推广速度之快前所未有，其潜在影响之广也远超预期。而在其背后，关于AI的可靠性、安全性与伦理机制的研究却慢了一个节拍，引发了外界对AI可能失控、被滥用的深层次担忧。

这件事情要辩证解读，担忧，并不意味着恐惧；谨慎，也不等于退却。真正决定技术走向的不是技术本身，而是人类如何理解它、掌控它、引导它为人所用。

《中国经济周刊》：对人工智能来说，为何“身体”如此重要？

刘云浩：具身智能中“具身”是指凭借在物理世界中的实体感知能力，实现更高级别的人工智能。

早在1950年，人工智能之父——图灵在他的经典论文《计算机与智能》中就展望了人工智能可能的两条发展道路：一是专注于抽象计算所需的智能，我们称之为“离身智能”；二是为机器配置最佳的传感器，教机器说话，使其可以与人类交流并像婴儿一样“成长”，我们称之为“具身智能”。

过去几十年，“离身智能”一直是人工智能的主流，目前火热的大语言模型也属于这一范畴，尽管已经大获成功，但是人工智能被困于“莫拉维克悖论”——AI做计算甚至下棋是容易实现的，但是要让AI有如几岁小孩般的感知和行动能力，却相当困难，甚至是不可能的。其中的原因是人工智能还没有与物理世界直接交互的能力，只能与预设数据进行互动。因此，人工智能要继续向前发展，必须通过获得实体感知能力，在物理世界中学习和进化。

《中国经济周刊》：具身智能会带来一个怎样的世界？

刘云浩：具身智能是人工智能发展的新阶段。随着具身智能逐渐深入人们的生产、生活，它带给我们的变化可以总结为三个层次，第一层次可以称为“科学显微镜”。具身智能会为世界打造一副新的“显微镜”，揭示我们可能忽视或者无法可视的对象和过程。第二个层次可以称为“灵感的源泉”。具身智能能够从海量环境数据中发现规律，找到其中隐藏很深的数据关联，为人类决策提供“灵感”。第三个层次可以称为“科学理解的工具”。机器能够协助人类获取新的科学理解，并清晰地解释这些理解。终极目标是在某些方向上协助人类突破当前认知局限。

《中国经济周刊》：当前大热的人形机器人产业处于怎样的发展阶段？中国有哪些优势？

刘云浩：具身智能和人形机器人不能简单地画等号。实现具身智能的路径大概会有多条，人形机器人的突破毫无疑问是其中一条，其他可能的路径还包括大模型加实体进行强化学习，以及通过万物智联实现智能涌现。可能还有其他路径，学术界正在探索。全球人形机器人产业过去10年聚焦原型验证（注：指将初步设计或设想制作成实物模型或样品，并测试功能和效果），如今已进入“小批量交付 + 场景试点”窗口。中国在该领域核心优势很多，例如完整的制造链、良好的成本控制、积极的政策拉动，以及手机、车企跨界带来的规模化能力等。亟待进一步提升的方面也有很多，比如高端减速器、微特电机、具身大模型、控制软件栈、统一的安全标准等。

书名：《具身智能：人工智能的下一个浪潮》

作者：刘云浩

出版社：中信出版集团

作者简介：

刘云浩

清华大学全球创新学院院长，清华大学自动化系教授、博导，曾任清华大学软件学院院长和美国密歇根州立大学计算机系主任。

本刊首席摄影记者肖翊I摄

责编：杨琳 [email protected]

美编：孙珍兰