
2023年5月,在ITF World 2023半导体大会上,英伟达(NVIDIA)创始人兼首席执行官黄仁勋在演讲中预测下一个科技浪潮时,提到了一种新型人工智能——“”。
在2025年央视春晚的舞台上,十几个人形机器人身着秧歌服、手持红手帕登上舞台,与舞蹈演员们默契配合,上演了一场创意融合舞蹈《秧BOT》。它们动作精准流畅,机械臂灵活挥舞着手帕,步伐与鼓点完美契合,每一个舞步都充满科技感,赢得了全国观众的喝彩。这些人形机器人之所以能够完成如此复杂精彩的动作,正是得益于具身智能技术。
什么是“具身智能”?

什么是“具身智能”?一般认为,具身智能(Embodied Artificial Intelligence,简称“EAI”)是指通过机器人等物理实体与环境交互,能进行环境感知、信息认知、自主决策和采取行动,并能够从经验反馈中实现智能增长和行动自适应的智能系统。
“具身”是具身智能的必要前提,但“具身”一词并不只是“具有身体”,而是指身体会参与认知,并影响逻辑判断的过程。
北京工业大学教授、北京智同精密传动科技有限责任公司首席科学家张跃明在接受《中国报道》记者专访时举例说,现在的工业机器人具有身体,但它的身体行动完全是由事先编好的程序控制,一步一步去执行,只有简单的逻辑、判断能力,不能算是具身智能。
与“具身”相对的概念是“离身”,即认知与身体分离。ChatGPT就是典型的离身智能。离身智能没有可以感知世界并与之交互的身体,虽然通过采集的海量数据来标记世间万物,却无法理解这些文本、图片在物理交互中真实的意义。当需要处理复杂现实任务时,由于缺少对真实环境的感知和交互能力,传统人工智能就很容易发生误判。
2021年7月,国外一社交网站用户分享了一则视频:他驾驶某款电动车开到一条高速公路时,自动驾驶系统将天空中的满月错误地识别为交通信号灯的黄灯信号,并试图使原本在高速巡航行驶中的车辆保持减速。
而具身智能则打破了传统人工智能中“身体”与“大脑”分离的模式,弥补了传统人工智能对环境感知和交互能力的不足,使机器能够像自然生物体一样,通过其身体与环境的互动,实现多模态、多尺度的环境适应,从而在复杂环境中自主决策,完成任务。
张跃明认为,具身智能的发展方向是使其具有类似人类的主观判断能力和逻辑推理能力,不仅可以独立完成以往人类才能胜任的任务,还要能与人协作共同完成任务。要实现这种智能,不仅靠算法和计算,还需要大数据的支持和具有学习能力。
具身智能机器人在未知的环境中执行物理任务时,更多依赖“感知—行动回路”,即先主动感知环境、对环境建模,进而采取行动、进行验证,并根据结果不断调整和优化自身的行动,从而更高效地完成任务。这个过程很类似人类儿童的学习过程。古人讲“知行合一”,具身智能的“知”建立在“行”之上,在具身本体与环境的交互中实现可持续的智能进化。
被视作未来实现通用人工智能的关键路径

具身智能的概念可以上溯到英国科学家艾伦·图灵于1950年发表的论文《计算机器与智能》(Computing Machinery and Intelligence)。此时,距离世界上第一台通用计算机“ENIAC”在美国宾夕法尼亚大学诞生仅过去4年。当时的机器单纯依赖预设程序行事,并不具有智能,但图灵却在论文中就“机器能否思考”进行了大胆探讨。为此,他构想了著名的“图灵测试”,以验证一台机器是否具备能模拟人类的智能。
为了让机器能够通过“图灵测试”,图灵提出了“学习机器”的概念。他写道:“与其试图编程模拟成人大脑,不如模拟儿童大脑。”图灵提出,通过对“儿童机器”的教育,让机器最终获得“成人大脑”。
在论文结尾,图灵展望了两条可能的发展道路:一条是聚焦发展抽象计算(比如国际象棋)所需的智能;另一条是购买最先进的传感器,然后教机器听说,就像教正常的孩子一样。后来,前一条道路发展出了离身智能,而后一条道路被认为是具身智能的思想萌芽。
1956年,在美国举行的达特茅斯会议正式确立“人工智能”这一术语。在人工智能发展初期,研究主要聚焦于抽象的符号处理和逻辑推理,试图让计算机通过程序模拟人类的智能行为,但这种方式在处理实际物理世界的复杂问题时遭遇了困境。
随着对智能本质研究的深入,一些研究者逐渐意识到,在过去的数亿年里,地球上包括人类在内的所有动物都是通过身体体验逐步产生智能。因此,身体与环境的交互在智能发展中起到了关键作用,具身智能的理念由此逐渐形成。
20世纪80年代,著名机器人制造专家罗德尼·布鲁克斯提出了行为式机器人概念,强调智能是具身化和情境化的,主张应当以“行为”为核心发展人工智能,为具身智能概念奠定了理论基础。罗德尼·布鲁克斯还亲自设计了一个六足步行机器人,通过简单的行为模块组合实现了稳定的行走,展示了具身智能的可行性,引发了学界对具身智能的广泛关注。此后,有更多学者进一步阐明“具身性”对理解智能本质的意义,不断完善和发展相关理论。
进入21世纪后,机器人技术、传感器技术以及机器学习算法迎来快速发展,为具身智能带来新的发展机遇。
在机器人硬件方面,各种类型的机器人不断涌现,从用于工业生产的固定基座机器人,到适应复杂地形的四足和履带式机器人,再到模仿人类形态和行为的人形机器人,机器人的性能和功能得到了极大提升。同时,传感器技术的进步使得机器人能够更精确地感知周围环境,为其智能决策提供了丰富的数据支持。
在软件算法层面,机器学习尤其是深度神经网络(深度学习)的兴起,为具身智能的发展注入了强大动力。深度神经网络在图像识别、语音处理等领域取得的巨大成功,被广泛应用于具身智能系统中,提升了机器人的感知、学习和决策能力。例如,在视觉导航任务中,基于深度学习的算法能够让机器人更准确地识别环境特征,规划出合理的行动路径。
近年来,各种大模型的出现,进一步推动了具身智能的发展。多模态大模型能够融合多种感知信息,使机器人具备更强大的感知和理解能力;世界模型则帮助机器人更好地模拟和预测环境变化,从而作出更具前瞻性的决策。
目前,具身智能机器人已经能够根据动态变化的环境进行自适应决策,并向着能够完全自主执行任务的技术方向发展。具身智能也被视作未来实现通用人工智能的关键路径。
具身智能时代到来?

当前,全球主要经济体、企业和研究机构均高度重视具身智能发展,不断加大对相关技术领域的研究和对商业化应用前景的探索。
2024年4月,美国高校联合发布2024版《美国机器人路线图:机器人让明天更美好》,旨在重振美国在机器人技术上的领先地位。该路线图预测,机器人有可能在未来10年内变得无处不在,并可能在未来数十年内彻底改变全球经济、社会、政治、环境和技术格局。
2024年2月,日本丰田研究所公布了一款人形机器人Punyo。该机器人的定位是“帮助人们在家中和其他地方完成日常任务”。因为要进入复杂多变的家庭环境,因此配备了内置传感器的柔软肢体。
2025年2月,特斯拉首席执行官埃隆·马斯克透露,特斯拉将致力于在2025年生产10000部“擎天柱”人形机器人。未来其产量还将进一步提高。预计从2026年开始向第三方售卖。
有消息称,苹果公司也正在为其未来的智能家居生态系统探索人形和非人形机器人。目前这些产品处于早期概念验证阶段,最快可能在2028年或更晚一些实现量产。
中国已经走在具身智能机器人领域的研发和应用前沿。2025年春晚上人形机器人的舞蹈,不仅展示了中国在机器人领域的技术突破,也标志着具身智能进入应用创新的新阶段。这些机器人走红的同时,全国各地积极布局具身智能产业。
2025年1月,北京市发布《北京具身智能科技创新与产业培育行动计划(2025—2027年)(征求意见稿)》,计划培育一批具身智能领域独角兽企业、科技型领军企业、国家高新技术企业和专精特新“小巨人”企业。
北京、山东、重庆等十余个省市将具身智能/人形机器人写入2025年政府工作报告,并将其作为推动经济高质量发展和产业升级的重要抓手。
据市场监管总局数据显示,截至2024年12月底,全国共有45.17万家智能机器人产业企业,注册资本共计64445.57亿元,企业数量较2020年底增长206.73%,较2023年底增长19.39%,呈稳健上扬态势。
人形机器人:具身智能的最佳载体

位于北京经济技术开发区的国家地方共建具身智能机器人创新中心(以下简称“国创中心”),是中国国内最早聚焦于具身智能机器人核心技术、产品研发和应用落地的科技企业之一。
国创中心品牌公关负责人魏嘉星告诉《中国报道》记者,具身智能机器人涵盖多种类型,可以是人形机器人、固定基座机器人、轮式机器人,也可以是履带式机器人或者四足机器人。其中,人形机器人是具身智能的最佳载体。不同类型具身智能机器人可以对应不同的应用场景。比如固定基座机器人活动范围受限但操作精度高,适合用于实验室和工业制造;履带式机器人越野能力强,可适用于野外复杂地形作业;轮式机器人移动效率高,可以用于巡检。
国创中心2024年8月发布的具身智能机器人“天轶”,就是一款轮式机器人。“天轶”身高163cm,体重72.5kg,拥有轮式全向移动能力,腿部具备升降功能,可智能适配服务对象的身高和状态,配合完整双臂和胸口大屏,能够实现定位导航、平稳移动、自然对话和精细手臂操作,可应用于接待、导览、咨询问答、场馆介绍等多种场景。通过观察对象面部动作表情,“天轶”能够实现精确识别人类情感与情绪,进行更深层次的智能交互。
目前,国创中心还是将人形机器人作为具身智能的重点研发载体。魏嘉星告诉记者,一个原因是人形机器人能更好地适应人类现有的工作和居住场景;另一个原因是,人形机器人对人类而言更具亲和力。
2023年10月20日,工业和信息化部印发《人形机器人创新发展指导意见》,该意见对人形机器人的发展作出了全面的战略部署。如今,作为衡量国家科技创新和高端制造业水平的重要标志,人形机器人已经成为科技竞争的新高地、未来产业的新赛道。
2024年4月,国创中心发布了全国首个通用机器人母平台“天工1.0 LITE”,实现了全球首例纯电驱全尺寸人形机器人的拟人奔跑。同年8月,国创中心发布了“天工1.1 PRO”。“天工1.1 PRO”拥有完整的手臂功能,身高163cm,体重56kg,具有42个自由度,内置多个视觉感知传感器及六维力传感器,配备惯性测量单元(IMU)和3D视觉传感器,每秒可进行550万亿次计算,具有更强的智能交互和任务执行能力。
日前,具身智能机器人“天工”已在亦庄供电公司10千伏实训基地高基配电室展开实地操作。“天工”可在台阶、窄道等地形自如穿梭,手持温度检测设备,对高基配电室的多台电柜进行多点位测温,执行巡检任务。基于灵巧的上肢能力,“天工”还可操作复杂的245母联柜,严格按照电力操作规程操作旋钮、按钮,顺利完成合闸、分闸等倒闸操作任务。
魏嘉星表示,作为通用机器人母平台,“天工”将持续进行技术迭代和功能升级,以适应更多复杂场景,服务于工业、制造业、商业、家庭等多个领域,更好地助力新质生产力的发展。
撰文:《中国报道》记者 王焱
责编:张利娟
编审:赵珺