人形机器人产业的发展需要人工智能、高端制造、新材料等先进技术的协同创新和共同突破。根据工业和信息化部印发的《人形机器人创新发展指导意见》,到 2025 年,人形机器人创新体系初步建立,大脑、小脑、本体等一批关键技术取得突破,确保核心部组件安全有效供给。其中,“大脑”“小脑”与“本体”实际上是对通用机器人整体功能架构的一种类比式理解,主要功能如下:
“大脑”负责感知外界并模拟人类思维决策过程,主要职能是环境理解、智能交互与认知推理,基础是机器视觉、大语言模型等组成的多模态大模型的发展,通常指使机器人实现理解交互、自主决策、任务规划等能力的认知智能或具身大模型。
“小脑”模仿生物进行复杂的运动控制,主要职能是运动控制、路径规划和步态平衡,通常指使机器人实现高稳定性、高复杂度、高动态响应运动控制能力的本体智能或具身本体智能模型。
“本体”包含机器人的物理结构和执行器,根据小脑层的运动规划来进行精确的伺服闭环控制每个电机高效精准地执行,完成既定运动任务。
其中,以具身大模型为代表的“大脑”技术是机器人实现理解交互、自主决策、任务规划,规模化进入工业生产、社会服务、家庭生活等应用场景的认知能力基础,以具身本体智能模型为代表的“小脑”技术则是机器人能够高稳定性、高灵活性地完成各项复杂任务的运动能力前提。
1)人形机器人“大脑”现阶段技术水平及未来发展方向
人形机器人的“大脑”是其实现智能决策与环境交互的核心中枢,其技术发展正经历着从专用、封闭的预编程系统,向通用、开放的具身大模型的根本性转变。这一演进主要建立在多模态大模型技术的突破性进展之上。现阶段,先进的研究体系致力于构建能够深度融合并理解视觉、语言、声学乃至触觉等多源异构信息的认知架构。此类架构使机器人能够对非结构化环境进行语义层面的解构与建模,进而完成包含复杂约束与隐含前提的自然语言指令。
在系统架构层面,为兼顾高层认知的通用性与底层控制的实时性、可靠性,“大脑-小脑”分层协同的框架已成为主流技术路线之一。在此框架下,高层“大脑”承担符号化推理、任务规划与场景理解等宏观认知功能,其输出为抽象的动作意图与目标状态;底层“小脑”专精于将这些抽象意图转化为具体的关节空间轨迹、力矩控制指令,并处理动力学约束与平衡维持等底层问题。
此外,端到端的视觉-语言-行动(Vision-Language-Action, VLA)模型作为一种新兴技术路线,正受到广泛关注。该模型旨在绕过传统的显式状态估计与符号规划环节,尝试建立从高维感知输入到低层控制指令的直接映射,在处理未知任务时展现出良好的泛化能力,具备较好发展前景。
再者,随着视频生成、时空建模、多模态融合等技术的突破,“世界模型”已成为具身智能领域最具前景的又一技术路线,其核心意义在于赋予智体“内在的世界理解与模拟能力”,能够在与环境交互过程对应的高维、多模态的感知数据中提取物理规律、因果结构与环境动态,从而形成可用于推理与规划的内部表征,进而提升决策性能。因此,衍生出“世界模型”的两大核心功能。
一是仿真引擎,使机器人无需完全依赖真实试错即可在内部进行未来情景预测与任务演练,提供合成数据,大幅降低数据采集成本并提升策略迭代速度。
二是策略增强,构建“世界模型+动作策略”(World-Model–Action, WMA)的架构范式,使智能体在与环境的交互作业中,不仅理解“现在发生什么”,更关键是预测“接下来会发生什么”,从而支持决策模型生成更安全、更高效、更具普适性的动作策略。该项 WMA 模型技术的逐步成熟有望引领具身智能技术能力的根本跃迁。
除 VLA 模型与 WMA 模型之外,双系统架构同样是当前具身智能领域的重要技术路线之一。该架构模仿人类“快慢思考”认知模式,以多模态大模型作为慢系统提供跨场景的泛化感知与规划能力,以 VLA/动作专家策略作为快系统保障动作实时性与可靠性,同时兼具决策过程可解释、可干预及各子系统独立迭代升级等优势。当前快慢系统间的高效协同虽仍存在一定技术瓶颈,但双系统架构以其明确的功能划分与突出的扩展能力,依然被视为具身智能领域极具前景的技术路径之一。
目前,全球范围内具身大模型正处于技术快速发展的探索阶段,行业内尚未形成统一、成熟的技术共识及竞争格局。VLA 模型、WMA 模型和双系统等多种技术路线并行发展,共同探索具身智能的未来,这种局面也为行业内企业提供了更为广阔的创新空间与差异化竞争机遇。
2)人形机器人“小脑”现阶段技术水平及未来发展方向
人形机器人的“小脑”是其运动控制的中枢,负责将高层“大脑”抽象的运动意图转化为精确、稳定、柔顺的躯体运动,并解决高维、非线性、欠驱动动力学系统下的实时控制与动态平衡问题。当前技术水平已显著超越了早期依赖于精确解析模型与预编程动作库的传统控制技术路线,进入了一个以数据驱动与优化理论相结合为特征的混合智能控制新阶段。
在全身运动控制层面,当前研究主要集中于强化学习控制方向。强化学习是机器学习的重要分支,机器人通过与环境不断交互,根据获得的奖励或惩罚试错学习,最终找到最优策略以达成长期目标。在操作执行控制层面,技术路径正从依赖专家知识的繁琐手动编程,转向基于大规模演示数据集、扩散模型、深度学习、强化学习等相关技术的自主操作范式。
通过在高度拟真的物理仿真环境中部署并行训练集群,利用深度强化学习等算法探索庞大的策略空间,机器人能够自主发现并掌握适应对象形态不确定性、环境参数变化以及任务目标多样性的操作策略。随后,通过系统辨识与域随机化的仿真到现实技术,将这些策略有效地迁移至物理实体。
3)人形机器人本体现阶段技术水平及未来发展方向
人形机器人本体是其智能认知与运动控制能力得以实现的物理载体与执行终端,其机械结构、驱动系统、传感配置与材料选择的综合性能,从根本上设定了机器人整体能力的上限。当前,本体技术的发展态势呈现出高性能追求与产业化可行性之间相互博弈与融合的鲜明特征。
在核心驱动与传动部件层面,关节模组作为机器人的运动核心,其技术集成的复杂度日益提升。先进的关节模组采用高度集成的机电一体化设计,通常融合了高功率密度的无框力矩电机、低背隙高刚度的减速器、高分辨率的编码器以及关节力或力矩传感器,从而实现了高带宽的力位混合控制与碰撞检测能力。在终端执行器方面,灵巧手已从功能简单的二指夹爪,演进为具有多个主动自由度、集成分布式触觉传感皮肤的拟人化设计,使其能够执行对力度和姿态有精细要求的任务,如稳定持握易碎物品或操作专用工具。
在整体构型与运动模态上,目前存在着以“仿人双足”为主、“轮足混合”为辅的多重技术路线。其中,双足仿人构型在理论上拥有对人类环境既存基础设施的最佳形态适应性,其通过动态平衡控制、能量效率、机械复杂度以及制造成本方面的技术平衡与整体提升,具备较高的商业化能力。“上肢人形、下肢轮式”的混合构型,在平坦或轻度崎岖地面上具有更高移动效率、更长续航时间、更佳静态稳定性以及更低的商业化成本,使其在物流、导览、接待等特定应用场景中具备了优先落地的可行性。
展望未来,人形机器人本体技术的演进将围绕以下几个方向展开。首先,是产业链的标准化与全生命周期成本的优化控制。目前,原型机的研发制造成本较高,推动核心部件(如关节模组、传感单元、控制接口)的标准化、模块化与性能分级,是实现大规模批量生产、降低边际成本、促进健康产业生态的关键前提。其次,是新材料与先进制造工艺的深度赋能。
为实现“轻量化”“高强度”“高刚度”的平衡,未来将广泛探索并应用高性能碳纤维复合材料、钛铝合金以及通过增材制造技术实现的轻质点阵结构与拓扑优化构件,以期在保证结构完整性的前提下,极致地降低运动部件的转动惯量与整体能耗。最后,是双足仿人构型方案的仿生优化,包括模拟生物肌腱的响应特性,设计失稳时的被动安全结构,集成高密度、多模态(视觉、触觉、力觉、惯性、听觉)的躯体传感网络,构建冗余可靠、实时感知的本体感知系统。
(2)商业化应用处于探索阶段,未来市场应用前景广阔
人形机器人厂商在产品研发和市场布局上瞄准了多个下游应用场景。从国内外主流厂商的应用规划来看,中短期内,人形机器人将主要集中应用于科学研究、应用开发、教育教学、文化表演、智能服务等领域;中长期内,人形机器人的目标将是走进工厂车间、千家万户,为工业、家庭及社会场景提供相关服务。应用场景的落地顺序将由应用场景的结构化程度和执行任务的复杂程度共同决定。
随着人形机器人不断演进,未来人形机器人将作为新质生产力在多种场景中替代低效、重复、高危的人工作业环节。人形机器人配合机械臂、灵巧手等优先胜任搬运、质检、衔接、基础组装等工业领域的简单工序,表演、教育、健康监测等服务领域工作,随着所处阶段不断进步将逐步胜任高危作业、柔性制造、复杂家务等高阶工作。不同领域的应用情况如下:
1)行业应用领域。人形机器人的应用正处于探索起步阶段,主要在一些对自动化、智能化有需求的企业中试点应用。相较工业机器人和移动机器人,人形机器人在某些特定场景下具有更好的适应性和灵活性,其大规模应用仍受到成本、技术和市场接受度等因素的限制。一方面,人形机器人需要具备高精度、高速度、高稳定性的运动控制能力,以满足工业制造领域各种生产任务的需求,还需要与其他设备和系统进行协同作业以提高整体生产效率;另一方面,人形机器人的研发和生产成本相对较高,尤其是在传感器、执行器和控制系统等关键部件方面,导致了人形机器人的市场价格相对偏高。
上述瓶颈的突破,人形机器人将有望率先在智能巡逻、危险作业、灾害救援等复杂、危险、恶劣环境下替代人类进行工作,提高工作效率和安全性;同时,随着泛化能力和智能性的不断提高,人形机器人将在汽车制造、3C 电子制造、智慧物流等多个工业化场景得到广泛使用。
2)消费服务领域。随着人工智能、机器学习和传感器技术的快速发展,以及人们对便捷生活需求的不断提高,人形机器人将在服务、娱乐、医疗、养老等领域发挥重要作用。在家庭服务与陪伴场景下,人形机器人作为陪伴型机器人能
提供家政、教育、娱乐等多种服务;在医疗保健与康复场景下,人形机器人通过辅助医护人员进行日常工作,可降低其工作强度与工作负担,并提供个性化的医疗陪护与康复支持;在教育与科研场景下,人形机器人可作为教学助手进入课堂,通过生动有趣的方式传授知识,激发学生的学习兴趣。同时,由于面临技术成熟度、产品性能、成本效益、用户接受度、隐私保护等一系列技术与伦理问题,人形机器人在服务领域的商业化应用正处于初期阶段。随着上述问题的优化解决及市场需求的持续增长,预计未来人形机器人将在上述各个领域不断渗透,并深刻改变人们的生活方式和社会服务体系。
(3)场景应用逐步扩大,技术创新激活广阔市场空间
目前,全球人形机器人行业正处于技术探索的早期阶段,尚未实现人形机器人的大规模应用。2024 年起宇树科技、特斯拉、Agility Robotics 等国内外厂商均推出有望实现商业化落地的人形机器人,从各企业规划的落地场景来看,工业制造及仓储物流领域将率先实现应用。随着技术的不断进步、成本的降低以及应用场景的拓展,预计未来几年内人形机器人在工业制造、消费服务、公共服务等多个下游领域的渗透率将逐步提升。
据高工机器人(GGII)预测,到 2030 年全球人形机器人市场规模预计将达到 150 亿美元,销量规模将增长至 60.57 万台。其中,中国人形机器人市场规模到 2030 年将达到近 380 亿元,销量规模将增长至 27.12 万台。现阶段来看,中国人形机器人产业的发展依托于行业政策引导与制度保障,以及坚实的产业链基础、广阔的内需市场、强大的研发实力,为人形机器人在中国市场的大规模技术创新与商业化应用创造了有利条件。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。