贺晗委员:破除数据与场景瓶颈,加快具身智能高质量发展

  • 来源:中国发展改革报社
  • 2026-03-04 18:26:49
  • 分享:

具身智能正成为继大模型之后的新一轮产业“主赛道”:它把算法能力从屏幕世界带入物理世界,面向制造、物流、安防巡检、应急救援、养老照护等场景,形成“会感知、能决策、可动手”的新质生产力。国家层面已明确战略节奏:工信部《人形机器人创新发展指导意见》提出到2025年实现整机产品批量生产并示范应用、到2027年实现规模化发展并成为重要增长引擎。

进入2025年以来,我国人形机器人产业热度高、企业多、产品迭代快,开始从“能动起来、能表演”转向“能上岗、能干活”。2026年2月,我国发布首个覆盖人形机器人与具身智能全产业链、全生命周期的国家标准体系,并明确标准体系由基础共性、类脑与智算、肢体与部组件、整机与系统、应用、安全与伦理六大板块构成,为产业从“野蛮生长”迈向“规范发展”奠定制度底座。

对此,十四届全国政协委员、天娱数科董事长贺晗建议,以“数据—模型—部件—整机—场景—标准”一体化思路,尽快补齐短板,把“热闹的展厅”变成“可复制的工位”,把“单点突破”变成“系统胜利”。

贺晗总结了当下具身智能存在的不足:

1、数据荒仍是具身智能最大瓶颈:数据碎片化、不可共享、不可复用。

与通用大模型可借助海量互联网数据不同,具身智能需要大量“任务级、过程级”的交互数据(抓取、装配、搬运、开门、叠衣等),数据获取成本高、标注难。国内各研究机构和企业的数据采集平台、传感器接口、数据格式各自为战,形成了大量“数据孤岛”,缺乏具有行业共识的高质量、大规模具身智能开源数据集。

2、“大脑”泛化能力不足:能做演示,不一定能上岗;能在A工厂跑通,不一定能迁移到B工厂。

具身智能的核心在于通用泛化。目前我国多数企业仍采用针对特定任务的定制化算法,缺乏真正意义上具备强泛化能力的具身智能基础大模型。因此,当前不少人形机器人在受控环境下表现亮眼,但面对真实世界的光照变化、物体多样性、工位差异、干扰碰撞等,仍易出现策略失效与长任务中断。

3、场景牵引不强:试点多、规模少;“示范应用”难自然长成“持续采购”。

制造、物流、商服、养老等领域的真实需求巨大,但落地常见“场景碎片化、验收口径不一、预算与迭代机制不足”,导致企业在“项目制交付”与“产品化复用”之间反复摇摆。即便政府采购与补贴有所增长,整体仍处于导入期,缺少可复制的“规模化上岗模板”。

4、同质化与泡沫风险上升:企业数量多、产品雷同、重复建设,容易“拼补贴不拼能力”。

标准体系已发布,但产业仍面临“多赛道拥挤、差异化不足”的结构性风险。目前行业软硬解耦程度仍然较低,尚未形成类似PC时代的“Wintel”或智能手机时代的“安卓+ARM”生态。由于缺乏通用的操作系统和中间件,开发者往往需要针对不同硬件底层“重复造轮子”,推高了全行业的研发成本。若缺少统一标准、公共数据底座与场景验证平台,可能出现低水平重复与无序价格战,影响长期创新投入与国际竞争力。

对此,贺晗建议:

1、以国家级“具身数据要素工程”破题:建公共数据底座、统一格式与权属规则。

建设若干“国家级具身智能数据采集与预训练中心”,面向典型任务(搬运/装配/分拣/巡检/护理)形成可复用数据集。统一数据标准:动作轨迹、力觉/触觉、视觉语义、工位工艺参数等数据格式与元数据规范,推动跨企业、跨平台复用。明确数据权属与合规边界:对涉及个人隐私、工厂商业秘密的数据建立分级脱敏、可信计算与授权机制,形成“可用不可见、可控可计量”的共享模式。

2、大力发展具身基础大模型。

支持头部AI企业与顶尖高校联合研发多模态具身通用大模型。重点突破端到端控制算法和 Sim-to-Real 迁移技术,提升机器人的常识推理能力和未见环境下的泛化操作能力。

3、以“场景牵引+政府采购/首台套保险+央国企带头应用”拉动规模化上岗。

建立国家级“人形机器人上岗清单”:优先选择收益可量化、环境相对结构化的场景(3C装配、仓储搬运、质检巡检、危化/电力巡检等)先形成规模。推行“首台套/首批次”风险分担:用保险、性能担保、分阶段验收与租赁(RaaS)降低企业采购门槛。用央国企做“锚定客户”:以“AI+制造”为抓手,形成真实工位数据回流与持续迭代机制,带动中小企业进入配套生态。

4、做强软件栈与开源生态,用开放接口降低重复研发、提高产业协同效率。

推动控制中间件、仿真平台、数据工具链、评测基准开源(或开放标准),形成类似“通用底座+行业插件”的生态。政府采购与示范项目设置“开放接口与可迁移性”要求,避免锁死在单一厂商。鼓励“模型—控制—硬件”解耦,提高跨平台复用,降低中小企业进入门槛。