2026-03-13 18:33:00
今年全国两会上,人工智能依然是热议的焦点。与过往更多关注大语言模型、通用人工智能等数字世界的突破不同,如何让AI“走出屏幕”,在物理世界中完成复杂任务,正成为产业界和学界思考的下一个关键命题。
多位业内专家关注AI在物理世界落地这一愿景的核心技术——具身智能产业的快速高质量发展。他们普遍认为,具身智能基础模型,即机器人“大脑”是产业突破的关键战场,需要多方联合营造良好生态,鼓励企业自主创新。
当前,具身智能已从技术研发阶段正式迈入国家战略层面的产业化培育期,成为新质生产力的关键组成部分。但截至目前,许多具身智能机器人虽能按照预先编好的程序完成精彩表演,却未能大规模进入严肃的生产力场景。
对此,中国企业财务管理协会会长张连起在走访调研了大量科技企业后了解到问题所在。他认为,我国人形机器人之所以迟迟无法批量进入工厂和家庭,缺的不是“身体”,而是能思考、会学习的“大脑”。当前我国在具身智能应用场景、数据、硬件等多个维度已形成全球领先优势,但模型能力发展有所滞后,影响了行业高质量发展。
“‘大脑’是具身智能产业突破的关键战场。”张连起表示,当前产业界和公众对具身智能存在一些认知误区,体现出“重硬件轻软件、重集成轻研发”的倾向。例如,简单地将“大语言模型”加上“动作模块”就等同于具身智能。
针对如何突破具身智能技术瓶颈,海尔集团董事局主席周云杰表示,我国具身智能正处于技术爆发与产业导入交叉期,呼吁设立国家重点研发专项,集中攻关核心算法,支持关键硬件研发与产业化,从源头提升产业竞争力。
尽管我国具身智能基础模型相对于硬件发展有所滞后,但也涌现出一批优秀企业。张连起在调研了自变量机器人等聚焦“大脑”研发的代表性企业后表示,近几年,国内一批聚焦这一领域的公司陆续成立并取得了飞速发展。这类企业之所以值得关注,在于其成立之初就聚焦具身基础模型自主研发,并坚持以极具前瞻性的端到端统一架构来高效训练迭代。
据了解,自变量是国内最早聚焦端到端通用具身基础模型研发的企业之一。在技术路线上,自变量选择了更具挑战但也更贴近物理世界本质的端到端统一架构进行正向研发。其自研的WALL-A模型,核心架构首创了视觉-语言-动作模型(VLA)与世界模型深度融合的系统范式。该模型采用原生多模态输入输出设计,率先实现“具身多模态思维链”,这一技术融合显著提升了机器人应对未知情境的强大泛化能力,通过自主学习在物理世界中持续进化。
模型持续进化,正是驱动具身智能广泛进入真实场景落地应用的关键。科技部原副部长李萌指出,具身智能作为与物理实体融合的人工智能,具备在与物理世界的互动中自主学习、持续学习的能力,正在成为改变人类生产生活方式、推动社会智能跃升的重要引擎。
数据是训练强大“大脑”的关键“养料”。中国信息通信研究院副院长魏亮强调,应充分发挥具备具身智能基础模型自研能力的行业领军企业的引领作用,由其牵头推进数据工厂数据集标准的研制与落地工作。唯有确立统一、规范的标准,才能从根本上优化行业数据采集模式,实现采集成本的系统性下降与综合运营效率的全面提升。
作为具身智能从业者,自变量创始人兼CEO王潜介绍,自变量机器人是国内最早规模化扩展真机数据采集的公司,坚持硬件-数据-模型的闭环迭代,通过基础模型给数据处理和硬件设计等各个环节提供反馈,迭代更高质量的数据和更高效率的数采设备,进一步提升基础模型的效果。
具身智能作为典型的前沿科技,其研发具有周期长、投入大、不确定性高的特点。多位专家指出,推动这一前沿产业发展,不能仅靠企业单点突破,更需构建一个能匹配其长周期特征的、包容而稳健的创新生态系统。