随着人工智能技术的飞速发展,具身智能机器人产业迎来重大发展机遇。2025年的《政府工作报告》,首次将“具身智能”纳入国家战略,标志着这一领域正式迈入政策红利期。
具身智能正在一步步的把算法从“数字世界的思考者”进化为“物理世界的行动者”。技术层面,具身智能机器人正处于从实验室走向市场的关键拐点。商业化应用方面,具身智能机器人已在工业、医疗、服务等领域逐步落地,展现出巨大的应用潜力。生态建设也在加速推进,产业链上下游企业通过合作与创新,共同构建多元互补的产业生态。然而,具身智能产业的发展也并非就是一条坦途。尽管中国机器人产业链完备、应用规模庞大,但在大规模量产和商业落地方面仍面临诸多挑战。
3月13日,在盖世汽车主办的第三届具身智能机器人产业发展论坛上,盖世汽车CEO周晓莺,浙江人形机器人创新中心首席科学家、浙江大学求是特聘教授熊蓉,智元具身研究中心常务主任任广辉,银河通用机器人合伙人史雪松,千寻智能董事、数据中心总经理孙荣毅,自变量机器人联合创始人兼CTO王昊,吉利汽车AI研究负责人冯朝明,蓝驰创投合伙人曹巍等行业专家,围绕具身智能行业的一系列话题,展开热点讨论,共同为行业的发展出谋划策。
技术路线的生死局
在具身智能机器人的发展历程中,技术路线的选择是关键问题,端到端大模型与模块化技术栈成为了两大主流发展方向。
端到端大模型是指通过大规模数据训练,能够直接从传感器数据中生成控制指令,将感知、决策和执行融合在一个模型中,避免了中间环节的延迟和误差累积,可以显著提升系统的效率和性能。
模块化技术栈则是将具身智能机器人的功能拆分为多个独立模块,每个模块负责单独的子任务,例如自动驾驶系统的一级模块可分为感知、规划和控制,每个一级模块下又分为众多子模块,每个模块可基于不同的规则或算法。由于每个独立模块负责单独的子任务,因此出现问题时可及时回溯,并易于调试,具有较强的解释性。以传统的工业机器人控制系统为例,其运动控制、视觉识别、力感知等模块都是相对独立的,通过标准化的接口进行数据交互和协同工作。这种架构在工业生产中得到了广泛应用,因为它稳定性高,易于维护和升级,技术人员可以根据具体需求选择和替换不同的模块。
在实际应用中,端到端大模型虽然在决策效率和泛化能力上具有优势,能够快速处理复杂任务,但模型的可解释性较差,当系统出现错误时,难以判断问题出在哪里。而模块化技术栈的可解释性强,但模块之间的协调和优化较为复杂,整体效率可能受到一定影响。
在智能机器人领域,技术路径的选择可以说是直接决定着企业的生死存亡。在讨论环节,多位行业专家也围绕两大技术路线,进行了激烈的观点碰撞。
自变量机器人CTO王昊旗帜鲜明地支持端到端大模型。他认为,传统模块化技术依赖预编程和固定轨迹,难以应对物理世界的复杂操作(如摩擦、软硬接触等随机性问题)。而端到端模型通过模仿人类“感知-决策-行动”的闭环学习方式,能处理非结构化场景,减少对预先建模的依赖。“当系统复杂度超越人类经验时,唯有依靠算力和数据驱动的端到端模型才能突破瓶颈。”
银河通用机器人合伙人史雪松则从商业化落地视角,指出端到端模型的限制:数据需求呈指数级增长。史雪松给出一个例子,如要说通过模块化技术训练感知模型需要一万条数据能够有效覆盖所有感知corner cases,训练规控模型也需要一万条数据覆盖规控相关corner cases,那么两万条有效的数据就能把两个模型训练好,但如果要训练的是一个端到端模型的话,上下游corner cases相耦合,可能需要一亿条数据才能达到同等可靠性。史雪松指出:“端到端肯定好,但要非常注重数据生产,否则盲目追求端到端可能适得其反。”
平衡点何在?浙江大学熊蓉教授提出“分阶段融合”思路:早期通过模块化技术积累数据与经验,逐步向端到端过渡。这一观点得到多数嘉宾认同——技术路线的选择需结合场景需求与数据储备,而非非此即彼。从发展趋势来看,两条技术路线并非完全对立,而是可能相互融合。一些企业目前就在尝试结合端到端大模型的决策优势和模块化技术栈的稳定性,开发出更具竞争力的具身智能机器人解决方案,以适应不同场景和应用需求。
数据飞轮陷阱:谁为千万级训练数据买单?
在智能机器人的发展中,数据起着至关重要的作用,正是大量的数据如同飞轮般,推动着具身智能机器人技术的进步与应用拓展。
数据飞轮是一种利用数据本身的力量,通过持续的反馈循环,促进数据增长和质量提升的机制。在这个循环中,机器人收集的数据越多,模型就能训练得越精准,从而提供更优质的服务或完成更复杂的任务,吸引更多用户使用,进而产生更多数据,形成良性循环。
以物流机器人为例,通过对仓库布局、货物位置、运输路径等大量数据的学习,机器人能够优化行走路线,提高搬运效率,降低运营成本。在服务机器人领域,对用户习惯、需求等数据的分析,可以让机器人提供更个性化的服务,增强用户体验。
数据是具身智能机器人的“燃料”,但获取高质量数据的成本与伦理问题成为行业共同痛点。
首先获取高质量的训练数据并非易事,且成本高昂。首先,数据的采集需要大量的人力、物力和时间。例如要训练一个能够准确识别各种物体的机器人视觉模型,需要收集包含不同角度、光照条件、背景环境下的海量物体图像数据。这些数据可能需要在真实场景中进行长时间的拍摄和记录,涉及到多个地区、多种场景的覆盖。此外,数据的标注也需要专业的人员和工具。标注人员需要对采集到的数据进行精确的分类和标记,如在图像数据中标注出物体的类别、位置等信息,这个过程不仅繁琐,而且对标注人员的专业知识和技能要求较高,人工成本不菲。
那么,谁来为这些千万级训练数据买单呢?目前来看,主要有机器人研发企业、投资机构和部分有需求的行业客户。机器人研发企业为了提升产品竞争力,往往会投入大量资金用于数据收集和训练,但这对企业的资金实力和技术能力要求极高,可能会给企业带来沉重的财务负担。投资机构看中机器人行业的发展潜力,会对一些有前景的企业进行投资,间接为数据训练提供资金支持。而一些行业客户,如大型制造业企业,为了实现生产自动化,可能会与机器人企业合作,共同承担数据训练成本,以获得符合自身需求的定制化机器人解决方案。
为了解决数据成本问题,一些创新的方法正在被探索。数据来源多元化是当前主流解决方案。千寻智能董事、数据中心总经理孙荣毅提到,企业通过合成仿真、真机遥操、人体动作捕捉等多渠道获取数据,但各家的“数据孤岛”现象严重。当然,这也是整个行业的发展由乱到序的一个必经的过程,未来,如何从产业链上打通数据的链路,在不同企业、研究机构之间建立数据共享平台,让行业间的数据在网上形成互动,实现数据共享与合作,是需要整个行业共同思考的问题。孙荣毅直言:“未来行业需建立统一的数据共享标准,国家可通过公共服务平台整合资源,打破数据垄断。”
成本绞杀战
此外,成本控制对于具身智能机器人的大规模商业化应用同样至关重要,直接关系到产品的市场竞争力和普及程度。
以服务机器人为例,过高的成本肯定会让众多消费者望而却步,限制其在家庭、办公等场景的广泛应用。而在工业机器人领域,成本也是制约企业大规模采购和自动化升级的关键因素。
目前智能机器人成本居高不下有多方面原因。从硬件角度看,核心零部件如高性能处理器、传感器、精密减速器等技术含量高,研发和生产成本高昂。在一些高端机器人中,采用的先进传感器能够实现高精度的环境感知,但价格往往十分昂贵。从软件层面来说,算法研发、测试和优化都需要大量的人力和时间投入,而且随着机器人功能的不断拓展,软件的复杂性也在增加,将进一步推高成本。此外,生产规模较小也是导致成本降不下来的重要因素,由于尚未形成大规模量产,无法充分发挥规模经济效应,单品分摊的固定成本还比较高。
在沟通中,多位嘉宾一致认为,“降本”是智能机器人普及的关键,而要在2026年实现将具身智能机器人BOM成本压缩到10万以下,是可实现的。
当然,前提是实现多维度发力,比如简化硬件,优化算法,实现产业链协同等。
技术创新是降低成本的核心驱动力。通过研发新型材料、优化零部件设计,可降低硬件成本。在传感器方面,研发更先进的传感器制造工艺,提高集成度,降低单个传感器成本。一些企业在探索使用新型复合材料来制造机器人的外壳和结构部件,既能保证强度和耐用性,又能减轻重量,降低材料成本。此外,提高生产效率也是关键。引入自动化生产线和智能制造技术,减少人工干预,提高生产精度和效率,降低生产过程中的废品率和返工率,从而降低成本。一些机器人制造企业还采用了数字化双胞胎技术,在虚拟环境中对生产流程进行模拟和优化,提前发现问题并改进,缩短生产周期,提高生产效率。
供应链优化同样不可忽视。事实上,从从产业链角度看,中国是享受了产业链的红利,尤其是具身智能机器人行业,在一定程度上来说,和车企的自动驾驶产业链是高度融合的,能给具身智能的发展带来很大的助推。
“不管是在家庭服务场景,还是在工业场景,具身智能机器人产业可能还有2-3年的窗口期,现在是比谁能够先把产品比较好做出来,然后有上牌桌的机会”,曹巍从投资视角指出:“初期企业可能以负毛利抢占市场,但长期需平衡技术与成本,参考发展路径,最终胜出者需兼具产品力与成本控制能力。”
生态霸权的争夺,谁将制定规则?
在智能机器人的发展浪潮中,车企、科技巨头和机器人公司都在积极布局,试图在这个新兴领域占据主导地位,争夺生态霸权,制定行业规则。
车企凭借在汽车制造领域的深厚积累,在机器人赛道上有着独特的优势。随着汽车智能化的发展,自动驾驶技术中的环境感知、路径规划、决策控制等核心模块与人形机器人的运动控制、环境交互、智能决策系统高度同源。在汽车领域,电池管理系统、电机控制技术等也可迁移至机器人研发。
同时,车企拥有成熟的供应链体系和大规模生产制造能力,能够有效降低成本,实现机器人的规模化生产。目前,不少国内外车企,如特斯拉、广汽等,都在积极的打造自己的具身智能产业版图。
科技巨头在人工智能、大数据、云计算等底层技术方面拥有强大的实力,可以为机器人的智能化发展提供了有力支撑。谷歌、微软等科技巨头在人工智能算法、大模型研发等方面处于领先地位,能够赋予机器人更强大的智能和学习能力。英伟达凭在高性能芯片领域的优势,也是具身智能机器人所需要的核心支撑。在2025的消费电子展(CES)上,英伟达就一次性的展示了由14款人形机器人组成的“机器人军团”,展示了其在机器人领域的技术实力和布局。
此外,科技巨头还拥有广泛的用户基础和强大的品牌影响力,能够快速推广机器人产品,构建庞大的生态系统。
再来看看专业的智能机器人公司,他们更加专注于智能机器人技术的研发和创新,在机器人本体设计、运动控制、人机交互等方面拥有更多的经验和技术积累。
三方各有各的优势,在未来争夺具身智能产业生态霸权的过程中,当然也会面临各自的挑战。车企在机器人领域的技术积累相对薄弱,科技公司在硬件设计和制
造方面缺乏经验,专业机器人公司则面临着资金压力大等问题。
未来的具身智能生态霸权争夺中,三个“方面军”势必要形成在竞争中互相合作的关系。比如说,英伟达与多家机器人公司已经有合作,CES上展出的机器人军团,就来自多个品牌。
曹巍:“中国凭借产业集群优势,未来5-10年将主导全球智能机器人市场。但最终牌桌上的玩家不会超过10家,大部分初创公司或被并购、淘汰。”熊蓉则提醒初创企业:“单点技术优势不足为凭,需构建全链路能力,同时警惕大厂‘低价卷杀’。”
未来,具身智能机器人的生态规则制定可能并非由某一方单独主导,而是三方相互合作、相互竞争的结果。随着技术的不断发展和市场的逐渐成熟,三方可能会在各自擅长的领域发挥优势,共同构建一个开放、共享、协同发展的具身智能机器人生态系统。
小结:具身智能机器人的“黄金三年”,是技术、成本、数据与生态的全面竞速。端到端与模块化之争背后,是对行业底层逻辑的重新定义,数据飞轮能否转动,取决于商业模式的创新与伦理规范的建立;成本绞杀战中,产业链协同与算法优化缺一不可;而生态霸权的归属,则将由技术深度、资源整合与市场洞察共同决定。
正如主持人所言:“这是最坏的时代,也是最好的时代——中国智能机器人产业正站在爆发前夜,谁能抓住黄金三年的窗口,谁就能定义下一个十年的规则。”
抓住机遇,迎接挑战,大家可以共同描绘具身智能机器人的美好未来。
推荐阅读:
「重磅」芯驿电子战略投资上海映赛科技,重仓车载电子后视镜CMS市场赛道
专题推荐: