2026年,已然成为“具身智能数据规模化元年”。 来源:猎云精选,文/王非 又一门“卖铲子”的生意,开始赚钱了。 2023年开始火热的“百模大战”,让“卖铲子”的算力硬件商赚得盆满钵满。类似的情况,正在具身智能产业“情景再现”,数据采集从业者正在密集融资且收获大量订单: 3月,光轮智能完成10亿元融资,成为全球第一个具身数据独角兽,并透露今年第一季度拿下5.5亿元订单;4月,无问智科完成超亿元融资,并透露今年第一季度签下的订单金额达到数亿元量级;4月,弈人科技完成Pre-A+轮及Pre-A++轮连续两轮亿元级融资,同时宣布2025年收入破亿并盈利,2026年Q1具身订单超去年全年营收;智元也已分拆成立觅蜂科技…… 不只是新创公司,互联网大厂也盯上了这块肥肉:京东发布具身智能数据全链路基础设施,计划发动60万人众包采集(如快递员、骑手佩戴设备),目标两年内积累1000万小时人类真实场景视频数据;百度选择了“数据超市”的模式…… 行业热度陡增,这也是觅蜂科技董事长兼CEO姚卯青所言,“在具身智能尚未真正大规模商业化之前,数据作为基础设施,会比终端应用更早形成商业回报”的底层逻辑。 具身智能的数据来源主要包含四类:位于金字塔顶层的是遥控真机(即遥操作)获得“真机数据”,数据质量最精准成本也最贵,但却是人形机器人落地的关键;仿真数据/合成数据处于中层,成本低、可规模化,能够弥补当前真机数据的不足;人类视频包含互联网视频、人类行为数据,处于金字塔底层,来源广泛、泛化性强;UMI(Universal Manipulation Interface,通用操作接口)协议,是具身智能领域的一种低成本、无本体的数据采集范式与技术标准。 来源:佐思汽研 ,《2026年具身智能机器人数据产业布局研究报告》 发展至今,数据采集赛道大致也可以分为四大流派:“真机数据”对应的如智元等头部机器人公司