智元系再落一子:具身智能的数据底座,开始有了估值锚

财报研究社pro
06-23

觅蜂科技6月中旬官宣完成数亿元天使+轮战略融资,把具身智能产业链里一个过去不算显眼的环节推到台前。

天眼查显示,公司带有明显智元系背景,定位是一站式物理AI数据服务平台。本轮由国方创投领投,孚腾资本、上海电科基金、元启创新跟投,老股东均普智能、鼎晖VGC继续追加。融资资金将投入物理采集硬件量产、数据治理平台迭代、采集网络扩张和机器人交互数据库扩建。

2026年,具身智能已经从“机器人能不能站起来、走起来”的硬件叙事,转向“机器人能不能学会干活”的训练叙事。本体、关节、减速器、灵巧手和运动控制仍然重要,但这些更多解决“机器人的身体”。真正决定机器人能不能进入工厂、仓库、商超、家庭的,是其有没有足够多、足够真实、足够标准化的物理交互数据。

大语言模型的燃料是文本和多模态内容,很多可以从互联网和版权库里获取;具身智能的燃料来自真实世界,来自抓取、装配、避障、力控、视觉感知、任务失败和重复修正。此类数据不能简单爬取,只能采集、治理、验证。

觅蜂科技的融资背后,机器人本体还在等待规模化出货,训练数据已经开始被定价。

数据短缺正在从技术问题变成资本开支问题

过去一两年,市场对具身智能的关注点集中在本体公司。谁做人形机器人,谁有整机出货,谁进入汽车工厂,谁拿到大厂订单,谁就更容易获得风险偏好。但产业往前推进一层,机器人模型想要泛化,不可能只靠少量实验室数据,也不可能完全依赖仿真环境。

仿真可以提高效率,但无法充分复刻物理世界的摩擦、接触、形变、失败动作和长尾场景。机器人拿起杯子、拧紧螺丝、分拣快递、整理货架,背后需要大量真实交互样本。一个动作成功,系统要记录视觉、轨迹、姿态、力度、时间同步和任务结果;一个动作失败,也同样有训练价值。具身智能和传统自动化最大的差别,就在于它不是写死规则,而是要通过数据把物理世界里的复杂性学出来。

这让数据从“技术配套”变成了“资本开支”。

模型公司要买算力,本体公司要买零部件,具身智能公司还要买数据。训练数据不再是一次性工程,而是伴随模型迭代、场景扩张和客户落地持续消耗的生产资料。对于投资者来说,这意味着产业链里可能出现一个比整机更早商业化的环节:数据服务商。

这个节点上,觅蜂科技提出真机采集、无本体采集、仿真模拟三套并行体系。真机采集解决机器人本体直接执行任务的数据问题;无本体采集通过人佩戴或操控设备,在真实场景里记录动作轨迹和多模态信息;仿真模拟补充规模、长尾和低成本训练环境。三套体系对应的不是传统标注公司的人力堆叠,而是数据产能的工业化。

能让国资平台、产业基金、老股东同时加码,说明资金不是只看一家公司,而是在抢具身智能的数据基础设施入口。

机器人行业现在最缺就是可验证的数据供给能力。谁能持续生产高质量、可复用、可交易的物理交互数据,谁就可能在下一轮估值切换里拥有更高议价权。

觅蜂要卖的是物理AI的数据工厂能力

仅把觅蜂科技理解成“AI标注公司”,不足以评估其价值。

传统数据标注更多围绕文本、语音、图片、视频做清洗和分类,核心竞争力是交付效率、标注质量和成本控制。具身智能数据复杂得多,要记录机器人和物理世界发生关系的全过程。视觉信息只是入口,真正有价值的是动作链路、力度变化、空间位置、任务结果和失败反馈。这类数据必须被采集、对齐、清洗、评估,再转换成模型能用的训练样本。

觅蜂强调MEgo系列无本体采集硬件,也强调MEgo Engine数据治理平台。硬件解决“数据从哪里来”,治理平台解决“数据能不能用”,采集网络和场景运营解决“数据能不能规模化”。这套组合更像一个物理AI数据工厂,而不是一个外包标注团队。

这条路径和二级市场已有的AI数据故事有相似性,也有明显差别。

视觉中国的逻辑,是把多年积累的版权图片、视频、音乐等内容资产重新结构化,卖给大模型公司做训练数据。核心是版权清晰、内容规模和合规授权。海天瑞声更接近AI训练数据服务商的传统样本,覆盖语音、文本、图像等数据品类,也在关注具身智能数据。石基信息这类垂直行业软件公司,则更多代表行业运营数据与AI应用结合的方向。

觅蜂科技切入的是更稀缺的物理交互数据。这些数据不是已有内容资产的再加工,而是要用硬件、场景和人机操作重新生产出来。此环节的成本更重、标准更复杂,但一旦形成规模,数据资产的壁垒也更硬。

不过,觅蜂科技还有三层故事需要持续关注。

第一层是数据订单。人形机器人公司、工业机械臂企业、具身大模型团队,都需要抓取、装配、力控、视觉感知等训练数据。只要客户开始持续采购,觅蜂就有机会形成比本体公司更早的收入兑现。

第二层是平台复用。数据采集硬件和治理平台如果标准化,边际成本会下降。采集同类任务越多,数据质量验证越成熟,客户交付越快,利润弹性也越容易被市场理解。

第三层是数据资产化。高价值场景数据未来不一定只卖一次,也可能通过使用权授权、订阅、联合训练、行业数据包等方式反复变现。这个故事如果成立,觅蜂的估值逻辑就不再是项目服务,而是数据基础设施。

这也是觅蜂科技和智元机器人关系的微妙之处。智元提供了本体、算法和场景验证的天然土壤,让觅蜂更容易建立数据闭环。但觅蜂要做大,不能只服务智元。公司必须证明自己是行业中立平台,能面向其他机器人公司和工业客户输出标准化数据服务。否则,市场不会将其视为独立的数据资产公司。

具身数据开始资本化

觅蜂科技这轮融资,或许会带动市场重新审视具身智能数据赛道,但这条线并不是没有风险。

第一个风险是数据权属。具身智能数据来自真实工厂、仓库、商超、家庭和实验场,里面可能包含产线工艺、空间布局、员工操作习惯、客户流程甚至企业经营信息。客户愿不愿意开放这些场景,取决于平台能否解决数据协议、隐私边界、使用权和所有权安排。数据越有价值,权属问题越敏感。

第二个风险是标准。机器人本体还没有完全收敛,不同厂商的硬件结构、控制系统、传感器方案、任务定义都有差异。数据平台要成为基础设施,必须解决跨本体、跨任务、跨场景的数据复用。如果每个客户都要深度定制,觅蜂就会回到项目制服务,收入能增长,但估值弹性会被压住。

第三个风险是客户中立性。智元系背景在早期是优势,但对外部客户也是心理门槛。其他本体厂商会不会采购一个智元系公司的数据?数据交易有没有严格隔离?模型训练效果和数据有效性如何验证?这些问题会直接影响订单能见度。

第四个风险是现金流质量。物理数据采集不是轻资产生意。硬件量产、采集网络、场景拓展、数据治理平台都需要资本开支。融资能不能换来有效产能,产能能不能转化为客户订单,订单能不能形成健康回款,是后续资本市场观察的重点。如果只能不断扩大采集规模,却无法形成稳定收入,主题升温很快会转为逻辑证伪。

但从行业前瞻看,具身智能数据的资本化趋势已经很难忽视。

机器人产业过去交易的是“本体能不能量产”,接下来会交易“模型能不能训练”。本体公司需要数据,算法公司需要数据,工业客户做场景落地也需要数据。具身智能如果要从发布会走向产线和家庭,数据服务一定会从后台走到前台。

机器人本体出货可能还要等待成本下降和场景验证,但数据需求已经在本体厂商、模型团队、工业客户之间提前出现。谁能把物理交互数据做成标准化产品,谁就能在产业真正放量前建立筹码。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法