Hugging Face第一名,锚定人类原生数据,这家具身智能企业是谁?

数科星球公众号
05-19

图片

图片

本文将带你看懂具身智能的行业周期与底层逻辑。

图片

@数科星球DigitalPlanet原创

作者丨苑晶

编辑丨大兔

2026年的人形机器人赛道,正经历一场悄无声息却影响深远的范式转移。

摩根士丹利5月发布的《HumanoidHorizons》报告,用一组硬核数据撕开行业表象:今年全球人形机器人风险投资规模已超2025年全年,中国市场贡献近半融资,成为绝对核心增长极。

而更关键的信号是,行业重心正从硬件参数比拼,悄然转向数据能力的终极较量。

过去两年,人形机器人赛道陷入硬件内卷的狂欢:整机厂商比拼身高体重、关节自由度、行走速度,零部件企业竞速减速器、电机、传感器的性能极限,一台又一台炫酷Demo机器人亮相发布会、展会,动作流畅、外观精致,却始终难以走出实验室,真正落地产业场景。

行业陷入“融资热、落地难”的怪圈,资本潮水褪去,大家才发现,精致硬件背后,是数据能力的巨大缺口——机器人缺乏真实、高质量的操作数据,无法真正理解物理世界、完成复杂灵巧任务。

当硬件内卷的天花板越来越低,数据成为破局唯一钥匙。而在这场数据浪潮里,灵初智能,这家聚焦具身智能大脑与灵巧操作的中国企业,正以一种反潮流、重本质的姿态,站在赛道核心位置。

它All in人类原生数据,自研低成本数采手套,坚持“小全栈”定位,不碰整机、深耕模型、数据、灵巧手,用一套独特的技术路线,试图定义具身智能的数据标准,筑造难以复制的护城河。

本次,数科星球DigitalPlanet深度对话了灵初智能创始人兼CEO王启斌,这家公司的奥秘是什么?

01

具身智能的周期轮回

读懂灵初智能的价值,必先看懂具身智能的行业周期与底层逻辑。

2018年,机器人行业曾经历一轮热潮,彼时行业核心是规则驱动+有限感知,机器人依赖预设程序完成固定动作,一旦环境稍有变化,任务便会失败。

那一轮热潮最终落幕,核心原因在于算法、供应链、算力三重瓶颈,无法支撑机器人从实验室走向真实世界。

时隔八年,2026年的具身智能热潮,早已不是简单的复刻,而是底层逻辑的根本性重构。这一次,行业迎来三大不可逆的质变,为数据驱动路线铺平道路。

图片

前些天,全球最大的开源AI社区HuggingFace上,由灵初智能开源的SynData数据集冲上了Trending榜全球第一。

其一,算法范式彻底革新。

端到端视觉-语言-动作世界模型的成熟,让机器人摆脱规则束缚,具备从数据中自主学习复杂操作的能力。

此前机器人需要工程师逐行编写动作程序,如今通过大量操作数据训练,模型能自主拆解任务、适应变化,这是具身智能从“人工编程”到“数据驱动”的核心跨越。

其二,中国供应链全面成熟。

灵巧手、精密减速器、高性能传感器等核心零部件,成本大幅下降、供应稳定性显著提升。

2018年,一款高精度灵巧手售价动辄数十万元,如今国产同类产品价格降至数万元甚至更低,硬件门槛的降低,让企业无需再陷入硬件制造的重资产竞争,得以聚焦数据与算法等核心壁垒。

摩根士丹利报告显示,中国人形机器人产业链已形成完整布局,从核心零部件到集成商,企业数量全球领先,为数据驱动路线提供坚实硬件支撑。

其三,算力基础设施普惠化。

大模型训练所需的云端算力成本持续下降,边缘端推理能力不断提升,中小科技企业也能负担大规模数据训练与迭代成本。

算力的普及,打破了头部科技企业的算力垄断,让灵初这类聚焦细分赛道的企业,得以在数据与算法领域实现突破。

三大质变叠加,行业共识逐渐清晰:硬件只是载体,数据才是灵魂。

一台机器人的性能上限,不取决于电机功率、关节数量,而取决于它所学习的真实操作数据的质量与规模。

过去行业沉迷的仿真数据、遥操作数据,始终无法跨越“虚拟到现实”的鸿沟,只有人类在真实场景中完成的原生操作数据,才能真正传递任务意图、手眼协调逻辑与自适应能力。

图片

02

锚定真实数据

灵初智能的崛起,始于一次极具勇气的战略转身。

2025年下半年,当行业仍沉浸在Demo狂欢,企业纷纷比拼机器人动作复杂度、外观精致度时,灵初做出一个颠覆性决策:停止所有纯Demo项目,全面转向真实场景数据采集与细分场景落地。

在当时的行业语境下,这一选择近乎“逆潮流而动”。

Demo是吸引资本、获得行业关注度的最快方式,一台炫酷机器人Demo能轻松登上行业头条,成为融资的重要筹码。

灵初CEO王启斌有着清晰的判断:Demo能展示能力,却无法积累真正的壁垒;真实场景数据,才是机器人行业的终极护城河。

今天能做出更好看Demo的竞争对手,明天就可能出现,但每一小时真实操作数据,都是无法复制的核心资产。

这次转身,不是一时冲动,而是基于行业本质的深度思考,也为灵初后续的发展定下核心基调:不追短期浮华,锚定长期价值。与战略转身相伴的,是灵初明确的“小全栈”定位。

在人形机器人赛道,多数企业追求“大而全”,试图打造从硬件整机、核心零部件到算法模型的全产业链布局,认为只有掌控整机,才能掌握行业话语权。

而灵初选择“小而精”,聚焦模型、数据、灵巧手三大核心环节,这一边界划分,看似保守,实则极具前瞻性。

整机制造是重资产、慢迭代的业务,需要投入大量资金、人力用于生产线建设、供应链整合,且硬件迭代周期长,难以适配算法与数据的快速迭代需求。

灵初不碰整机,既能避开与整机厂商的直接竞争,又能将全部资源集中在核心壁垒构建上。

而模型、数据、灵巧手三者高度耦合,缺一不可:数据是模型训练的基础,模型是灵巧手的控制核心,灵巧手是数据采集与场景落地的关键载体,三者形成紧密的能力闭环,共同构筑灵初的差异化壁垒。

这种“小全栈”模式,让灵初轻装上阵,得以在数据与算法领域快速迭代、持续深耕,也为后续人类原生数据路线的落地,奠定了组织与资源基础。

图片

03

人类原生数据的颠覆式价值

灵初最核心的竞争力,在于其坚定的All in人类原生数据”路线,以及由此构建的数据护城河。

在行业数据认知普遍模糊的当下,灵初率先明确:人类原生数据,是具身智能最优质、最不可替代的核心数据。

行业主流数据来源,主要分为遥操作数据与仿真数据,二者均存在难以克服的短板。遥操作数据,是操作员通过远程控制设备操控机器人完成任务所产生的数据,其核心缺陷在于节奏慢、成本高、质量低。

操作员在屏幕前的操作能力,远不如现场自然操作,动作僵硬、节奏拖沓,且遥操作成本高昂,难以规模化采集。

更关键的是,遥操作数据传递的是“屏幕前的操作意图”,而非真实场景下的任务逻辑,迁移到真实机器人上时,效果大打折扣。

仿真数据,是通过虚拟仿真环境生成的操作数据,其最大痛点是“虚拟到现实鸿沟(Sim2RealGap)”。

仿真环境中的物理模型再精准,也无法完全复刻真实世界的细微差异,比如物体表面摩擦力、光线变化、微小形变等。

在精细操作任务中,毫米级的误差就会导致任务失败,仿真数据训练出的模型,在实验室仿真环境中表现优异,一旦落地真实场景,便会频繁出错,难以实用。

而人类原生数据,是人类在真实物理世界、真实工作场景中,自然完成操作任务所产生的全模态数据,天然携带三大核心价值:真实的任务分解逻辑、精细的手眼协调反馈、灵活的意外自适应能力。

人类在工厂装配、仓库分拣、门店整理等场景中,每一个动作都经过长期实践打磨,蕴含着对任务本质的深刻理解,面对物体轻微移位、环境光线变化、突发干扰等情况,能自然调整动作,这些能力,是遥操作与仿真数据都无法复刻的。

为规模化、低成本采集人类原生数据,灵初自研了外骨骼数采手套。

图片

这款手套采用轻量化设计,能以亚毫米级精度,同步采集人类手部3D关节轨迹、触觉信号、第一视角视觉流,同时支持语言标注,实现全模态数据采集。

更关键的是,这款手套的成本仅为传统真机遥操方案的十分之一,彻底打破了高精度数据采集的成本壁垒,让大规模人类原生数据采集从实验室构想,变为现实可行的规模化工程。

依托自研手套,灵初已积累近10万小时高质量人类原生数据,覆盖制造业精密装配、物流柔性打包等高频场景,数据质量与规模均处于行业领先水平。

而灵初的目标远不止于此:2026年底冲击100万小时数据量级,构建覆盖500+场景、万级任务、千级物体的全国最大灵巧手数据集。

图片

要实现百万小时目标,灵初搭建了“四位一体”的数据规模化基建:

  • 一是工厂与物流驻场采集,与制造业、物流企业深度合作,在真实作业场景中同步采集数据,既产生商业价值,又积累数据资产;

  • 二是专业数采厂运营,在北京石景山建立专属数采场地,开展标准化数据采集;

  • 三是行业平台合作,与专业具身数据平台协同,拓展数据采集渠道;

  • 四是分布式微支付网络,用户可租赁手套完成简单操作获取报酬,覆盖家庭、长尾场景,进一步丰富数据多样性。

数据采集之外,灵初还构建了一套完整的数据处理与飞轮体系。

一条人类原生数据,从手套采集到模型优化,需经历“采集-质检-标注-训练-部署-回流”全流程:手套采集原始数据后,灵初自研的Psi-W0世界模型自动质检打分,过滤低质量数据;高质量数据经自动标注与少量人工审核后,进入Psi-R2动作模型预训练池;模型训练完成后部署到真实场景,作业过程中回流新数据,再次进入训练闭环,形成正向加速的数据飞轮。

数据飞轮的加速效果已在实践中得到验证:半年前,灵初模型完成一项新任务需要数百条真机演示数据,如今仅需不到100条,模型泛化能力呈非线性提升。

这一变化,直观印证了人类原生数据的核心价值,也让灵初的数据护城河,越筑越高、越筑越宽。

04

双模型架构与朴素技术哲学

数据是基础,模型是核心。灵初的技术内核,是Psi-R2动作模型与Psi-W0世界模型组成的双模型架构,以及贯穿始终的“RawDataIn,RawDataOut”朴素技术哲学。

行业多数企业倾向于将动作、感知、决策等功能整合为单一超大模型,认为“大而全”的模型性能更强。

而灵初坚持双模型分工,核心原因在于两类模型的训练目标、数据需求完全矛盾,强行合并会导致性能相互掣肘。

Psi-R2动作模型,专注学习“如何完成任务”,核心目标是掌握灵巧操作的动作逻辑,训练数据必须是高质量、成功的人类原生操作轨迹,聚焦“成功案例”,学会精准、高效的动作执行。

而Psi-W0世界模型,专注理解“世界物理规律与行为后果”,核心目标是预判动作结果、推演未知场景,训练数据不仅包括成功案例,还需纳入30%失败样本,通过“虚拟试错”理解边界条件,提升模型鲁棒性。

两套模型分工明确、协同工作:Psi-R2负责输出精准动作指令,Psi-W0负责实时推演动作后果、优化动作细节,二者配合,让机器人既能精准执行操作,又能灵活应对未知情况,实现“思考-行动”的高度统一。

支撑双模型架构的,是灵初坚守的朴素技术哲学:Raw Data In,Raw Data Out,即不做复杂人工特征工程,不添加冗余模块,让模型直接从原始数据中学习规律。

这一理念源于AI领域经典的“苦涩教训”:当数据规模足够大时,人工设计的特征、模块最终都会成为性能天花板,限制模型泛化能力。

灵初早期也曾尝试人工设计中间表示、对齐模块,但实验结果显示,数据量较小时,人工设计能快速提升性能;一旦数据量达到一定规模,简单结构的泛化能力显著超越复杂模块。

基于实验结论,灵初果断放弃人工干预,坚持让模型自主从原始人类原生数据中学习,哪怕短期内面临性能压力,也绝不妥协。

跨本体映射是灵初技术的另一核心突破。

人类手部有21个自由度,而机械手指自由度远低于二者,物理结构、运动规律差异巨大,如何将人类手部动作精准迁移到机械手上,是行业公认的技术难题。

传统做法是人工设计映射规则,人为定义人手关节与机械手的对应关系,但规则存在天花板,无法覆盖所有边角情况。

灵初的解法是“粗对齐+自主学习”:仅用运动学做最基础的关节对应框架,不设定具体映射规则,剩余细节全部交给Psi-W0世界模型自主学习。

模型通过大量人类原生数据训练,结合强化学习反复试错,自主找到适配机械手物理规律的最优动作映射方案,全程减少人工干预,最大化保留数据中的原始信息,最终实现高精度跨本体迁移。

这套朴素却高效的技术路线,让灵初模型在少样本泛化能力上实现行业领先。目前Psi-R2模型在MolmoSpaces榜位居全球前列,仅需不到100条真机演示数据,就能完成手机装配、工业包装、叠纸盒等复杂长程任务,真正实现“小样本、强泛化”。

图片

05

从实验室到产业场景

技术的终极价值,在于落地应用、创造商业价值。

灵初深知,再先进的模型、再优质的数据,若无法解决真实场景问题,都只是空中楼阁。

因此,灵初聚焦制造业精密装配、物流柔性打包两大核心场景,稳步推进商业化落地,同时明确后续拓展方向,构建可持续商业闭环。

制造业精密装配是灵初的核心落地场景之一,聚焦电子产品、汽车零部件等细分领域。

这类场景任务高频、精度要求高、人工成本攀升,且作业环境相对规整,属于半结构化场景,适配灵初模型能力。

图片

灵初的灵巧手+模型解决方案,可完成微小零件抓取、组装、检测等精细操作,替代人工重复劳动,提升生产效率、降低次品率。

目前已与多家电子制造企业达成合作,进入小批量试产阶段。

物流柔性打包是灵初另一核心落地场景,重点布局服装仓储领域。

服装SKU丰富、尺寸多样、形态柔软,分拣、打包任务复杂,是物流行业的痛点场景,同时丰富的SKU能提供海量多样性数据,持续反哺模型训练。

灵初方案可实现不同款式、尺寸服装的自动分拣、折叠、打包,适配柔性化作业需求,目前已在国内多家服装仓库部署试点,作业效率显著提升。

除两大核心场景外,灵初正积极评估零售门店补货、电商多品混合拣选等后续拓展场景。这类场景同样具备高频、可量化、半结构化特点,且客户降本需求迫切,与灵初模型能力高度匹配。

图片

数据变现方式,灵初构建了三层路径:

  • 一是数采工具销售,自研外骨骼手套直接销售或租赁,创造硬件收入;

  • 二是数据资产授权,高质量人类原生数据集对外授权,服务行业研究与企业训练需求;

  • 三是场景解决方案交付,软件(模型)+硬件(灵巧手)+数据服务打包交付,这是灵初核心商业价值来源。

目前灵初的商业闭环已初步验证:半年前部署新任务需数百条演示数据,如今仅需不到

100条,数据消耗减少、积累增多,正向飞轮加速运转。

2026年底,灵初设定数亿元销售额目标,这一目标不是盲目扩张,而是基于现有管线的务实规划,核心目的是验证“数据-模型-交付-回流”商业闭环的可行性。

站在行业发展的关键节点,灵初的意义远超一家企业。

它代表了中国具身智能企业的理性选择:不盲目跟风硬件内卷,锚定数据核心价值;不追求大而全,聚焦核心壁垒;不沉迷短期流量,深耕长期价值。

随着百万小时数据目标的推进、技术能力的持续迭代、商业落地的稳步拓展,灵初有望在具身智能浪潮中,成为数据标准的定义者、行业生态的构建者,推动中国具身智能产业从跟跑到领跑。

未来,当人形机器人真正走进工厂、仓库、家庭,人们或许会记得,有一家叫灵初的企业,以人类原生数据为基石,在喧嚣的行业热潮中,守住本质、筑造壁垒,为具身智能的落地,点亮了一盏理性而坚定的灯。

↓↓↓

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法