话说,这两天有个事情还挺有意思的,那就是,京东突然宣布建成全球最大的具身数据采集中心,还说要发动宿迁超十万人来进行数据采集。嘿,有点意思,不过,京东这到底是个啥动作啊?能不能成啊?
先来说说“具身智能”这个词,其英文名是“Embodied AI”,简单点来说就是是“有身体的AI”,AI在物理世界落地, 能看、听、摸、走、抓、操作现实物体。这个词火啊,特别是在今年春晚被机器人占领之后,“具身智能”更是火得一塌糊涂。
但很多人不清楚的是,“具身智能”不仅仅局限于人形机器人,它也涉及到了“大脑”——大模型聪明不聪明,但同时,现在这个阶段,“具身智能”最缺的是“数据”。什么数据呢?就是真实世界的操作数据,人类“怎么做事”的过程数据以及手、眼、身体协同的数据等等。比如,让机器人做一件简单的事情—— “把桌上的杯子拿起来放进洗碗机”,这里的难点不在理解语言,而在判断杯子材质、控制力度、避免碰撞找到路径,这些都需要海量真实操作数据训练。
大模型的数据可以将现有互联网的数据爬取做训练,而具身智能的数据只能“人肉采集”,需要人去做示范动作(抓、放、走、搬)、标注行为(成功/失败)以及在真实环境反复执行。 从“标注语言” 升级为“标注人类行为”。
而做这个事情,你别说,京东还真是自己的优势。首先,京东的员工数多啊,而且大多数是一线的物流人员。比如根据京东的财报披露,截至2025年底,京东体系人员总数超90万人,京东物流的员工数约68万人。简单来说就是,京东每天都有这么多人在做搬运、抓取、分拣、路径规划、配送,这才是最真实的具身智能训练数据。同时,京东的场景也很丰富,除了物流配送外,京东还有家政、健康、工业等场景,京东这些场景的一线员工可以帮助京东积累更多元的数据。
所以啊,这么看来,京东说要建立全球规模最大的具身智能采集中心,还真的是靠谱的。京东方面称,京东依托超级供应链核心优势,以及零售、物流、健康、工业、外卖、家政等海量真实业务场景,将建成全球规模最大、场景最全的具身智能数据采集中心,两年内积累超1000万小时优质数据。
在这个机器人数据采集中心中,构建了“采集—标注—训练—验证”全流程数据流水线,覆盖物流仓储、工业制造、健康医疗、家庭服务、城市运维等五大核心场景,记录视觉、触觉、空间轨迹等全维度数据。
而为了更快速地进行数据采集。京东这次更是发动数十万人参与数据采集——包括内部超过10万名各类职业员工,以及外部最多50万各行业人员。
其中,京东创始人刘强东的家乡人民这次也参与到这一数据采集运动中来。据说,宿迁将发动超10万市民参与,覆盖家庭、办公室、工厂到物流、商店、餐厅、医疗、环卫等超百个细分场景,遍布人类真实活动的方方面面,开展“人类历史上规模最大的数据采集行动”。不得不说,刘强东造福了家乡,家乡人民也是很给力啊。
而京东方面也预计,通过以上举措,京东将于一年内积累500万小时人类真实场景视频数据,两年内突破1000万小时,同步实现采集机器人本体数据100万小时,成为全球最大的具身智能数据公司,从源头破解行业“数据荒”。
也不得不说,京东这一手也真是有点意思,京东的员工们在干电商干物流的同时,还一边顺手把AI训练给做了,这还真是很多AI公司做不到的。
有了这些“具身智能”的数据,京东可能还真的会成为AI时代重要的参与者啊,你们说是不?
精彩评论