编辑:具身研习社社员原力灵机提出VLA框架GeoVLADexmal原力灵机提出一种全新的VLA框架GeoVLA,它在保留现有视觉-语言模型(VLM)的预训练能力的同时,采用了一种双流架构(Dual-path Architecture)。具体而言,GeoVLA在保留VLM强大的语义理解能力的同时,引入专用的点云嵌入网络PEN和空间感知动作专家3DAE,直接利用深度图生成的点云数据,赋予机器人真正的...
网页链接编辑:具身研习社社员原力灵机提出VLA框架GeoVLADexmal原力灵机提出一种全新的VLA框架GeoVLA,它在保留现有视觉-语言模型(VLM)的预训练能力的同时,采用了一种双流架构(Dual-path Architecture)。具体而言,GeoVLA在保留VLM强大的语义理解能力的同时,引入专用的点云嵌入网络PEN和空间感知动作专家3DAE,直接利用深度图生成的点云数据,赋予机器人真正的...
网页链接
精彩评论