谷歌具身智能VLA模型RT-H—— 基于语言的动作分层框架

Ofweek维科网2025-07-10

2024年3月,谷歌DeepMind正式推出端到端的框架RT-H。它是一个带动作分层结构的机器人Transformer —— 将语言化动作作为高级任务描述与低级动作之间的中间预测层,从而通过语言化动作构建动作分层结构。那么,什么是语言化动作(language Motion),构建动作分层结构又能带来哪些好处呢?语言化动作是以自然语言描述机器人行为的语义单元,它作为高层任务与底层机器人动作(...

网页链接
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法