阿里又放大招!一句话,造一个能走进去的世界

新智元06-17 18:58

新智元报道

【新智元导读】今天,阿里重磅上线HappyOyster 1.0世界模型,一句话直接生成可实时探索、物理交互的开放世界!

“快乐生蚝”,真的来了!

今天,阿里正式放出了HappyOyster 1.0——这是一款可实时构建和交互的开放式世界模型产品。

一句话,即可生成一个完整、可演绎、可探索、可互动的数字世界。

2个月前,阿里曾把“快乐生蚝”放进了公众视野,如今这只生蚝终于长成了1.0。

一句话,一个世界,这次是真的实现了。

世界模型,AI下一个战场

过去两年,文生视频已经相当成熟。

输入一句话,等上几十秒,就能拿到一段成片,它把“文本变成画面”这件事,做得很好。

只不过,成片有它天然的边界:画面生成完,这段视频就定稿了,你能做的是“看”,而不是“参与”。

而世界模型想做的,是另一件事:让你不只是看一段视频,而是走进一个能实时互动、随时改变走向的世界。

这无关谁取代谁,文生视频交付的是“一段结果”,世界模型为你创造的是“一段体验”——

你给一张图、一段话,它生成的那一刻,体验才刚开始。

那它具体是怎么做到的?

它把视频,当成一个需要被持续推演的世界状态,学习世界如何随时间演化的规律——

空间怎么连续、物体怎么守恒、动作之后会引发什么反馈。

它要做的,不再只是“把内容生成出来”,而是“把一个世界持续推演下去”。

放眼全世界,硅谷大厂、AI大佬创业公司,纷纷押注“世界模型”这一赛道。

这其中,不仅有谷歌DeepMind的Genie,也有李飞飞团队倾力打造的Marble。

在这场角逐中,阿里HappyOyster强势入局,路线非常明确:主动式、实时——

你说话的同时,世界就在回应你。

HappyOyster命名的灵感,来源沙翁的名言——The world is your oyster(世界是你的牡蛎 ,撬开它)

如今,阿里把将这句箴言刻印在“世界模型”上,态度很直白:世界,由你来撬开。

快乐生蚝,一手实测

这一次,HappyOyster 1.0核心版本升级,主打两大功能——

世界探索(Adventure):你就是世界里角色的一部分,一句话、一张图,即可开启任意世界的探索。

实时导演(Directing):你就成了那个站在世界之上的人,去导演一整个故事。

百闻不如一见,接下来,我们将开启一场全面的硬核实测。

世界探索:你就是世界里的“主角”

一句话或一张图,你就进入一个可漫游、可战斗、可互动的开放世界。

第一人称、第三人称随你切,还支持1分钟以上的实时位移与镜头控制。

“世界探索”新增了一整套丰富的交互动作:前冲 / 加速、下蹲、攻击、跳跃,还支持更复杂的环境交互——乘坐驾驶载具、使用各类武器战斗。

它真正把“看一个世界”变成了“在一个世界里活动”。

下面这个测试中,我们让HappyOyster 1.0生成了两个壮汉在地下拳馆格斗的场景。

这一场格斗里,攻击、跳跃、闪避这些动作,都是实时操控出来的——出拳、反击、再追打,节奏完全跟着指令走。

关键是,一拳打出去,命中之后对手会触发“踉跄倒退”的受击反应。

HappyOyster凭借着对客观世界的理解能力,根据场景实时演化对应的物理交互,让各种复杂动作实时发生。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法