新智元报道
【新智元导读】今天,阿里重磅上线HappyOyster 1.0世界模型,一句话直接生成可实时探索、物理交互的开放世界!
“快乐生蚝”,真的来了!
今天,阿里正式放出了HappyOyster 1.0——这是一款可实时构建和交互的开放式世界模型产品。
一句话,即可生成一个完整、可演绎、可探索、可互动的数字世界。
2个月前,阿里曾把“快乐生蚝”放进了公众视野,如今这只生蚝终于长成了1.0。
一句话,一个世界,这次是真的实现了。
世界模型,AI下一个战场
过去两年,文生视频已经相当成熟。
输入一句话,等上几十秒,就能拿到一段成片,它把“文本变成画面”这件事,做得很好。
只不过,成片有它天然的边界:画面生成完,这段视频就定稿了,你能做的是“看”,而不是“参与”。
而世界模型想做的,是另一件事:让你不只是看一段视频,而是走进一个能实时互动、随时改变走向的世界。
这无关谁取代谁,文生视频交付的是“一段结果”,世界模型为你创造的是“一段体验”——
你给一张图、一段话,它生成的那一刻,体验才刚开始。
那它具体是怎么做到的?
它把视频,当成一个需要被持续推演的世界状态,学习世界如何随时间演化的规律——
空间怎么连续、物体怎么守恒、动作之后会引发什么反馈。
它要做的,不再只是“把内容生成出来”,而是“把一个世界持续推演下去”。
放眼全世界,硅谷大厂、AI大佬创业公司,纷纷押注“世界模型”这一赛道。
这其中,不仅有谷歌DeepMind的Genie,也有李飞飞团队倾力打造的Marble。
在这场角逐中,阿里HappyOyster强势入局,路线非常明确:主动式、实时——
你说话的同时,世界就在回应你。
HappyOyster命名的灵感,来源沙翁的名言——The world is your oyster(世界是你的牡蛎 ,撬开它)
如今,阿里把将这句箴言刻印在“世界模型”上,态度很直白:世界,由你来撬开。
快乐生蚝,一手实测
这一次,HappyOyster 1.0核心版本升级,主打两大功能——
世界探索(Adventure):你就是世界里角色的一部分,一句话、一张图,即可开启任意世界的探索。
实时导演(Directing):你就成了那个站在世界之上的人,去导演一整个故事。
百闻不如一见,接下来,我们将开启一场全面的硬核实测。
世界探索:你就是世界里的“主角”
一句话或一张图,你就进入一个可漫游、可战斗、可互动的开放世界。
第一人称、第三人称随你切,还支持1分钟以上的实时位移与镜头控制。
“世界探索”新增了一整套丰富的交互动作:前冲 / 加速、下蹲、攻击、跳跃,还支持更复杂的环境交互——乘坐驾驶载具、使用各类武器战斗。
它真正把“看一个世界”变成了“在一个世界里活动”。
下面这个测试中,我们让HappyOyster 1.0生成了两个壮汉在地下拳馆格斗的场景。
这一场格斗里,攻击、跳跃、闪避这些动作,都是实时操控出来的——出拳、反击、再追打,节奏完全跟着指令走。
关键是,一拳打出去,命中之后对手会触发“踉跄倒退”的受击反应。
HappyOyster凭借着对客观世界的理解能力,根据场景实时演化对应的物理交互,让各种复杂动作实时发生。
精彩评论