谷歌全面押注智能体,AI将成下一代操作系统
北京时间5月20日凌晨,2026 Google I/O开发者大会在美国山景城举办。谷歌本次大会核心聚焦智能体AI(Agentic AI),以Gemini 3.5系列模型为核心,宣布全生态智能化升级,意图将AI从工具升级为下一代系统操作层。
今年大会的亮点有四个:
1. Gemini Omni,不仅仅是生成视频,而是理解物理世界。
你可以混合输入文字、图片、音频、视频,让它生成高质量视频。它被形容为“视频版的 Nano Banana”。它不再只是“拼贴”,而是理解重力、动能。例如,让它生成“用粘土动画解释蛋白质折叠”,它能精准展示氨基酸链折叠成α螺旋的科学过程。支持在生成的视频中进行角色保持、物理逻辑成立的连续编辑(如改变场景、视角,但演奏动作和音乐依然连续)。
2. Gemini 3.5 Flash,打破了“快就不强,强就不快”的定律。在几乎所有基准测试中(如Coding、Agent任务),它都全面胜出了三个月前发布的旗舰模型 Gemini 3.1 Pro。输出速度达到289 tokens/秒,比其他前沿模型快4倍以上。现场演示了仅用12小时,利用93个子Agent,从零开始构建了一个功能完整的操作系统内核,并成功在上面运行了《毁灭战士》(DOOM)。
3. Antigravity 2.0从IDE进化为Agent开发平台,谷歌彻底拥抱Agent-First设计。它支持动态生成子Agent并行工作,互不干扰,新增了定时任务(Scheduled Tasks)和斜杠命令(如 /goal 一口气跑完,/grill-me 先搞清楚需求再动手)。
4. Gemini Spark:7×24小时的云端个人管家,不需要用户打开App,它就在云端替用户干活。它运行在云端专用虚拟机上,即使合上笔记本也在工作。能自动跨Gmail、Docs、聊天记录抓取信息,甚至模仿你的语气写邮件。谷歌 现场演示了自动规划街区派对,包括创建RSVP追踪表、给邻居发邀请函、生成宣传PPT等。
蓝鲨财经社将谷歌去年的I/O会跟今年做了对比:
这场大会最大的不同在于,谷歌不再仅仅发布“更好用的AI模型”,而是展示“不需要人类喂料”的AI。从Omni理解物理世界,到Agent写出操作系统,再到Spark替你生活,谷歌加速构建通往ASI(人工超级智能)的入口。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


