我们知道,世界是三维的。 但互联网普及至今,受限于技术、硬件和传播载体,在几十年的时间里,都在把这个三维世界压成二维来表达。文字、图片、视频,这三种信息载体承载了我们今天在网上看到的几乎一切,都已经把这个世界降维。这是过去,互联网受限于带宽、硬件和计算能力后的「妥协」。 直到 3D 高斯泼溅(3D Gaussian Splatting, 3DGS) 的出现,才第一次让「随手拍、即时重建、实时漫游」三维场景成为可能。但这项技术一直卡在「最后一百米」:怎么让普通人在浏览器里流畅地看? 今年 4 月,李飞飞领衔的 World Labs 开源了 3D 高斯渲染引擎 Spark 2.0,瞬间引起技术圈的关注。 就在刚刚,群核科技的空间智能平台 Aholo 又推进了一步:正式了开源 3D 高斯浏览器 Aholo Viewer,并且在渲染速度和大场景加载性能上超越了 Spark 2.0。它让任何设备的浏览器都能流畅运行 10 亿 + 粒子的超大 3D 场景。 简单理解,它可以让你像刷视频一样, 在浏览器里流畅浏览超大的 3D 世界。就像 3D 版的抖音、B 站,超大 3D 世界也可以像视频一样快速传输。 从更大的意义来说,李飞飞与群核科技接连推出 3D 高斯浏览器,是一个时代到来的信号,代表着信息载体的范式跃迁:互联网信息载体从文字、图片、视频,第一次真正迈向可交互、可漫游的 3D 内容,而 3D 将成为互联网的基础语言之一。 十亿高斯点,手机浏览器也能流畅跑 在三维视觉领域,3D 高斯泼溅的出现是一个里程碑。 这是一种从 2023 年起在学界快速走红的三维场景表示方法。它把一整个真实场景显式地建模为数十万到数十亿个可学习的 3D 高斯椭球,每个椭球带有自己的位置、形状、颜色和透明度,再通过可微分光栅化做实时渲染。 但新技术的出现,并没有