$NEBIUS(NBIS)$ 就在昨天,Daniel Koss 访谈了 Nebius 联合创始人兼首席商务官 Roman Chernin,这份访谈长达 56 分钟,涵盖了从宏观市场逻辑到微观技术优化的深度内容。为了让你更透彻地理解,我将视频的核心观点拆解为**市场洞察、产品技术路径、商业竞争策略**以及**未来蓝图**四个维度:
### 1. 宏观市场洞察:不仅仅是“算力荒”
* **市场认知的误区 [00:01:48]:**
Roman 指出,华尔街和社交媒体(X)上对 AI 基础设施的分类太粗糙。仅仅用“GPU 数量”来衡量公司是错误的。市场正分化为:纯数据中心建设者、算力聚合器/平台、以及像 Nebius 这样**全栈自持且拥有强软件能力**的供应商。
* **训练 vs. 推理的深层逻辑 [00:10:24]:**
* **推理的集中性:** 一个有趣的观点是,Roman 认为目前推理任务比训练更集中(主要在少数几个大模型头部厂商手里)。
* **推理的碎片化趋势:** 但长期来看,推理会极其分散,覆盖数万家企业,这是 Nebius 必须抓住的“长尾市场”。
* **协同效应 [00:15:16]:** 他提出了一个**“计算池借调”**的概念:如果一家公司同时在 Nebius 上进行训练和推理,当推理出现流量高峰(Spike)时,系统可以自动从训练任务中“借用”算力,从而实现 100% 的资源利用率。
### 2. 产品与技术路径:抽象层的演进
Nebius 的核心产品哲学是**“隐藏复杂性”**:
* **Token Factory (托管推理) [00:18:38]:**
* **解决痛点:** 很多公司(如 Revolute)不想管 GPU 挂载或 CUDA 环境,他们只想要 API。
* **性能榨取:** Roman 提到一个技术傲娇的点:即使把优化配方告诉客户,客户自己也复现不了。Nebius 的工程团队能通过底层优化,让同样的硬件多出 25% 的产出。
* **Tavily 与 Agentic Search (智能体搜索) [00:43:37]:**
* **搜索的范式转移:** 传统搜索是给人类看的(10个蓝色链接);智能体搜索(Agentic Search)是给 AI 看的。
* **技术灵活性:** 智能体可以并行发出数百个查询,自动汇总、去重并结构化。收购 Tavily 是为了让 Nebius 的算力直接转化成“答案”,而不是原始的“计算周期”。
### 3. 商业竞争策略:如何从巨头口中夺食
* **避开价格战 [00:34:29]:**
Daniel 问及 Nebius 是否靠便宜赢单,Roman 予以否定。他认为**TCO(总拥有成本)**才是关键。
* **例子:** 如果别家 GPU 便宜 10%,但故障率高、网络延迟大,导致训练任务频繁中断,那最终成本反而更高。
* **选择性接单 [00:39:43]:** Nebius 目前处于“拒绝客户”的状态。他们倾向于选择那些**“懂行”且有成长性**的客户(如 Revolute),而不是只看单价的客户。
* **垂直整合的红利 [00:32:03]:**
Nebius 自建数据中心、自研云管理平台、自研推理引擎。这种“从电到 Token”的全链路控制,让他们在算力短缺的时代有更强的交付保证。
### 4. 未来蓝图:迈向“万亿”估值的路线图
* **资本与规模的横向扩张 [00:52:01]:**
基础设施是规模游戏。Roman 承认,没有人需要一个“小型”的基础设施公司。Nebius 必须在 financing(融资)、location(选址)和 building(建设速度)上疯狂竞速。
* **服务层级的纵向延伸 [00:46:12]:**
* **L1 裸金属:** 卖给 Meta 这种有自研能力的巨头。
* **L2 托管云:** 卖给中型 AI 公司。
* **L3 Token Factory:** 卖给想要部署模型的企业。
* **L4 Agentic Platform:** 卖给开发者,让他们直接构建能够执行任务的 AI。
* **总结逻辑:**
Nebius 的目标是让客户在任何一个复杂度层级上都能“买到”算力。你想管硬件?可以。你只想买个答案?也可以。
### 访谈中的一个精彩细节 (Jevons Paradox) [00:28:14]:
Daniel 提到了**“杰文斯悖论”**:当推理变得越来越便宜、高效时,人们不会少花钱,反而会因为 ROI 变高而投入更多的钱去运行更多的 AI 任务。这解释了为什么 Nebius 拼命帮客户优化、省钱,但客户反而租了更多的 GPU。
**给你的启发:**
如果你关注 AI 行业的投资或发展,这个视频揭示了**“算力商品化”**的终结——未来的赢家不是拥有 GPU 最多的人,而是能把 GPU 效率转化成最高业务价值(Token 或结果)的人。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


