过去三年,大家都在争相抢购GPU。
英伟达的股价在三年内飙升了15倍。H100显卡一机难求。HBM显存供需失衡,美光和SK海力士的股价也因资本涌入而一路飙升。所有人都将整个人工智能革命的成败归功于一个词:计算。
但你可能忽略了一点——无论单个GB300 GPU的性能有多强大,如果它不能与成千上万的其他GPU高速通信,那么大部分计算能力都会被浪费掉。
不妨这样想。把人工智能训练集群想象成一栋大楼,成千上万的人在这里一起工作。GPU就是员工。HBM就是每张桌子上的记事本。云存储就是公司档案库。每个人都在争论“我们应该招多少员工”和“记事本够不够大”,但却没有人问一个问题:楼梯和走廊够不够宽敞?
一个拥有万亿参数的大型语言模型会将训练任务分割成数千个部分,并将它们分布到数千个GPU上进行并行计算,然后将中间结果同步到所有GPU上。如果GPU之间的“通道”不够宽或速度不够快,增加GPU数量只会造成更多孤立的计算孤岛。
“GPU是人工智能的大脑,但大脑之间的神经网络决定了整个系统的运行速度。如果没有光互连,更多的GPU就只是孤立的孤岛。”
该神经网络是光互连网络。
以下数据对比或许会让你重新思考整个行业:
全球所有上市光互连公司的总市值都低于美光科技一家公司的市值;
然而,到2024年,全球光模块市场规模翻了一番,达到154亿美元;到2025年,又增长了55%,达到 238亿美元;
AI光收发器(处理AI训练流量的领域)从2025年的165亿美元跃升至2026年的预计260亿美元,同比增长57% ;
LightCounting的乐观预测:到2030年,光互连市场总额将超过1100亿美元;
高盛的预测更为激进:光互连市场规模将从2025年的150亿美元增长到2028年的1540亿美元——增长 9倍;
2025年前9个月,五大云服务提供商(谷歌/微软/AWS/Meta/Oracle)的资本支出总额超过3000亿美元,创历史新高,其中绝大部分资金都流入了人工智能基础设施;
光模块需求一度超过供应2倍以上,EML激光器、CW激光器和硅光子代工产能均严重短缺。
注意一个细节:“存储是季度性事件,而光学则是一项多年结构性变革。” ——前者是产品周期性波动,伴随着一年内的价格上涨;后者则是整个供应链的彻底重建。两者不可同日而语。
在这一结构性转变中,规模最大的单次重组将于2026年发生——即CPO。从2026年的1.6亿美元到高盛预测的 2028年的910亿美元,短短24个月——这是光互连供应链历史上规模最大、最集中的价值重估。
为什么是光?三山压铜!
要了解为什么2026年突然出现了价值1.6亿美元的CPO市场,首先需要明白一件事——铜缆无法满足需求。
几十年来,数据中心内部GPU、CPU和存储设备之间的连接一直依赖于传输电信号的铜缆。铜缆价格低廉且可靠,这固然没错——但在人工智能集群中,铜缆已经彻底失效。
第一:物理带宽已达到极限。
材料科学和电磁学的发展已经将单根铜线的传输速度推向了极限。无论如何优化工艺或更换材料,单根电缆的带宽都无法再提升。这就像一条双车道公路——无论铺多少路,也只能并排行驶两辆车。人工智能训练的带宽需求每一代都翻倍——从400G到800G,再到1.6T和3.2T——铜线的物理性能已经无法满足需求。
第二:信号在几米后就会衰减。
铜缆在几十厘米的距离内传输效果良好。一两米后,信号就开始衰减。再过几米,信号就会被噪声淹没。但现代人工智能数据中心机架之间的连接距离通常为几十米甚至几百米。铜缆根本无法胜任这种传输距离。
三:功耗超过数据中心总能耗的 30% 。
英伟达GPU的功耗随着每一代产品的推出而飙升:H100为700瓦,B200高达1千瓦,GB300甚至更高。在如此高的功耗水平下,连接GPU的成千上万根铜缆所消耗的能量,就可能占到数据中心总能耗的30%以上。这意味着,每增加一名员工(GPU),为这些“楼梯间”供电和通风的成本就会呈指数级增长。
光纤的优势正面迎击了这三大挑战:
带宽:单根光纤的带宽是铜缆的数十倍,而采用 WDM 波分复用技术(8 种不同颜色的光同时在一根光纤中传输,互不干扰),带宽还可以再增加几倍;
距离:数公里,性能无丝毫下降;
功耗:极低,几乎可以忽略不计。
最关键的是,人工智能数据中心的需求受到双重驱动——不仅来自数据中心规模的扩张,也来自“光取代铜”渗透率的不断提高。在传统云架构下可能只需要几千根光纤的GPU集群,在生成式人工智能集群中则需要10到100倍的光纤。规模×渗透率——这正是光互连市场在2024年至2026年间翻番的根本原因。
“五年内,所有人工智能数据中心互连都将采用光纤连接。这不是预测,而是物理定律。”
什么是CPO
CPO是过去两年光互连领域最常被提及的三个字母的缩写,但90%的投资者实际上无法解释它是什么。
CPO是Co-Packaged Optics(共封装光学器件)的缩写。听起来很专业,但其核心思想可以用一句话概括:将光器件从服务器背面移到芯片封装内部。
它解决了一个非常具体的物理问题。
目前的标准配置是这样的:一个光模块(一个U盘大小的盒子)插入服务器或交换机的背面。GPU生成电信号后,信号首先要沿着主板上的铜线传输数十厘米才能到达服务器背面的光模块,在那里进行电光转换,然后才能通过光纤传输。这数十厘米的铜线意味着三件事——信号损耗、传输延迟和严重的发热。在如今密度不断增加的AI集群中,这种损耗被放大了数十万倍,已经从一个不起眼的工程细节演变成系统级的瓶颈。
CPO的方法是将光学元件移至GPU或交换芯片封装内部,紧邻GPU。这样一来,电光转换距离就从几十厘米缩短到几毫米。
为了更直观地说明这一点,我将借用我认为最好的比喻——午餐盒的比喻:
目前的配置是将食物和汤分别放在不同的容器中。GPU放在一个“午餐盒”里,光模块放在另一个保温瓶里,两者之间用一段铜线连接。CPO配置则将汤倒入同一个“午餐盒”内的另一个独立隔间中。食物和汤仍然是分开的,但它们位于同一个盒子里,彼此之间只有几毫米的距离。
“目前食物和汤分别装在不同的容器里。CPO会将汤倒入午餐盒内的一个隔间里。”
要了解CPO究竟颠覆了什么,首先需要了解传统可插拔光模块的内部结构。通常,它包含五个核心组件:
1. 激光芯片——发射连续光作为光信号的载体。可以把它想象成一个比指甲盖还小的微型手电筒,能产生极其精确、极其纯净的光。关键在于:激光器使用的是磷化铟 (InP) 或砷化镓 (GaAs) 化合物半导体材料,而不是硅——因为硅本身发光性能很差。这句话至关重要,之后会反复出现。
2. 调制器芯片——将电信号“写入”光波。激光器发射一束不携带任何信息的白光;调制器控制激光器的开关或强度——0表示允许光线通过,1表示阻挡光线——每秒进行数千亿次切换。激光器和调制器有时集成在同一芯片上,称为 EML(电吸收调制激光器)——将“手电筒”和“开关”合二为一。
3. 探测芯片——接收端的“耳朵”,负责将光信号转换回电信号。当检测到光信号时,输出1;当检测不到光信号时,输出0。材料也为InP或GaAs。
4. DSP芯片——光模块内部的“大脑”,负责纠错、编码和均衡。光信号在传输过程中会累积噪声和失真;DSP在发送端进行编码,在接收端进行噪声消除,确保恢复的0和1与原始数据完全匹配。该DSP采用硅芯片,由台积电(TSMC)制造。在800G和1.6T等高速模块中,DSP的成本占比可能超过激光器。
5. 透镜和光纤耦合组件——将激光器发射的光束精确对准光纤入口。光纤纤芯的宽度只有头发丝的十分之一,对准精度必须达到微米级——就像在生产线上自动将一根针穿过另一根针的针眼一样,重复数百万次。
以下是CPO的核心架构:
封装内部包含:一个硅光子集成电路(PIC),用于处理光操控——调制、传输和检测全部在这个硅芯片上完成。它紧邻 GPU,通过先进的封装技术安装在同一封装基板上,像 HBM 一样堆叠在 GPU 旁边。此外还有一个驱动芯片(由于距离只有几毫米,而且不需要复杂的纠错编码,因此它是 DSP 的一个高度简化版本)。
封装外部:一个独立的外部激光光源(ELS),通过光纤将光输入到封装内部的硅光子集成电路 (PIC) 中。为什么不把激光器放在封装内部呢?因为磷化铟 (InP) 激光器会产生大量热量且寿命有限——将其放在封装内部会降低整体良率,而且一旦发生故障,整个芯片就得报废(一套 GPU+PIC+ELS 组件价值数万美元)。采用外置可插拔单元设计,故障的激光器可以轻松更换。
至此,您应该明白CPO真正颠覆的是什么——它并非对光模块内部某个组件的升级,而是对“光模块”产品本身的形态进行了彻底的解构。
如今的可插拔光模块是一个独立的小盒子,里面集成了激光器、调制器、探测器、DSP 和透镜。CPO将这个盒子拆解开来——硅光子集成电路被封装进去,激光器变成了一个独立的外部光源,DSP 被大幅简化甚至完全移除,而插在服务器背面的小盒子也不再需要了。
对于光模块公司而言,这是业内历史上规模最大的产品外形尺寸重组。
CPO的两大核心器件:硅光子集成电路和外部激光器
CPO变革虽然瓦解了一种产品外形,却催生了两种全新的器件——硅光子集成电路 (PIC) 和外部激光光源 (ELS)。前者导致了硅光子代工厂的稀缺;后者则开创了一个全新的激光子行业。
一、硅光子学PIC(光子集成电路)
一个类比就能很容易理解——传统的集成电路(IC)将数十亿个晶体管集成在硅芯片上进行计算。而光子集成电路(PIC)则将调制器、光波导和探测器集成在硅芯片上进行光操控。两者都被称为“集成电路”,但一个集成的是计算单元,另一个集成的是光学单元。
光子集成电路(PIC)不使用普通的硅片,而是使用一种特殊的三明治结构硅片,称为SOI(绝缘体上硅)——衬底+绝缘层+顶层硅。为什么要采用这种特殊的结构呢?因为普通的硅片是实心的,光线会进入并散射到各个方向,完全无法控制。SOI中的绝缘层就像一面镜子,将光线反射回顶层,迫使光线只能沿着预先设计的路径在薄薄的顶层硅中传播。
这里有两个独特的瓶颈:
SOI衬底:法国Soitec公司占据近乎垄断的市场,市场份额高达95%。三大硅光子器件代工厂(Tower、GF、TSMC)均只认可Soitec的产品;
硅光子集成电路代工:市场份额最高的并非台积电,而是Tower Semiconductor。许多投资者都误解了这一点。台积电擅长硅基逻辑工艺,而 Tower Semiconductor则精通SOI封装的改进型CMOS工艺——硅光子代工实际上是台积电的强项。
但是硅光子集成电路 (PIC) 有一个固有的局限性:硅不能发光。
“硅本身不会发光——它只能操控光。这句话解释了为什么硅元素突然变得稀缺。”
硅光子集成电路(PIC)可以进行调制、传输和检测,但它本身不能产生光。光源必须由外部提供。这就引出了CPO架构的第二个核心器件:
二、外部激光源(ELS)
ELS必须由InP化合物半导体材料制成。InP激光器有两个特性——发热量大和寿命有限——使得它们无法放置在GPU封装内部:
高发热量会导致GPU与发热元件一起封装时出现热失控风险;
寿命有限意味着封装内部的单个故障会导致整个芯片报废(GPU+PIC+ELS 组件价值数万美元)。
因此,激光器必须设计成外置可插拔单元,通过光纤将光传输到封装内部。如果激光器出现故障,只需更换激光模块即可,而不会影响GPU本身。
至此,CPO的两大核心设备已经很明确了。但接下来要提出的论点却是本文中最反主流、最容易被忽视的:
工艺不匹配——LITE的首席执行官表示,他们自己必须从公开市场上购买CPO激光器。
主要激光器制造商(如LITE/COHR)的产能几乎全部用于生产EML (电吸收调制激光器)——这种激光器将“光发射”和“调制”集成在单个芯片上,专门用于可插拔光模块。英伟达已锁定这些EML订单至2027-2028年,所有产能均已预订。
但CPO不需要 EML。CPO需要一种更简单的激光器——一种只发射光而不进行调制的激光器(因为调制是由封装内的硅光子 PIC 处理的)。
两种激光器都使用InP材料,但设计不同、生产线不同、工艺参数不同——不能直接切换。LITE公司不能说“今天我关闭EML生产线,明天开始为CPO生产CW激光器”——那意味着要报废一条价值数亿美元的生产线。
更重要的是,LITE的CEO在最近一个季度的财报电话会议上原话道:他们自己也必须从公开市场上购买CPO激光器。
这句话为SIVE打开了一扇机会之窗。由于大型制造商的产能都被传统的EML订单所占据,溢出的需求只能由像SIVE这样的小型独立激光供应商来消化。
一句话概括——CPO的爆发式增长并非仅仅是“激光公司销售更多激光器”。相反,它将创造一个全新的供应商生态系统,将以前默默无闻的小公司变成稀缺的供应商。
三组数字已经验证了超级周期
很多人一听到“超级周期”这个词,就觉得又是炒作。但这次不一样。这次,三个完全独立、相互印证的数据集已经证实了这一点。
第一个数字:市场翻了一番又一番。
2024年,光模块市场规模翻了一番,从75亿美元增至154亿美元。2025年,市场规模再次增长55%,达到238亿美元。专门用于处理人工智能流量的AI光收发器市场规模在2025年达到165亿美元,预计到2026年将跃升至260亿美元(增长57%)。速度最快的1.6T光模块在2025年的出货量为80万台,预计2026年将达到200万台——仅用4年时间就实现了年出货量1000万台的目标,而100G光模块则需要10年时间才能达到这一目标。
光传输正在加速取代铜缆,而1.6T正在加速取代800G。
第二点:英伟达正在用真金白银锁定供应链。
2026年3月2日:英伟达同时向Lumentum和Coherent各投资20亿美元,总计40亿美元,直接确保优先获得这两家公司的InP激光器/EML/CW 上游产能;
2026年5月6日:英伟达向康宁公司追加投资32亿美元,并做出采购承诺,在北卡罗来纳州和德克萨斯州建造3座专用光学工厂,将连接能力扩大10倍;
结合之前对SK海力士和CoWoS的产能锁定——英伟达正在系统地将整个AI 基础设施供应链中的每个关键节点“上链”。
从历史上看,英伟达并非一家热衷于投资的公司。黄仁勋更愿意保留现金用于收购ASML和台积电的产能。但本轮周期,英伟达却斥资数百亿美元进军光互连领域——这只有一个解释:在黄仁勋看来,这是下一个瓶颈所在。
第三点:CEO的原话被当作信号弹。
数据可以解读,但CEO在财报电话会议上的原话是最难伪造的信号弹:
Lumentum 首席执行官:“CPO将面临大规模的供需失衡”,“CPO是Lumentum最大的单一增长驱动力”,“仍处于非常早期的阶段”。
Tower Semiconductor :2026年5月13日公告——2027年硅光子代工收入预订额为13亿美元,其中预付款为2.9亿美元。
Coherent :积压订单达39亿美元,2026财年第三季度数据中心订单出货比超过4倍,AI光收发器季度收入超过10 亿美元。
三家公司,三个维度(最大客户预订量、CEO措辞、订单验证)——都指向同一个结果:供应无法满足需求。
“当行业内级别最高的首席执行官们直言不讳地说出‘严重的供需失衡’时,这就是一个信号。”
为何是2026年?
CPO的概念已经存在了8-10年。为什么它没有更早爆发,而突然在2026年爆发?
答案只有一个:英伟达的下一代架构将CPO从可选变为强制。
以下是英伟达GPU集群架构的飞跃:
目前的旗舰级GB300 NVL72 :72个GPU组成一个机架。机架内部,铜缆(NVLink+NVSwitch)负责几十厘米到几米的传输距离——铜缆完全够用。机架之间,可插拔的光模块负责几十米的传输距离——光模块是必需的。因此,在目前的GB300系统中,光模块仅用于机架间的传输。
新一代Rubin平台:AI集群可扩展至数百甚至数千个GPU,机架间的网络交换机成为新的瓶颈。Rubin首次在机架间网络交换机上引入CPO(可插拔光模块),取代了传统的可插拔光模块。这也是英伟达首次在其自有平台中正式采用 CPO。
下一代Feynman平台(预计2028年):CPO甚至可能进入机架内的GPU互连——这意味着光从“机架到机架”转移到“GPU到GPU”。
光线每向前移动一步,就离GPU近一毫米。Rubin是第一毫米,Feynman是第二毫米。
行业参与者正朝着同一个方向发展:
博通:于2025年10月向客户交付CPO产品(Tomahawk 5-Bailly 出货量超过50000台)—— CPO的商业化实际上领先于英伟达;
台积电:专门为CPO推出了COUPE 3D封装解决方案,Nvidia和Broadcom均采用了该方案;
Meta :在OFC 2026上证明,CPO比可插拔式更可靠、更便宜、更节能;
Coherent :在OFC 2026上展示了具有专有ELS的6.4T (32×200G) 槽型CPO。
爆炸式增长曲线如下——2026年CPO实际出货量为1.6亿美元(主要是样品和小批量)→ 高盛预测 2028年为910亿美元。
这是一条从零到千亿美元的爆炸式增长曲线,中间仅用了24个月。
“从1.6亿美元到910亿美元——只剩下24个月了。”
光学演化的三个阶段
光学器件取代铜器件并非一蹴而就,而是一个三波结构性变革的过程。每一波变革都让光线更接近GPU。
第一阶段:可插拔光模块(当前主流)。
它的外形尺寸与U盘大小相仿。一端插入服务器或交换机的背面,另一端连接光纤。GPU的电信号首先沿着主板上的铜线传输数十厘米,到达服务器背板上的光模块,在那里进行电光转换,然后通过光纤传输。目前的主流规格是800G,预计在2025-2026年将快速过渡到1.6T,并在2028年达到3.2T。
第二阶段:NPO近封装光学器件(2026年下半年)。
将光模块从服务器的后面板移到交换机内部,紧邻交换芯片。电信号路径从几十厘米缩短到几厘米。这是一种过渡形式——本质上,“光仍然在GPU外部”。
第三阶段:CPO共封装光学器件(2026-2028年产能爬坡)。
将光学元件直接置于GPU/交换芯片封装内部。电光转换距离从几十厘米缩短到几毫米。
关键在于:这三个阶段并非相互替代,而是相互叠加。CPO不会让可插拔光模块消失,而是开辟了一个全新的市场——超级节点内部以及GPU与GPU之间的超高密度互连。在机架之间以及数据中心之间,可插拔光模块仍然是主力军。
因此,更准确的描述是:三个浪潮并行发展——2026年可插拔1.6T交换机量产,2027年交换机CPO量产,2028 年Scale-Up网络全面光纤化。
“光线每向前移动一步,就离GPU近一毫米。CPO是最终目标。”
那么,为什么CPO终于可以从“未来愿景”走向“当下行动”?两项外部认可:
Meta 在2026年OFC展会上正式证明,CPO比可插拔式更可靠、更便宜、更节能——这是客户的直接认可;
在2026年的GTC大会上,英伟达将CPO技术写入了Rubin平台的参考架构。Feynman一代(2028年)甚至可能将CPO技术应用到机架内的GPU互连中。
当英伟达和 Meta 都用脚投票时,供应链上的其他企业也只能跟随。
完整供应链:六个层级
光互连供应链与GPU完全不同。
在GPU领域,英伟达几乎垄断了整个市场,AMD只能分到一小部分。但在光互连领域,分工极其细致,瓶颈也极其分散——而这恰恰是普通投资者蕴藏的机会所在。
整条链条从上到下分为六层:
第一层:平台架构师——系统集成商,包括英伟达、思科和博通等公司。他们定义整个人工智能数据中心的架构,为所有下层设定标准和外形尺寸。
第二层:光学元件和模块——构建完整光学系统的公司,例如 Lumentum、Coherent 和 AAOI。激光器、调制器、探测器、模块组装——完整的技术栈。
第三层:连接集成电路——数字信号处理器(DSP)、重定时器、CPO控制器。主要厂商包括博通、Marvell、Credo和Astera Labs。
第四层:晶圆代工和制造——这是最关键的一层。台积电提供硅光子集成电路 (PIC) 晶圆代工服务和硅芯片代工服务。Tower提供硅光服务。格罗方德 (GlobalFoundries) 也拥有硅光子器件生产线。稳懋半导体 (Win Semiconductor) 提供化合物半导体激光器晶圆代工服务。Fabrinet 提供光模块组装服务。
第五层:测试和高级封装— POET Technologies 和 AEHR Test Systems。
第六层:上游材料——衬底(SOI 采用 Soitec,InP 采用 AXT)、外延层(IQE)和光纤(康宁)。
这里有一个关键的认知点:光互连涉及两个完全不同的工艺生态系统:
DSP芯片:硅基芯片,台积电制造,博通/Marvell/Credo设计;
光芯片(激光器、调制器、探测器):采用 InP 或 GaAs 化合物半导体材料,在完全独立的生产线上生产,主要参与者包括 Lumentum、Coherent、AAOI、Sivers 和 Win Semi。
为什么光学公司不也生产数字信号处理器(DSP),或者数字信号处理器公司不也生产激光器呢?因为这两个过程就像心脏外科医生和脑外科医生——都是外科医生,但没有人会跨越学科壁垒。
光学工程师精通激光物理、光波导理论和量子阱结构。数字芯片工程师则精通逻辑电路和数字信号处理算法。他们的专业知识完全不重叠。台积电的整条生产线(设备、化学品、工艺参数)都是为硅设计的——InP根本无法在其上运行。
这种分散性恰恰为普通投资者提供了机会——因为没有哪一家公司能够“独占鳌头”,每个瓶颈都必须单独定价。
“在GPU领域,英伟达占据了绝对优势。而在光互连领域,瓶颈则非常分散——而这恰恰是各方争夺的焦点所在。”


