AI 硬件供应链全图谱:市场追逐的热点到底是什么?一文看懂【上】

最近跟朋友交流,他们都在跟我抱怨,现在市场热点太多了,每天都在像无头苍蝇一样乱碰。所以今天整理出了一整条完整的链路,文章比较长,我会分成上下发出来。

理解这条链,最好的方式是跟着一颗芯片走一遍。它的”一生”大致是这样:

① 设计(图纸):工程师先在 EDA 软件里画出电路、做仿真验证,结合外购的 IP(如 Arm 的 CPU 指令集),最终产出一套”版图”和光罩(掩膜)数据。这一步不碰任何硬件,产出的是”怎么造”的指令。

② 前道制造(把图纸变成晶体管):晶圆厂(台积电)拿一片高纯度硅片当画布,用光刻机(EUV/DUV)配合光刻胶、刻蚀、沉积、离子注入等上百道工序,一层一层把数百亿个晶体管”印”上去,最终在一整片晶圆上做出几十上百颗裸晶(die)。投入的原料是硅片、光刻胶、电子特气、CMP 抛光液和光罩。

③ 晶圆测试 / CP(先验货):晶圆还没切开,就要用探针机+探针卡扎到每颗 die 上做电性测试,挑出好的。业内叫”已知良好裸晶”(KGD)。为什么这么早就测?因为后面的封装极贵,绝不能把一颗坏 die 封进价值数万美元的成品里。

④ 存储的平行支线(HBM):与此同时,DRAM 厂(SK 海力士等)把多片 DRAM 裸晶垂直堆成 8/12/16 层,用 TSV(硅通孔)上下打通,做成 HBM 高带宽存储;HBM 也要测,确保已知良好堆叠(KGSD)。

⑤ 先进封装 / CoWoS(把 GPU 和 HBM 拼到一起):这是关键一步。把 GPU 裸晶和好几颗 HBM 一起,通过微凸点贴到一块”硅中介层”上。中介层是一块带超细线路和 TSV 的硅片,提供 GPU 与 HBM 之间极短、极密的互连,这直接决定了带宽。这个组合体再贴到下面的载板上。这套工艺就叫 CoWoS(Chip-on-Wafer-on-Substrate)。

⑥ 载板 / ABF(翻译成主板能用的样子):封装好的芯片有成百上千个引脚,间距极细,没法直接焊到普通电路板上。载板就是一块多层有机基板,把这些密集的 I/O 一层层”扇出”、转接到主板能接受的间距,同时承担供电和散热路径。它的核心绝缘材料就是 ABF 膜。

⑦ 终测 + SLT(成品再验一遍):封装好的成品用分选机送进测试机做终测(FT);复杂的 AI 大芯片还要做系统级测试(SLT),在接近真实负载下跑,并经过老化筛掉早夭品。

⑧ 板级组装:合格的芯片焊到 PCB 主板上,配上成千上万颗 MLCC(陶瓷电容)来稳定供电,做成 GPU 计算模组/计算板。

⑨ 系统集成(攒成服务器/机柜):计算板 + CPU + 网络交换芯片 + 光模块/铜缆 + 电源 + 散热,由 ODM(鸿海、广达等)组装成 AI 服务器,再叠成整机柜(如英伟达 GB300 NVL72)。

⑩ 数据中心(通电、组网、跑起来):机柜进数据中心,接上电力(800V 供电+液冷散热),用光模块/OCS 把成千上万张 GPU 组成一张网,开始跑训练和推理,吐出 token。

所以整个流转的过程是硅片 → 前道制造(裸晶) → 晶圆测试(KGD) →〔HBM 支线〕→ CoWoS 封装(GPU+HBM+中介层) → ABF 载板 → 终测/SLT → 板级组装(+MLCC) → 服务器/机柜(ODM) → 数据中心(供电+散热+组网)

芯片造好之后,运行时的”数据流”分三个尺度,正好对应三类互连:

GPU ↔ HBM(封装内,毫米级):靠硅中介层,这是先进封装要解决的;

GPU ↔ GPU(机柜内,米级):靠 NVLink 铜背板和高速铜缆,这是铜互连要解决的;

机柜 ↔ 机柜(数据中心内,几十到几百米):靠光纤,这是光互连要解决的。

距离越远,铜越扛不住、越要上光;距离越近,铜越省电越可靠。

整条供应链里封装、铜缆、光模块三个环节的存在与博弈,本质上都是在为”不同尺度的数据搬运”服务。

逐块拆解:每片拼图的壁垒与价值

下面的文章会围绕这 5个支点展开:

设计:英伟达约 80% 训练加速器份额、约 71% 毛利率、CUDA 生态护城河,Vera Rubin 2026 下半年量产;定制 ASIC(博通+迈威尔合计约 95% 协同设计份额)增速远超 GPU;

代工:台积电约 67% 代工营收、制造约 92% 先进 AI 芯片,营业利润率约 58%;HBMSK 海力士/三星/美光三足鼎立,2026 售罄、排单到 2027–2028;

设备:ASML 独家 EUV、毛利率约 53%;

软件:新思/楷登/西门子 EDA 垄断约四分之三市场。

板块 A:材料、硅片与 EDA(造芯片的原料和图纸,成熟寡头)

这是最上游的原料 + 图纸。

硅片是芯片的物理衬底,玩家有信越化学、SUMCO(日)+ 环球晶圆(台)+ Siltronic(德)的三家寡头;

光刻胶在曝光时充当感光成像介质,由 JSR、东京应化、信越、富士胶片、住友化学等日企掌握约九成 EUV 胶;

电子特气、CMP 抛光液服务于刻蚀、清洗、平坦化等工艺;

EDA 软件是设计芯片的工具,是新思、楷登、西门子三家天下。另外,Arm 提供 CPU 指令集 IP。

这些是结构稳定的日本/美国垄断带,壁垒在纯度与认证周期,国产替代多年只在成熟节点缓慢渗透。属于”稳”而非”快”的环节。

板块 B:封装与载板(全链最卡)

这一板块要解决两件事:第一,把 GPU 和 HBM 以最短距离、最高密度连起来,这决定了”喂数据”的带宽;第二,把脆弱、引脚密集的硅芯片”翻译”成一个能焊到主板、能供电、能散热的成品。

它分四层:

中介层与 CoWoS(先进封装本体)

CoWoS 的字面意思是”芯片-在晶圆-在基板上”。它先把 GPU 和多颗 HBM 用微凸点贴到一块硅中介层上,中介层是带 TSV 和超细布线的硅片,提供 die 之间的超密互连;再把这个整体贴到载板。

工艺有几种分支:CoWoS-S 用纯硅中介层(成熟但尺寸受限);CoWoS-L 用”重布线层(RDL)+ 局部硅桥(LSI)”拼接出更大的封装面积,英伟达 Blackwell 即采用此路线,但要应对大面板的”翘曲”难题;CoWoS-R 用 RDL 中介层。更先进的 SoIC 是把多颗 die 垂直 3D 堆叠(铜-铜直接键合)。(这些路径我之前专门写过)

台积电把 CoWoS 月产能从 2023 年底约 1.3 万片扩到 2026 年底约 12–13 万片(近十倍)仍售罄,英伟达一家预订了一半以上,台积电把部分工序外包给封测厂日月光(ASE)安靠(Amkor)

载板(IC/ABF substrate)

把封装好的芯片几千个密集 I/O 扇出、转接到 PCB 能焊接的间距,并承载供电。行业高度集中,前五约占 74%:欣兴(Unimicron)、揖斐电(Ibiden,历史上独供英伟达 GPU 载板)、新光电气(Shinko)、南亚电路板、奥地利 AT&S,再加景硕(Kinsus)、三星电机。台湾约占三成产能。

2026 年载板市场约 161 亿美元,高端 ABF 载板已售罄、龙头稼动率约九成,机构预计 2027 年缺口超 20%载板扩产周期长达 2.5–3 年(比 PCB 还长),大规模新产能要等到 2028–2029 年,价格在 2026 年以每季度约 3%–7% 的节奏温和上行。

ABF 膜(独家卡点)

ABF 是味之素堆叠膜(Ajinomoto Build-up Film)的缩写,这层绝缘树脂是高端载板的关键材料,由日本味之素一家独占,一家做味精的公司垄断了全球高端芯片载板的命脉材料,该业务营业利润率高达约 55%,计划 2030 年前增产约 50%

玻纤布(T-glass,卡脖子的卡脖子)

载板内部要用特种玻纤布做骨架增强,约七成 T-glass 流向 ABF 载板,主要供应商是日本日东纺(Nittobo)、台玻(TGI)和中国大陆玻纤厂商。

机构判断 T-glass 短缺持续到 2027 年、缺口在 2026 年见顶。再往上的覆铜板(CCL)、铜箔、玻纤纱也都在涨价、交期拉长

玻璃基板(下一代基板/中介层)

这是 2026 年从研发跨入试产+客户认证的暗马。

它的逻辑是用玻璃芯替代现在的有机(ABF)芯做载板,或者用玻璃中介层替代昂贵且尺寸受限的硅中介层

玻璃的优势是平整度、热稳定性、尺寸稳定性更好,可以做成更大的矩形面板(提升面积利用率)、支持更高层数和更大封装,并用 TGV(玻璃通孔)替代 TSV。难点是玻璃易裂,以及检测困难。玻璃透明反光,让传统的自动光学检测(AOI)几乎失效,反而催生新的检测设备需求。

玩家正在快速卡位:

Absolics(SKC 子公司)在美国乔治亚州建成全球首座玻璃基板量产厂,已向 AMD 送样进入认证,目标年底实现全球首个商用量产,母公司 SKC 把超 6000 亿韩元注入它;

英特尔投入超 10 亿美元,2026 年初展示了 EMIB + 玻璃芯样品(号称无微裂),目标 2030 年标准化;

三星电机在世宗试产、2027 年后量产,依托其显示面板的玻璃工艺积累;

台积电把面板级封装命名为 CoPoS(Chip-on-Panel-on-Substrate,310×310mm),试产线 2026 年落地、量产看 2028–2029,并与康宁台湾厂合作;

日本 DNP、凸版和中国 BOE 也在推进。上游材料是康宁、AGC、NEG,TGV 激光设备是 LPKF、Disco。

玻璃基板很特殊,它既是对 ABF 载板厂的长期替代威胁,又是台积电/英特尔争夺的下一代护城河

整个封装板块整体呈一层卡一层:CoWoS 卡产能、载板卡产能与扩产周期、ABF 膜与玻纤布卡材料;受益面从台积电一路延伸到日月光/安靠、欣兴/揖斐电/南电,乃至味之素、日东纺这种卖味精、卖玻璃布的隐形冠军。

板块 C:存储与被动元件(HBM 上游/测试与 MLCC)

HBM 的制造与上游

HBM 是把多片 DRAM 裸晶垂直堆叠(8/12/16 层),用 TSV(硅通孔)把上下层打通,底部放一颗逻辑基底 die 负责与 GPU 通信。

最难的工序是堆叠键合:SK 海力士用 MR-MUF(批量回流模塑底填),良率和散热占优,是它领先的关键;三星用 TC-NCF(热压非导电膜);到 HBM4 的 16 层,行业开始转向混合键合(hybrid bonding,无凸点的铜-铜直接键合)以堆得更高更薄。

相关设备由 BESI、ASMPT、韩国 Hanmi 等供应。HBM 测试则是新瓶颈:必须保证”已知良好堆叠”(KGSD),任何一层坏了整堆报废,还要测极高速接口,这把测试难度和成本推上了新台阶(见后文)。

MLCC / 陶瓷电容(即陶瓷薄膜)

MLCC 是叠层陶瓷电容,贴在 GPU 封装和计算板上做去耦和储能。GPU 在做矩阵运算时电流会瞬间剧烈波动,MLCC 就近储存并释放电荷、平滑电压、滤除噪声。没有它,供电电压会瞬间塌陷、芯片直接出错。

AI GPU 功耗高、工作电压低(不到 1V)、电流瞬变剧烈、供电轨道多,因此一块 GB200 计算板要用上万颗 MLCC,而且要求高容值、低寄生电感(低 ESL)、小尺寸(0201/01005)、耐高温车规级。

玩家是日系主导高端:村田(Murata,全球第一)、太阳诱电、TDK,加上韩国三星电机、台湾国巨与华新科。英伟达 800VDC拉动的是量增 + 规格升级双击,逻辑清晰,属已被充分认知的环节。

(3)连接器与高速铜缆(铜互连)(这部分就简单过一下)

在机柜内部和机架内(米级短距离),用铜缆传数据比光更省电、更便宜、更可靠,所以英伟达 NVLink 的机柜内 scale-up 大量用铜背板和高速铜缆(DAC/ACC)+连接器。这就是前面说的”铜与光分工”里铜的一侧。

玩家有安费诺(Amphenol,AI 连接器最大赢家)、泰科电子(TE)、立讯精密。

其实有的环节还有很多细分,但是篇幅原因,我就不在这里一一展开。下一篇文章讲光互连与光模块、散热与液冷、设备厂等几个环节。

$特斯拉(TSLA)$ ROUNDHILL GENERATIVE AI & TECHNOLOGY ETF(CHAT) $通用人工智能 ETF-AGIX(AGIX)$

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论