【洞见AI液冷时代】技术破局——从风冷极限到液冷革命

港股解码
19:52

当我们在谈论AI的算力狂飙时,往往只关注芯片的晶体管数量,却忽略了它们正面临着“高烧不退”的物理极限。

正如浪潮通信副总经理曾经指出的,如果将几十台家用电暖器塞进一个冰箱大小的机柜里同时烤火,几分钟内产生的高温足以烧开一浴缸水。在AI大模型时代,这就是高算力集群面临的真实困境。

传统的“吹风扇”式风冷,在单机柜功耗突破40千瓦一路攀升至上百千瓦后,早已显得力不从心:不仅噪音震耳欲聋,还会导致芯片因过热而降频,白白浪费算力。

于是,“泡冷水”的液冷技术应运而生。本文作为专题的开篇,将深入剖析液冷技术为何能成为破局关键,并以英伟达(NVDA.US)最新的Vera Rubin平台为例,解读这场散热革命的颠覆性逻辑。

液体凭什么比空气“能打”?

空气的导热系数大约是0.024瓦每米每开尔文,常温清水导热系数约0.6,单纯静态的传导能力,风冷与液冷相差二十五倍。但实际设备循环换热场景下,水冷流体持续流动,综合换热效率更是风冷的上百倍。

换句话说,同等体积下,水承载、转移热量的能力远不是空气能比的。这就好比用扇子扇一块烧红的铁板,和把铁板直接浸入水中的区别——前者靠低速气流缓慢带走热量,后者依靠液体大面积紧密接触快速导走高温,散热效率天差地别。

传统风冷的基本逻辑是:风扇把冷空气吹过芯片表面的金属鳍片,热量从芯片传到鳍片,再被流动空气带走。整条链路存在芯片、金属鳍片、空气三层热阻,每一段都会产生热量损耗。

当AI芯片单机功耗突破一千瓦后,传统风冷就像用小风扇去冷却一台开足马力的重型发动机——散热速度根本追不上发热速度,极易出现降频、高温故障。

液冷则大幅缩短传热路径,规避多层热阻损耗。冷却液(多为水与丙二醇的混合防冻介质)直接流经紧贴处理器表面的冷板,在热源处就将热量“截胡”。好比把散热系统从“间接吹风”升级成了“直接导流”,效率提升不止一个数量级。

液冷还有几个隐形红利。一是大幅降低数据中心的能耗——去掉大量高速风扇和压缩制冷环节,电费支出会直观下降。二是消除机房持续轰鸣,设备故障率更低,运维环境从“工地”变成了“手术室”。三是液冷产生的余热可以回收给办公室供暖或用于农业温室——这不是科幻,已经在北欧一些数据中心变成了现实。

当然,液冷也分派别。冷板式是当前主流——冷却液在紧贴芯片的金属冷板内部流动,介质不直接接触电路板和电子元件,技术成熟、维护方便。

浸没式则更激进——将GPU主板整体浸泡在绝缘冷却液中,换热接触面积最大化,双相浸没方案的单芯片解热能力可突破3000W,是应对未来超功耗芯片的关键路径之一;缺点是整机改造、机房改造成本更高,单点维护复杂,短期更适合超大规模专属智算集群。

还有液态金属散热——依靠金属流体极致导热性能压缩热传导距离。目前该技术已初步实现商业化应用——波士顿材料的第一代液态金属产品已在千瓦级液冷ASIC与GPU中实现了超过10°C的冷却性能提升——但材料成本、密封防漏技术仍在持续优化中,大规模普及尚需时日。

此外,微通道均热板、金刚石复合热沉这类热界面材料,不算独立冷却方案,而是搭配冷板式液冷使用的配套导热升级部件。其中金刚石复合热沉已在国内超算中心实现规模化应用, $英伟达(NVDA)$ 下一代GPU也已确认采用该技术路线;微通道均热板技术已进入客户认证阶段,或有望在2026年下半年至2027年逐步导入量产。

45℃温水全液冷:英伟达Vera Rubin的散热破局

如果说上述液冷技术是渐进式的改良,那么英伟达在2026年6月的最新动作,则是一场面向未来的颠覆性重构。

2026年6月21日,英伟达官方博客发布重磅技术长文,正式宣告Vera Rubin新一代AI算力平台将全面迈入100%全链路液冷时代。这不仅是散热方案的升级,更是底层架构的彻底重构。

与上一代Blackwell平台仅GPU贴冷板(仅GPU和CPU采用冷板散热,但系统其他组件仍依赖风冷)的“半吊子”混合方案不同,Vera Rubin是全球首款真正意义上整机全部件液冷的AI服务器。从GPU、CPU到NVSwitch交换芯片、高速光模块乃至供电母线,全部接入密闭水循环管路,整机彻底取消所有散热风扇和通风孔。

这套方案中最具颠覆性的设计,是采用了45℃的温水冷却——比热水浴(通常38-40℃)还要热。

传统液冷往往需要大功率冷水机组将水温降至较低温度,而英伟达反常识地将进水标准拉升至45℃。由于水温每提升1℃,冷却系统能耗就能降低约4%,这种高温温水方案使得多数温带或亚热带地区的机房可以直接依靠室外干冷器进行自然散热,大幅减少甚至彻底砍掉高耗能的机械制冷机组。凭借这一突破,Vera Rubin架构能将机房PUE(电源使用效率)大幅降低(据第三方估算可降至1.15左右),实现算力与能效的跨越式提升。

英伟达用一套45℃的冷却液,为AI时代画出了一条新的温度线。这条线的一侧,是风冷的黄昏,另一侧则是液冷的黎明。而这条温度线所划出的,不仅是技术的分水岭,更是整个产业链价值重构的起点。

在本专题的下一篇中,我们将深入解读这一宣言对算力基建、服务器制造乃至国产替代带来的深层影响。

作者:吴言

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法