GPU是AI算力最优解吗,还有哪些公司能打破英伟达垄断地位?

个人认为英伟达的GPU未必是算力最优解,但在当前阶段是效费比最优解,而天下事怕就怕成本二字。

GPU

X86架构能成为桌面主流,ARM能成为移动端主流是因为它们是算力最优解吗?

电动车能成为新能源主流,难道是因为电动车是新能源最优解吗?

以英伟达GPU为人工智能的算力支撑,除了英伟达的高性能GPU本身在算力方面的优势外,还有一个很重要的原因在于英伟达GPU是目前唯一可以持续稳定廉价且足量供应的优质算力工具,你别看A100显卡动不动大几万,H100动不动几十万,但这已经是目前最廉价的优质算力解决方案了,比它能算的方案比它贵出一大截,比它便宜的方案远远没它能算,说白了英伟达GPU的效费比是最好的,你其实根本就没得选。

之所以英伟达GPU会成为人工智能最具效费比的算力工具,这和人工智能最初的诞生环境有关。

人工智能

目前人工智能训练的基础大纲是反向传播算法,基于这套算法的梯度优化是人工智能训练的主流技术路径,反向传播算法之父辛顿在最初设计这套算法的时候,就是用英伟达的游戏显卡作为算力工具的,这导致这套算法和英伟达GPU具有天然的适配性,相当于是娘胎里带出来的优势,就像你问中国人为什么说中国话说的那么好,我怎么知道,从小在那么个环境里长大,说着说着自然就说的好了。

这种高适配性带来的优势就是高效费比,可以近似的理解为早年的主机游戏通过手工调整代码让游戏程序更适配于主机硬件,这让主机游戏可以在硬件参数逊于同时代PC的情况下,通过更好的适配性,让游戏的画面表现打平乃至超越同时代的PC。

这个道理其实国内也有人懂,当年百度和谷歌竞逐招募辛顿时,除了开出的价码比谷歌高外,还承诺在辛顿采购硬件上给予大量照顾,特别是辛顿孜孜以求的显卡。

另一方面英伟达在人工智能领域布局多年,其硬件的设计方案在数年前就针对人工智能的使用场景进行了针对性优化,连带着整个产业设计思路也越来越“亲人工智能化”,就连游戏硬件都开始引入深度学习超级采样技术来改善画面表现,实现了人工智能对游戏硬件的反哺,再加上游戏显卡和数据中心两大关键业务摊薄了相关研发成本,在进一步提高了和人工智能算法的适配性的同时还进一步降低了成本,效费比再次提升。

至于英伟达常年深耕半导体供应链带来的全产业链成本优势,更是毋庸多言,工业化的优势并非制造单一高技术产品——那是手工业的优势——恰恰在于批量提供质量稳定成本低的量产产品。

企业为啥要做人工智能?为了赚钱,因此效费比最高的方案哪怕不是技术最优解,也是现实最优解。

随着人工智能的逐步迭代和英伟达针对迭代后的人工智能的针对性硬件设计,这种效费比优势只会增加而不会减弱,因为它是一个标准的帕累托改进过程,是一个越滚越大的雪球:高适配性→高性能→高效费比→高应用量→高利润→高改进→高适配性。

这注定了其它任何后来者在检索所有技术路线后会发现,最优解就是去把英伟达已经走过的路再原模原样的走一遍。

领先这个东西,是一步快,步步快,落后也一样,一步慢,步步慢。

AI

所以,只有财大气粗的大佬才能玩这个游戏。

据我有限的了解,真正能够挑战 NV 霸主的只有三家公司:Google 、Intel 和 华为。只有这三家可以软硬件协同设计,并且能够推动整个生态。

Google 的 TPU,设计时融入了大量工程师思维,性能很强,大量的网络互联设计,配合自家 TF、JAX 和 XLA。但是 TPU 普及不好,只有 Google Cloud Platform 上有,colab 可以白嫖,但用户量总体有限。TPU 本身部署有限 + TF被喷屎一样的API + JAX学习曲线陡峭。TPU 前途貌似也不是很明朗。当然TF和JAX用好之后,性能还是很出色的。要不是 Google 的光环效应,我真担心 TPU 的市场。

华为 的 升腾。21年我一直在研究升腾(Ascend)。芯片本身算力很高,HBM内存,每张卡上自带一个 RoCE RDMA网卡,用于多机通信。华为从软硬件上投入了大量精力,提供了 CANN(对标CUDA),深度学习编译器、集合通信库 hccl。一方面是后来者,要追赶,硬件上设计还不是特别完善;另一方面美国打压,新一代芯片量产难度大;CANN的软件栈只有华为一家在玩,生态还不行,网上资料少,小白用户入门难度大;再有 MindSpore 是国产框架,推向世界的难度大,易用性等各方面还有待完善。但总的来说,已经超过很多同类了。

Intel 是芯片的老玩家,他们的数据中心产品很强,曾经什么都自己做:傲腾内存、Omni-Path高速网络,以及 GPU。但真正经得住市场检验的只有 CPU,而且 CPU 现在也四面楚歌。现在通过收购或者自研,新做了不少深度学习芯片产品线,能不能突围,还有待进一步观察。

无论是 Google、华为、Intel、还是 Graphcore、每家公司都想做生态,但是这些公司做到最后,实际还是自己一家玩。

所以, NVIDIA 最牛的是有生态布局,拥抱开源。现在开源社区离不开 NVIDIA,那 NVIDIA 可以继续卖硬件。

至于国产的其他公司,没有一个公司敢像华为站出来明确搞自研、搞国产化。为啥?分分钟被美国搞死。华为被美国打压,就是活生生的案例。所以大家只能悄悄地做生态。那么问题来了,悄悄滴能做得起生态么......

$AI(BK4543)$ $英伟达(NVDA)$ $上证指数(000001.SH)$

# 英伟达破万亿!C3.ai财报能否助燃AI?

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论12

  • 推荐
  • 最新
  • 伟大复兴壹号
    ·2023-05-29
    精彩
    显卡通过游戏完成了原始积累,现在靠ai业务就能养活自己,并且成为下一次技术革命的基础设施。而我们还在焦虑这个月的游戏版号怎么还没下来$上证指数(000001.SH)$
    回复
    举报
    收起
    • 抓紧麻袋
      一句话:自然演化,并非优者生存,而是适者生存
      2023-05-29
      回复
      举报
  • 作手蓝海
    ·2023-05-29
    精彩
    我认为最重要的原因还是在于生态,诸多引擎都是围绕英伟达的微架构进行优化的,有些不仅是优化的问题,是离了英伟达就根本跑不动的问题
    回复
    举报
    收起
    • 股侠钟超
      省流: 1:纸面实力=ppt实力 2 督战
      2023-05-29
      回复
      举报
  • 羊掌舵人
    ·2023-05-29
    精彩
    能设计出来的芯片不一定做的出来,难还是难在上游代工,工艺才是那座无法跨越的大山。
    回复
    举报
  • 天玑量化
    ·2023-05-29
    与其说是DSA已死,不如说是传统GPU已死。DSA联合CPU,披着GPGPU的前端占据了AI云计算领域的头把交椅,训练则要仰仗一众精简核心CPU,而不是传统GPU的渲染单元。甚至CUDA生态也有众核CPU的味道,跟传统GPU并不相同。如果体系架构量化分析让位于文字争议,就会形如java和php哪个好的辩论。DSA和GPGPU本来就有各自优势场景,不同流派思路只是侧重点不同,大家开心就好。
    回复
    举报
  • 优不优其实问题不大,相对于获客成本,在AI芯片上差一些性能多一些成本都是小事,重要的是,英伟达能做到的你必须都能做到,这一点还是挺难的。
    回复
    举报
  • 宁宁梦
    ·2023-05-29
    “英伟达帝国的一道裂缝”……点进去一看……居然在说TPU和各家互联网的自研芯片,这要是算裂缝,已经裂开七八年了,NV的地位倒是越裂越稳固了。
    回复
    举报
  • 不轻易上车
    ·2023-05-29
    事实垄断企业自己会摆烂,从英伟达这几年消费显卡的更新就能看的出来。
    回复
    举报
  • 青云栈道
    ·2023-05-29
    凡事不谈成本不谈性价比,还是市场化程度不够
    回复
    举报
  • 无聊追踪者
    ·2023-05-29
    另外几家竞争对手,根本就是摆烂的样子。
    回复
    举报
  • 一猫胜三虎
    ·2023-05-29
    已阅
    回复
    举报