把回复其他帖子的内容再强调一遍。DeepSeek只是用了20%的PTX,为了提高通讯效率利用了CUDA的中间层汇编语言通讯而已,剩余的80%还是CUDA的高级语言。这个是量化和数学问题常用的方案。和所谓的“绕过”根本不是一回事。将来AI芯片的主要问题是GPU和ASIC的市场再分配。现在的波动只是暂时的,将来$英伟达(NVDA)$的财务数据会说明一切。
廉价的方案只会促进LLM的快速产品化,真正走进我们的生活,所以对各类芯片的需求只多不少。
同时关注$台积电(TSM)$ 芯片的制造短期内离不开他家。
精彩评论