英伟达赢麻了,马斯克重磅宣布购买10万GPU打造最强超算中心

臻研厂
2024-05-28

事件

据硅谷科技媒体The Information报道称,今年5月,马斯克在向投资者演示时表示,xAI计划建造一台规格惊人的超级计算机。xAI需要部署10万个H100来训练和运行Grok的下一个版本,计划将所有芯片串联成一个巨大的计算机——马斯克称之为「超级计算工厂」(Gigafactory of Compute)。本文将结合近期xAI的一系列举措,梳理马斯克对Grok发展的计划。

xAI于4月疯狂融资,超算中心早有预兆

同样据The Information报道,埃隆·马斯克旗下的大型人工智能模型公司xAI在4月份完成最新一轮融资,红杉资本(Sequoia Capital)是此次融资的主要投资方之一。本次融资额达到60亿美元,公司投后估值高达180亿美元,预计将在两周内完成。xAI成立至今仅不到一年时间,就已接连获得了许多投资机构的青睐。

凭借这轮融资,xAI将成为继OpenAI、Anthropic、Cohere和Inflection等公司之后,人工智能大模型领域融资额最高的平台之一。这不仅标志着xAI在资金实力上的显著提升,也将成为整个大模型市场强有力的竞争者。

4月12日, xAI宣布推出了其首个具备多模态功能的模型——Grok 1.5 Vision,新模型不仅继承了前身强大的文本处理能力,还新增了处理各种视觉资料的功能,包括文档、图表、图解、屏幕截图和照片等,擅长多学科推理和理解物理世界的空间关系,在 x.AI的新 RealWorldQA 基准测试中优于同行。

资料来源:xai官网

这一轮融资的目的在现在看来已经不言而喻-xAI需要足够的芯片来确保Grok2的训练,在4月份他表示训练Grok 2需要大约2万个基于Hopper架构的英伟达H100 GPU,并补充说Grok 3模型及更高版本将需要10万个H100 芯片。

部署10万GPU主力Grok训练,大模型竞争日益疯狂

xAI 可能会与甲骨文合作开发这台超级计算机。xAI 一直在与甲骨文高管讨论在未来几年内可能花费 100 亿美元租用云服务器的问题。目前,xAI 已经从甲骨文租用了大约 1.6 万台 H100 芯片服务器,也是甲骨文此类芯片最大客户。

此外,也传出微软和 OpenAI 正在威斯康星州建设一个独立于价值1000亿美元的超级计算机的大型数据中心,竞争成本约为100亿美元;亚马逊网络服务正在亚利桑那州建设一些 AI 数据中心;扎克伯格今年1月曾经在Instagram上发帖,称Meta到今年底将再部署35万个H100,加上之前的算力总共相当于60万个H100。同时,Nvidia CFO已将 xAI 列入六家客户名单中,这些客户将与 OpenAI、亚马逊、谷歌等公司一起率先使用 Nvidia的下一代旗舰芯片 Blackwell。Nvidia在这次算力的PK中,再次受益良多。

除了算力的需求外,电力同样是大模型训练中的重要一环,xAI 的办公室位于旧金山湾区,据悉,拥有 10 万个 GPU 的数据中心可能需要 100 兆瓦的专用电力。这将比传统云计算中心所需的电力要多很多,与云提供商目前运行和建设的容纳多个集群的 AI 中心的能源需求相当,这些数据中心越来越多地建在偏远或非传统的地方,那里的电力更便宜,也更充足。

例如,微软和OpenAI除了计划那个耗资千亿美元的超算,也正在威斯康星州建造大型数据中心,建设成本约为100亿美元;亚马逊云服务的数据中心则选址在亚利桑那州。xAI一个非常可能的选址,是特斯拉总部,德克萨斯州奥斯汀市。去年特斯拉宣布建造的Dojo就部署在了这里。这台超算基于定制芯片,帮助训练AI自动驾驶软件,也可以用于向外界提供云服务。

另外,马斯克近日在VivaTech 2024科技创业大会上的一次访谈中提到,未来我们可能不需要工作——如果我们幸运的话,我们将不必担心缺少生活中的一切物品和服务,而是寻求生活的意义。一切事情交给AI来做,还重申了他之前签署的信件中的观点,即相信未来AI和大型语言模型的发展应暂停。但这一发言或许与他启动自己的AI实验室xAI以及深度集成的“最有趣的聊天机器人”Grok也有些自相矛盾。 @小虎征文 @爱发红包的虎妞 @Seven8 @话题虎 @小虎活动

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法