虎虎夺食
03-19
老黄,人形钢铁侠
现场直击GTC|最科幻发布会,性能翻30倍的恐怖Blackwell芯片,黄仁勋宣告“新工业革命”来了
“AI界春晚”来了,聚焦英伟达GTC2024
英伟达于美国时间3月18~21日在圣荷西会议中心举行2024年度GTC大会,CEO黄仁勋登台发表谈话并发布新产品。本届GTC是时隔5年后首次线下举行,已成为公认的“AI风向标”。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
分享至
微信
复制链接
精彩评论
我们需要你的真知灼见来填补这片空白
打开APP,发表看法
APP内打开
发表看法
1
{"i18n":{"language":"zh_CN"},"detailType":1,"isChannel":false,"data":{"magic":2,"id":285867938152624,"tweetId":"285867938152624","gmtCreate":1710810394050,"gmtModify":1710810395870,"author":{"id":3506039362500508,"authorId":3506039362500508,"authorIdStr":"3506039362500508","name":"虎虎夺食","avatar":"https://static.tigerbbs.com/e86eafee011fc9c49dcbe948ef450768","vip":1,"userType":1,"introduction":"","boolIsFan":false,"boolIsHead":false,"crmLevel":1,"crmLevelSwitch":0,"individualDisplayBadges":[],"starInvestorFlag":false},"themes":[{"themeId":"f928058a14024f3cbe9f3e0312e7e174","categoryId":"2929bb7468f5415f853fd96fb35d7c3b","name":"“AI界春晚”来了,聚焦英伟达GTC2024","type":2,"rnLink":"https://laohu8.com/RN?name=RNTheme&page=/theme/special/finance&rndata={\"themeId\":f928058a14024f3cbe9f3e0312e7e174}&rnconfig={\"headerBarHidden\": true}","description":"英伟达于美国时间3月18~21日在圣荷西会议中心举行2024年度GTC大会,CEO黄仁勋登台发表谈话并发布新产品。本届GTC是时隔5年后首次线下举行,已成为公认的“AI风向标”。","image":"https://static.tigerbbs.com/025bb689cb28861f14b915b2e2904739"}],"images":[],"coverImages":[],"html":"<html><head></head><body><p>老黄,人形钢铁侠</p></body></html>","htmlText":"<html><head></head><body><p>老黄,人形钢铁侠</p></body></html>","text":"老黄,人形钢铁侠","highlighted":1,"essential":1,"paper":1,"likeSize":1,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/285867938152624","repostId":1175744569,"repostType":2,"repost":{"id":"1175744569","pubTimestamp":1710807397,"share":"https://www.laohu8.com/m/news/1175744569?lang=&edition=full","pubTime":"2024-03-19 08:16","market":"us","language":"zh","title":"现场直击GTC|最科幻发布会,性能翻30倍的恐怖Blackwell芯片,黄仁勋宣告“新工业革命”来了","url":"https://stock-news.laohu8.com/highlight/detail?id=1175744569","media":"硅星人Pro","summary":"2024年3月18日的GTC上,黄仁勋正式成了新的乔布斯。在一段预热片后,黄仁勋上台。可能是人类历史上最科幻的一场发布会。是时候该发布重要芯片了。这是Hooper后的新一代架构,以数学家Blackwell命名。在性能上,它就是黄仁勋“黄氏定律”的集大成者和奠基者。如今,使用2000个Blackwell GPU就可以完成相同的任务,同时仅消耗4兆瓦的电力。“新的工业革命来了。”","content":"<html><head></head><body><p>2024年3月18日的GTC上,黄仁勋正式成了新的乔布斯。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/0ad4878c713044b91b612209f31db144\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>当天下午黄仁勋走上台开始演讲,而这次与以往都不同。这场发布会在SAP中心进行,人们在百米长的队伍里要经过两个小时地检票和等待,里外里转好几道弯,才进到演讲会场。这里是硅谷很多演唱会和演出的举办地,占地4.2万平方米,曾举办过滚石和Bon Jovi 演唱会、美国NHL全明星赛,而现在站在舞台中央的是黄仁勋,他让现场的许多开发者想到了乔布斯。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b2471af90907fe5a06b557eb49e5a1f5\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>在一段预热片后,黄仁勋上台。背景停留在“我是AI”的界面。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/ad088b2702c6e9876ae33c1ad8e4dfda\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"462\"/></p><p>“希望大家意识到这不是一场演唱会。你来到的是个开发者大会。”黄仁勋说。这是一场只有模拟而没有动画的发布会。他说。这也让后来整场发布会越来越像科幻片。可能是人类历史上最科幻的一场发布会。</p><p>“今天抵达GTC现场的公司们价值1 trillion。这么多伙伴,需要这么多的算力,怎么办?我们需要大得多的GPU。把所有GPU 连接起来,成千上万个大的GPU里是成千上万小的GPU, 百万个GPU让你的效率提升!”</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/dbe8c3a02c314c5b1fbb98022b57adc7\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"810\"/></p><p>然后他简单回顾了一下AI的发展历史,“20年前我们就看到了它会到来”。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/593a4aa88e39e8e5fa817f84a0eb55cb\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>“然后CUDA和AI做了第一次亲密接触。”他说。“06年推出CUDA的时候,我们以为这是革命性的,会一夜成功,结果一等就等了二十年!”</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/bc281db41346afe32a2418250dd7f57b\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>“今天的一切都是homemade。”在一个个通过AI模拟出来的酷炫的视频后,一切铺垫就绪了——<a href=\"https://laohu8.com/S/NVDA\">英伟达</a>就是这一切进步的基石。是时候该发布重要芯片了。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/9384bb23b9b630721b457f7f74abd157\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"727\"/></p><p><strong>人们对此有预期,但当B200出现的时候,现场(可能包括全世界围观者)都还是忍不住惊呼。</strong></p><p><strong>这是Hooper后的新一代架构,以数学家Blackwell命名。在性能上,它就是黄仁勋“黄氏定律”的集大成者和奠基者。</strong></p><p>以下是我用AI总结的<strong>Blackwell GPU</strong>的性能特点:</p><ol start=\"1\" style=\"\"><li><p><strong>高AI性能</strong>:B200 GPU提供高达20 petaflops的FP4计算能力,这是由其2080亿个晶体管提供的。</p></li><li><p><strong>高效推理</strong>:当与Grace CPU结合形成GB200超级芯片时,它能在LLM推理工作负载上提供比单个GPU高出30倍的性能,同时在成本和能源消耗上比H100 GPU高出25倍。</p></li><li><p><strong>训练能力</strong>:使用Blackwell GPU,训练一个1.8万亿参数的模型所需的GPU数量从8000个减少到2000个,同时电力消耗从15兆瓦降低到仅四兆瓦。</p></li></ol><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b3af4a432a7d5f323083856439bd0884\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><ol start=\"4\" style=\"\"><li><p><strong>GPT-3性能</strong>:在GPT-3 LLM基准测试中,GB200的性能是H100的七倍,训练速度提高了4倍。</p></li><li><p><strong>改进的Transformer引擎</strong>:第二代Transformer引擎通过使用每个神经元的四位而不是八位,实现了计算、带宽和模型大小的翻倍。</p></li><li><p><strong>下一代NVLink开关</strong>:允许多达576个GPU之间进行通信,提供每秒1.8太比特的双向带宽。</p></li><li><p><strong>新的网络交换芯片</strong>:拥有500亿晶体管和3.6 teraflops的FP8计算能力,用于支持大规模GPU集群的通信。</p></li><li><p><strong>扩展性</strong>:Nvidia的系统可以扩展到数万个GB200超级芯片,通过800Gbps的Quantum-X800 InfiniBand或Spectrum-X800以太网连接。</p></li></ol><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/95e8d69b11574a3dd3fcef4643d28503\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"607\"/></p><ol start=\"9\" style=\"\"><li><p><strong>大规模部署</strong>:GB200 NVL72设计可以将36个CPU和72个GPU集成到一个液冷机架中,提供总共720 petaflops的AI训练性能或1.4 exaflops的推理性能。</p></li><li><p><strong>支持大型模型</strong>:单个NVL72机架可以支持高达27万亿参数的模型,而且有意思的是,黄仁勋似乎透露了一下GPT-4的参数,它可能是一个约1.7万亿参数的模型。</p></li></ol><p>(更多关于B200的解读我们会在今天稍晚带来,欢迎关注硅星人GTC后续报道)</p><p>黄仁勋回顾了自己送给OpenAI的第一个DGX,它只有0.17Peataflops,而今天的DGX Grace-Blackwell GB200已经超过1 Exaflop的算力。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/36c1a9edada700d12dbc7b59884b6321\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"607\"/></p><p>老黄站在这张图前讲了半天,这画面让你觉得摩尔定律可能真的死了,黄氏定律正式登基。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/70bf1f2012506e5f2b856e62e645f347\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>在B200的发布后,黄仁勋用一个AI生成的模拟短片介绍了“配套”的一系列产品,从集群到数据中心的交换机等。基本都是性能怪兽。</p><p>GB200超级芯片就是将两个B200 GPU与一个Grace CPU结合在一起,它能将成本和能源消耗比 H100降低多达25倍”。黄仁勋表示自己可得拿稳了,“这块很贵,可能100亿?不过以后会便宜的。”现场爆笑。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/1a2ca2107735a99293d85395ad7a1d0a\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>与此同时,他也强调了新一代芯片和相关产品在能耗上的改进。之前训练一个1.8万亿参数的模型需要使用8000个Hopper GPU和15兆瓦的电力。如今,使用2000个Blackwell GPU就可以完成相同的任务,同时仅消耗4兆瓦的电力。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/ba1166abc5a005cdb4a3b49634497049\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>黄仁勋说,英伟达还正在将它们打包成更大的设计,比如GB200 NVL72,把36个CPU和72个GPU集成到一个单一的液冷机架中,提供总共720 petaflops 的AI训练性能或1440petaflops的推理性能。它内部有近乎两英里的电缆,包括5000条独立电缆。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/192ea44faa769071c32a67b5a61ffb9f\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>此外他也特意强调了推理性能的提升,毕竟英伟达最新的财报已经显示,它的收入越来越多的来自客户们在AI推理部分的支出。主要的云厂商也都被点名表扬了一下,他们和英伟达越来越不可分离。</p><p>软件方面, 黄仁勋介绍到,英伟达正在打包预训练模型及其附属延伸,并简化了称为NVIDIA推理微服务(NIMS)的微服务部署。这不仅仅是之前的CUDA,而是让模型更易于实施和管理的平台。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/58189071662d587e3342beeb8cddff1d\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>“你现在就可以下载,带走,安装在你自己的数据中心”,他说道。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/593a4aa88e39e8e5fa817f84a0eb55cb\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>并且NVIDIA提供服务帮助企业和应用程序对模型进行微调或定制。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b49116c0058c2d89ea3fea21c7c7b247\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>在罗列了一系列在气象和科学上的合作后,黄仁勋开始进入关于<a href=\"https://laohu8.com/S/300024\">机器人</a>技术的部分,这场发布会开始变得更加科幻。</p><p>黄仁勋说,英伟达正在押注的下一代产品是能够控制人形机器人。Jetson Thor 就是接替NVIDIA Jetson Orin,为机器人技术推出的更新产品。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/34120726203b60f18503062c7cd4e0bf\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>“确实,世界是为人类设计的,所以我们希望使用英伟达Thor芯片和GR00T软件来训练和管理新一代的人形机器人。这样的机器人将能更好地适应人类设计的环境和工作流程,从而在多样的任务和场景中提供帮助。”</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/e77a737fb31a5f3a107f03165fa97879\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"607\"/></p><p>机器人展示视频过后,舞台灯光再次亮起时,黄仁勋与身后所有由公司提供动力的人形机器人站在一起,向观众致意。不知为什么有种钢铁侠的意思~</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/7c0885c7dfd678b8196ab244e1794efd\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>还领上来两个在NVIDIA Isaac SIM中学会走路的<a href=\"https://laohu8.com/S/DIS\">迪士尼</a>小型机器人。黄仁勋说话时它们一直扭扭捏捏,让老黄不得不低头怜爱地低声说:“Orange(小机器人的名字),我在努力专心!不要再拖延时间了”——超级可爱,把现场气氛推向高潮。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/aae2c12c24dd4b962d2a9a28a5cda447\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>而在黄仁勋和这两个小机器人一起“打开”的谢幕视频里,一架微型小飞船飞过英伟达历代GPU产品、架构,在光缆中完成了技术巡礼,最后飞机舱门不经意的打开,驾驶员正是黄仁勋的卡通虚拟数字人。</p><p>主题演讲结束前,黄仁勋又总结了一遍今天的发布会,而近距离镜头可以看到,黄仁勋似乎有些带着泪光。</p><p>“如果你问我,心目中的GPU是什么样子,今天的发布就是我的答案。”</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/daf290a8c3dc9061e98dee51cbf3d82e\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>他说今天他展示了什么是英伟达的灵魂。“我们站在计算科学和物理等其他一切科学的交叉点”。这是他心里英伟达的定位。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/188d807c31cd9f1e61f251c11078c9a4\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p>“新的工业革命来了。”而他没说的,是藏在今天一堆PPT里某一张的那行小字——英伟达,新工业革命的引擎。</p><p>这是黄仁勋的时代了。</p></body></html>","source":"lsy1694483538611","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>现场直击GTC|最科幻发布会,性能翻30倍的恐怖Blackwell芯片,黄仁勋宣告“新工业革命”来了</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n现场直击GTC|最科幻发布会,性能翻30倍的恐怖Blackwell芯片,黄仁勋宣告“新工业革命”来了\n</h2>\n\n<h4 class=\"meta\">\n\n\n2024-03-19 08:16 北京时间 <a href=https://mp.weixin.qq.com/s/wVS2O2l4yPq_h5zUZt72bw><strong>硅星人Pro</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>2024年3月18日的GTC上,黄仁勋正式成了新的乔布斯。当天下午黄仁勋走上台开始演讲,而这次与以往都不同。这场发布会在SAP中心进行,人们在百米长的队伍里要经过两个小时地检票和等待,里外里转好几道弯,才进到演讲会场。这里是硅谷很多演唱会和演出的举办地,占地4.2万平方米,曾举办过滚石和Bon Jovi 演唱会、美国NHL全明星赛,而现在站在舞台中央的是黄仁勋,他让现场的许多开发者想到了乔布斯。在...</p>\n\n<a href=\"https://mp.weixin.qq.com/s/wVS2O2l4yPq_h5zUZt72bw\">Web Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/9384bb23b9b630721b457f7f74abd157","relate_stocks":{"LU0640476718.USD":"THREADNEEDLE (LUX) US CONTRARIAN CORE EQ \"AU\" (USD) ACC","IE00BJJMRX11.SGD":"Janus Henderson Balanced A Acc SGD","LU0417517546.SGD":"Allianz US Equity Cl AT Acc SGD","IE00B1XK9C88.USD":"PINEBRIDGE US LARGE CAP RESEARCH ENHANCED \"A\" (USD) ACC","LU0080751232.USD":"富达环球多元动力基金A","LU0079474960.USD":"联博美国增长基金A","BK4592":"伊斯兰概念","LU0127658192.USD":"EASTSPRING INVESTMENTS GLOBAL TECHNOLOGY \"A\" (USD) ACC","NVDA":"英伟达","LU0109391861.USD":"富兰克林美国机遇基金A Acc","BK4527":"明星科技股","IE0009356076.USD":"JANUS HENDERSON GLOBAL TECHNOLOGY AND INNOVATION \"A2\" (USD) ACC","LU0056508442.USD":"贝莱德世界科技基金A2","BK4543":"AI","LU0234570918.USD":"高盛全球核心股票组合Acc Close","IE00BKDWB100.SGD":"PINEBRIDGE US LARGE CAP RESEARCH ENHANCED \"A5H\" (SGDHDG) ACC","BK4529":"IDC概念","GB00BDT5M118.USD":"天利环球扩展Alpha基金A Acc","LU0348723411.USD":"ALLIANZ GLOBAL HI-TECH GROWTH \"A\" (USD) INC"},"source_url":"https://mp.weixin.qq.com/s/wVS2O2l4yPq_h5zUZt72bw","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"1175744569","content_text":"2024年3月18日的GTC上,黄仁勋正式成了新的乔布斯。当天下午黄仁勋走上台开始演讲,而这次与以往都不同。这场发布会在SAP中心进行,人们在百米长的队伍里要经过两个小时地检票和等待,里外里转好几道弯,才进到演讲会场。这里是硅谷很多演唱会和演出的举办地,占地4.2万平方米,曾举办过滚石和Bon Jovi 演唱会、美国NHL全明星赛,而现在站在舞台中央的是黄仁勋,他让现场的许多开发者想到了乔布斯。在一段预热片后,黄仁勋上台。背景停留在“我是AI”的界面。“希望大家意识到这不是一场演唱会。你来到的是个开发者大会。”黄仁勋说。这是一场只有模拟而没有动画的发布会。他说。这也让后来整场发布会越来越像科幻片。可能是人类历史上最科幻的一场发布会。“今天抵达GTC现场的公司们价值1 trillion。这么多伙伴,需要这么多的算力,怎么办?我们需要大得多的GPU。把所有GPU 连接起来,成千上万个大的GPU里是成千上万小的GPU, 百万个GPU让你的效率提升!”然后他简单回顾了一下AI的发展历史,“20年前我们就看到了它会到来”。“然后CUDA和AI做了第一次亲密接触。”他说。“06年推出CUDA的时候,我们以为这是革命性的,会一夜成功,结果一等就等了二十年!”“今天的一切都是homemade。”在一个个通过AI模拟出来的酷炫的视频后,一切铺垫就绪了——英伟达就是这一切进步的基石。是时候该发布重要芯片了。人们对此有预期,但当B200出现的时候,现场(可能包括全世界围观者)都还是忍不住惊呼。这是Hooper后的新一代架构,以数学家Blackwell命名。在性能上,它就是黄仁勋“黄氏定律”的集大成者和奠基者。以下是我用AI总结的Blackwell GPU的性能特点:高AI性能:B200 GPU提供高达20 petaflops的FP4计算能力,这是由其2080亿个晶体管提供的。高效推理:当与Grace CPU结合形成GB200超级芯片时,它能在LLM推理工作负载上提供比单个GPU高出30倍的性能,同时在成本和能源消耗上比H100 GPU高出25倍。训练能力:使用Blackwell GPU,训练一个1.8万亿参数的模型所需的GPU数量从8000个减少到2000个,同时电力消耗从15兆瓦降低到仅四兆瓦。GPT-3性能:在GPT-3 LLM基准测试中,GB200的性能是H100的七倍,训练速度提高了4倍。改进的Transformer引擎:第二代Transformer引擎通过使用每个神经元的四位而不是八位,实现了计算、带宽和模型大小的翻倍。下一代NVLink开关:允许多达576个GPU之间进行通信,提供每秒1.8太比特的双向带宽。新的网络交换芯片:拥有500亿晶体管和3.6 teraflops的FP8计算能力,用于支持大规模GPU集群的通信。扩展性:Nvidia的系统可以扩展到数万个GB200超级芯片,通过800Gbps的Quantum-X800 InfiniBand或Spectrum-X800以太网连接。大规模部署:GB200 NVL72设计可以将36个CPU和72个GPU集成到一个液冷机架中,提供总共720 petaflops的AI训练性能或1.4 exaflops的推理性能。支持大型模型:单个NVL72机架可以支持高达27万亿参数的模型,而且有意思的是,黄仁勋似乎透露了一下GPT-4的参数,它可能是一个约1.7万亿参数的模型。(更多关于B200的解读我们会在今天稍晚带来,欢迎关注硅星人GTC后续报道)黄仁勋回顾了自己送给OpenAI的第一个DGX,它只有0.17Peataflops,而今天的DGX Grace-Blackwell GB200已经超过1 Exaflop的算力。老黄站在这张图前讲了半天,这画面让你觉得摩尔定律可能真的死了,黄氏定律正式登基。在B200的发布后,黄仁勋用一个AI生成的模拟短片介绍了“配套”的一系列产品,从集群到数据中心的交换机等。基本都是性能怪兽。GB200超级芯片就是将两个B200 GPU与一个Grace CPU结合在一起,它能将成本和能源消耗比 H100降低多达25倍”。黄仁勋表示自己可得拿稳了,“这块很贵,可能100亿?不过以后会便宜的。”现场爆笑。与此同时,他也强调了新一代芯片和相关产品在能耗上的改进。之前训练一个1.8万亿参数的模型需要使用8000个Hopper GPU和15兆瓦的电力。如今,使用2000个Blackwell GPU就可以完成相同的任务,同时仅消耗4兆瓦的电力。黄仁勋说,英伟达还正在将它们打包成更大的设计,比如GB200 NVL72,把36个CPU和72个GPU集成到一个单一的液冷机架中,提供总共720 petaflops 的AI训练性能或1440petaflops的推理性能。它内部有近乎两英里的电缆,包括5000条独立电缆。此外他也特意强调了推理性能的提升,毕竟英伟达最新的财报已经显示,它的收入越来越多的来自客户们在AI推理部分的支出。主要的云厂商也都被点名表扬了一下,他们和英伟达越来越不可分离。软件方面, 黄仁勋介绍到,英伟达正在打包预训练模型及其附属延伸,并简化了称为NVIDIA推理微服务(NIMS)的微服务部署。这不仅仅是之前的CUDA,而是让模型更易于实施和管理的平台。“你现在就可以下载,带走,安装在你自己的数据中心”,他说道。并且NVIDIA提供服务帮助企业和应用程序对模型进行微调或定制。在罗列了一系列在气象和科学上的合作后,黄仁勋开始进入关于机器人技术的部分,这场发布会开始变得更加科幻。黄仁勋说,英伟达正在押注的下一代产品是能够控制人形机器人。Jetson Thor 就是接替NVIDIA Jetson Orin,为机器人技术推出的更新产品。“确实,世界是为人类设计的,所以我们希望使用英伟达Thor芯片和GR00T软件来训练和管理新一代的人形机器人。这样的机器人将能更好地适应人类设计的环境和工作流程,从而在多样的任务和场景中提供帮助。”机器人展示视频过后,舞台灯光再次亮起时,黄仁勋与身后所有由公司提供动力的人形机器人站在一起,向观众致意。不知为什么有种钢铁侠的意思~还领上来两个在NVIDIA Isaac SIM中学会走路的迪士尼小型机器人。黄仁勋说话时它们一直扭扭捏捏,让老黄不得不低头怜爱地低声说:“Orange(小机器人的名字),我在努力专心!不要再拖延时间了”——超级可爱,把现场气氛推向高潮。而在黄仁勋和这两个小机器人一起“打开”的谢幕视频里,一架微型小飞船飞过英伟达历代GPU产品、架构,在光缆中完成了技术巡礼,最后飞机舱门不经意的打开,驾驶员正是黄仁勋的卡通虚拟数字人。主题演讲结束前,黄仁勋又总结了一遍今天的发布会,而近距离镜头可以看到,黄仁勋似乎有些带着泪光。“如果你问我,心目中的GPU是什么样子,今天的发布就是我的答案。”他说今天他展示了什么是英伟达的灵魂。“我们站在计算科学和物理等其他一切科学的交叉点”。这是他心里英伟达的定位。“新的工业革命来了。”而他没说的,是藏在今天一堆PPT里某一张的那行小字——英伟达,新工业革命的引擎。这是黄仁勋的时代了。","news_type":1},"isVote":1,"tweetType":1,"viewCount":431,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"upFlag":false,"length":15,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"isCommentEnd":true,"isTiger":false,"isWeiXinMini":false,"url":"/m/post/285867938152624"}
精彩评论