英伟达适配DeepSeek-V4 AI模型，开箱性能超150 tokens/sec/user

市场资讯04-25 15:43

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

　　（来源：IT之家）

　　IT之家 4 月 25 日消息，英伟达今天（4 月 25 日）发布博文，宣布其 NVIDIA Blackwell 平台已适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。

　　英伟达在博文指出，DeepSeek-V4-Pro 拥有 1.6T 总参数量与 49B 激活参数，定位高级推理任务；DeepSeek-V4-Flash 版本则为 284B 总参数量与 13B 激活参数，主打高速高效场景。

　　两款模型均支持 100 万 Token 上下文窗口与最高 38.4 万 Token 输出长度，覆盖长文本编码、文档分析等核心应用，并采用 MIT 开源协议。

　　实测数据显示，DeepSeek-V4-Pro 在 NVIDIA GB200 NVL72 上开箱即用性能超 150 tokens / sec / user，借助 vLLM 的 Day 0 配方，开发者可在 Blackwell B300 上快速部署。随着 Dynamo、NVFP4 及 CUDA 内核的深度优化，预期性能将进一步提升。

　　部署生态方面，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。SGLang 提供低延迟、均衡及最大吞吐量三种配方；vLLM 则支持多节点扩展至 100 个以上 GPU，具备工具调用与推测解码能力。

海量资讯、精准解读，尽在新浪财经APP

责任编辑：张恒星

免责声明：本文观点仅代表作者个人观点，不构成本平台的投资建议，本平台不对文章信息准确性、完整性和及时性做出任何保证，亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白

发表看法

{"i18n":{"language":"zh_CN"},"isChannel":false,"data":{"share":"https://www.laohu8.com/m/news/2630808408?lang=zh_CN&edition=full","thumbnail":"","is_english":false,"pubTime":"2026-04-25 15:43","share_image_url":"https://static.laohu8.com/b0d1b7e8843deea78cc308b15114de44","id":"2630808408","market":"sh","top_or_hot":-1,"title":"英伟达适配DeepSeek-V4 AI模型，开箱性能超150 tokens/sec/user","media":"市场资讯","content":"<html><body><div>\n<blockquote><p>　　炒股就看<a href=\"https://laohu8.com/S/603586\">金麒麟</a>分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！</p></blockquote> <p>　　（来源：IT之家）</p>\n<p cms-style=\"font-L\">　　IT之家 4 月 25 日消息，<a href=\"https://laohu8.com/S/NVDA\">英伟达</a>今天（4 月 25 日）发布博文，<font cms-style=\"font-L strong-Bold\">宣布其 NVIDIA Blackwell 平台已适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型</font>，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。</p>\n<p cms-style=\"font-L\">　　英伟达在博文指出，DeepSeek-V4-Pro 拥有 1.6T 总参数量与 49B 激活参数，定位高级推理任务；DeepSeek-V4-Flash 版本则为 284B 总参数量与 13B 激活参数，主打高速高效场景。</p>\n<div><img src=\"http://n.sinaimg.cn/spider20260425/344/w660h484/20260425/6eed-9204002666445de1dfd9165b7939fa76.jpg\"/><span></span></div>\n<p cms-style=\"font-L\">　　两款模型均支持 100 万 Token 上下文窗口与最高 38.4 万 Token 输出长度，覆盖长文本编码、文档分析等核心应用，并采用 <a href=\"https://laohu8.com/S/ME8U.SI\">MIT</a> 开源协议。</p>\n<p cms-style=\"font-L\">　　实测数据显示，<font cms-style=\"font-L strong-Bold\">DeepSeek-V4-Pro 在 NVIDIA GB200 NVL72 上开箱即用性能超 150 tokens / sec / user</font>，借助 vLLM 的 Day 0 配方，开发者可在 Blackwell B300 上快速部署。随着 Dynamo、NVFP4 及 CUDA 内核的深度优化，预期性能将进一步提升。</p>\n<div><img src=\"http://n.sinaimg.cn/spider20260425/296/w660h436/20260425/a40b-041e472c080af751fb4991cce93bbed4.jpg\"/><span></span></div>\n<p cms-style=\"font-L\">　　部署生态方面，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。SGLang 提供低延迟、均衡及最大吞吐量三种配方；vLLM 则支持多节点扩展至 100 个以上 GPU，具备工具调用与推测解码能力。</p>\n<div><img src=\"http://n.sinaimg.cn/spider20260425/232/w660h372/20260425/46ca-9372e4e40dff77526b52f60b04a16cb3.jpg\"/><span></span></div>\n<div>\n<div><img src=\"\"/></div>\n<div>海量资讯、精准解读，尽在新浪财经APP</div>\n</div>\n<p>责任编辑：张<a href=\"https://laohu8.com/S/002132\">恒星</a> </p>\n</div></body></html>","source":"sina","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>英伟达适配DeepSeek-V4 AI模型，开箱性能超150 tokens/sec/user</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n英伟达适配DeepSeek-V4 AI模型，开箱性能超150 tokens/sec/user\n</h2>\n\n<h4 class=\"meta\">\n\n</h4>\n\n</header>\n<article>\n<html><body><div>\n<blockquote><p>　　炒股就看<a href=\"https://laohu8.com/S/603586\">金麒麟</a>分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！</p></blockquote> <p>　　（来源：IT之家）</p>\n<p cms-style=\"font-L\">　　IT之家 4 月 25 日消息，<a href=\"https://laohu8.com/S/NVDA\">英伟达</a>今天（4 月 25 日）发布博文，<font cms-style=\"font-L strong-Bold\">宣布其 NVIDIA Blackwell 平台已适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型</font>，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。</p>\n<p cms-style=\"font-L\">　　英伟达在博文指出，DeepSeek-V4-Pro 拥有 1.6T 总参数量与 49B 激活参数，定位高级推理任务；DeepSeek-V4-Flash 版本则为 284B 总参数量与 13B 激活参数，主打高速高效场景。</p>\n<div><img src=\"http://n.sinaimg.cn/spider20260425/344/w660h484/20260425/6eed-9204002666445de1dfd9165b7939fa76.jpg\"/><span></span></div>\n<p cms-style=\"font-L\">　　两款模型均支持 100 万 Token 上下文窗口与最高 38.4 万 Token 输出长度，覆盖长文本编码、文档分析等核心应用，并采用 <a href=\"https://laohu8.com/S/ME8U.SI\">MIT</a> 开源协议。</p>\n<p cms-style=\"font-L\">　　实测数据显示，<font cms-style=\"font-L strong-Bold\">DeepSeek-V4-Pro 在 NVIDIA GB200 NVL72 上开箱即用性能超 150 tokens / sec / user</font>，借助 vLLM 的 Day 0 配方，开发者可在 Blackwell B300 上快速部署。随着 Dynamo、NVFP4 及 CUDA 内核的深度优化，预期性能将进一步提升。</p>\n<div><img src=\"http://n.sinaimg.cn/spider20260425/296/w660h436/20260425/a40b-041e472c080af751fb4991cce93bbed4.jpg\"/><span></span></div>\n<p cms-style=\"font-L\">　　部署生态方面，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。SGLang 提供低延迟、均衡及最大吞吐量三种配方；vLLM 则支持多节点扩展至 100 个以上 GPU，具备工具调用与推测解码能力。</p>\n<div><img src=\"http://n.sinaimg.cn/spider20260425/232/w660h372/20260425/46ca-9372e4e40dff77526b52f60b04a16cb3.jpg\"/><span></span></div>\n<div>\n<div><img src=\"\"/></div>\n<div>海量资讯、精准解读，尽在新浪财经APP</div>\n</div>\n<p>责任编辑：张<a href=\"https://laohu8.com/S/002132\">恒星</a> </p>\n</div></body></html>\n\n<div class=\"bt-text\">\n\n\n<p> 来源：<a href=\"https://finance.sina.com.cn/stock/t/2026-04-25/doc-inhvszcf0799441.shtml\">市场资讯</a> </p>\n\n<p>为提升您的阅读体验，我们对本页面进行了排版优化</p>\n\n</div>\n\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":null,"symbol_name":null,"start_time":0,"source_url":"https://finance.sina.com.cn/stock/t/2026-04-25/doc-inhvszcf0799441.shtml","article_id":"2630808408","we_media_id":null,"thumbnails":[],"rights":null,"url":"https://stock-news.laohu8.com/highlight/detail?id=2630808408","pubTimestamp":1777102980,"columns":[],"sourceInfo":{"source_id":"sina","name":"sina"},"weMediaInfo":null,"summary":"　　IT之家 4 月 25 日消息，英伟达今天发布博文，宣布其 NVIDIA Blackwell 平台已适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。　　英伟达在博文指出，DeepSeek-V4-Pro 拥有 1.6T 总参数量与 49B 激活参数，定位高级推理任务；DeepSeek-V4-Flash 版本则为 284B 总参数量与 13B 激活参数，主打高速高效场景。　　实测数据显示，DeepSeek-V4-Pro 在 NVIDIA GB200 NVL72 上开箱即用性能超 150 tokens / sec / user，借助 vLLM 的 Day 0 配方，开发者可在 Blackwell B300 上快速部署。","collect":0,"end_time":0,"defaultTopTitle":"sina.com.cn","property":["earning"],"viewcount":null,"language":"zh","relate_stocks":{},"translate_title":"NVIDIA adapts DeepSeek-V4 AI model, unboxing performance exceeds 150 tokens/sec/user","themeId":null,"isJumpTheme":false,"ttsUrl":"https://static.tigerbbs.com/dde8205e3c7297539532095de36bde36","symbols_score_info":{"AMZN":0.6,"NVD3.UK":0.6,"NVDS":0.6,"NVDL":0.6,"AAPL":0.6,"NVDB":0.6,"NVDY":0.6,"3NVD.UK":0.6,"TSLA":0.6,"NVDX":0.6,"NVDS.UK":0.6,"NVD":0.6,"GOOG":0.6,"NVDW":0.6,"NVDQ":0.6,"NVDO":0.6,"NVII":0.6,"NVDU":0.6,"ANV":0.6,"2NVD.UK":0.6,"MSFT":0.6,"SNVD.UK":0.6,"NVD2.UK":0.6,"NVIW.SI":0.6,"DIPS":0.6,"NVDG":0.6,"NVDA":1.96,"META":0.6,"NVDD":0.6},"content_text":"炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！ 　　（来源：IT之家）\n　　IT之家 4 月 25 日消息，英伟达今天（4 月 25 日）发布博文，宣布其 NVIDIA Blackwell 平台已适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。\n　　英伟达在博文指出，DeepSeek-V4-Pro 拥有 1.6T 总参数量与 49B 激活参数，定位高级推理任务；DeepSeek-V4-Flash 版本则为 284B 总参数量与 13B 激活参数，主打高速高效场景。\n\n　　两款模型均支持 100 万 Token 上下文窗口与最高 38.4 万 Token 输出长度，覆盖长文本编码、文档分析等核心应用，并采用 MIT 开源协议。\n　　实测数据显示，DeepSeek-V4-Pro 在 NVIDIA GB200 NVL72 上开箱即用性能超 150 tokens / sec / user，借助 vLLM 的 Day 0 配方，开发者可在 Blackwell B300 上快速部署。随着 Dynamo、NVFP4 及 CUDA 内核的深度优化，预期性能将进一步提升。\n\n　　部署生态方面，开发者可通过 NVIDIA NIM 微服务下载部署，或利用 SGLang 与 vLLM 框架进行定制化推理。SGLang 提供低延迟、均衡及最大吞吐量三种配方；vLLM 则支持多节点扩展至 100 个以上 GPU，具备工具调用与推测解码能力。\n\n\n\n海量资讯、精准解读，尽在新浪财经APP\n\n责任编辑：张恒星","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"0","news_tag":"","news_rank":0,"isVideo":false,"video":null,"symbols":[],"gpt_button":1,"need_auth":false,"need_login_tip":false,"code":"91000000","status":"200"},"commentList":[],"isCommentEnd":true,"newsSizeData":{"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"likeStatus":false,"favoriteStatus":false},"APP":{"userAgent":"Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)","isDev":false,"isTTM":false,"tenantId":"TBCN","deviceId":"web-server-community-laohu8-v3","version":"4.42.0","shortVersion":"4.42.0","platform":"web","vendor":"web","appName":"laohu8","isIOS":false,"isAndroid":false,"isTiger":false,"isTHS":false,"isWeiXin":false,"isWeiXinMini":false,"isWeiBo":false,"isQQ":false,"isBaiduSwan":false,"isBaiduBox":false,"isDingTalk":false,"isToutiao":false,"isOnePlus":false,"isHuaWei":false,"isXiaomi":false,"isXiaomiWebView":false,"isOppo":false,"isVivo":false,"isSamsung":false,"isMobile":false},"href":"/m/news/2630808408","isCrawlerRequest":true}