((自动化翻译由路透提供,请见免责声明 )) Max A. Cherney
路透社旧金山3月27日 - 人工智能基准测试组织 MLCommons 周三发布了一组新的测试和结果,对顶级硬件运行人工智能应用和响应用户的速度进行了评测。
MLCommons新增的两项基准测试衡量的是人工智能芯片和系统从包含数据的强大人工智能模型中生成响应的速度。这些结果粗略地展示了人工智能应用程序(如 ChatGPT)对用户查询做出响应的速度。
其中一个新基准增加了测量大型语言模型问答场景速度的功能。该基准名为 Llama 2,包含 700 亿个参数,由 Meta Platforms 开发。
MLCommons 官方还为基准测试工具套件添加了第二个文本到图像生成器,名为 MLPerf,基于 Stability AI 的 Stable Diffusion XL 模型。
Alphabet 旗下的谷歌 、超微 和英伟达 等公司采用英伟达 H100 芯片制造的服务器在两项新的原始性能基准测试中均轻松获胜。多家服务器制造商提交了基于该公司性能较弱的 L40S 芯片的设计。
服务器构建商 Krai 为图像生成基准测试提交了一款采用高通 AI 芯片的设计,该芯片的功耗明显低于 Nvidia 的尖端处理器。
英特尔 也提交了基于其 Gaudi2 加速器芯片的设计。该公司将结果描述为 "扎实"。
在部署人工智能应用时,原始性能并不是唯一关键的衡量标准。先进的人工智能芯片耗能巨大,而人工智能公司面临的最重大挑战之一就是部署能以最低能耗提供最佳性能的芯片。
MLCommons 有一个单独的基准类别,用于测量功耗。
精彩评论