新的人工智能基准测试对用户查询的响应速度

Reuters03-27

((自动化翻译由路透提供,请见免责声明 )) Max A. Cherney

路透社旧金山3月27日 - 人工智能基准测试组织 MLCommons 周三发布了一组新的测试和结果,对顶级硬件运行人工智能应用和响应用户的速度进行了评测。

MLCommons新增的两项基准测试衡量的是人工智能芯片和系统从包含数据的强大人工智能模型中生成响应的速度。这些结果粗略地展示了人工智能应用程序(如 ChatGPT)对用户查询做出响应的速度。

其中一个新基准增加了测量大型语言模型问答场景速度的功能。该基准名为 Llama 2,包含 700 亿个参数,由 Meta Platforms 开发。

MLCommons 官方还为基准测试工具套件添加了第二个文本到图像生成器,名为 MLPerf,基于 Stability AI 的 Stable Diffusion XL 模型。

Alphabet 旗下的谷歌 、超微 和英伟达 等公司采用英伟达 H100 芯片制造的服务器在两项新的原始性能基准测试中均轻松获胜。多家服务器制造商提交了基于该公司性能较弱的 L40S 芯片的设计。

服务器构建商 Krai 为图像生成基准测试提交了一款采用高通 AI 芯片的设计,该芯片的功耗明显低于 Nvidia 的尖端处理器。

英特尔 也提交了基于其 Gaudi2 加速器芯片的设计。该公司将结果描述为 "扎实"。

在部署人工智能应用时,原始性能并不是唯一关键的衡量标准。先进的人工智能芯片耗能巨大,而人工智能公司面临的最重大挑战之一就是部署能以最低能耗提供最佳性能的芯片。

MLCommons 有一个单独的基准类别,用于测量功耗。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法