IT之家 2 月 5 日消息,AI 推理芯片初创企业 Positron 当地时间公布了其第二代 ASIC 设计 Asimov,宣称该产品的 Token 能效与性价比都可以达到英伟达 Rubin GPU 的五倍。Positron 表示 Transformer 推理运行的限制在内存而非算力,因此 Asimov 在设计上就是以内存优先,拥有 90% 的内存带宽利用率,并从结构上消除不必要的远程数据移动。...
网页链接IT之家 2 月 5 日消息,AI 推理芯片初创企业 Positron 当地时间公布了其第二代 ASIC 设计 Asimov,宣称该产品的 Token 能效与性价比都可以达到英伟达 Rubin GPU 的五倍。Positron 表示 Transformer 推理运行的限制在内存而非算力,因此 Asimov 在设计上就是以内存优先,拥有 90% 的内存带宽利用率,并从结构上消除不必要的远程数据移动。...
网页链接
精彩评论