作者 | 陈骏达编辑 | 漠影智东西3月20日报道,昨天,小米发布了Mimo-V2 Pro大模型,又一次把混合注意力架构推到了行业的聚光灯下。这款万亿参数的大模型,采用了1:7的混合注意力比例,在提供接近Claude Opus 4.6能力的同时,API定价仅为后者的1/5。实际上,小米的混合注意力架构探索,延续了国内大模型头部厂商在效率优化上的技术共识。过去一段时间里,国内多个大模型头部玩家都展示...
网页链接作者 | 陈骏达编辑 | 漠影智东西3月20日报道,昨天,小米发布了Mimo-V2 Pro大模型,又一次把混合注意力架构推到了行业的聚光灯下。这款万亿参数的大模型,采用了1:7的混合注意力比例,在提供接近Claude Opus 4.6能力的同时,API定价仅为后者的1/5。实际上,小米的混合注意力架构探索,延续了国内大模型头部厂商在效率优化上的技术共识。过去一段时间里,国内多个大模型头部玩家都展示...
网页链接
精彩评论