| 2026年6月2日星期二 | NO.1 MiniMax发布新一代模型M3 6月1日,国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。据了解,M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token(词元)。据悉,M3是同时具备“...
网页链接| 2026年6月2日星期二 | NO.1 MiniMax发布新一代模型M3 6月1日,国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。据了解,M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token(词元)。据悉,M3是同时具备“...
网页链接
精彩评论