$阿里巴巴(BABA)$ 阿里巴巴的Qwen 3.7 Max预览版突然出现在LM Arena(前身是LLM Arena)上了。这个榜单是通过匿名人类偏好投票来评估大语言模型的独立排行榜。
这次亮相之所以引人注意,是因为Qwen 3 Ultra预览版目前也还在榜单上。这意味着阿里巴巴正在同时公开测试两款720亿参数的旗舰模型。这种双轨并行的策略,让关注中国大模型快速发展的研究者们很感兴趣。
自从Qwen 2发布以来,这个系列在全球范围内的认可度在逐步提升,尤其在推理、编程和多语言任务上表现不错。根据一些说法,Qwen 3.7 Max预览版在复杂推理和遵循指令的基准测试上有所改进。
精彩评论