阿里发布Fun-CosyVoice3.5与Fun-AudioGen-VD语音模型

DoNews03-02

2026年3月2日,阿里通义实验室语音团队发布两款支持FreeStyle自然语言指令的语音生成模型:Fun-CosyVoice3.5与Fun-AudioGen-VD。前者聚焦多语种语音复刻与精细化表达控制,新增泰语等4种语言支持,生僻字读错率由15.2%降至5.3%;后者专注声音设计与场景化音频生成,可联合建模音色、情绪、角色及环境音效。两款模型均面向开发者开放API调用,提升语音合成的可控性与...

网页链接
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法