NVIDIA发布全双工语音对话模型PersonaPlex-7B-v1

DoNews01-20

NVIDIA研究院近日推出PersonaPlex-7B-v1,一款基于Moshi架构的70亿参数全双工语音到语音对话模型。该模型摒弃传统ASR→LLM→TTS级联流程,采用统一Transformer架构,在单一网络中同步处理语音理解与生成,支持自然打断、重叠语音、快速轮转及上下文感知的反馈词。PersonaPlex通过混合提示机制实现精准角色控制:音频提示定义音色与韵律,文本提示设定角色身份与业务...

网页链接
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法