科技媒体marktechpost报道,英伟达近日推出开源自动语音识别(ASR)模型Parakeet TDT 0.6B,在Hugging Face平台公开。该模型以速度和精度见长,仅需1秒即可处理60分钟音频,速度达主流开源ASR模型的50倍,字错率(WER)低至6.05%,位居开源ASR领域前列。
网页链接科技媒体marktechpost报道,英伟达近日推出开源自动语音识别(ASR)模型Parakeet TDT 0.6B,在Hugging Face平台公开。该模型以速度和精度见长,仅需1秒即可处理60分钟音频,速度达主流开源ASR模型的50倍,字错率(WER)低至6.05%,位居开源ASR领域前列。
网页链接
精彩评论