OpenBMB/VoxCPM
github.com原文 ↗
VoxCPM2 是 tokenizer-free TTS 系统,直接生成连续语音表示。README 给出关键数字:2B 参数、200 万+小时多语言语音、30 种语言、48kHz 输出,支持 Voice Design、Controllable Cloning、Ultimate Cloning;RTX 4090 上 RTF 约 0.3,Nano-vLLM/vLLM-Omni 加速约 0.13。值得看的是开源 TTS 正在从“读文本”走向可控声音设计和低延迟服务。
–浏览
评论 · Comments