VoxCPM重新思考语音建模方式的TTS 系统
VoxCPM 是一款免费开源的文本转语音(TTS)工具,无需令牌即可将文本转换为逼真语音,生成贴合语境、富有表现力的音频,仅需 3–10 秒样本就能完美克隆音色。你可以从 Hugging Face 下载 VoxCPM1.5(8 亿参数),通过 pip 安装,使用简洁的 Python 或 CLI 命令快速合成语音(在 RTX 4090 上实时率 RTF 可达 0.15),也可微调自定义音色。
油管:https://youtu.be/L7hlQXIylsY











