实时语音合成开源项目SV2TTS:基于说话人验证的迁移学习
2025-09-14
这是一个基于迁移学习的实时多说话人文本转语音合成(SV2TTS)开源项目,源于作者的硕士论文。该项目包含三个阶段:首先,从几秒钟的音频中创建语音的数字表示;然后,使用该表示作为参考,根据任意文本生成语音。虽然项目较为早期,但支持Windows和Linux系统,并推荐使用GPU加速。项目提供了详细的安装和使用指南,并支持多种数据集。
开发