LlamaVoice: 基于 Llama 的大型语音生成模型

2024-09-26

LlamaVoice 是一种基于 Llama 的大型语音生成模型,能够进行推理和训练。与依赖矢量量化进行离散语音代码预测的传统模型相比,它采用直接预测连续特征的新方法,提供更精简、更高效的流程。其主要功能包括:连续特征预测、VAE 潜在特征预测、联合训练、高级采样策略以及基于流的增强。

32
未分类