EzAudio:使用高效扩散Transformer增强文本到音频生成

2024-09-24

EzAudio是一种先进的文本到音频(T2A)生成模型,可以从文本提示中创建高质量的音频。它通过提供快速、高效和逼真的声音效果生成功能,为开源T2A模型树立了新标准。