EzAudio:使用高效扩散Transformer增强文本到音频生成 2024-09-24 EzAudio是一种先进的文本到音频(T2A)生成模型,可以从文本提示中创建高质量的音频。它通过提供快速、高效和逼真的声音效果生成功能,为开源T2A模型树立了新标准。 (haidog-yaqub.github.io) 27 未分类 文本到音频 EzAudio