GitHub - huggingface/speech-to-speech: 语音到语音:开源模块化 GPT4-o 的努力

2024-09-03

Hugging Face 开源了一个名为 Speech-to-Speech 的语音到语音管道项目,目标是创建一个类似 GPT4-o 的开源模块化语音模型。该管道由语音活动检测 (VAD)、语音到文本 (STT)、语言模型 (LM) 和文本到语音 (TTS) 四个主要部分组成,并允许用户根据需要选择和修改每个部分的模型。

37
未分类