Webtagr - 科技资讯摘要

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

GitHub - huggingface/speech-to-speech: 语音到语音：开源模块化 GPT4-o 的努力

2024-09-03

Hugging Face 开源了一个名为 Speech-to-Speech 的语音到语音管道项目，目标是创建一个类似 GPT4-o 的开源模块化语音模型。该管道由语音活动检测 (VAD)、语音到文本 (STT)、语言模型 (LM) 和文本到语音 (TTS) 四个主要部分组成，并允许用户根据需要选择和修改每个部分的模型。

(github.com)

未分类

更坚固、更轻便的新型钢材助力汽车行业发展

图语言模型