LLaMA-Omni: 与大型语言模型进行无缝语音交互
2024-09-19
LLaMA-Omni 是一种建立在 Llama-3.1-8B-Instruct 基础上的语音语言模型,它支持低延迟和高质量的语音交互,可以根据语音指令同时生成文本和语音响应。LLaMA-Omni 的特点是响应质量高,语音交互延迟低至226ms,能够同时生成文本和语音响应,并且仅需4块GPU在不到3天的时间内完成训练。
34