搜索技巧 海洋云增白 开源地图 AI 搜索答案 沙丘魔堡2 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 PostgreSQL AI工具 证券 DirectX DrawingPics 化学 KDE 披萨农场 多动症 植物学 分析化学 Three.js 大会 残疾人学校 初创 矿池 QB64 更多

LLaMA-Omni: 与大型语言模型进行无缝语音交互 (github.com)

LLaMA-Omni 是一种建立在 Llama-3.1-8B-Instruct 基础上的语音语言模型,它支持低延迟和高质量的语音交互,可以根据语音指令同时生成文本和语音响应。LLaMA-Omni 的特点是响应质量高,语音交互延迟低至226ms,能够同时生成文本和语音响应,并且仅需4块GPU在不到3天的时间内完成训练。