搜索技巧 海洋云增白 开源地图 AI 搜索答案 沙丘魔堡2 压缩机站 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 PostgreSQL AI工具 证券 DirectX DrawingPics 化学 KDE 披萨农场 多动症 植物学 分析化学 Three.js 大会 残疾人学校 初创 QB64 更多

GitHub - homebrewltd/ichigo: Llama3.1 学会倾听 (github.com)

🍓 Ichigo(原llama3-s)是一个开源的实时语音AI研究项目,目标是扩展基于文本的LLM,使其具备原生“倾听”能力。它采用受Meta的Chameleon论文启发的早期融合技术,使用WhisperSpeechVQ对连续语音数据进行预训练,并通过在交织的合成数据上进行训练来增强模型的音频指令遵循能力。Ichigo v0.3模型在更清晰、改进的数据集上进行训练,实现了63.79的增强MMLU得分,并展现出更强的语音指令遵循能力,甚至在多轮交互中也是如此。

评论已经关闭!