搜索技巧 海洋云增白 开源地图 AI 搜索答案 沙丘魔堡2 压缩机站 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 PostgreSQL AI工具 证券 DirectX DrawingPics 化学 KDE 披萨农场 多动症 植物学 分析化学 Three.js 大会 残疾人学校 初创 QB64 更多

Hertz-dev:首个开源对话音频生成基础模型 (si.inc)

标准智能公司开源了其全双工音频Transformer基础模型Hertz-dev,该模型拥有85亿参数,包含音频自动编码器hertz-codec、变分自编码器hertz-vae和Transformer堆栈hertz-dev三个部分。Hertz-codec实现了低比特率下的高保真音频压缩,hertz-vae作为学习的先验,hertz-dev则基于预训练语言模型进行初始化和训练。Hertz-dev具有低延迟特性,适用于实时语音交互,是目前同类模型中延迟最低的,为构建更流畅的对话体验奠定了基础。

评论已经关闭!