Sesame AI、10億パラメーターの会話型音声モデルを発表

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

Sesame AI、10億パラメーターの会話型音声モデルを発表

2025-03-18

Sesame AI Labsは、Llamaアーキテクチャに基づく10億パラメーターの会話型音声モデルCSM（Conversational Speech Model）を発表しました。CSMは、テキストと音声入力からRVQオーディオコードを生成します。CSMのチェックポイントはHugging Faceで公開されており、インタラクティブな音声デモと、音声生成をテストするためのHugging Faceスペースも提供されています。様々な声を生成できますが、特定の声に微調整されておらず、多言語対応は限られています。Sesame AIは、研究と教育目的でのみ使用することを強調し、なりすまし、虚偽情報の拡散、違法行為を禁止しています。

(github.com)

DOGEの元補佐官、暗号化されていないデータベースを漏洩し財務省の方針に違反

驚きの多義語リスト：3語から6語まで