Kokoro:82MパラメーターのTTSモデルで電子書籍を高音質オーディオブックに変換

2025-01-15

Claudio Santiniは、軽量な82Mパラメーターのテキスト読み上げモデルKokoroを活用したツールAudiblezを作成しました。これにより、電子書籍を高音質のオーディオブックに変換できます。Audiblezは複数の言語と音声に対応し、大規模な電子書籍も数時間で変換可能です。Pythonベースのこのツールは、必要なライブラリとモデルファイルのインストールが必要です。章の検出はまだ改善の余地がありますが、全体的には良好に動作し、今後の改善として章の検出と機能追加が予定されています。