Voxtral:オープンソース音声理解モデルが人機インタラクションを革新

2025-07-16
Voxtral:オープンソース音声理解モデルが人機インタラクションを革新

Voxtralは、プロダクション向けの240億パラメータ版とエッジ展開向けの30億パラメータ版の2つの最先端の音声理解モデルをリリースしました。どちらもApache 2.0ライセンスで提供されます。これらのモデルは、優れた転写精度、長尺オーディオ(最大40分)の処理、組み込みのQ&Aと要約機能、ネイティブな多言語サポートを備えています。特に重要なのは、Voxtralが同等のAPIをコスト面で下回っており、高品質の音声インテリジェンスを大規模に利用し制御可能にすることです。高いエラー率のオープンソースシステムと高価なクローズドソースAPIのギャップを解消し、音声コマンドをシステムアクションに直接変換する機能呼び出し機能を提供します。Voxtralは、人機インタラクションに革命を起こす準備ができています。

AI