Voxtral：オープンソース音声理解モデルが人機インタラクションを革新

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

2025-07-16

Voxtralは、プロダクション向けの240億パラメータ版とエッジ展開向けの30億パラメータ版の2つの最先端の音声理解モデルをリリースしました。どちらもApache 2.0ライセンスで提供されます。これらのモデルは、優れた転写精度、長尺オーディオ（最大40分）の処理、組み込みのQ＆Aと要約機能、ネイティブな多言語サポートを備えています。特に重要なのは、Voxtralが同等のAPIをコスト面で下回っており、高品質の音声インテリジェンスを大規模に利用し制御可能にすることです。高いエラー率のオープンソースシステムと高価なクローズドソースAPIのギャップを解消し、音声コマンドをシステムアクションに直接変換する機能呼び出し機能を提供します。Voxtralは、人機インタラクションに革命を起こす準備ができています。