アリババ、新しい視覚推論モデルQvQを発表
2024-12-25
アリババは最近、Apache 2.0ライセンスの下で新しい視覚推論モデルQvQ-72B-Previewを発表しました。AIの視覚推論能力を向上させることを目的として設計されたQvQは、推論スケーリングモデルQwQをベースに、画像処理を追加しています。画像とプロンプトを受け入れ、詳細で段階的な推論プロセスを生成します。ブロガーのSimon WillisonはQvQをテストし、ペリカンのカウントなどのタスクでは成功しましたが、複雑な推論問題では精度が低いことを発見しました。現在Hugging Face Spacesで利用可能であり、将来の計画にはローカル展開とより幅広いプラットフォームのサポートが含まれています。