Qwen VLo:画像を理解し、創造する統合型マルチモーダルモデル
2025-06-28
アリババDAMOアカデミーは、画像の内容を理解するだけでなく、その理解に基づいて高品質な画像を生成する新しいマルチモーダルモデル、Qwen VLoを発表しました。漸進的な生成方法を採用し、左から右へ、上から下へと段階的に画像を構築することで、最終結果の一貫性と調和性を確保しています。Qwen VLoは多言語の指示をサポートし、画像編集やスタイル転送などの複雑なタスクを処理し、生成した画像の内容を理解することもできます。現在プレビュー段階ですが、その強力なマルチモーダル機能は、画像生成におけるAIの可能性を示しています。
AI