Qwen VLo：画像を理解し、創造する統合型マルチモーダルモデル

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

2025-06-28

アリババDAMOアカデミーは、画像の内容を理解するだけでなく、その理解に基づいて高品質な画像を生成する新しいマルチモーダルモデル、Qwen VLoを発表しました。漸進的な生成方法を採用し、左から右へ、上から下へと段階的に画像を構築することで、最終結果の一貫性と調和性を確保しています。Qwen VLoは多言語の指示をサポートし、画像編集やスタイル転送などの複雑なタスクを処理し、生成した画像の内容を理解することもできます。現在プレビュー段階ですが、その強力なマルチモーダル機能は、画像生成におけるAIの可能性を示しています。