Qwen-Image:200億パラメーターの画像基盤モデルが登場
アリババDAMOアカデミーが、200億パラメーターの画像基盤モデル「Qwen-Image」を発表しました。このモデルは、複雑なテキストレンダリングと高精度な画像編集において大幅な進歩を遂げています。英語や中国語など複数の言語で高忠実度のテキストレンダリングをサポートし、編集時の意味と視覚的なリアリズムを維持します。複数の公開ベンチマークで既存モデルを凌駕し、画像生成と編集における強力な能力を示しました。デモでは、複雑な中国語の書体やレイアウトを持つ画像の生成、詳細なPPTスライドの作成、さらにはバイリンガルのテキストレンダリングなど、その強力なテキスト処理能力と画像生成能力が示されています。
続きを読む