Qwen-Image : Lancement d'un modèle de base d'image de 20 milliards de paramètres
Alibaba DAMO Academy a lancé Qwen-Image, un modèle de base d'image de 20 milliards de paramètres qui réalise des progrès significatifs dans le rendu de texte complexe et l'édition précise d'images. Il offre un rendu de texte haute fidélité dans plusieurs langues (y compris l'anglais et le chinois), préservant la signification sémantique et le réalisme visuel lors des opérations d'édition. Qwen-Image surpasse les modèles existants sur plusieurs benchmarks de génération et d'édition d'images. Des démonstrations ont mis en évidence ses capacités : générer des images avec une typographie et des mises en page chinoises complexes, créer des diapositives PPT détaillées et même gérer le rendu de texte bilingue, soulignant ses solides capacités de traitement de texte et de génération d'images.