Qwen-Image: Lanzamiento de un Modelo de Fundación de Imagen de 20 000 millones de Parámetros
Alibaba DAMO Academy lanzó Qwen-Image, un modelo de fundación de imagen de 20 000 millones de parámetros que avanza significativamente en la representación de texto complejo y la edición precisa de imágenes. Cuenta con representación de texto de alta fidelidad en varios idiomas (incluido inglés y chino), preservando el significado semántico y el realismo visual durante las ediciones. Qwen-Image supera a los modelos existentes en varios puntos de referencia para la generación y edición de imágenes. Las demostraciones mostraron sus capacidades: generar imágenes con tipografía y diseños chinos intrincados, crear diapositivas de PPT detalladas e incluso manejar la representación de texto bilingüe, destacando sus sólidas capacidades de procesamiento de texto y generación de imágenes.
Leer más