Qwen-Image: Modelo de Fundação de Imagem de 20B Parâmetros Lançado
A Alibaba DAMO Academy lançou o Qwen-Image, um modelo de fundação de imagem de 20 bilhões de parâmetros que avança significativamente na renderização de texto complexo e na edição precisa de imagens. Ele possui renderização de texto de alta fidelidade em vários idiomas (incluindo inglês e chinês), preservando o significado semântico e o realismo visual durante as edições. O Qwen-Image supera os modelos existentes em vários benchmarks de geração e edição de imagens. Demonstrações mostraram suas capacidades: gerar imagens com tipografia e layouts chineses intrincados, criar slides de PPT detalhados e até mesmo lidar com renderização de texto bilíngue, destacando suas robustas capacidades de processamento de texto e geração de imagens.