Qwen-Image: Ein 20-Milliarden-Parameter-Bildgrundmodell wird veröffentlicht

2025-08-05
Qwen-Image: Ein 20-Milliarden-Parameter-Bildgrundmodell wird veröffentlicht

Alibaba DAMO Academy hat Qwen-Image veröffentlicht, ein 20 Milliarden Parameter umfassendes Bildgrundmodell, das erhebliche Fortschritte beim Rendern komplexer Texte und bei der präzisen Bildbearbeitung erzielt. Es bietet eine hochgenaue Textwiedergabe in mehreren Sprachen (einschließlich Englisch und Chinesisch) und bewahrt dabei die semantische Bedeutung und den visuellen Realismus bei Bearbeitungsvorgängen. Qwen-Image übertrifft bestehende Modelle in verschiedenen Benchmarks für die Bildgenerierung und -bearbeitung. Demonstrationen zeigten seine Fähigkeiten: Bilder mit komplexer chinesischer Typografie und Layouts zu generieren, detaillierte PPT-Folien zu erstellen und sogar zweisprachiges Textrendering zu handhaben, was seine robusten Fähigkeiten in der Textverarbeitung und Bildgenerierung unterstreicht.