Gemini 2.5 Flash Image: Googles KI-Durchbruch bei der Bilderzeugung
Google hat Gemini 2.5 Flash Image vorgestellt, ein hochmodernes Modell zur Bilderzeugung und -bearbeitung. Es ermöglicht die Verschmelzung mehrerer Bilder, die Beibehaltung der Charakterkonsistenz für reichhaltigere Geschichten, präzise Transformationen mithilfe natürlicher Sprache und die Nutzung des Weltwissens von Gemini zur Bilderzeugung und -bearbeitung. Der Preis beträgt 30 US-Dollar pro 1 Million Ausgabe-Tokens (ca. 0,039 US-Dollar pro Bild) und ist über die Gemini-API und Google AI Studio für Entwickler sowie Vertex AI für Unternehmen zugänglich. Der „Build-Modus“ von Google AI Studio wurde ebenfalls erheblich verbessert, um die App-Erstellung zu vereinfachen. Zu den Hauptfunktionen gehören die Charakterkonsistenz, die promptbasierte Bildbearbeitung und das native Weltwissen, wodurch neue Möglichkeiten in der Bilderzeugung und -manipulation eröffnet werden.