Gemini 2.5 Flash Image : La percée de Google en matière de génération d’images par IA
Google a dévoilé Gemini 2.5 Flash Image, un modèle de pointe pour la génération et l’édition d’images. Il permet de fusionner plusieurs images, de maintenir la cohérence des personnages pour des récits plus riches, d’effectuer des transformations précises à l’aide du langage naturel et de tirer parti des connaissances du monde de Gemini pour générer et éditer des images. Au prix de 30 $ US pour 1 million de jetons de sortie (environ 0,039 $ US par image), il est accessible via l’API Gemini et Google AI Studio pour les développeurs, et Vertex AI pour les entreprises. Le « mode de construction » de Google AI Studio a également été considérablement amélioré pour simplifier la création d’applications. Les principales fonctionnalités incluent la cohérence des personnages, l’édition d’images basée sur des invites et la connaissance native du monde, ouvrant de nouvelles possibilités dans la génération et la manipulation d’images.