Jusqu’ici, modifier une photo avec une IA ressemblait un peu à lancer un dé : vous vouliez juste changer la couleur d’un t-shirt et vous vous retrouviez avec un visage déformé ou un arrière-plan méconnaissable. Pas idéal.
Transformer une photo sans tout casser
Avec Gemini 2.5 Flash Image, Google assure que les choses vont changer. L’IA garde en mémoire les détails importants et les conserve d’une retouche à l’autre. Résultat : en transformant un portrait en torero ou en personnage de sitcom des années 90, le personnage principal garde ses caractéristiques physiques principales. Et ça marche même après plusieurs modifications successives.
Autre fonction intéressante : la fusion d’images. Il est possible de mélanger deux photos différentes – une personne et son chien, par exemple – et obtenir un cliché réaliste où les deux se retrouvent ensemble. On peut aussi s’amuser à combiner des éléments plus abstraits, du moment que la demande reste dans les clous imposés par Google.
Ce nouveau modèle arrive dans un contexte où tout le monde veut être le roi de la retouche intelligente. OpenAI a frappé fort au printemps avec GPT-4o, qui a inondé internet de mèmes façon Studio Ghibli. Meta a choisi de miser sur Midjourney. Et en Europe, la start-up Black Forest Labs brille avec ses modèles FLUX.
De son côté, Google joue gros : Gemini compte 450 millions d’utilisateurs mensuels, contre plus de 700 millions d’utilisateurs hebdomadaires pour ChatGPT. Pas étonnant que le géant du web pousse ses innovations. « Cet outil fait des retouches plus naturelles et les résultats sont directement exploitables », assure Nicole Brichtova, responsable produit chez DeepMind.
Pour éviter les dérapages, chaque image sort avec un filigrane « AI » bien visible, plus une signature numérique invisible. L’idée est de rendre les deepfakes plus faciles à identifier, même si ça n’empêchera pas forcément les images douteuses de circuler.
Au-delà des démos impressionnantes, Google insiste sur les petits usages pratiques. Vous voulez visualiser votre salon avec un nouveau canapé et une autre couleur de mur ? Mélangez une photo de votre pièce, un meuble et une palette, et l’IA s’occupe du reste. Même principe pour imaginer un jardin, une terrasse ou refaire la déco.
Le nouvel éditeur d’images est dispo dès maintenant dans l’appli Gemini. Et pour les développeurs, il arrive bientôt dans l’API, AI Studio et Vertex AI.
🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.