Gemini prépare un outil pour retoucher les images de l’IA… à coups d'annotation

Gemini prépare un outil pour retoucher les images de l’IA… à coups d’annotation

Google continue d’ajouter des outils créatifs à Gemini. Selon plusieurs indices repérés dans l’application Android de l’assistant, l’outil de génération d’images Nano Banana pourrait bientôt permettre de retoucher directement ses créations en les annotant à l’écran. Une évolution simple sur le papier, mais qui pourrait rendre la modification d’images générées par l’IA beaucoup plus naturelle.

Créer une image avec une IA est aujourd’hui relativement facile. La modifier précisément, en revanche, l’est souvent beaucoup moins. Google semble vouloir corriger cet irritant avec une fonction d’annotation en préparation pour Gemini. Des éléments découverts par Android Authority dans une version récente de l’app Android de Gemini suggèrent en effet qu’un nouvel outil d’édition pourrait apparaître pour les images générées par le modèle Nano Banana. Une fois l’image produite, une icône en forme de crayon apparaîtrait dans le coin supérieur droit.

Entourer un détail et demander une correction

En appuyant dessus, l’utilisateur accéderait à un écran d’édition baptisé « Mark Up ». Ce dernier permettrait d’annoter l’image directement avec différents outils. Un mode « Sketch » servirait à tracer des cercles ou des traits autour des éléments à modifier, tandis qu’un mode « Text » permettrait d’ajouter des indications.

Plusieurs couleurs seraient également disponibles pour faciliter le marquage des zones à corriger. L’idée est simple : l’utilisateur entoure un objet ou une partie de l’image, puis explique ce qu’il veut changer. Dans l’exemple montré lors des tests, la consigne est très basique : « change la couleur de cet élément en vert ». Une fois la zone indiquée et l’instruction écrite, Gemini renvoie l’image au générateur Nano Banana, qui produit une nouvelle version modifiée.

Ce système évite d’avoir à décrire laborieusement l’endroit précis à modifier, ce qui peut rapidement devenir compliqué lorsque l’image contient beaucoup d’éléments. Aujourd’hui, corriger une image générée par l’IA dans Gemini n’est effectivement pas toujours très pratique. Dans certains cas, il faut télécharger l’image, l’ouvrir dans une autre application pour la marquer, puis la renvoyer dans Gemini avec une nouvelle instruction.

La fonction en préparation supprimerait ce détour pénible. Les modifications pourraient être effectuées directement dans la conversation avec l’IA. L’utilisateur pourrait ainsi générer une image, corriger un détail, demander une nouvelle modification, puis recommencer autant de fois que nécessaire. Une manière de travailler beaucoup plus proche d’un véritable outil de création que d’un simple générateur d’images.

Cette approche présente aussi un avantage pour l’IA elle-même. En montrant exactement la zone à modifier, l’utilisateur fournit un contexte visuel clair. Le modèle comprend immédiatement ce qui doit être changé, ce qui réduit les allers-retours pour obtenir le résultat souhaité. Pour l’instant, la fonctionnalité n’a pas encore été activée dans l’application. Les éléments repérés indiquent simplement qu’elle est en développement.

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.