Avec Imagen 2, Google veut se frotter aux cadors de la génération d'images IA

Avec Imagen 2, Google veut se frotter aux cadors de la génération d’images IA

Imagen 2 veut marcher sur les platebandes de Dall-E et de Midjourney. Cette nouvelle version du modèle IA de génération d’images de Google est présentée comme une amélioration substantielle de son prédécesseur.

Développé en collaboration avec Google DeepMind, Imagen 2 promet une qualité d’image supérieure à la première version, et de nouvelles fonctionnalités comme la capacité de générer du texte et des logos sur les images. Thomas Kurian, le patron de Google Cloud, a souligné lors d’une conférence de presse que cette nouvelle IA peut être utilisée pour créer des images avec superposition de texte, par exemple dans la publicité.

Une IA adaptée pour la publicité

Une avancée qui positionne Imagen 2 en compétition directe avec d’autres modèles de génération d’image comme DALL-E 3 d’OpenAI et Titan Image Generator d’Amazon. Une fonction importante d’Imagen 2 est sa capacité à générer du texte dans plusieurs langues, y compris le chinois, l’hindi, le japonais, le coréen, le portugais, l’anglais et l’espagnol. De plus, le modèle peut intégrer des logos sur divers produits et surfaces, ce qui représente une avancée significative dans le domaine de la génération d’image. Les annonceurs vont certainement apprécier !

Au niveau de la traçabilité, les images générées par Imagen 2 intègrent le watermark SynthID développé par DeepMind. Il n’en reste pas moins que ce lancement est entouré de controverses. Google n’a pas révélé les données utilisées pour entraîner ce modèle, ce qui ne rassurera évidemment personne sur la problématique des droits de propriété intellectuelle et la protection des créateurs. Cette opacité contraste avec la stratégie adoptée pour la première version d’Imagen, où Google avait révélé l’utilisation d’une version du dataset public LAION.

Imagen Blogtout 2.max 2000x2000 — © Google

La question légale de savoir si les fournisseurs d’IA peuvent utiliser des données publiques, y compris protégées par le droit d’auteur, pour former puis commercialiser un modèle, reste en suspens. Plusieurs procès sont en cours, les éditeurs de ces services se défendant en invoquant l’usage équitable. En attendant, Google semble opter pour la prudence en restant discret sur les données utilisées.

De plus, contrairement à certaines entreprises comme Stability AI et récemment OpenAI, Google n’offre pas aux créateurs la possibilité de retirer leurs contenus des bases de données d’entraînement, ni un mécanisme de compensation. Cette absence de reconnaissance des droits des créateurs est un sujet de préoccupation dans l’industrie.

En face des progrès techniques qui sont indéniables, il y a donc les questions posées par l’exploitation des données d’entraînement et le respect des droits des créateurs. Google est pourtant partie prenante dans les discussions actuelles menées au plus haut niveau, que ce soit aux États-Unis ou en Europe, pour trouver un terrain d’entente sur ces sujets ô combien sensibles.

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.