MAI-Image-2 : Microsoft se lance (enfin) dans la génération d’images maison

Microsoft ne veut plus seulement s’appuyer sur des partenaires pour générer des images IA. Avec MAI-Image-2, l’éditeur propose son propre modèle… performant, mais encore un peu bridé.

Jusqu’ici, Microsoft jouait surtout les intégrateurs. Pour Copilot ou l’outil Image Creator de Bing, l’entreprise s’appuyait largement sur les modèles d’OpenAI. Avec MAI-Image-2, elle change clairement de stratégie en développant son propre générateur d’images. Le modèle, conçu par l’équipe « AI Superintelligence », s’est déjà hissé à la troisième place du classement Arena.ai, un benchmark indépendant qui compare les modèles d’IA en fonction des préférences d’utilisateurs humains lors de tests à l’aveugle. De quoi placer Microsoft dans la course, derrière Google et OpenAI, mais désormais sur ses propres bases.

Microsoft sort de sa dépendance

MAI-Image-2 est accessible via un espace de test, le MAI Playground, avec un déploiement progressif prévu dans Copilot et Bing Image Creator. L’API reste pour l’instant réservée à quelques clients professionnels, en attendant une ouverture plus large via Microsoft Foundry.

Microsoft a cherché à répondre à des besoins très concrets. L’entreprise dit avoir travaillé avec des photographes, designers et créateurs visuels pour orienter le développement. Trois priorités en ressortent : mieux gérer les scènes complexes, améliorer le rendu photoréaliste et la fiabilité du texte intégré dans les images.

Et sur ces points, le modèle tient assez bien la route, d’après les premiers retours. Le rendu des images est propre, avec une bonne gestion de la lumière et des textures. Les proportions sont globalement cohérentes, même dans des situations improbables. Quant au texte dans l’image, un point faible classique, il est ici nettement plus lisible que chez beaucoup de concurrents.

Tout n’est pas parfait pour autant. La première limite saute rapidement aux yeux : la modération. MAI-Image-2 applique des règles très strictes, au point de refuser certaines scènes pourtant anodines. Même des illustrations stylisées peuvent être bloquées si elles sont jugées ambiguës. Pour les créatifs, cela risque de coincer assez vite.

Les contraintes d’usage n’aident pas non plus. Chaque image générée impose un délai d’environ 30 secondes, et le nombre total est plafonné à 15 par jour. Une fois la limite atteinte, il faut patienter 24 heures. C’est bien pour tester, mais clairement insuffisant pour un usage intensif. Autre restriction : le format. Impossible de sortir du carré 1:1. Pas de paysage, pas de portrait, pas de format personnalisé. En 2026, c’est un choix étonnant, surtout pour un outil destiné à alimenter des contenus en ligne.

Côté fonctionnalités, le service reste assez basique. MAI-Image-2 fonctionne uniquement en génération à partir de texte. Pas d’édition d’image, pas de retouche avancée. Des options devenues courantes ailleurs. Malgré tout, le potentiel est là. Techniquement, le modèle s’en sort bien, parfois même mieux que certains concurrents mieux classés dans les benchmarks. Et surtout, il permet à Microsoft de reprendre la main, réduire sa dépendance à OpenAI et maîtriser ses coûts à long terme.

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.