C'est prouvé, l'IA copie des œuvres protégées

C’est prouvé, l’IA copie des œuvres protégées

On n’avait que très peu de doute sur la question, mais cette étude vient confirmer les soupçons.

Depuis déjà quelques années, éditeurs et ayant droits s’écharpent sur le sujet de l’IA. Quand certains auteurs comme George R.R. Martin crient au plagiat de leurs textes, OpenAI et ses concurrents répliquent en invoquant le fair use, qui permet de s’inspirer sans citer directement, à la manière d’un être humain qui engrangerait des connaissances pour étoffer son travail, sans avoir à recopier directement. Problème : cette “régurgitation” massive ne passe plus. Une menée par les chercheurs de Stanford et Yale, et publiée début janvier 2026, démontre que les grands modèles d’IA comme GPT-4.1, Gemini 2.5 Pro, Grok 3 ou Claude 3.7 Sonnet reproduisent fidèlement des livres sous copyright. Évidemment, c’est interdit.

L’IA aime (un peu trop) Harry Potter, Orwell et Game of Thrones

Pour les besoin de l’étude, quatre LLM ont été testés entre août et septembre 2025 : Claude 3.7 Sonnet (Anthropic), GPT-4.1 (OpenAI), Gemini 2.5 Pro (Google), Grok 3 (xAI). Les résultats sont édifiants : pour 1984 de George Orwell, Claude est capable de recracher plus de 94% du livre original. Même chose pour Harry Potter et la Pierre philosophale. La concurrence ne fait pas beaucoup mieux, puisque tous les modèles interrogés surpassaient les 70% de taux de citation directe.

Le problème, c’est que les entreprises comme OpenAI, Google, Anthropic ou xAI entraînent leurs LLM sur des bases de données massives, incluant livres, articles et images protégés, sans rémunérer les ayants droit. À la lumière des récentes découvertes de Stanford et Yale, l’idée d’un “apprentissage transformateur”, humanisé est sérieusement remis en doute.

Enjeux éthiques et judiciaires

Pour les créateurs (auteurs, éditeurs, labels), cette découverte est un levier, qui pourrait leur permettre d’obtenir gain de cause face à des IA tentaculaires. À mesure que le marché évolue, il faudra d’ailleurs s’attendre à voir les partenariats se multiplier. Disney a récemment annoncé une collaboration inattendue avec OpenAI, et plusieurs médias internationaux ont signé des accords pour alimenter les LLM. À terme, on peut imaginer que les organismes chargés de faire valoir les droits des auteurs se mêleront de l’affaire, et qu’ils réclameront un système de rémunération. En attendant, les résultats de cette étude viennent rallumer une mèche déjà incandescente.

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.