L’annonce a fait l’effet d’un coup de cymbales mal placé : Spotify a confirmé avoir désactivé des comptes après la mise en ligne, par le groupe d’activistes Anna’s Archive, d’une base de données contenant 86 millions de morceaux issus de la plateforme. L’opération est revendiquée par un collectif qui se présente comme une bibliothèque universelle dédiée à la conservation du savoir, et désormais de la musique.
Un aspirateur branché sur Spotify
Spotify n’y va pas par quatre chemins : il n’y a pas eu d’intrusion dans ses systèmes internes. « Nous avons identifié et désactivé les comptes malveillants impliqués dans un scraping illégal », explique un porte-parole. La méthode ? Du « stream-ripping » mené sur plusieurs mois via des comptes utilisateurs créés par des tiers, en violation des règles de la plateforme. Pas de hack, donc, mais un contournement patient à une échelle industrielle.
La plateforme dit avoir renforcé ses protections contre ce type d’attaques liées au droit d’auteur et surveiller de près les comportements suspects. Et de rappeler un refrain bien rodé : « Depuis le premier jour, nous soutenons la communauté des artistes contre le piratage ». Détail qui pique : Anna’s Archive n’a pas jugé utile de prévenir Spotify avant de publier ses fichiers. De son côté, le groupe assume sans détour. Dans un billet de blog, le collectif explique que sa mission de préservation « ne distingue pas les types de médias ». « Nous avons découvert un moyen d’aspirer Spotify à grande échelle », écrit-il, voyant là l’occasion de lancer une archive musicale tournée vers la conservation.
Les chiffres donnent le tournis : un fichier principal d’un peu moins de 300 téraoctets, regroupant 86 millions de fichiers audio, censés représenter 99,6 % des écoutes sur Spotify. À cela s’ajoute une base de 256 millions de pistes en métadonnées, couvrant les mises en ligne de 2007 à juillet 2025, plus un lot séparé avec les 10.000 titres les plus populaires. Selon le site, il s’agirait « de loin de la plus grande base de données musicale publique ».
Le collectif en profite pour livrer quelques curiosités statistiques. Les trois chansons les plus écoutées — « Birds of a Feather » de Billie Eilish, « Die with a Smile » de Lady Gaga et « DtMF » de Bad Bunny — totaliseraient plus d’écoutes que les 20 à 100 millions de morceaux les moins populaires réunis. Un rappel assez brutal de la réalité des plateformes : une poignée de titres fait le maximum d’écoutes, au mépris de la diversité.
Anna’s Archive n’est pas un nouveau venu. Le site est bloqué dans plusieurs pays pour violations répétées du droit d’auteur et s’inscrit dans la lignée de Z-Library, fermée en 2022 après l’intervention du ministère américain de la Justice. Z-Library revendiquait alors plus de 11 millions d’e-books. Depuis, Anna’s Archive a agrégé des catalogues issus de Internet Archive, Library Genesis ou Sci-Hub. En décembre, le site annonçait héberger 61 millions de livres et 95 millions d’articles scientifiques.
🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.