Passer au contenu

La page n°1 de Wikipedia en dit long sur le Web d’aujourd’hui

Si une reine ayant vécu il y a deux millénaires domine Wikipedia, c’est en partie grâce à Google Assistant.

Taha Yasseri est un professeur de sociologie au prestigieux University College de Dublin qui s’intéresse tout particulièrement à la façon dont les humains se comportent sur Internet. Depuis le début de l’année, il s’est penché sur les statistiques de l’encyclopédie collaborative Wikipédia en 2022, et il a livré le fruit de ses réflexions dans un billet fascinant paru sur The Conversation. Visite guidée d’une enquête qui en dit long sur l’Internet d’aujourd’hui.

Ces dernières années, on constate que les pages les plus populaires gravitaient souvent autour des mêmes thématiques : les célébrités, le divertissement, et la politique. 2020 a par exemple été dominée par la pandémie de Covid-19, les élections présidentielles américaines et la mort de la légende de la NBA Kobe Bryant. En 2021, c’est l’Euro de football, la série à succès Squid Games et la mort du prince Philippe qui ont attiré le plus d’utilisateurs.

On retrouve également ce genre de tendances en 2022. Côté sport, la Coupe du Monde de la FIFA (5e), Lionel Messi (14e) ou Cristiano Ronaldo (12e) ont tous attiré plus de 20 millions d’internautes. Même constat pour Amber Heard et Johnny Depp, dont le procès pour diffamation a fait les gros titres pendant des mois.

Le décès de la reine Elizabeth II (6e) a fait encore mieux, avec plus de 40 millions de visites. La page de l’incontournable Elon Musk, particulièrement loquace dans les médias cette année, hérite de la 8e place avec presque 28 millions de visites.

Une première place surprenante…

Rien de bien surprenant, en somme… du moins, jusqu’à la première position. Car le moins que l’on puisse dire, c’est que le lien avec l’actualité est beaucoup moins évident qu’avec les pages mentionnées ci-dessus. Et sans l’image en tête d’article, vous aurez probablement du mal à deviner de quoi il s’agit.

Certains penseront très probablement à la situation en Ukraine. Après tout, elle ne cesse de faire les gros titres depuis bientôt un an. Raté ! Effectivement, la politique a aussi occupé une place prépondérante. Mais l’invasion par la Russie n’arrive qu’en troisième position du classement annuel, avec plus de 50 millions de visites. Vladimir Poutine arrive en 9e position avec 25 millions de vues. Il est suivi de près par la page de l’Ukraine (11e) qui a accumulé 24 millions de vues en 2022.

S’agirait-il de la série Netflix basée sur Jeffrey Dahmer, qui a fait un véritable carton ? Non plus ! Le tueur en série campé par Evan Peters échoue sur la deuxième marche du podium annuel, avec plus de 54 millions de vues. La victoire revient en fait à… Cléopâtre, la légendaire reine d’Égypte antique, qui totalise presque 56 millions de visites !

…et étonnamment tenace

Un détail qui a beaucoup surpris le sociologue. Certes, Cléopâtre était la star d’une publicité du Superbowl, la grand-messe annuelle du football américain. Nous avons aussi vu passer quelques rumeurs à propos d’un éventuel remake du film classique de 1963, avec Gal Gadot dans le rôle de la dynaste. Mais rien qui suffit à expliquer le score invraisemblable de cette page Wikipédia.

Et en poussant l’analyse plus loin, Yasseri a fait une autre découverte étonnante. En se penchant sur les statistiques, il a déterminé ce qu’il appelle la demi-vie moyenne d’une page Wikipédia. Ce concept de demi-vie est généralement utilisé par les physiciens nucléaires ; il désigne la durée au bout de laquelle la moitié des atomes se désintègre naturellement dans un matériau radioactif. On l’utilise aussi en pharmacologie. Dans ce contexte, la demi-vie désigne la durée nécessaire pour que la concentration d’une molécule dans le sang diminue de moitié.

Dans le cas de Wikipédia, la demi-vie désigne la durée au bout de laquelle l’attention du public diminue de moitié. Elle va généralement de cinq à huit jours, ce qui est assez faible dans l’absolu. Sur ce graphique produit par Yasseri et son équipe, on constate que cela se vérifie dans le cas de Dahmer. On observe un pic de fréquentation extrême sur la page Wikipédia au moment de la sortie de la série. Elle a ensuite chuté très rapidement dans les jours qui ont suivi.

un graphique de la fréquentation des pages wikipedia de Cléopâtre et Jeff Dahmer
© Taha Yasseri et al.

Quand Google Assistant joue au rabatteur

On peut déjà en tirer une conclusion assez anecdotique, mais pas inintéressante sur la fameuse « culture de l’instantané » que le Web est souvent accusé d’encourager. Mais le graphique de la page de Cléopâtre, en revanche, a une allure totalement différente. On constate non pas un, mais plusieurs pics d’attention successifs. Comme si la souveraine avait fait les gros titres plusieurs fois au cours de l’année.

De plus en plus perplexes, les chercheurs ont donc continué d’explorer diverses pistes. Ils ont enfin obtenu un début de réponse grâce à Pierre-Yves Beaudouin, administrateur de la branche française de Wikimedia. Sur Twitter, ce dernier a suggéré que cette popularité incroyable était directement liée… à l’intervention de Google Assistant.

À première vue, le lien entre une régente décédée depuis plus de 2000 ans et un assistant vocal moderne est tout sauf évident. Mais il se trouve que lorsqu’on utilise le programme pour la première fois, il propose quelques exemples de commandes vocales. Il peut par exemple suggérer « Raconte-moi une blague », « Ouvre YouTube »… ou « Montre-moi Cléopâtre sur Wikipédia » !

Or, Google Assistant n’est pas qu’un simple gadget. D’après un communiqué de la maison-mère, il est utilisé par des centaines de millions d’utilisateurs chaque mois. Et mécaniquement, nombre d’entre eux ont donc été redirigés vers la page Wikipédia de la reine d’Égypte. De plus, il se trouve qu’en 2020, avant la montée en puissance de Google Assistant, la page n’attirait que 2 à 3 millions d’utilisateurs par an.

la fréquentation de la page wikipedia de cléopatre a explosé après l'introduction d'une ligne de texte dans google assistant
La fréquentation de la page Wikipédia de Cléopâtre a explosé après l’introduction d’une ligne de texte dans Google Assistant. © Taha Yasseri et al. via The Conversation

L’énigme semble donc résolue : si Cléopâtre règne aujourd’hui sur Wikipédia comme sur l’Égypte d’antan, c’est parce qu’un logiciel moderne a joué au rabatteur… et c’est là que cette histoire prend un tournant plus préoccupant.

Une émanation inoffensive d’un problème pernicieux

Car en pratique, tout a commencé lorsque les designers de l’application ont décidé d’utiliser l’exemple de Cléopâtre. Un choix de design assez anecdotique, et surtout complètement arbitraire, mais qui a généré un trafic important. Or, il y a un autre système qui accorde une importante particulière à ces statistiques : Google lui-même !

En effet, même si les nuances de l’algorithme restent mystérieuses, on sait que les pages les plus populaires ont tendance à être mises en avant dans les résultats du moteur de recherche, avec différents ajustements pour privilégier le contenu jugé pertinent. Cela se traduit par un effet boule de neige ; puisque la page en question est mieux positionnée sur Google suite au rabattage de l’assistant, elle est aussi plus visible pour les autres utilisateurs du moteur d’Alphabet — c’est-à-dire presque tout le monde en Amérique et en Europe !

En résumé, on a donc une situation où un choix de design anecdotique a multiplié par 20 le nombre de personnes exposées à sujet précis sur la base d’un critère complètement arbitraire. On se retrouve donc avec une sorte d’effet papillon numérique qui regorge d’implications profondes.

Cela montre à quel point des choix à première vue innocents peuvent conditionner profondément le comportement des internautes. Le simple positionnement d’une image, la forme d’un bouton, le moindre bout de texte peuvent avoir un impact très concret sur les priorités du public.

Dans ce cas précis, ce n’est pas quelque chose d’intrinsèquement grave. Le thème est à la fois très intéressant et pas franchement sujet à controverse. Mais à la lumière de scandales sordides comme l’affaire Cambridge Analytica, on comprend facilement à quel point ces leviers pourraient être problématiques s’ils étaient utilisés à des fins politiques, par exemple.

L’objectif de Yasseri n’est pas de cogner à bras raccourcis sur la filiale d’Alphabet en particulier. Ses conclusions concernent tous les acteurs du numérique. Et à cause de leur statut dans cette industrie, Google et les autres GAFAM ont mécaniquement une responsabilité plus importante à ce niveau.

chien en laisse
© Laurent Mandine – Unsplash

Ce qu’il faut retenir du billet de Yasseri, c’est donc qu’il faut toujours rester conscient du pouvoir immense dont jouissent ces superpuissances. Certes, leurs produits nous rendent de fiers services au quotidien. Mais puisqu’ils agissent en coulisses, il est aussi facile d’oublier qu’aujourd’hui, nous sommes systématiquement tenus par la main lorsque nous naviguons sur Internet. Ce n’est plus seulement l’humanité qui définit ses propres centres d’intérêt; les produits des géants du numérique y participent directement.

Il est donc fondamental de rester alerte pour éviter que cet accompagnement ne se transforme en pilotage pur et simple. Car dans le cas contraire, nous risquons d’être menés à la baguette, voire complètement tenus en laisse par des algorithmes aux suggestions pas toujours pertinentes.

Vous pouvez retrouver ce texte et les autres contributions fascinantes de Yasseri sur son profil The Conversation, à cette adresse. Son classement des pages Wikipedia en 2022 est disponible ici.

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

17 commentaires
  1. “Taha Yasseri est un professeur de sociologie au prestigieux University College de Dublin qui s’intéresse tout particulièrement à la façon dont les humains.”
    “S’agirait-il de la série Netflix basée sur Jeffrey Dahmer, qui a fait un véritable ?”

    C’est impressionnant, cet article m’a tellement.

  2. Et pendant ce temps-là, cet article qui m’a été proposé par Google est truffé de pubs choisies pour moi par Google….

  3. Effectivement une belle démonstration de ce qu’est le Web d’aujourd’hui et dès la première phrase qui me laisse.
    Je pense que le meilleur de cet articles ce sont les 2 premiers commentaires qui sont.

  4. “on sait que les pages les plus populaires ont tendance à être mises en avant dans les résultats du moteur de recherche”

    C’est faux. Autant les phrases éclatées admettons, mais de la pure désinformation comme ça… En effet toute personne qui s’intéresse au SEO sait que les résultats de recherche sont indépendants du nombre de clics ou de vues.

    Par contre oui évidemment cela pose question sur le pouvoir des GAFAM sur les gens, mais on n’avait pas besoin de la page Wikipédia de Cléopâtre et de cette invention pour s’en rendre compte…

  5. Antoine, l’auteur de l’article, passionné par l’espace, les sciences, et l’informatique, est aussi friand. 🤔😂

  6. « Mais le plus le graphique de la page de Cléopâtre, en revanche, a une allure totalement différente »
    Toi aussi ssi, tu peux t’amuser à déchiffrer le texte de cet article. C’est vraiment un.

  7. Il s’intéresse à la façon dont les humains ?
    Il est pas le seul, moi aussi ma thèse s’intéressait à la façon dont les humains.
    Heureux que mon sujet reçoive plus d’attention.

  8. Ben moi j’ai bien l’article en entier je le trouve particulièrement intéressant j’avoue ne pas comprendre tous ces commentaires. Est-ce qu’il y aurait des bugs de visionnage sur certains navigateur ?
    Bizzare

    En tout cas cet article m’a vraiment appris des choses et je le trouve plutôt bien documenté.

    Bon de toute façon les gens qui se plaignent ne reviendront pas ici pour lire ce commentaire et comprendre qu’ils n’ont pas eu l’article en entier donc je ne suis pas sûr qu’il servira à grand-chose.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *