Yahoo offre 13,5 To de données d’utilisateurs pour améliorer les algorithmes de recommandation

Sur le web

Par Henri le

Vous le savez déjà, mais surfer sur le Net sans VPN équivaut très souvent à être tracké par de la publicité en tout genre. Et cette dernière devient de plus en plus intelligente.

yahoo-logo-violet

Yahoo vient de faire un beau cadeau à la communauté de chercheurs qui s’intéressent aux algorithmes de recommandation sur Internet. Dans le cadre de son programme Webscope, la firme de Sunny Vale a en effet livré plus de 13,5 To de données anonymisées aux chercheurs, ce qui représente les interactions de plus de 20 millions d’utilisateurs de Yahoo entre les mois de février et mai 2015.

Cela équivaut environ à 110 milliards d’interactions, directement liés aux fils d’actualité de plusieurs des services de la société comme Yahoo News, Sports, Finance, Movies ou Real Estate. Le document proposé atteint les 13,5 To, soit un fichier compressé de 1,5 To.

slide_1

Ces données ont beau être anonymes, elles sont suffisamment précises pour mettre en place des analyses poussées. On peut y consulter la tranche d’âge, le genre et même les données géographiques à l’origine de ses interactions.

Cette immense « bibliothèque de comportements » va laisser un champ d’action considérable aux chercheurs. Grâce à ces données, ces derniers vont pouvoir à terme améliorer les algorithmes de recommandation, et mieux comprendre les démarches des internautes quand ils surfent sur le net.

Screen-Shot-2013-02-20-at-6.03.25-AM-600x383

Cela permettrait également de faire des avancées dans le domaine de l’apprentissage automatique, une branche particulièrement pointue de l’intelligence artificielle, qui permet à une machine (ici algorithmique) d’évoluer par un processus systématique.

Des recherches à la fois fascinantes et terrifiantes.