Reconnaissance faciale : IBM a utilisé un million de clichés sur Flickr sans informer les personnes photographiées

Développer un système de reconnaissance faciale requiert un lot de données très important. Et IBM ne s’est pas trop fatigué pour aller chercher des photos de gens sur le net.

Crédits : IBM

Depuis le mois de janvier dernier, IBM travaille à l’amélioration des systèmes de reconnaissance faciale, et tout particulièrement sur le secteur de l’équité. La firme espère ainsi minimiser les erreurs de reconnaissance selon les différentes ethnies ou couleurs de peau en travaillant sur la diversité des visages.

Elle a donc eu besoin d’un énorme stock de photos pour faire travailler ses algorithmes, et a décidé d’en piocher environ un million dans l’énorme de catalogue de Flickr. La firme a donc choisi une collection nommée « YFCC100M » composé de 99,2 millions de photos en Creative Commons, qui suppose une utilisation libre dans la majorité des cas. Elle n’est pas allée chercher bien loin puisque cette collection avait auparavant été composée par Yahoo (les anciens propriétaires de Flickr), également dans le cadre de recherches.

Mais IBM avait-il le droit de faire ça ? C’est la question que se pose NBC News, qui précise que les personnes en question n’ont jamais signé un accord pour que leurs visages servent à entraîner un puissant logiciel de reconnaissance faciale, notamment sur des questions aussi sensibles que l’appartenance ethnique. La chaîne d’info a mis en place un moyen de vérifier si vos photographies ont été utilisées.

IBM s’est défendu dans les colonnes de The Verge, en précisant que la totalité des principes de vie privée avait été respectée. Le géant de l’informatique ajoute que les personnes présentes dans cette base de données pouvaient la quitter très simplement. Un conseil que certains auraient peut-être voulu entendre avant que la firme ne s’en serve.