Passer au contenu

DeepMind : cette IA révolutionnaire résout un problème majeur de la biologie

DeepMind ne développe pas seulement des IA pour remporter le jeu de Go. Le laboratoire de Google a mis au point AlphaFold, qui prédit avec une précision révolutionnaire la forme exacte des protéines.

Crédits : DeepMind / YouTube.

“Nous sommes bloqués face à ce problème de repliement des protéines depuis presque 50 ans, souligne John Moult, professeur en biologie cellulaire de l’université du Maryland. Voir DeepMind y trouver une solution, après y avoir moi-même travaillé depuis si longtemps, est un moment très spécial.” Le domaine de la biologie est aujourd’hui en effervescence. AlphaFold, une intelligence artificielle développée par le laboratoire DeepMind d’Alphabet, la maison-mère de Google, est parvenue à prédire la forme de protéines très complexes avec une précision jamais atteinte auparavant.

C’est la forme qui fait la protéine

Les protéines sont les éléments fonctionnels de la vie. L’hémoglobine permet, par exemple, de transporter le dioxygène (O2) dans notre sang. En outre, les immunoglobulines de type G constituent ce que l’on appelle communément les anticorps. Ces protéines, nécessaires à notre vie et notre survie, sont codées à partir des gènes de notre ADN sous la forme d’acides aminés, imbriqués les uns aux autres par des liaisons peptidiques en une séquence. Cette dernière n’est cependant pas plane : selon des lois de physique moléculaire et de biochimie, sa complexité lui donne une forme – dite de repliement – particulière en plusieurs hélices, feuillets et coudes. C’est cette forme en 3D élaborée qui permet à une protéine d’exercer correctement sa fonction, et donc sa raison d’être. La connaître revient à comprendre exactement à quoi sert la protéine en question et comment s’en servir – notamment, dans le domaine médical. Si connaître la simple séquence d’une protéine est aujourd’hui relativement aisé, parvenir à savoir avec précision comment chaque protéine se comporte dans l’espace est en revanche extrêmement ardu. “Le défi majeur est le nombre astronomique de repliements qu’une protéine peut adopter en théorie, en comparaison de la structure 3D finale qu’elle peut prendre en réalité” atteste les ingénieurs et scientifiques de DeepMind.

Des prédictions proches de la réalité

Dans cette optique, des chercheurs comme John Moult ont fondé le CASP (pour “Critical Assessment of protein Structure Prediction“), qui invitent les biochimistes et autres spécialistes à collaborer ensemble tous les deux ans pour déterminer le repliement réel de certaines protéines d’intérêt, à l’aide de technologies informatiques. Des experts viennent ensuite donner un score de précision au modèle prédictif établi par protéine, appelé GDT (ou “Global Distance Test”, qui correspond en quelque sorte à son pourcentage de conformité avec la réalité). Lors du CASP 14, cette année, l’intelligence artificielle AlphaFold de DeepMind a réussi à obtenir un score de 92,4 GDT pour son modèle prédictif de la forme (jusque là indéterminée) d’une protéine du coronavirus SARS-CoV-2, ORF8. Lors du précédent essai d’AlphaFold, en 2018, le modèle prédictif qu’elle avait donné pour une autre protéine n’avait obtenu que 60 GDT. Aujourd’hui, sa nouvelle version arrive même pour des protéines réputées extrêmement complexes à obtenir, en moyenne, un résultat de 87 GDT – donc, approchant énormément de la réalité.

Le secret d’AlphaFold ? Pouvoir se baser sur 128 processeurs spécialisés de Google, ou puces d’accélération de réseaux de neurones artificiels (NPU). Ces derniers ont été entraînés à connaître les structures 3D de 170 000 protéines et les séquences d’un nombre encore plus pharamineux d’autres protéines connues et archivées dans des bases de données publiques. Pour en savoir plus, il faudra cependant attendre que DeepMind se décide à publier ses travaux en détail.

[amazon box=”B08DHT8M1C”]

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

Source : Nature

1 commentaire
  1. Il faudrait savoir en combien de temps un modèle est généré…mais c est encourageant. Avec folding@home et ça, j espère que ca va aider concrètement la recherche.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *