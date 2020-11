Selon l’Académie des technologies de France, le stockage ADN pourrait devenir la technologie d’archivage à long-terme par excellence d’ici 2040. François Képès, chercheur et membre de l’Académie, nous explique tout !

A l’heure où la miniaturisation électronique semble atteindre ses limites, les géants de l’informatique explorent la piste des ordinateurs quantiques. Leurs capacités sont toutefois limitées pour l’heure et leurs besoins énergétiques pantagruéliques. Depuis les années 1990, des biologistes, des généticiens et des chimistes développent heureusement une alternative très prometteuse : le stockage ADN.

Des films, comme Le Voyage dans la Lune de George Méliès, ont déjà été archivés dans le célèbre acide désoxyribonucléique, mais il serait capable de bien plus. Aujourd’hui, l’Académie des technologies de France assure qu’elle est la meilleure solution pour satisfaire notre gourmandise numérique. François Képès, académicien, ancien directeur de recherche à l’Institut de biologie des systèmes et de synthèse (iSSB) et co-auteur d’un récent rapport de l’Académie sur la question, nous a expliqué le principe, les enjeux et les limites de cette biotechnologie révolutionnaire.

JDG : Comment peut-on stocker des données numériques dans une molécule ADN ?

François Képès : Le principe est simple. Il faut suivre cinq étapes pour stocker de l’information numérique sur un support ADN : coder, écrire, stocker, lire et décoder. Pour coder, il est nécessaire de traduire un fichier numérique, composé d’une suite de 0 et de 1 selon le langage binaire des bits, en une séquence ADN, s’appuyant sur un langage quaternaire correspondant aux différents nucléotides qui la composent (A, C, G et T). Pour prendre un exemple, il suffit de convertir une paire de 00 en un A, 01 en C, 10 en G et 11 en T et votre codage est fait. Ensuite, le fichier ainsi traduit en « langage ADN » doit être écrit dans une molécule ADN : pour cela, on synthétise une séquence de nucléotides correspondant exactement à la séquence numérique codée.

L’ADN ainsi produit doit alors être stocké et protégé de ses ennemis naturels pour être conservé durablement. Aujourd’hui, la meilleure méthode est sans doute celle employée par la société française Imagene : elle consiste à mettre de l’ADN dans une capsule en verre, lui-même protégé par une capsule en acier inoxydable à atmosphère neutre. En somme, il faut éviter à l’ADN de se retrouver dans l’eau, face à l’oxygène dans l’air extérieur ou à la lumière. Cette capsule fait seulement la taille d’une pile bouton et 96 d’entre elles peuvent être contenues dans un support en plastique dans la paume de la main. Enfin, pour lire et décoder l’ADN, il suffit de réaliser le chemin inverse et de décoder le fichier moléculaire en fichier numérique conventionnel, grâce à des méthodes automatisées.

Quel est l’intérêt du stockage ADN ?

L’Académie des technologies a identifié cinq avantages : la longévité du support, la densité informationnelle, son indépendance des ressources rares (contrairement à la plupart des matériaux électroniques), la facilité avec laquelle il peut être copié et sa capacité à pouvoir être détruit facilement et totalement, si besoin (à l’inverse des données numériques). Conservé à 25°C, la demi-vie de l’ADN (temps nécessaire pour qu’une substance perde 50% de son activité physiologique) a été établie à 52 000 ans. Autrement dit, l’ADN est une molécule extrêmement stable, sur des dizaines de milliers d’années, si on l’écarte de ses ennemis. C’est un excellent médium pour le stockage.

Le stockage ADN réglerait aussi un sérieux problème de place et de consommation électrique, posé actuellement par les « data-centers » utilisés à travers le monde. Toutes les données numériques créées et stockées par l’humanité en 2018 représentent trente-trois mille milliards de milliards d’octets (ou 33 000 exaoctets). L’ensemble des serveurs renfermant l’ensemble de ces données recouvrait aujourd’hui un millionième de la surface émergée de la planète. Si rien ne change, d’ici 2040 le territoire occupé sera du millième. Certes, un progrès est encore possible mais la marge est fine. L’ADN nous a semblé l’alternative idéale et la plus avancée pour relever ce défi d’ici là.

Quel volume de données l’ADN est-il capable de contenir ?

Et bien, par exemple, 33 000 exaoctets tiendraient, en théorie, dans seulement 66 grammes d’ADN. En réalité, il existe encore une perte de densité : les techniques de synthèse actuelles nous oblige à découper un fichier numérique codé en plusieurs segments de séquence ADN. De plus, il faut compter sur le volume réel des conteneurs, qui pèsent environ 0,08 g la capsule. De ce fait, toutes les données de la planète tiendrait dans une fourgonnette pleine de ses conteneurs miniatures remplis d’ADN. Concrètement, dans une molécule, un bit serait stocké sur environ 50 atomes tandis que le stockage magnétique traditionnel a besoin d’un million d’atomes pour stocker un seul bit.

Quels progrès peut-on espérer de cette technologie dans les années à venir ?

La loi de Moore, bien émoussée depuis quelques années, prévoyait une vitesse de progrès informatique (de rentabilité de la bande magnétique et de la réduction des tailles des transistors) d’un facteur deux tous les deux ans. Le domaine du stockage ADN, quant à lui, avance d’un facteur deux tous les six mois. Sa vitesse d’amélioration est exponentielle. Et contrairement au progrès informatique, le progrès en matière de stockage ADN n’est pas prêt de s’arrêter. Cette approche va finir par sérieusement concurrencer la bande magnétique, le support de base des serveurs actuels.

En conclusion de notre rapport, nous entrevoyons deux issues économiques majeurs. D’une part, dans cinq à dix ans, le stockage ADN devrait conquérir trois marchés de niche : le secteur de l’archivage culturel, pour la conservation des films et des musiques ; celui des données scientifiques, comme pour les 100 pétaoctets de données accumulées par le CERN (Conseil européen sur la recherche nucléaire) sur la physique nucléaire, par exemple ; et le domaine des informations sensibles et confidentielles, qui demandent d’être reproduites facilement et discrètement mais aussi d’être détruites sans laisser de trace. D’autre part, d’ici 2040, le stockage ADN pourrait devenir la technologie d’archivage à long-terme pour des marchés plus globaux comme le stockage des données pour les réseaux sociaux ou pour des grandes bibliothèques publiques.

Quels obstacles pourraient empêcher l’ADN de devenir le serveur du futur ?

Notre groupe de travail à l’Académie a interrogé 26 personnalités du secteur, provenant de 10 pays différents. Et ce qui est le plus limitant, selon eux, c’est finalement la lecture et l’écriture de l’ADN. D’après nos calculs, il faudrait améliorer la technologie d’un facteur mille pour le coût de lecture de l’ADN et de cent millions pour celui de la vitesse d’écriture. Des compagnies comme Microsoft travaillent déjà sur des prototypes déjà capables de stocker 1 Go de données dans l’ADN et bientôt d’optimiser encore davantage ses opérations. En 2024, selon la vitesse exponentielle du progrès en matière de stockage ADN, il serait possible d’archiver (et désarchiver à loisir) 1 To en 24 heures pour un coût d’environ mille dollars. Dans un premier temps, dans les années à venir, le stockage ADN sera surtout utiliser pour le « cold storage », le stockage de données froides, que l’on ne touche plus après les avoir archivées.

Le fait que l’ADN soit le support universel de la vie y est-il pour quelque chose ?

S’il existe un lien entre le besoin technologique et la nature héréditaire de l’ADN, c’est l’obsolescence. Tant qu’il y aura de la vie et une « technologie de la vie », la médecine, on saura lire et écrire de l’ADN. Cet avantage est unique. L’ADN sera toujours un standard technologique disponible. Bien qu’elle soit utilisée en priorité à l’extérieur du vivant, il faut néanmoins noter que si cette technologie est utilisée au sein du vivant, elle peut poser des problèmes non seulement techniques mais éthiques. Certains laboratoires ont déjà essayé de stocker d’énormes quantités de données distribuées dans l’ADN contenu dans des cellules vivantes. Il existe une probabilité que la cellule s’en serve, accidentellement, et auquel cas, on ne pas prédire son effet biologique. D’ailleurs, à l’inverse, d’autres sociétés n’utilisent pas l’ADN mais d’autres polymères « numériques » – dont les monomères peuvent être traduits en bits aussi – plus malléables chimiquement. Cependant, leurs applications n’ont pas l’avance et le potentiel dont bénéficie le stockage ADN.