Publicité
Tech by VICE

Peut-on vraiment reconstituer un visage à partir d'un échantillon ADN ?

"Bientôt, nous serons capables de prédire la personnalité des gens à partir de leur génome", affirme Craig Venter. Ce n'est pourtant pas ce que dit la communauté des généticiens.

par Alessandro Tavecchio
15 Septembre 2017, 8:00am

Image : PNAS.

Le voeu le plus cher des agences de sécurité nationales et internationales est de pouvoir reconstituer le visage d'une personne en utilisant son ADN. Née dans la littérature de science fiction, cette technologie fascinante serait désormais à "portée de main" si l'on en croit les médias les plus hâtifs.

Une publication récente du Human Longevity Institute et à laquelle a participé Craig Venter – l'entrepreneur qui a fait fortune dans les biotechnologies et dont les recherches sont réputées pour leur audace – explique qu'en combinant de nouvelles méthodes bioinformatiques et l'intelligence artificielle, il est en effet possible de réaliser cet exploit.

Les chercheurs ont utilisé des scans 3D en haute résolution des visages de plus d'un millier de personnes d'âge, genre et origine ethnique différents, dont ils avaient préalablement séquencé le génome. En combinant analyse ADN et scans faciaux, l'équipe a utilisé une IA permettant d'associer un polymorphisme (la variation d'une seule paire de bases du génome) avec des traits physiques, comme la hauteur des pommettes. Après avoir entrainé leur système à base de réseaux de neurones sur leur base de données génétiques, l'IA est parvenue à identifier correctement un individu à partir des données extraites de son génome dans 74% des cas.

La publication a évidemment suscité l'intérêt de la presse, mais également de nombreuses critiques de la part des généticiens et des bioinformaticiens. L'article de l'équipe du Human Longevity Institute a été publié le 6 septembre dans l'après-midi, et le premier papier rejetant ses conclusions est paru en preprint sur Biorxiv quelques heures plus tard.

Exploiter uniquement les données sur l'âge, le genre et l'origine ethnique des sujets permet d'identifier les individus dans 75% des cas, contre 74% avec la méthode dite "génétique".

La principale critique du travail de Venter porte sur la robustesse du mécanisme d'identification au cœur du système. La base de données du HLI contient un peu plus qu'un millier d'individus, mais en pratique l'IA a pour tâche d'en identifier une dizaine seulement, choisis de manière aléatoire. Du fait de la petite taille de la base de données et du peu de comparaisons à effectuer au sein de l'échantillon de 10 individus, il était très facile pour l'ordinateur de localiser la bonne personne à partir de variables démographiques toutes simples – comme l'âge ou le sexe – sans nul besoin de fouiller les profondeurs du génome pour déduire l'espace entre les sourcils d'untel ou d'unetelle.

Dans sa critique publiée sur Biorxiv, le généticien Yaniv Erlich du New York Genome Center et le chef du conseil scientifique de MyHeritage – une entreprise de généalogie rivale de la boite de Venter – ont montré qu'ignorer les données liées à l'ADN en se contentant d'utiliser l'âge, le genre et l'origine ethnique des sujets permettait d'identifier les individus cible dans 75% des cas, contre 74% avec la méthode dite "génétique".

Autre critique : en dépit de la montagne de données récoltées sur les pommettes et les structures faciales des visages, l'IA a utilisé une approximation générique des caractéristiques de genre et des caractéristiques ethniques des personnes considérées, plutôt que de cibler une seule personne.

En réponse aux critiques, Craig Venter a posté une reconstruction 3D de son propre visage à partir de son ADN – espérant ainsi démontrer la validité de sa méthode. Yaniv Erlich a fait remarquer que le visage en question était si générique qu'il pouvait passer pour n'importe qui, dont un scan du visage de l'acteur Bradley Cooper.

Le côté générique de la reconstruction faciale est d'autant plus évident lorsqu'on compare plusieurs modèles prédictifs de visage, réalisés à partir de différents échantillons ADN :

À gauche, des scans de visages réels. À droite et au centre, des reconstitutions de l'IA.

Même le processus de publication de l'article a une histoire trouble. L'un des auteurs, Jason Piper, a quitté l'équipe en cours de route (selon lui, sur les 29 auteurs du papier, seuls 13 sont encore au Human Longevity Institute). Il accuse l'Institut d'avoir fait des déclarations fracassantes pour effrayer le public, ce qui risque de bloquer la diffusion de bases de données génétiques publiques à l'avenir – au profit de bases de données privées telles que celle de Venter.

Piper note également que la publication a d'abord été rejetée par les revues Science et Nature et a fini par paraître dans PNAS par soumission directe – c'est-à-dire grâce au système hétérodoxe de la revue qui permet aux auteurs de choisir eux-mêmes leurs reviewers.

L'équipe HLI a déjà annoncé qu'elle comptait répliquer les résultats de cette étude. Pour le moment, elle reconnait la faiblesse de son protocole expérimental, mais l'attribue exclusivement à la taille de l'échantillon étudié. Elle estime que la méthode employée est parfaitement fonctionnelle. Venter, de son côté, soutient que ses résultats sont alarmants et qu'il faut en tirer des conclusions radicales : il serait impossible de préserver l'anonymat d'un donneur d'ADN, selon lui.

"Bientôt, nous serons capables de prédire la personnalité des gens à partir de leur génome", scande-t-il. Il ajoute que nous pourrions être à l'aube d'une ère du "profiling génétique".

D'une certaine façon, les critiques adressées à Craig Venter sont représentatives de la méfiance d'une partie de la communauté scientifique face à la perspective de reconstituer la forme d'un visage à partir d'un échantillon ADN. Les experts s'accordent sur le fait que c'est possible en théorie, surtout si l'on travaille sur un génome complet. Mais en pratique, les choses sont beaucoup plus complexes. Certains traits physiques sont déterminés au cours du développement embryonnaire et ne pourront jamais être prédits par l'ADN seul : c'est pour cette raison que les reconstitutions faciales se ressemblent toutes.

Quand notre attention est monopolisée par la recherche d'avant-garde sur la reconstitution faciale, les vrais enjeux nous échappent. Aujourd'hui, on peut identifier des individus précis à partir des bases de données généalogiques comme 23andMe, et tout le monde l'a déjà oublié.