Le 16 février 2001 constitue une date marquante dans l’Histoire des sciences. C’est le jour où les célèbres revues scientifiques Science et Nature annonçaient le séquençage total du premier génome humain. La conclusion d’un projet scientifique international lancé en 1990 et ayant mobilisé au total près de 3 milliards de dollars. De ce premier séquençage sont nées les grandes études de génomique, qui permettent progressivement de comprendre l’impact de la génétique sur les maladies.
Du séquençage du génome à l’ère de la génomique
Le premier séquençage du génome humain a permis de lister de manière exhaustive l’ensemble des gènes codant pour des protéines, mais aussi de mettre en évidence toutes les parties non codantes du génome, c’est-à-dire toutes les parties qui ne codent pas pour des protéines. Restait alors à décrypter le rôle de ces parties non codantes dans l’expression des gènes codant pour des protéines.
Depuis 20 ans, les équipes de recherche du monde entier travaillent sur différentes parties du génome pour comprendre la variabilité génétique d’un individu à l’autre et les différents schémas d’expression des gènes en particulier dans le cadre des 1 660 pathologies connues pour avoir une origine génétique. L’ensemble de ces études permettent progressivement de :
- mieux comprendre les gènes impliqués dans certaines maladies ;
- analyser les variabilités de l’expression génétique ;
- entrevoir l’importance de l’épigénétique ;
- imaginer des solutions de thérapie génique pour traiter des maladies.
La génomique à l’heure de l’intelligence artificielle
Pourtant, 20 ans après la lecture du premier génome humain et après des milliers d’études menées partout dans le monde, des zones d’ombre persistent. Il n’existe par exemple pas encore de consensus international sur la localisation précise de la séquence qui marque le début ou la fin d’un gène. De même, les experts ne sont pas unanimes sur les séquences obtenues à partir de certains gènes. Enfin, certaines parties du génome sont très étudiées, tandis que d’autres restent encore peu ou pas explorées.
Si désormais, le séquençage d’un génome humain s’effectue de manière beaucoup plus rapide et avec un coût réduit, l’interprétation de l’expression génique reste complexe, en raison du volume colossal de données obtenues. L’arrivée récente et l’essor de l’intelligence artificielle pourraient permettre d’accélérer les découvertes sur la génétique.
Différents algorithmes d’intelligence artificielle ont été développés ces dernières années pour faciliter la recherche en génomique. Ils permettent notamment de mieux comprendre l’évolution d’un gène au cours du temps : comment un gène évolue d’une espèce à l’autre au fil de l’évolution. Mais aussi de mieux prédire les conséquences biologiques des variations dans les séquences génétiques pour comprendre l’origine des maladies.
Des outils d’IA spécifiquement développés et entraînés pour étudier la variabilité génétique
Les capacités hors normes de l’intelligence artificielle facilitent l’analyse d’une multitude de données en un temps court. Ainsi, l’un des derniers algorithmes développés, AlphaGenome, permet d’évaluer l’impact d’une mutation génétique sur l’ensemble des signaux biologiques pris en compte (près de 6 000) en moins d’une seconde. Ces résultats, publiés dans la revue scientifique Nature, soulignent l’intérêt de l’IA, notamment pour analyser de longues séquences du génome. Jusque-là, les scientifiques s’intéressaient généralement à des portions plus réduites du génome, alors que l’IA offre la possibilité d’analyser des portions plus importantes, jusqu’à un million de paires de bases, avec une résolution au nucléotide près.
Reste à savoir comment ces algorithmes sont entraînés. Dans le cas d’AlphaGenome, son analyse s’appuie sur un seul génome humain de référence et sur un génome comparatif de souris. Les scientifiques doivent désormais apporter des améliorations à ces outils d’IA pour leur permettre de prendre en compte les variabilités génétiques entre les individus, prédire des traits complexes ou encore analyser l’impact sur des maladies multifactorielles impliquant plusieurs gènes de susceptibilité.
Sources
- Sorbonne Université. AlphaGenome, une nouvelle avancée en intelligence artificielle pour comprendre les effets des mutations génétiques. 17 février 2026. https://www.sorbonne-universite.fr/actualites/alphagenome-une-nouvelle-avancee-en-intelligence-artificielle-pour-comprendre-les-effets
- Pour la Science. Le projet « Génome humain », une mine de découvertes. 18 février 2021. https://www.pourlascience.fr/sd/genetique/le-projet-genome-humain-une-mine-de-decouvertes-21431.php
- Le Journal du CNRS. L’IA au secours du décodage et de l’analyse du génome. 1er octobre 2025. https://lejournal.cnrs.fr/nos-blogs/focus-sciences/lintelligence-artificielle-au-secours-du-decodage-et-de-lanalyse-du-genome