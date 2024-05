En 2020, le monde scientifique a connu une secousse d'envergure. Google DeepMind avait dévoilé la deuxième version d'AlphaFold, son intelligence artificielle capable de prédire la manière dont une protéine se replie, et donc de mieux comprendre son rôle.

L'outil, qui a fait l'objet de l'un des articles scientifiques sur l'IA les plus cités de l'histoire, est désormais utilisé par des millions de biologistes. Ces derniers s'en servent pour accélérer les progrès en matière de découverte de médicaments, de développement de vaccins, de recherche sur des maladies génétiques...

Quatre ans après, il est probable que la firme reproduise ce coup d'éclat ce mercredi 8 mai. Les chercheurs de DeepMind et d'Isomorphic Labs (laboratoire également propriété de Google) présentent donc AlphaFold 3, dans la revue Nature.

Un modèle IA capable de prédire les interactions entre biomolécules

Ce modèle (qui combine en réalité des dizaines d'algorithmes différents) va au-delà des protéines et fournit des prédictions précises sur les interactions entre les protéines et les autres biomolécules de nos cellules. A l'instar de l'ADN, l'ARN et les petites molécules comme les ligands que l'on retrouve dans de nombreux médicaments. Bref, de quoi prédire comment différentes molécules présentes dans notre corps (et dans la nature) se comportent. Ce qui peut faciliter encore davantage la recherche de nouveaux traitements et matériaux.

Aujourd'hui, « environ un quart de la recherche sur AlphaFold se concentre sur la compréhension et la lutte contre les maladies - plus particulièrement le cancer, les bactéries résistantes aux médicaments, la Covid-19 et les maladies neurodégénératives comme Parkinson et Alzheimer », précise un porte-parole de Google DeepMind.

Des systèmes permettant de prédire des interactions entre différentes molécules existent déjà, mais les équipes de Google avancent que leur technologie est bien plus précise. « Nous constatons une amélioration d'au moins 50 % par rapport aux méthodes de prédiction existantes », note l'entreprise dans un post de blog.

Une IA qui surpasse les méthodes physiques classiques, selon Google

AlphaFold 3 combine des architectures de deep learning (apprentissage profond) avec des modèles de diffusion (comme ceux que l'on trouve dans les générateurs d'images comme Midjourney et DALL-E-3) pour créer des prédictions de structures moléculaires très précises, couvrant un large éventail de molécules biologiques. Plutôt que de se baser directement sur des calculs physiques détaillés pour chaque interaction, il apprend à partir de grandes quantités de données sur des structures biomoléculaires déjà connues.

Autrement dit : AlphaFold 3 « observe » comment les molécules se comportent, apprend de ses observations, et utilise ces connaissances pour prédire de nouvelles structures. Et il serait, selon Google, la première IA à surpasser les méthodes classiques qui simulent les interactions entre molécules en se basant sur les lois physiques.

En parallèle de ce nouveau modèle, Google lance le serveur AlphaFold : un outil gratuit et simple d'utilisation permettant aux chercheurs d'accéder aux fonctionnalités d'AlphaFold 3 pour générer des structures biologiques. De quoi démocratiser son accès, notamment auprès de biologistes ayant moins de compétences en informatique. Concrètement, un chercheur peut demander à AlphaFold comment telle protéine réagira avec une autre ou telle molécule d'ADN. Et le modèle se charge de prédire l'interaction en quelques secondes, versus plusieurs mois, voire années pour expérimenter cette interaction en laboratoire, avance Isomorphic Labs dans un post de blog.

« Un outil indispensable en biologie »

Avoir accès au modèle plus simplement pourrait changer la donne pour le monde de la recherche. Car depuis la mise en ligne de la précédente version d'AlphaFold, les laboratoires utilisaient surtout une base de données mise à disposition par Google regroupant la structure de 200.000 protéines, générées par AlphaFold. Ils ne faisaient pas forcément tourner le modèle directement.

« Les laboratoires qui font tourner AlphaFold pour déterminer des structures complexes de protéines restent rares », observe Christopher Swale, chercheur à l'Institut pour l'Avancée des biosciences (Inserm). Celui-ci utilise cette IA dans le cadre de recherches en parasitologie, notamment pour trouver de nouvelles cibles thérapeutiques contre le paludisme.

Pour lui, AlphaFold représente une révolution similaire à celle de Crispr (le ciseau moléculaire, qui permet de faire des corrections) pour le monde scientifique. Car cet outil a, selon lui, permis de gagner un temps et des grosses sommes d'argent.

« C'est devenu un indispensable en biologie. Avant, pour connaître la structure d'une protéine, il fallait des techniques de biologies structurales, et cela demandait des années et des centaines de millions d'euros. »

Des contrats avec Novartis et Lilly

Si la prouesse technologique est à saluer, AlphaFold ne reste toutefois qu'une brique dans le processus scientifique. « C'est un super outil pour affiner nos théories », précise Christopher Swale. « Mais cela ne suffit pas. »

Si Google DeepMind diffuse AlphaFold en accès libre, l'entreprise compte bien générer un revenu grâce à ce modèle. En janvier dernier, son laboratoire Isomorphic Labs, qui s'appuie sur AlphaFold, a signé des contrats initiaux de plusieurs dizaines de millions d'euros avec deux grands laboratoires pharmaceutiques : le suisse Novartis et l'américain Lilly. Le montant total de ces accords pourrait atteindre 1,7 milliard de dollars pour Lilly et 1,2 milliard pour Novartis.