Comment découvrir de nouvelles molécules utiles, par exemple pour fabriquer des médicaments ou des matériaux innovants ? Aujourd’hui, cette quête ressemble à chercher une aiguille dans une botte de foin : l’espace des combinaisons possibles est immense, et chaque tentative demande du temps, des calculs complexes et beaucoup de ressources.
Le projet G-GENOCOD, mené par une équipe de chercheurs angevins des laboratoires LERIA et MOLTECH-Anjou (CNRS) de l’Université d’Angers, propose une approche novatrice : utiliser l’Intelligence Artificielle (IA) pour apprendre à imaginer et construire des molécules. L’idée repose sur la représentation des molécules sous forme de graphes — un schéma reliant des atomes par des liaisons, un peu comme un jeu de construction. L’algorithme, comme un joueur qui s’améliore en testant différentes stratégies, explore cet espace et apprend progressivement à générer des structures prometteuses. Mais imaginer une molécule « idéale » ne suffit pas. Encore faut-il qu’elle soit synthétisable, c’est-à-dire réalisable en laboratoire. C’est pourquoi G-GENOCOD intègre un aspect essentiel : la synthétisabilité.
Pour y parvenir, le projet s’appuie sur deux apprentissages complémentaires : un premier algorithme apprend à concevoir des molécules, tandis qu’un second apprend à les construire à partir de réactions chimiques connues, en suivant une démarche réaliste et reproductible. Ces apprentissages sont guidés par les règles de la chimie réelle, avec une exigence forte : produire des molécules non seulement prometteuses, mais aussi réellement « fabriquables » en laboratoire. À terme, ce projet pourrait accélérer la découverte de nouveaux composés d’intérêt, tout en proposant à la communauté scientifique de nouveaux outils pour générer, analyser et fabriquer des composés chimiques. G-GENOCOD incarne ainsi une rencontre prometteuse entre IA et recherche en chimie.
Le projet s’inscrit dans le domaine de l’Intelligence Artificielle, plus précisément la programmation génétique et l’apprentissage par renforcement appliqués à la génération de structures graphiques. Dans ce cas, l’objectif est de générer des graphes représentant des molécules chimiques. La problématique est motivée par les besoins en chimie moléculaire, notamment la recherche de nouvelles molécules aux propriétés optimales (par exemple, pour la pharmacologie ou les matériaux). En plus de générer des molécules avec des propriétés intéressantes, un enjeu majeur est que ces structures soient synthétisables en laboratoire, c’est-à-dire qu’elles puissent être réellement produites à partir de réactions chimiques connues et accessibles. Générer une molécule aux propriétés idéales mais impossible à fabriquer n’a pas d’intérêt pratique.
L’objectif principal de G-GENOCOD est de développer des modèles d’IA capables de générer automatiquement des molécules à la fois innovantes et synthétisables. Pour cela, le projet combine des techniques avancées de génération de graphes, d’apprentissage par renforcement et de prédiction de réactions chimiques. Ces outils doivent permettre à la fois l’exploration de l’espace chimique et la validation de la faisabilité des molécules.
Le projet a permis de réaliser des travaux qui ont mené à une publication dans une revue international de rang Q1 (d’après SJR), une publication en conférence internationale de rang B (d’après ICORE), une en pré-publication sur ArXiv (soumise et en cours de relecture), une communication orale et un poster en symposium national (MADICS) et deux communications orales dans le cadre d’un séminaire spécifique à la chémoinformatique (SFR MathSTIC de l’Université d’Angers). Enfin, un mémoire d’Habilitation à Diriger des Recherches (HDR) a été publié (HDR soutenue le 31/03/2025), dont un chapitre porte sur le projet G-GENOCOD.
Retrouvez ici les publications scientifiques issues du projet G-GENOCOD :
G-GENOCOD est présenté dans divers événements scientifiques et de vulgarisation :
Les ressources du projet seront progressivement mises à disposition :