Pierre Monnin a obtenu le prix de thèse EGC 2022 !
Sa thèse, intitulée Appariement et fouille dans les graphes de connaissances du web de données : applications en pharmacogénomique, a été réalisée au Loria (CNRS, Inria, Université de Lorraine), sous la direction d’Adrien Coulet et Amedeo Napoli (Orpailleur) dans le cadre du projet ANR PractiKPharma.
Un prix qui récompense des travaux à la croisée de l’informatique et de la biomédecine.
La pharmacogénomique étudie l’impact des variations génétiques des patients sur leur réponse aux médicaments. Face à la diversité des connaissances du domaine et à leur hétérogénéité, le projet PractiKPharma propose de comparer les différentes sources et de les synthétiser sous la forme de graphes de connaissances afin d’en obtenir une vue consolidée. À long terme, cette étude aidera à mieux comprendre comment prescrire des traitements plus adaptés et personnalisés.
Les connaissances de pointe en pharmacogénomique proviennent de la littérature biomédicale, de bases de données comme PharmGKB et de dossiers patients électroniques. Elles sont formalisées dans une relation triangulaire mettant en interaction gène, médicament et réponse au médicament. « Le but de ma thèse a été d’extraire les connaissances et les comparer entre elles grâce à des technologies du web sémantique, explique Pierre Monnin. Une de mes tâches principales a été l’appariement des données : il existe en effet une grande hétérogénéité entre celles-ci. D’une source à l’autre, nous pouvons voir apparaître des vocabulaires et des niveaux de granularité différents, mais qui font référence au même phénomène. Par exemple, un texte va évoquer « des saignements » quand un autre parlera « d’hémorragie ». De même, les noms de médicaments peuvent parfois être différents alors qu’il s’agit de la même molécule ». Cette phase d’appariement est cruciale car elle permet de croiser des connaissances co-existantes et complémentaires, et ainsi de les synthétiser automatiquement.
L’objectif a été de générer une vue synthétique et intégrée des sources de données et de l’ouvrir à la communauté, notamment avec le développement de PGxLOD, un graphe de connaissances construit de manière semi-automatique. Cette vue a déjà permis de proposer des mécanismes des effets secondaires aux médicaments avec l’intelligence artificielle explicable. Un projet stimulant, offrant une aide aux curateurs de bases comme PharmGKB et ce qui indirectement peut permettre de guider la pratique des cliniciens. « Ces travaux ont été enrichissants car ils m’ont permis de croiser mon expertise en fouille des données et des applications en santé. », s’enthousiasme Pierre Monnin.
Son doctorat en poche en décembre 2020, Pierre a ensuite intégré Orange, où il explore aujourd’hui les mêmes méthodes neuro-symboliques d’appariement et de fouille en travaillant sur des graphes de connaissances pour l’indexation de jeux de données.
Formé d’un consortium pluridisciplinaire de deux laboratoires de recherche en informatique – le Loria et le LIRMM -, et de deux établissements de santé – l’Hôpital Européen Georges Pompidou et le laboratoire SSPIM du CHU de Saint Etienne -, le projet PractiKPharma a été financé par l’ANR de 2016 à 2021.
> Retrouvez l'entretien avec Pierre Monin
- Plus d’informations : PractiKPharma
- En savoir plus sur l’équipe Orpailleur : orpailleur.loria.fr
- Lire la thèse de Pierre Monnin