Nature Medicine publie aujourd’hui les résultats des recherches d’Owkin et de ses partenaires sur l’utilisation de l’apprentissage fédéré pour entraîner des modèles de deep learning dans plusieurs hôpitaux français sans exposer les données des patients
Ces recherches ont été effectuées avec la collaboration de 4 grands centres et hôpitaux français spécialisés en oncologie : l’Institut Curie, l’IUCT Oncopole de Toulouse, le Centre Léon Bérard et Gustave Roussy.
Ces résultats prouvent qu’il est possible d’utiliser l’apprentissage fédéré dans des contextes opérationnels réels notamment pour effectuer des découvertes médicales
A Paris, le 19 janvier 2023 –Owkin, biotech spécialisée dans l’IA appliquée à la recherche médicale, dévoile aujourd’hui la publication de ses recherches dans Nature Medicine. Ces résultats démontrent pour la première fois que l’apprentissage fédéré peut être utilisé pour entraîner des modèles de deep learning sur des données d’histopathologie provenant simultanément de plusieurs hôpitaux, ces dernières restant à l’abri derrière les pare-feux des hôpitaux d’où elles proviennent.
Cette découverte ouvre la voie à une recherche médicale dont l’un des moteurs serait l’IA utilisant de plus grands ensembles de données multicentriques, permettant aux modèles d’échapper aux biais des études monocentriques. A terme, cela pourrait permettre de réaliser des percées dans la médecine de précision grâce à l’utilisation d’une IA sécurisée préservant la confidentialité et la gouvernance des données.
L’IA au service de la recherche médicale
À l’aide des données conservées dans quatre grands hôpitaux français, Owkin a construit des modèles d’IA capables de générer une prédiction de la réponse future des patientes atteintes d’un cancer du sein triple négatif (TNBC) à une chimiothérapie néoadjuvante. En utilisant une IA interprétable pour extraire des informations de lames de pathologie numérique, Owkin a pu mettre en exergue de nouveaux biomarqueurs potentiels. À l’avenir, cela pourrait aider à orienter les patients vers des traitements plus adaptés ou de nouveaux traitements expérimentaux, améliorant ainsi la personnalisation des soins médicaux.
Le consortium a ainsi utilisé l’apprentissage fédéré, une approche d’IA collaborative qui préserve la confidentialité et la sécurité des données grâce à Substra (logiciel d’Owkin récemment mis en libre accès sur la plateforme github, qui rend chaque opération traçable grâce à la technologie hyperledger). C’est la première fois que des modèles d’apprentissage automatique sont entraînés à l’aide de données histopathologiques provenant de plusieurs hôpitaux, sans que ces données ne quittent ces derniers. Jusqu’à aujourd’hui, la plupart des études publiées se limitaient à simuler l’apprentissage fédéré en distribuant artificiellement des données dans des faux centres. Il s’agit d’une preuve historique de l’utilisation de l’IA dans la recherche médicale et d’une percée dans la réalisation des avantages pratiques de l’IA pour la recherche.
L’étude a utilisé les données pathologiques numériques et les informations cliniques de 650 patients provenant de l’Institut Curie à Paris, du Centre Léon Bérard à Lyon, de l’Institut Gustave Roussy à Villejuif et de l’IUCT Oncopole à Toulouse, en faisant ainsi l’une des plus grandes cohortes TNBC jamais réunie pour ce type d’analyse.
La recherche s’appuie sur l’utilisation pionnière de l’apprentissage fédéré menée par Owkin pour permettre aux entreprises pharmaceutiques de collaborer pour la recherche de médicaments tout en préservant la confidentialité, la sécurité et l’avantage compétitif potentiel de chaque partenaire. Les résultats du projet MELLODDY, publiés cette année, avaient montré que la collaboration en IA pour la découverte de médicaments était possible à l’échelle industrielle grâce à l’apprentissage fédéré, une première pour l’industrie. En plus de répondre aux préoccupations en matière de confidentialité et de sécurité, l’apprentissage fédéré peut également simplifier les questions de gouvernance des données, en supprimant la nécessité de les transférer et en favorisant une recherche plus collaborative.
“Grâce à nos partenaires, nous sommes fiers d’avoir réalisé une analyse fédérée originale sur des données médicales en conditions réelles, et la première de ce type sur des données d’histopathologie. En connectant les institutions de manière fédérée, nous avons pu atteindre la masse critique de données de cancer du sein triple négatif nécessaire pour que l’IA découvre, par elle-même, des modèles histologiques prédictifs de la réponse au traitement. Nous espérons que cette preuve de concept va encourager les institutions médicales à collaborer dans des réseaux d’apprentissage fédérés afin de faire avancer la recherche tout en préservant la confidentialité des données des patients.”, se réjouit Jean du Terrail, Senior Machine Learning Scientist chez Owkin.
“Nous avons franchi une étape importante avec le déploiement de cette infrastructure d’apprentissage fédérée, montrant une nouvelle approche dans la construction des algorithmes d’IA dans la recherche sur le cancer répondant aux enjeux RGPD. Nous sommes vraiment heureux d’avoir fait partie de cette aventure et espérons que cela ouvrira des perspectives prometteuses pour l’avenir des soins aux patients.“, déclare Julien Guérin, Directeur des Données à l’Institut Curie à Paris.
“Grâce à ce partenariat multidisciplinaire, nous avons pu vérifier la faisabilité d’une approche d’apprentissage fédérée collaborative inter-hospitalière sur une question médicale pertinente. Cela nous a permis de constituer rapidement un ensemble de données hétérogènes mises en commun de manière sécurisée afin de développer des modèles reproductibles, transférables et même interprétables. Cette preuve de concept a le potentiel de devenir un outil de décision thérapeutique.“, affirme le Dr Guillaume Bataillon, pathologiste à l’IUCT Oncopole de Toulouse.
“L’essor de la pathologie numérique couplé à l’explosion des différentes techniques d’apprentissage automatique devrait permettre une médecine de plus en plus précise et personnalisée. De plus, l’apprentissage fédéré réalisé dans ce projet, en évitant les flux de données externes, facilite et sécurise le processus pour notre future pratique clinique quotidienne.“, commente le Dr Pierre Etienne Heudel, oncologue médical au Centre Léon Bérard à Lyon.
“La pathologie numérique et l’IA représentent la troisième révolution dans notre discipline, et les pathologistes sont enthousiastes à l’idée d’être des leaders dans ce nouveau changement de leur pratique. L’apprentissage fédéré, pionnier de la recherche en IA dans le domaine de la pathologie numérique, nous rapproche un peu plus de l’identification de nouveaux biomarqueurs en oncologie tout en garantissant la confidentialité et la sécurité des données.” explique le Dr Magali Lacroix-Triki, pathologiste à Gustave Roussy.
“En permettant d’entraîner des modèles d’IA multicentriques sans centralisation des données, l’apprentissage fédéré contourne l’un des principaux obstacles à l’apprentissage automatique sur des données médicales, sans faire de compromis concernant le respect des données personnelles.“, conclut le Dr Camille Franchet, pathologiste à l’IUCT Oncopole de Toulouse.
À propos d’Owkin
Owkin est une startup franco-américaine qui utilise l’intelligence artificielle pour trouver le bon traitement pour chaque patient. Notre objectif est d’utiliser l’IA pour découvrir et développer de meilleurs traitements pour des besoins médicaux non satisfaits, en commençant par la lutte contre le cancer.
Nous utilisons l’IA pour identifier de nouveaux traitements, dé-risquer et accélérer les essais cliniques et construire des outils de diagnostic qui améliorent les résultats des patients. Grâce à l’apprentissage fédéré, une structure d’IA collaborative pionnière, Owkin permet aux partenaires médicaux et pharmaceutiques d’obtenir des informations précieuses à partir d’ensembles de données cloisonnés, tout en protégeant la vie privée des patients et en sécurisant les données propriétaires.
Owkin a été cofondé par Thomas Clozel MD, ancien professeur adjoint en onco-hématologie clinique, et Gilles Wainrib, pionnier dans le domaine de l’apprentissage automatique en biologie, en 2016. Owkin a levé plus de 300 millions de dollars et est devenue une licorne grâce à un investissement de 180 millions de dollars de la société pharmaceutique Sanofi en novembre 2021.