MedtechBioinformatique
Communiqué de presse
Arkhn s’associe à Owkin et Inria pour standardiser l’accès aux données de santé de l’IUCT-Oncopole, l’Institut Curie, l’Institut Bergonié et du CHU de Toulouse dans un projet de plus de 10 millions d’euros
LUNDI 20 JUIN 9H
Paris (France), le 20/06/2022 : Le projet OncoLab vise à rendre accessibles les données d’oncologie issues des
établissements de santé pour l’ensemble des acteurs de l’écosystème, à des fins de recherche et d’innovation.
Les données multi-modales entreposées dans les établissements seront standardisées, structurées, et étudiées
de manière synchronisée.
Un consortium public-privé de centres experts pour faciliter la recherche et l’innovation en oncologie
Le projet OncoLab vise à déployer des architectures de données à destination de la recherche et de l’innovation
en oncologie auprès de quatre établissements de premier plan dans le domaine : l’Institut Curie, l’Institut
Bergonié, l’IUCT-Oncopole et le CHU de Toulouse. Objectif ? Répondre aux différents enjeux actuels de gestion
et d’accessibilité des données de santé, en fournissant un socle technique commun et standardisé aux
établissements de santé et à leurs partenaires. Ces architectures de données seront développées par la société
Arkhn, chef de file du projet, et étudiées de manière décentralisée grâce à l’expertise en data science et en
intelligence artificielle d’Owkin, afin de préserver la confidentialité des données et la souveraineté des
établissements de santé. Au total, le projet dispose d’un budget de près de 11 Millions d’euros.
Vers des entrepôts de données standardisés et garantissant la souveraineté des établissements pour faciliter l’accès aux données de santé
Les architectures de données déployées par OncoLab intègreront des données d’oncologie de tous types
(compte-rendus, examens, imagerie, biologie, etc.) pour tous types de cancers, recueillies auprès des centaines
de milliers de patients suivis par les établissements de santé. Une plateforme sécurisée permettra de simplifier
considérablement l’accès technique aux données de chaque centre souhaitant les mettre à disposition pour la
conduite de projets de recherche et d’innovation, réduisant ainsi drastiquement leurs coûts et délais de mise en
œuvre. Cet accès direct à des données standardisées offrira de nouvelles perspectives aux établissements de
santé à l’origine des données ainsi qu’à leurs partenaires. Les établissements de santé concernés pourront ainsi
conserver un contrôle total des données de leurs patients, notamment grâce à des technologies modernes telles
que l’apprentissage fédéré (Federated Learning) qui permet de mener des projets de recherche sans que les
données ne soient extraites des établissements.
Entraîner des algorithmes d’Intelligence Artificielle de pointe pour mieux structurer et exploiter les données pour la recherche contre le cancer
Le projet OncoLab va permettre d’améliorer les méthodes de Traitement Automatique du Langage (TAL ou NLP
– Natural Language Processing) nécessaires pour analyser automatiquement des dizaines de milliers de
documents médicaux (ordonnances, comptes-rendus d’hospitalisation, lettres de liaisons, etc.) et en extraire les
informations pertinentes pour la recherche. Développées en collaboration par les partenaires du projet, ces
méthodes s’appuient sur des modèles d’Intelligence Artificielle de pointe portés notamment par l’équipe-projet
ALMAnaCH d’Inria.
Emeric Lemaire, Corneliu Malciu et Théo Ryffel, co-fondateurs d’Arkhn : « Le projet OncoLab est une formidable opportunité de rendre aux établissements de santé l’accès aux données de leurs patients, tout en facilitant
l’émergence de projets de recherche et de partenariats publics-privés, au bénéfice de l’ensemble de
l’écosystème. »
Nicolas Portolan (Directeur Général Adjoint Bergonié) : « Inventer un langage commun, grâce aux apports de
l’IA, va permettre de lever beaucoup de freins présents aujourd’hui et permettre de répondre beaucoup plus
facilement aux questionnements de nos cliniciens/chercheurs. Un algorithme en forme d’esperanto au service
de l’accélération de la recherche contre le cancer ! »
Julien-Aymeric Simonnet (Directeur Données et santé numérique) : « Faire parler les données médico-biologiques hétérogènes et massives en les structurant, telle est la mission du consortium du projet Oncolab. Il
s’agit de la brique fondamentale pour mener des recherches en données de vie réelle et développer des
innovations médicales au bénéfice des patients. »
Eric Fleury (Directeur du centre de recherche Inria de Paris) : « Les applications des sciences du numérique au
secteur de la santé sont au cœur des axes stratégiques d’Inria. Le projet Oncolab illustre parfaitement l’apport
de l’IA et la richesse des partenariats publics et privés au service de la santé. »
Jean-François Lefebvre (Directeur Général du CHU de Toulouse) : « Le projet Oncolab concrétise la collaboration
fructueuse entre le CHU de Toulouse, associé à l’Institut Claudius Regaud, tous deux réunis au sein de l’Institut
Universitaire du Cancer de Toulouse – Oncopole, avec la société ARKHN. Ce lien fort entre le CHU de Toulouse et
l’écosystème startup vise à structurer la donnée de santé cancer à une échelle inédite. L’intégration et le
développement des technologies de l’IA dans nos entrepôts de données nous ouvrent les portes de la recherche
sur données en facilitant leur réutilisation pour améliorer la connaissance de la maladie, toujours au bénéfice des
malades. Un projet d’envergure, qui traduit l’excellence des équipes du CHU de Toulouse, pleinement investies
dans l’innovation numérique. »
Pr Jean-Pierre Delord (Directeur général de l’Institut Claudius Regaud, administrateur du GCS IUCT-Oncopole) :« OncoLab s’inscrit parfaitement dans notre stratégie de partenariat en IA. La structuration desdonnées est un enjeu majeur pour favoriser le continuum soin-recherche et qui fait la force del’IUCT- Oncopole ».
Amaury Martin (Directeur Adjoint, Institut Curie) : « Le projet Oncolab constitue une formidable opportunité
pour l’Institut Curie de partager au sein d’un consortium de premier plan son expertise en matière de
standardisation des données, initiée depuis plusieurs années, et d’amplifier cette dynamique au niveau national
avant de se projeter à l’international. La recherche contre le cancer fondée sur des données passera
nécessairement par le dialogue entre des bases de données décentralisées, plaçant au cœur des enjeux un accès
à des socles techniques harmonisés et à des standards de partage. »
Jocelyn Dachary (SVP IT & Data Solutions, Owkin) : « Veiller à ce que les chercheurs aient accès à des données
de haute qualité sur les patients est une étape cruciale pour espérer de prochaines découvertes médicales, qui
est au cœur de notre mission. Le projet OncoLab offre ici une excellente occasion d’aborder l’interopérabilité des
données, enjeu fondamental pour tirer tout le potentiel de l’intelligence artificielle. Il va permettre d’augmenter
la puissance de l’entraînement fédéré déjà apporté par la technologie Owkin, en y ajoutant un accès facilité à
des données structurées dans un format de référence. »
À propos d’Arkhn
Arkhn répond à la problématique d’accessibilité des données de santé en mobilisant son savoir-faire unique
dans l’élaboration d’entrepôts de données de santé standards au sein des établissements de santé. Cette
approche permet de maintenir la souveraineté des établissements sur les données qu’ils produisent, tout en
favorisant le développement d’un écosystème de recherche et d’innovation autour de la valorisation de ces
données. www.arkhn.org
À propos d’Owkin
Owkin utilise les techniques d’intelligence artificielle pour trouver le bon traitement pour chaque patient. Nous
utilisons l’IA pour identifier de nouveaux médicaments potentiels, dé-risquer et accélérer les essais cliniques et
construire des outils de diagnostic qui visent à améliorer les résultats des patients. Grâce à l’apprentissage
fédéré, Owkin permet de débloquer des informations précieuses à partir d’ensembles de données cloisonnés,
tout en garantissant la confidentialité des informations relatives aux patients et en sécurisant les données
protégées.
Owkin a été cofondée par Thomas Clozel MD et Gilles Wainrib en 2016, et travaille désormais avec les centres
de lutte contre le cancer et les sociétés pharmaceutiques les plus en vue en Europe et aux États-Unis. Elle a levé
plus de 300 M$, devenant une licorne en novembre 2021. www.owkin.com
À propos de l’Institut Curie
Premier centre français de lutte contre le cancer, l’Institut Curie associe un Centre de Recherche de renommée
internationale et un Ensemble Hospitalier de pointe qui prend en charge tous les cancers y compris les plus rares.
Précurseur dans l’informatisation des données cliniques, l’Institut Curie a pris un nouvel essor en 2017 avec la
création d’une Direction des data. Ce département repose sur une expertise pluridisciplinaire à travers une
équipe de scientifiques, médecins, bioinformaticiens, ingénieurs et gestionnaires de données, travaillant en
tandem avec des cliniciens pour accompagner les projets en recherche clinique et translationnelle, et bâtir les
fondations nécessaires à l’exploitation de l’IA dans la pratique clinique. Cette structure dédiée favorise
également le développement de partenariats académiques et le co-pilotage de projets nationaux et
internationaux. Pour en savoir plus : www.curie.fr
À propos de l’Institut Bergonié
L’Institut Bergonié est le Centre régional de Lutte Contre le Cancer (CLCC) de la Nouvelle-Aquitaine. C’est un
Établissement de Santé Privé d’Intérêt Collectif (ESPIC) qui contribue au progrès médical et au rayonnement
international de la recherche en matière de prévention, de dépistage et de traitement du cancer. A Bergonié,
les équipes impliquées dans le projet OncoLab ont développé une expertise particulière dans la gestion des
données de cancérologie et leur structuration à visée d’études cliniques, notamment dans le cadre des activités
du groupement OSIRIS, élaboré en partenariat avec l’Institut Curie. Cette équipe interdisciplinaire réunit des
professionnels à vocation médicale ainsi que des spécialistes des données réunis au sein de la direction Données
et santé numérique.
A propos de l’IUCT-Oncopole
L’IUCT-Oncopole, centre de soin, de recherche et de formation en cancérologie regroupe à Toulouse l’expertise
de 1 800 professionnels sur un même site labellisé « Comprehensive Cancer Center ». Il combine plusieurs
installations cliniques de pointe pour le traitement du cancer avec une infrastructure de recherche de classe
mondiale, sur un campus intégré qui rassemble des parties prenantes publiques et privées, y compris des
partenaires industriels. L’IUCT-Oncopole, qui réunit Institut Claudius Régaud (ICR) et plusieurs équipes du CHU
de Toulouse, traite plus de 10 000 nouveaux patients chaque année, et plus d’un patient sur huit est inscrit dans
des études cliniques.
http://www.iuct-oncopole.fr
Bilan Activité 2020 I Version complète du rapport disponible ici – Vidéo de présentation ici
À propos du CHU de Toulouse
Le CHU de Toulouse prend en charge environ 280 000 malades chaque année ce qui le situe au quatrième rang
des hôpitaux français en termes d’activité. Il est un acteur majeur de la cancérologie en Occitanie et le traitement
du cancer représente 25% de son activité. Les missions de recherche et d’innovation du CHU font partie
intégrante à la fois de son activité quotidienne et de sa stratégie pour l’avenir. Avec plus de 2000 projets de
recherche en cours dont 380 projets promus par le CHU de Toulouse, l’innovation et la santé numérique sont
placées parmi les axes prioritaires en les intégrant dans la feuille de route du Projet d’Établissement. Ainsi, une
plateforme Innov’Pôle Santé a été créée dans l’objectif d’accompagner l’évaluation, le développement puis la
mise sur le marché des innovations technologiques et organisationnelles. La recherche est menée en
collaboration étroite avec l’Université Toulouse III-Paul Sabatier, les facultés et les organismes de recherche que
sont notamment l’Institut national de la santé et de la recherche médicale (Inserm), le Centre national de la
recherche scientifique (CNRS) et l’Artificial and Natural Intelligence Toulouse Institute (ANITI). Les équipes du
CHU de Toulouse travaillent sur plus d’une vingtaine de projets en Intelligence Artificielle dont deux promus par
le CHU de Toulouse remportés auprès du Health Data Hub.
À propos d’Inria
Inria est l’institut national de recherche en sciences et technologies du numérique. La recherche de rang
mondial, l’innovation technologique et le risque entrepreneurial constituent son ADN. Au sein de 200 équipes-projets, pour la plupart communes avec les grandes universités de recherche, plus de 3 500 chercheurs et
ingénieurs y explorent des voies nouvelles, souvent dans l’interdisciplinarité et en collaboration avec des
partenaires industriels pour répondre à des défis ambitieux. Institut technologique, Inria soutient la diversité
des voies de l’innovation : de l’édition open source de logiciels à la création de startups technologiques
(Deeptech).
L’équipe-projet ALMAnaCH (Automatic Language Modelling and Analysis & Computational Humanities) fait
partie du centre de recherche Inria de Paris. ALMAnaCH a pour domaine de recherche le traitement automatique
des langues (TAL ou NLP), au cœur de l’Intelligence Artificielle et des Humanités Numériques, à la croisée entre
informatique théorique, apprentissage automatique et linguistique.