Le programme de recherche Challenge4Cancer, un data challenge sur l’épidémiologie du cancer, d’où son nom Epidemium, permet à des équipes pluridisciplinaires de développer des projets innovants à partir d’outils numériques et de jeux de données mis à leur disposition par Epidemium.
Interview d’Olivier de Fresnoye, coordinateur d’Epidemium
La saison deux d’Epidemium sur l’épidémiologie du cancer n’est pas achevée, mais le 20 janvier vous avez remis les prix des challenges 1 & 2 de juin à décembre 2017. Le challenge 3 continue?
Oui, Les challenges 1&2 ont commencé fin mars 2017 et se sont achevés en janvier, le challenge 3 a lieu en décalé d’octobre 2017 jusqu’en mai. Nous avons eu une forte demande cette année de la part des grandes écoles et les dates ne correspondaient pas à celles des périodes scolaires. Les étudiants représentaient déjà 10 % de notre communauté, par intérêt pour la discipline. A présent, les écoles veulent inclure ça dans le projet pédagogique. Nous avons donc 7 équipes : une de Polytechnique, 3 de Centrale et 3 ESIEA (Ecole Supérieure d’Informatique Electronique Automatisée).
Parmi les lauréats des challenges 1 & 2, la première équipe est open Cancer avec le développement d’un modèle prédictif et d’une plateforme associée. La seconde équipe sur la visualisation, la troisième sur les modèles prédictifs d’incidence des cancers liés à l’alimentation.
Pour le troisième challenge, notre volonté est de nous orienter vers les pays en développement et la mortalité par cancer où nous avons de plus en plus de données disponibles. Les projets sont très intéressants et ont donné matière à des échanges intenses via les outils de la plate-forme du programme et les réseaux sociaux (voir les dernières newsletters).
Les projets lauréats ont été poussés à un stade avancé et sont d’une grande qualité. Ils nous engagent à les accompagner vers une publication dans les revues à comité de lecture. C’est enthousiasmant et cela devient l’un de nos objectifs.
Vous avez des partenaires industriels tels que Roche France ?
Roche France a été toujours été partenaire en lien avec l’innovation. Ils sont très impliqués dans le programme Epidemium qui a été lancé fin 2015. Nous avons la chance d’ « implémenter » les challenges avec des données disponibles en Open data sur les plateformes d’organisations telles que l’OMS, la Banque mondiale en les orientant sur la valorisation ou sur la recherche académique. Nous avons démarré fin mars, il y a eu un mois d’audit et la finale aura lieu en mai-juin.
Nous visons la valorisation de l’ensemble des projets qui ont été à leur terme. Nous pouvons construire la synergie entre ces différents projets, mutualiser les ressources : logique, base de données, algorithmes. Nous pouvons « implémenter » certains de ces projets sous forme de POC (grâce aux données disponibles en Open data provenant de la Banque mondiale ou de la FAO), à l’aide d’algorithmes variés.
Quelle sera la conclusion du second épisode de ce programme ?
Nous co-organisons une conférence satellite de la conférence RECOMB, la 22ème édition des conférences de Maths/Stats à la dimension médicale du 21 au 24 avril (NDLR la plus importante conférence internationale sur la biologie informatique qui rassemble 400 chercheurs du monde entier, étudiant prometteurs et chercheurs seniors). A l’image du Dream Challenge organisé par Sage, nous co-organisons ensemble une conférence satellite les 19 et 20 avril au Campus de Sorbonne Université (à Jussieu) avec des chercheurs d’IBM.
Lors de ce Grand Survey Science nous aurons une tribune pour les deux meilleurs lauréats de nos challenges en épidémiologie des cancers et DREAM présentera les meilleures équipes de leur dernier challenge en génomique et protéomique. En un jour et demi, nous allons réfléchir avec nos partenaires à la manière de valoriser les meilleurs projets de nos challenges au stade encore embryonnaires.
Les Challenges IA, c’est une nouvelle vague ?
Nous nous sommes lancés dans ce mouvement en 2015. Il y a eu la mode des hackathons pour prototyper, parfois de manière très approximative, des tests numériques (codeurs, designers, design métiers, médecins). Cette vague s’est un peu essoufflée depuis.
Nous avons utilisé RAMP – le format utilisé dans l’IA – à la Paillasse en février 2016 pour prédire le taux de mortalité d’une trentaine de cancers différents. Le RAMP (Rapid Analytics et Model Prototyping) est un outil, développé par le Paris-Saclay Center for Data Science et le CGS de l’Ecole des Mines, pour la gestion des « datathons » et des data challenges en format de compétition / collaboration.
Le challenge représente un travail de moyen-long terme (6 mois) qui suit différentes étapes d’affinage et de valorisation. Nous avons la volonté d’explorer un mode de recherche mettant en œuvre l’intelligence collective dans le domaine de l’Intelligence Artificielle. C’est la première fois que la FDA a validé un algorithme pour une App médicale qui réalise un travail d’analyse, d’ingénierie automatisée, reposant sur des réseaux de neurones. Un travail fantastique avec des résultats de nature à transformer les métiers, mais qui montre surtout un changement des approches de la recherche médicale par la data et les modèles d’intelligence artificielle. Pour accélérer les développements, il faut entraîner les algorithmes sur des masses de données très importantes. Nous avons besoin de données. Se confronter à l’épidémiologie des cancers est une bonne stratégie pour animer la réflexion et la communauté.
Aurez-vous d’autres partenaires industriels ? Pensez-vous que ces challenges IA soient la nouvelle stratégie d’innovation de groupes pharma pour à la fois nourrir leur recherche en interne, recruter des talents voire acquérir des start-up?
Nous avons la chance d’avoir un partenaire tel que Roche France. Cet industriel n’a aucun droit sur la propriété intellectuelle : tout est sous licences ouvertes.
Dans les premiers Hackathons avec certains GAFAM, en effet, la meilleure équipe gagnante était recrutée et rémunérée en direct. Nombreux sont les candidats aujourd’hui qui sont recrutés sur github, StackOver Flow, reconnus pour leur savoir-faire.
Avec le format RAMP, on donne aux participants des jeux de données et le meilleur score gagne. Au cours du « Dream Mammography Challenge », une prime de 1 million de dollars a été accordé à une équipe de 4 ou 5 chercheurs qui leur a permis de créer la start-up Therapixel, dirigée par Olivier Klatz.
Dans l’équipe d’Epidemium avez-vous autant de médecins que de datascientists à présent ?
Le docteur Medhi Benchoufi, chef de clinique dans le département épidémiologie à l’Hôtel Dieu (AP-HP) et agrégé de mathématiques, coordonne Epidemium avec moi. Il y a toute une équipe de professeurs et de médecins, comme par exemple le Professeur de médecine, Bernard Nordlinger qui a créé avec le mathématicien Cédric Villani une « spin-off » du programme Epidemium : un groupe de travail inter-académique mathématique et big data. Cédric Villani fait encore partie du comité d’éthique d’Epidemium, il continue à accompagner la démarche et à participer au challenge selon ses disponibilités. Il nous a d’ailleurs auditionnés dans le cadre de sa mission sur l’IA.
Pour répondre à votre question, nous avons mobilisé plus de médecins pour la saison 2 et de jeunes médecins de santé publique ont même mis en place des formations sur l’épidémiologie des cancers pour répondre aux questions des datascientists.
Et pour la saison 3 que prévoyez-vous?
Avec les lauréats, nous réfléchissons à ce que nous voulons faire par la suite. Nous discutons avec nos partenaires afin d’aller plus loin dans les applications éventuelles.
Si une équipe a développé une solution et veut fonder une start-up, certains ont envie de le faire et d’autres pas. Comment leur laboratoire de recherche pourra-t-il les accompagner du mieux possible? Comment faire en sorte qu’une communauté s’intéresse à ce sujet et que les chercheurs puissent s’en emparer ?
Les projets sont accessibles, via une plateforme, aux utilisateurs et aux chercheurs. Nous voulons fédérer l’intelligence collective au service de l’IA pour développer des outils : citons par exemple une solution professionnelle de réponse par les patients qui pourrait bénéficier d’une aide publique.
Combien de personnes ont participé à ces challenges Epidemium?
Une communauté de 1200 personnes à différents niveaux d’activité. Certains sont venus de temps en temps. Les choses se mettent en place par une succession d’interactions, par petites touches. C’est une communauté de qualité.
Vous êtes intervenu le 6 février dernier à une table-ronde sur l’IA à l’Institut Pasteur ?
Oui, pour présenter l’approche d’Epidemium qui repose avant tout sur une communauté humaine. L’IA gagne du terrain, c’est important que la technique, l’éthique et le médical soient mises en commun au service du collectif. Petit à petit, la communauté scientifique et médicale prend en considération l’IA. Il faut trouver les mécanismes qui lui permettent de se développer. C’est un sujet de plus en plus important dont la société toute entière doit s’emparer.