Emmanuelle Becker (équipe DYLISS) soutiendra son HDR mercredi 14 décembre à 14h en salles Petri Turing et Markov de l'Inria Rennes
"Des données homogènes aux données hétérogènes en biologie des systèmes"
Résumé :
Les systèmes biologiques font intervenir un grand nombre d'entités différentes et chacune fonctionne de façon coordonnée avec les autres.
Leur compréhension est cruciale et peut être abordée à différentes échelles, de l'échelle moléculaire à l'échelle systémique.
L'observation de toutes ces entités dans des contextes et à des échelles différentes génère un «tsunami de données», posant des problèmes informatiques complexes et intéressants.
Mes travaux portent sur le développement de méthodes de génération de connaissances et d'extraction de connaissances à partir de cette masse de données.
Le manuscrit est organisé en trois axes. Le premier axe traite de méthodes visant à identifier des signatures interprétables, robustes et réplicables dans des données unimodales de grande dimension. Le second axe propose le développement d'une nouvelle approche pour intégrer des données multimodales (miARN + IRM), et identifier des scores de progression de maladies à partir de celles-ci. Enfin, le dernier axe traite également d'intégration de données hétérogènes, mais avec une approche systémique, c'est à dire en prenant en compte les relations connues entre entités. Les travaux présentés illustreront la complexité de l'extraction d'information de qualité des bases de données existantes, malgré les efforts constants de la communauté bioinformatique pour structurer et unifier l'information disponible.
Abstract
Biological systems involve a large number of different entities, each functionning in a coordinated manner with the others.Their understanding is crucial and can be approached at different scales, from the molecular to the systemic one.
The observation of all these entities in different contexts and at different scales generates a "tsunami of data", posing complex and interesting computational problems.
My work focuses on the development of methods for knowledge generation and knowledge extraction from these massive data.
The manuscript is organized in three axes. The first axis deals with methods to identify interpretable, robust and replicable signatures in high dimensional unimodal data. The second axis proposes the development of a new approach to integrate multimodal data (miRNA + MRI), and to identify disease progression scores. Finally, the third axis also deals with the integration of heterogeneous data, but with a systemic approach, i.e. taking into account the known relationships between entities. The work presented illustrates the complexity of extracting information from existing databases, despite the constant efforts of the bioinformatics community to structure and unify the available information.
Christine BRUN : Directrice de recherche (TAGC, Marseille), examinatrice
Alessandra CARBONE : Prof. Sorbonne Univ. (LCQB, Paris), examinatrice
Olivier DAMERON : Prof. Univ. Rennes (IRISA, Rennes), examinateur
Elisa FROMONT : Prof. Univ. Rennes (IRISA, Rennes), examinatrice
Alejandro MAASS : Prof. Univ. Chile (CMM, Chili), rapporteur
Anne SIEGEL : Directrice de recherche (IRISA, Rennes), examinatrice
Patricia THEBAULT : MCU Univ. Bordeaux (LABRI, Talence), rapportrice