La composition du microbiote intestinal influence diverses maladies et peut être utilisée pour la classification automatique de l'état de santé. Cette thèse propose une méthode intégrant l'annotation fonctionnelle du microbiote intestinal dans un processus de classification automatique pour améliorer l'interprétation des résultats. En utilisant les données taxonomiques et les annotations fonctionnelles via le pipeline EsMeCaTa, un profil fonctionnel du microbiote est établi. Ces profils, microbien et fonctionnel, servent à entraîner des Forêts Aléatoires pour différencier les échantillons malades des témoins. Une sélection automatique des variables basée sur leur importance est itérée jusqu'à la diminution des performances de classification. Les résultats montrent que les profils fonctionnels offrent des performances comparables aux profils microbiens et permettent d'identifier un sous-ensemble robuste de variables discriminantes. Ces variables se sont révélées plus fiables que celles obtenues par des méthodes de référence et ont été validées par une recherche bibliographique. L'analyse des interconnexions entre taxons et annotations fonctionnelles a révélé que cartaines annotations importantes sont issues de l'influence cumulative de taxons non sélectionnés.
Laurent BREHELIN, Chargé de recherche, CNRS, LIRMM, Montpellier
Julien CHIQUET, Directeur de Recherche, INRAE, MIA, Paris-Saclay (rapporteur)
Damien EVEILLARD, Professeur, Univ Nantes, LS2N, Nantes
Yann LE CUNFF, Maitre de conférences, Univ Rennes, IRISA, Rennes
Nathalie VIALANEIX, Directrice de recherche, INRAE Toulouse, UMR Mathématiques et Informatique appliquées de Toulouse (rapportrice)
Dir. de thèse : Anne SIEGEL, Directrice de recherche, CNRS, IRISA, Rennes
Co-dir. de thèse : Isabelle LE HUËROU-LURON, Directrice de recherche, INRAE, Numecan