Paradigmes d'Apprentissage Automatique Non-Supervisés pour les Représentations de la Similarité et de la Structure Musicale.

Defense type
Thesis
Starting date
End date
Location
IRISA Rennes
Room
Salle METIVIER
Speaker
Axel MARMORET
Theme

Résumé :

La structure musicale, définie comme la représentation simplifiée de l'organisation d'un morceau de musique, est un concept musicologique important mais néanmoins complexe à estimer automatiquement.

Cette thèse présente de nouvelles méthodes pour estimer automatiquement la structure musicale, se focalisant sur l'étude à l'échelle de la mesure musicale. Par le développement d'un nouvel algorithme de segmentation (appelé ``CBM'') et par l'étude et la comparaison de différentes méthodes de compression non supervisées (allant de l'algèbre linéaire et multilinéaire aux réseaux de neurones), les paradigmes introduits dans cette thèse permettent d'obtenir des résultats quantitatifs dépassant l'Etat-de-l'Art non supervisé actuel et se
rapprochant de l'Etat-de-l'Art global, issu de méthodes d'apprentissage avec supervision.

En particulier, les méthodes décrites dans cette thèse étant non supervisées, l'estimation ne repose pas sur des bases de données annotées, permettant ainsi de mitiger les biais liés à l'ambiguïté et à la subjectivité (inhérents à la structure musicale), tout en limitant le perte en performance par rapport aux meilleures méthodes supervisées.

Enfin, certaines méthodes étudiées dans cette thèse (en particulier la décomposition nonnégative en Tucker) permettent d'extraire automatiquement des parties interprétables de la chanson qui pourraient être utilisées pour d'autres tâches que l'estimation de structure, et s'intégrer dans le développement d'algorithmes interprétables d'apprentissage automatique profond, sujet de recherche majeur aujourd'hui.

Composition of the jury
Rapporteurs :
- Cédric Févotte, Directeur de Recherche à l'Institut de Recherche en Informatique de
Toulouse (IRIT), Université de Toulouse
- Mathieu Giraud, Directeur de Recherche au CRIStAL, Université de Lille
Examinateurs :
- Aline Roumy, Directrice de Recherche à l'IRISA, Inria, Université de Rennes 1
- Elaine Chew, Professeure au King's College London
Directeur de thèse :
- Frédéric Bimbot, Directeur de Recherche à l'IRISA, Université de Rennes 1
Co-dir de thèse:
- Jérémy Cohen, Chargé de Recherche au CREATIS, CNRS, Université de Lyon
Membres invités :
- Nancy Bertin, Chargée de Recherche à l'IRISA, Université de Rennes 1
- Simon Leglaive, Maître de Conférences à CentraleSupélec, IETR