Résumé en français (in english below)
Ces dernières années, le gain d’intérêt pour la détection d’événements sonores et la réduction des coûts de l’électronique ont conduit à s’intéresser au déploiement de dispositifs de détection distribués sur des réseaux de capteurs sans fil. Cependant, la transmission d’informations binaires qu’elle requiert induit à la fois une forte consommation d’énergie et une dégradation des données émises. L’objectif de cette thèse est de travailler sur la minimisation de la consommation d’énergie d’une communication sans fil, et d’analyser l’impact de la transmission des descripteurs sur les performances de la détection. Tout d’abord, nous étudions les différents modèles énergétiques d’une transmission afin d’approcher au mieux la consommation réelle. Nous proposons alors une analyse de l’efficacité spectrale minimisant cette énergie. Dans un second temps, nous étudions la faisabilité d’un dispositif de détection d’événements sonores distribué, avec ses avantages et ses contraintes. Nous introduisons les méthodes utilisées pour coder en virgule fixe les descripteurs audio sur une longueur de quantification limitée. Nous commençons par analyser l’influence de cette quantification sur les performances d’un GMM ou d’un CRNN. Nous étudions finalement l’impact des erreurs de transmission sur cette même détection, et proposons une méthode d’augmentation de données pour le limiter.
Mots Clés : détection d’événements sonores, réseaux de capteurs sans fi l, faible consommation, efficacité spectrale, quantification
In recent years, increased interest in sound event detection and reduced electronics cost have led to a focus in the deployment of distributed detection devices on wireless sensor networks. However, the transmission of binary information that it requires induces both high energy consumption and degradation of the transmitted data. This thesis aims to work on minimizing the energy consumption of wireless communication, and to analyse the impact of features transmission on detection performance. First of all, we study the different transmission energy models in order to better approximate the real consumption. We then propose an analysis of the spectral efficiency that minimizes this energy.
In a second step, we study the feasibility of a distributed sound event detection system, with its advantages and constraints. We introduce the methods used to fixed-point encode the audio features over a limited quantization length. We start by analyzing the influence of this quantization on the performance of a GMM or CRNN. We finally study the impact of transmission errors on this same detection, and propose a data augmentation method to limit it.
Yannis POUSSET, Professeur des Universités, Université de Poitiers
Romain SERIZEL, Maître de Conférences, Université de Lorraine (Rapporteur)
David SODOYER, Chargé de Recherche, IFSTTAR (Lille)
Pascal SCALART, Professeur des Universités, Université de Rennes 1 (Directeur de thèse)
Nancy BERTIN, Chargée de Recherche, Irisa (Rennes)
Romuald ROCHER Maître de Conférences, Université de Rennes 1