Voir la démo
Pour accéder à la démo en ligne, cliquer sur l'image ci dessous.
Obtenir le logiciel
Pour l'instant le logiciel n'est pas diffusé. Le présent site a pour but de faire découvrir les travaux de recherche effectués sur ce projet. La plateforme de démonstration illustre de manière concrète les résultats de ces recherches.
›› État des lieux
L'apprentissage artificiel consiste à découvrir par induction un modèle de la structure qui sous-tend implicitement un ensemble de données. Parmi les nombreuses méthodes d'apprentissage automatique, la programmation logique inductive (PLI) est particulièrement intéressante car elle permet l'analyse de données complexes : les données de ce type sont organisées selon une structure mettant en jeu plusieurs relations qu'il est difficile d'expliciter par des méthodes plus classiques utilisant une représentation par attributs-valeurs.
La PLI est une méthode d'apprentissage symbolique automatique supervisée. À partir d'exemples représentant des situations où le concept se manifeste de manière positive ou négative, la méthode d'apprentissage permet d'induire une représentation générale de ce concept sous la forme d'une ou plusieurs clauses, contenant une ou plusieurs relations codées en logique du premier ordre. Cette propriété est nécessaire pour représenter de manière simple et naturelle des motifs temporels comme ceux associés aux pathologies cardiaques. En résultat, les règles obtenues sont exprimées dans un langage de haut niveau, facilement compréhensible par un humain. Cet aspect est particulièrement important pour valider les résultats obtenus auprès d'experts du domaine.
Pour plus d'informations sur la PLI, voir ici.
›› Contributions
Notre travail s'est focalisé sur l'apprentissage de connaissances temporelles à partir de séries temporelles issues de capteurs. Précisément, les exemples d'apprentissage sont constitués de fragments d'électro-cardiogrammes (ECG) représentés de manière symbolique et exprimant une pathologie. La PLI produit un ensemble de clauses constituées d'événements (occurences d'ondes spécifiques dans l'ECG) et de contraintes temporelles sur l'occurrence de ces événements. La traduction de tels ensembles de clauses dans le formalisme des chroniques en vue de leur reconnaissance sur un flux de données est quasi-directe.
Apprentissage monovoie
La représentation des exemples et des
hypothèses doit faciliter l'apprentissage, en particulier,
en respectant la structure implicite présente dans les
données. Pour satisfaire cet objectif, nous avons
utilisé une structure chaînée. Tout en
évitant d'introduire un biais trop important qui nuirait
à la généralité de
l'apprentissage, cette représentation permet d'induire plus
facilement la structuration séquentielle des
événements et de la
généraliser dans les modèles obtenus.
De plus, elle permet de restreindre l'espace de recherche des
hypothèses en éliminant de manière
précoce des solutions qui ne respecteraient pas une
structure séquentielle adéquate.
Apprentissage multisources
Lorsque les données proviennent de plusieurs
sources, par exemple plusieurs voies d'ECG et une voie de pression ou
de respiration, la taille de l'espace de recherche devient telle qu'un
apprentissage par PLI est pratiquement impossible. L'idée
consiste alors à utiliser une méthode "diviser
pour régner". L'apprentissage comprend deux
étapes : apprentissage indépendant sur chacune
des voies en utilisant un langage de représentation
spécifique plus simple que le langage global, puis fusion
des résultats pour obtenir le modèle global. Nous
utilisons une technique originale ne consistant pas à
fusionner directement les modèles partiels mais à
explorer l'espace global des hypothèses en étant
guidé par les modèles appris au cours de la
première étape.
Apprentissage de règles de
décision
L'acquisition de règles de décision auprès
d'experts ou en utilisant des techniques d'analyse de données
telles que l'analyse en composantes principales peut s'avérer
longue et fastidieuse. Nous avons évalué une technique
d'apprentissage automatique produisant des arbres de décision
à partir desquels il est possible de dériver des
règles de décision pour le système de pilotage
d'algorithmes. Pour ce faire, chacun des algorithmes concurrents est
préalablement exécuté dans divers contextes de
bruit courants en environnement clinique. Les règles produites
comportent en partie prémisse une condition testant plusieurs
attributs décrivant le contexte et en partie conclusion
l'algorithme choisi ainsi qu'un réglage de ses paramètres.