Fouille de données temporelles
Analyse de flux de données

Atelier à EGC 2009
27 janvier 2009

Appel à communication


Objectifs

Dans de nombreux domaines applicatifs, tels la biologie, la santé, les télécommunications, la vidéo-surveillance, l’énergie, l’environnement, etc., des données sont enregistrées de manière continue. Les bases de données concernées peuvent atteindre des tailles gigantesques ou ne retenir que les données les plus récentes. Les données représentent, par exemple, les valeurs prises par des variables mesurées à intervalles réguliers ou des événements se produisant de manière irrégulière. Dans la plupart des cas, les données présentent un caractère temporel qu'il est intéressant de caractériser : relations entre les tendances de plusieurs variables, relations temporelles entre occurrences de certains types d'événements, etc. L'exploitation de cette dimension temporelle introduit une complexité supplémentaire dans les tâches de fouille de données et d'extraction de connaissances. Ainsi, il faut tenir compte
  • des aspects métriques ou symboliques des relations temporelles traitées,
  • de l'irrégularité ou du manque de synchronisation des mesures,
  • du volume des données à traiter,
  • de la fugacité des données et de la nécessité d'un traitement en temps-réel,
  • de la nécessité/possibilité ou non d'un encodage explicite des relations temporelles des données avant leur exploitation,
  • de la granularité temporelle et du caractère hétérogène des types des données pouvant avoir un impact sur les motifs susceptibles d'être découverts,
  • de la nature et de l'utilisation des connaissances extraites,
  • de la possibilité de prendre en compte la connaissance générale sur le domaine.
Les approches généralement suivies consistent, soit à étendre les approches classiques de la fouille de données pour prendre en compte la dimension temporelle, soit à proposer de nouvelles solutions et algorithmes appropriés aux données temporelles. Dans les deux cas, elles doivent tenir compte de la complexité des algorithmes utilisés et de leur possibilité de "passer à l'échelle". L'objectif de cet atelier est de rassembler des chercheurs, du domaine académique ou de l'industrie, travaillant sur des problèmes cités ci-dessus ou sur des applications confrontées à ces problèmes.

Thèmes (liste non exhaustive)

  • l'analyse exploratoire et l'abstraction symbolique de séries temporelles, la découverte de motifs temporels,
  • les méthodes de prédiction pour les données temporelles,
  • la prise en compte de l'aspect multidimensionnel des données temporelles,
  • la prise en compte de données qualitatives (non numériques),
  • la sélection de caractéristiques (feature selection) dans les données temporelles (pour déterminer les relations temporelles implicites intéressantes, par exemple),
  • la réduction de la dimensionnalité des données temporelles,
  • l’évolution des connaissances extraites,
  • le traitement des flux de données (requêtes sur des flux, fouille de flux de données),
  • les applications de la fouille de données temporelles, par exemple dans les domaines suivants :
    • la bioinformatique,
    • la santé (monitoring, surveillance),
    • les télécommunications (facturation, diagnostic, surveillance et sécurité des réseaux),
    • les services web,
    • l'environnement,
    • etc.

Programme

14h15-14h15 ACCUEIL  
14h15-15h45 SESSION 1 : analyse de flux de données  
14h15-14h45 Simulation et détection de l’évolution des données temporelles issues de l’usage du Web Alzennyr Da Silva, Yves Lechevallier, Francisco De Carvalho
14h45-15h15 Contrôle des observations pour la gestion des systèmes de flux de données Christophe Dousson, Pierre Le Maigat, Fabrice Clérot
15h15-15h45 Structure statistique de récupération de données multiphase : application possible aux flux de données issues des compteurs électriques communicants Alain Dessertaine
15h45-16h00 PAUSE  
16h00-17h30 SESSION2 : segmentation et extraction de connaissances temporelles  
16h00-16h30 Detection of Change–Points in the Spectral Density With Applications to ECG Data Pierre R. Bertrand, Gilles Teyssière, Gil Boudet, Alain Chamoux
16h30-17h00 Découverte complète et interactive de motifs temporels avec contraintes numériques à partir de séquences d’événements Damien Cram, Béatrice Fuchs, Yannick Prié
17h00-17h30 Extraction et exploitation de données temporelles pour un portail d’e-tourisme Jérôme Fortin, Olivier Carloni , Michel Leclère, Stéphanie Weiser
17h30 FIN DE L'ATELIER  

Organisateurs

Comité de sélection

  • Fabrice Clérot (France Telecom R&D, Lannion)
  • Michel Dojat (Unité mixte INSERM-UJF U594, Grenoble)
  • Alain Dessertaine (EDF R&D, Clamart)
  • Joao Gama (Université de Porto, Portugal)
  • Catherine Garbay (Laboratoire d'Informatique de Grenoble)
  • Thomas Guyet (INRIA Rennes)
  • Georges Hébrail (ENST Paris)
  • Anne Laurent (LIRMM Montpellier)
  • Yves Lechevallier (INRIA Rocquencourt)
  • Pierre-François Marteau (Université de Bretagne Sud Vannes)
  • Florent Masseglia (INRIA Sophia Antipolis)
  • Pascal Poncelet (Ecole des Mines d’Alès)
  • René Quiniou (INRIA Rennes)
  • Fabrice Rossi (INRIA Rocquencourt)

Format des soumissions

Les textes doivent être soumis en format pdf (on trouve un convertisseur gratuit sur http://www.pdf995.com).

Ils doivent respecter les limites de 6 à 8 pages selon le style LaTeX des ateliers EGC 2009 : atelier_egc.cls.

Afin de garantir une uniformité du style dans les actes, nous insistons pour que les auteurs utilisent le style LaTeX plutot que Word.

Dates

Réception des communications : 30 novembre 2008
Notification aux auteurs : 15 décembre 2008
Réception des articles pour publication : 5 janvier 2009
Atelier : 27 janvier 2009

Contact, soumission électronique