Fouille de données temporelles

Atelier à EGC 2008
29 janvier 2008

Appel à communication


Objectifs

Dans de nombreux domaines applicatifs, tels la biologie, la santé, les télécommunications, la vidéo-surveillance, l’énergie, l’environnement, etc., des données sont enregistrées de manière continue. Les bases de données concernées peuvent atteindre des tailles gigantesques ou ne retenir que les données les plus récentes. Les données représentent, par exemple, les valeurs prises par des variables mesurées à intervalles réguliers ou des événements se produisant de manière irrégulière. Dans la plupart des cas, les données présentent un caractère temporel qu'il est intéressant de caractériser : relations entre les tendances de plusieurs variables, relations temporelles entre occurrences de certains types d'événements, etc. L'exploitation de cette dimension temporelle introduit une complexité supplémentaire dans les tâches de fouille de données et d'extraction de connaissances. Ainsi, il faut tenir compte
  • des aspects métriques ou symboliques des relations temporelles traitées,
  • de l'irrégularité ou du manque de synchronisation des mesures,
  • du volume des données à traiter,
  • de la fugacité des données et de la nécessité d'un traitement en temps-réel,
  • de la nécessité/possibilité ou non d'un encodage explicite des relations temporelles des données avant leur exploitation,
  • de la granularité temporelle et du caractère hétérogène des types des données pouvant avoir un impact sur les motifs susceptibles d'être découverts,
  • de la nature et de l'utilisation des connaissances extraites,
  • de la possibilité de prendre en compte la connaissance générale sur le domaine.
Les approches généralement suivies consistent, soit à étendre les approches classiques de la fouille de données pour prendre en compte la dimension temporelle, soit à proposer de nouvelles solutions et algorithmes appropriés aux données temporelles. Dans les deux cas, elles doivent tenir compte de la complexité des algorithmes utilisés et de leur possibilité de "passer à l'échelle". L'objectif de cet atelier est de rassembler des chercheurs, du domaine académique ou de l'industrie, travaillant sur des problèmes cités ci-dessus ou sur des applications confrontées à ces problèmes.

Thèmes (liste non exhaustive)

  • l'analyse exploratoire et l'abstraction symbolique de séries temporelles, la découverte de motifs temporels,
  • les méthodes de prédiction pour les données temporelles,
  • la prise en compte de l'aspect multidimensionnel des données temporelles,
  • la prise en compte de données qualitatives (non numériques),
  • la sélection de traits (feature selection) dans les données temporelles (pour déterminer les relations temporelles implicites intéressantes, par exemple),
  • la réduction de la dimensionnalité des données temporelles,
  • l’évolution des connaissances extraites,
  • le traitement des flux de données (requêtes sur des flux, fouille de flux de données),
  • les applications de la fouille de données temporelles, par exemple dans les domaines suivants :
    • la bioinformatique,
    • la santé (monitoring, surveillance),
    • les télécommunications (facturation, diagnostic, surveillance et sécurité des réseaux),
    • les services web,
    • l'environnement,
    • etc.

Programme

14h15-14h30 ACCUEIL  
14h30-15h00 Wilfried Despagne Prévision à très court terme de l’activité des 57 plates-formes du transporteur sous température dirigée TFE
15h00-15h30 Sylvain Ferrandiz, Marie-Luce Picard Applications de gestion de flux de données chez EDF R& D
15h30-16h00 Pascal Neveu, Virginie Rossard, E. Aguera, M. Perez, C. Picou, J.M. Sablayrolles Gestion de données et de connaissances pour les bioprocédés
16h00-16h30 PAUSE  
16h30-17h00 My Huynh Lim, Fabrice Clérot, Pascal Cheung-Mon-Chan Influence de l’échantillonnage sur la détection d’objets massifs du trafic Internet
17h00-17h30 Muhammad Marwan Muhammad Fuad, Pierre-François Marteau Une Distance d’Édition Etendue Multi Résolution (MREED)
17h30 FIN DE L'ATELIER  

Organisateurs

Comité de sélection

  • Fabrice Clérot (France Telecom R&D, Lannion)
  • Michel Dojat (Unité mixte INSERM-UJF U594, Grenoble)
  • Alain Dessertaine (EDF R&D, Clamart)
  • Joao Gama (Université de Porto, Portugal)
  • Catherine Garbay (Laboratoire d'Informatique de Grenoble)
  • Georges Hébrail (ENST Paris)
  • Bernard Hugueney (Université Paris 9 Dauphine)
  • Yves Lechevallier (INRIA Rocquencourt)
  • Pierre-François Marteau (Université de Bretagne Sud Vannes)
  • Pascal Poncelet (Ecole des Mines d’Alès)
  • René Quiniou (IRISA/INRIA Rennes)
  • Fabrice Rossi (INRIA Rocquencourt)

Format des soumissions

Les textes doivent être soumis en format pdf (on trouve un convertisseur gratuit sur http://www.pdf995.com).

Ils doivent respecter les limites de 6 à 10 pages selon le format de la conférence EGC 2008 (celui de la Revue des Nouvelles Technologie de l'Information-RNTI, http://www.antsearch.univ-tours.fr/rnti/).

Afin de garantir une uniformité du style dans les actes, nous insistons pour que les auteurs utilisent le style LaTeX plutot que Word.

Dates

Réception des communications : 18 novembre 2007
Notification aux auteurs : 14 décembre 2007
Réception des articles pour publication : 7 janvier 2006
Atelier : 29 janvier 2006

Contact, soumission électronique