|
Sujet de Master 1 (stage d'été)
Titre |
Développement
d’un
entrepôt
de
données
spatiales
sur
la
plateforme
Pentaho |
Auteur(s) |
Tasssadit
BOUADI,
René
Quiniou
et
Marie--Odile
Cordier
|
Début |
à partir de mai 2012 |
Description |
Ces
travaux
sont
menés
dans
le
cadre
d’une
collaboration
IRISA
(Projet
DREAM)/
INRA
(SAS)
sur
le
transfert
de
polluants
et
l’amélioration
de
la
qualité
des
eaux
de
bassins
versants
agricoles.
Dans
ce
contexte,
un
entrepôt
de
données
a
été
développé
au
sein
de
l’équipe
comme
outil
d’analyse
et
d’exploration
de
résultats
de
simulations
issus
d’un
modèle
agro--hydrologique.
Le
concept
d’entrepôt
de
données
(ED)
a
été
formalisé
pour
la
première
fois
en
1990
par
Bill
Inmon.
Il
s’agissait
de
constituer
une
base
de
données
orientée
sujet,
intégrée
et
contenant
des
informations
historisées,
non
volatiles
et
exclusivement
destinées
aux
processus
d’aide
à
la
décision.
Les
ED
offrent
un
ensemble
d’opérateurs
OLAP
«
analyse
en
ligne
»
permettant
une
analyse
multidimensionnelle
de
gros
volumes
de
données.
Cependant,
sans
volet
cartographique,
il
est
impossible
de
visualiser
et
d’analyser
la
composante
géométrique
de
ces
données.
Une
solution
pourrait
être
de
combiner
des
technologies
spatiales
et
non--spatiales
:
SIG
&
OLAP
(SOLAP).
Les
SIG
étant
des
logiciels
spécialisés
dans
l'analyse
et
la
visualisation
de
données
géographiques.
En
effet,
l’analyse
en
ligne
«
OLAP
»
prend
toute
sa
valeur
lorsqu'elle
est
couplée
à
des
outils
de
visualisation
(cartes
de
terrain)
identifiant
les
configurations
spatiales
sources
de
la
pollution.
L’objectif
de
ce
stage
est
d’étudier
l’intégration
de
la
technologie
SOLAP
dans
l’entrepôt
de
données
déjà
développé
en
se
basant
sur
le
modèle
multidimensionnel
existant.
Les
étapes
majeures
de
ce
stage
sont:
-- la
familiarisation
avec
la
plate
forme
décisionnelle
PENTAHO
et
particulièrement
le
serveur
SOLAP
«
GeoMondrian
»
;
-- l’installation
et
la
configuration
du
serveur
«
GeoMondrian
»
;
-- la
modélisation
des
dimensions
spatiales
en
se
basant
sur
le
schéma
multidimensionnel
existant
;
-- le
déploiement
de
l’entrepôt
de
données
spatiales
;
-- les
test
de
quelques
requêtes
spatiales
avec
le
langage
de
requêtes
«
spatial
MDX
»
sur
des
données
réelles.
Les
développements
seront
réalisés
en
Perl,
Python
ou
un
autre
langage
de
script
que
vous
maîtrisez.
Concernant
la
phase
d'apprentissage,
des
connaissances
rudimentaires
des
SIG,
XML
et
MySQL
sont
souhaitables.
Les
technologies
utilisées
vont
vous
permettre
de
découvrir
la
plateforme
décisionnelle
Pentaho
(en
particulier
les
modules
:
Mondrian,
GeoMondrian
et
workbench),
le
langage
de
requêtes
MDX
et
les
entrepôts
de
données
spatiales.
Le
stage
sera
effectué
à
l'IRISA
au
sein
de
l'équipe
DREAM
(Diagnostic,
Recommandation
d'Action,
Modélisation).
Bibliographie :
-- http://mondrian.pentaho.com/
-- http://wiki.spatialytics.org/doku.php?id=projects:geomondrian
-- Taher
Omran
Ahmed.
2008.
Spatial
On--line
Analytical
Processing
(SOLAP):
Overview
and
Current
Trends.
In
Proceedings
of
the
2008
International
Conference
on
Advanced
Computer
Theory
and
Engineering
(ICACTE
'08).
IEEE
Computer
Society,
Washington,
DC,
USA,
1095--1099.
Mots cles : Entrepôt
de
données
spatiales,
modèle
multidimensionnel
et
temporel,
SIG,
OLAP
&
SOLAP
Contacts : Tassadit Bouadi, René Quiniou, Marie-Odile Cordier
Équipe : IRISA – Équipe DREAM
Mail : tassadit.bouadi@irisa.fr, rene.quiniou@inria.fr, marie-odile.cordier@irisa.fr
|
|