Stage

Sujet de stage : Définition et implémentation des nouvelles méthodes de géovisualisation pour SOLAP dans une architecture orientée services web

Encadrements :

Laboratoire d’accueil : IRSTEA, Centre de Clermont-Ferrand, Unité de recherche TSCF, 9 avenue Blaise Pascal, 63172

Contexte

Les entrepôts de données associés à des outils d’analyse On Line Analytical Processing (OLAP), représentent une solution effective pour l’informatique décisionnelle (Immon, 1992). Les données dans les hypercubes sont organisées en axes d’analyses appelés dimensions. Les sujets d’analyse, appelés « faits » sont caractérisés par des mesures, qui sont pré-calculées à l’aide de fonctions d’agrégation selon les différentes granularités définies par le schéma hiérarchique de chaque dimension. Dans le cas classique, une mesure est une valeur numérique qui décrit quantitativement le fait. Ainsi une analyse multidimensionnelle portant sur un fait « ventes » d’un ensemble de magasins pourra être réalisée en définissant comme mesures « le volume de la vente» et « le montant de la vente». Le processus d’analyse est conduit par la navigation dans le cube multidimensionnel. Les opérateurs OLAP (roll-up, drill-down, slice, etc.) permettent de visualiser les mesures pour des ensembles de membres à des niveaux de granularité sélectionnés par l’utilisateur. Les opérations de forage (roll-up, drill-down) sont fondées sur des fonctions d’agrégation appliquées aux mesures, par exemple la somme appliquée au volume de produits vendus. Des interfaces orientées navigation (tableau de bord, tableau multidimensionnels, graphes) complètent le panel des outils décisionnels.

Un système d’Information Géographique permet d’acquérir, de structurer, de mémoriser, d’analyser et de visualiser les données géographiques. Les utilisateurs potentiels d’un SIG sont tous les spécialistes qui ont besoin d’analyser d’importants volumes de données géographiques dans différents domaines.

Les Systèmes d’Aide à la Décision et les systèmes OLAP en particulier, ne présentent aucun instrument pour la gestion des données spatiales. Des solutions, connues sur le terme d’OLAP Spatial, qui visent à intégrer la donnée spatiale dans l’OLAP, ont donc été développées.

L’OLAP Spatial (SOLAP) a été défini par Yvan Bédard comme « une plateforme visuelle conçue spécialement pour supporter une analyse spatio-temporelle rapide et efficace à travers une approche multidimensionnelle qui comprend des niveaux d’agrégation cartographiques, graphiques et tabulaires » (Rivest et al., 2005). Le SOLAP enrichit les capacités d’analyse des systèmes OLAP classiques car la visualisation des mesures sur une carte permet de comprendre la distribution géographique d’un phénomène et de mettre en relation les différents phénomènes spatiaux par rapport aux axes d’analyse alphanumériques et de comparer ces phénomènes à diverses granularités géographiques. De plus, la composante cartographique dans l’OLAP représente une interface vers l’entrepôt de données spatiales. En d’autres termes, l’utilisateur peut accéder aux opérations de navigation multidimensionnelle à travers la simple interaction avec la composante cartographique.

Aujourd’hui les systèmes OLAP sont basés sur une architecture orientée services web (SOA) avec XMLA, qui permet une majeure interopérabilité entre clients et serveurs OLAP. Dans le contexte du SOLAP, à présent aucun standard a été défini pour associer une client SOLAP et un serveur (S)OLAP dans l’approche SOA, ce qui rend compliqué la définition d’applications mashup SOLAP.

Dans le processus d’analyse spatiale, la visualisation joue un rôle très important. Les cartes ne visualisent pas seulement les données géographiques, mais elles stimulent également l’utilisateur dans son processus mental pour la découverte de patterns, relations et tendances (MacEachren, 2001). Les relations entre les domaines de la cartographie et du SIG d’un côté, et la visualisation scientifique de l’autre, sont à la base d’une nouvelle discipline scientifique : la Géovisualisation. Celle-ci intègre les techniques de visualisation scientifique, de cartographie, d’analyse des images, d’exploration de données, pour fournir une théorie, des méthodes et des outils pour la représentation et la découverte de la connaissance spatiale (MacEachren et Kraak, 2001). Dans ce contexte, il est fondamental que les procédures de cartographie fassent plus attention aux interfaces homme-machine et donc aux problématiques de représentation et de calcul dans le processus de visualisation et aux capacités de facilité d’utilisation et surtout d’interaction.

Objectif

Les outils SOLAP existantes (Bimonte, 2010) se basent sur l'utilisation des deux techniques de géovisualisation principales : les cartes interactives, les vues intégrées (mulitlple linked view) et les multimaps. Donc, l'analyse SOLAP n'utilise pas pleinement la richesse d'analyse des différentes techniques de géovisualisation.

Le but de ce stage est la définition d'un cadre théorique pour l'intégration/adaptation des méthodes de géovisualisation spatio-temporels pour le modèle multidimensionnel. Ces techniques doivent prendre en compte la structure sous forme d'hypercube de l'entrepôt de données spatiales (hiérarchies, mesures, etc.) l'important volume de données, la sémantique des données et le caractère exploratoire et en ligne de l'analyse SOLAP. Par exemple l'utilisation de globes virtuels (Di Martino et al., 2009), ou le space-time cube (Bimonte et al., 2007), les cartes animées, peuvent être des pistes fructueuses.

De plus, ces techniques doivent être implémentées en utilisant des standards pour les données cartographiques comme le SDL, GML, etc. qui permettrai le couplement avec XMLA et donc la définition d’une architecture SOLAP orientée services.

Plan

Les objectifs à attendre sont :

  1. Étude des modèles et outils (S)OLAP (GeoMondrian) dans une approche SOA
  2. Étude des modèles et outils de visualisation cartographiques dans une approche SOA
  3. Étude des techniques de géovisualisation pour les donnes spatio-temporelles
  4. Définition d’un modèle de données générique pour la représentation des visualisations SOLAP
  5. Définition et implémentation d’une architecture SOA pour SOLAP

Questions pratiques

Le stage se déroulera au Irstea (ex. Cemagref) de Clermont-Ferrand au sein de l'équipe Copain.

Références

  • MALINOWSKI Elzbieta et ZIMÁNYI Esteban. Representing spatiality in a conceptual multidimensional model. In : PFOSER Dieter, CRUZ Isabel F. et RONTHALER Marc. 12th ACM International Workshop on Geographic Information Systems, 12-13 Novembre, 2004, Washington, DC, USA. New York, USA : ACM Press, 2004, 12-22 p.
  • RIVEST Sonia, BÉDARD Yvan, PROULX Marie-Josée, NADEAUM Martin, HUBERT Frederic et PASTOR Julien. SOLAP: Merging Business Intelligence with Geospatial Technology for Interactive Spatio-Temporal Exploration and Analysis of Data. Elsevier : Journal of International Society for Photogrammetry and Remote Sensing, 2005, Vol. 60, n° 1, 17-33 p.