Introduction et rappels
Qu'est-ce qu'un système d'information décisionnel ?
Evolution des exigences de décision dans le contexte actuel.
L’offre actuelle.
Les concepts
L’architecture type d’un système décisionnel
L’ETL dans la chaîne décisionnelle
Les composants principaux, Data Warehouse, ODS ou "staging area", Datamarts
Comprendre la finalité de l'approche Data Warehouse par rapport au "simple" relationnel
Gérer un projet décisionnel
Les acteurs et livrables du projet.
Recueil des besoins métier. Formalisation des exigences techniques et d'organisation.
Organisation et synthèse des interviews utilisateur pour le recueil du besoin.
Compréhension et identification des processus métiers à modéliser.
Identification des priorités et du périmètre pilote.
Modélisation des informations.
Choix de l'infrastructure. Implémentation et recette.
Déploiement et maintenance du modèle.
Gestion des historiques.
Travaux pratiques
Conduite d'interview de recueil de besoin pour l'analyse
Principes, architecture et définitions de base sur la modélisation en étoile
Conception du modèle
Rappels sur la modélisation des bases de données opérationnelles.
Différences entre OLTP et OLAP. Entités, attributs, cardinalités, formes normales.
Les architectures proposées par Kimball et Inmon. Avantages et inconvénients.
Positionnement du modèle en étoile dans le Data Warehouse selon l'architecture.
Les phases du cycle de vie d'un Data Warehouse.
Les critères de qualité d'un Data Warehouse.
La notion de métadonnée, de référentiel.
Le principe de la dénormalisation pour concevoir un modèle en étoile.
Comprendre les notions de fait, dimension et axe d'analyse.
Les alternatives de modélisation : modèle en flocon, en galaxie.
Les règles et bonnes pratiques de modélisation en étoile. Proposition alternative de Kortink et Moody.
Choix des dimensions d'analyse. Création de hiérarchies dans les dimensions.
Identification des mesures et croisements avec les dimensions.
Définition de la granularité de l'analyse.
Utilisation d'outils de modélisation.
Travaux pratiques
A partir d'un cahier des charges d'analyse, identifier les dimensions et faits principaux d'un modèle.
Conception d’un modèle en étoile.
Alimentation du modèle en étoile
Contraintes des systèmes opérationnels sources.
Rôle des ODS dans l'alimentation.
L'organisation des traitements dans la DSA (Data Staging Area).
Les différents types d'alimentation (delta, stock, complète).
Les étapes, les règles et les prérequis de l'alimentation.
Gestion des rejets.
Gestion des sources différentes pour l'alimentation d'une dimension ou d'un fait.
ETL, les solutions d'alimentation disponibles sur le marché.
Présentation de l'ETL Microsoft SSIS
Travaux pratiques
Sur une étude de cas, proposer une architecture de chargement : alimentation table de dimension et table de fait.
Performances
Les problèmes récurrents de performances d'un datawarehouse
La métrologie
Qu’est-ce qu’un CUBE ?
Rôle et performances d’un CUBE.
Utilisation du partitionnement des tables.
Travaux pratiques
Utilisation du concepteur de cubes SSAS.
Reporting
Les différents types d'outils au service de la restitution.
Le marché des outils de restitution.
Optimisation du modèle pour l'exploration des données.
Travaux pratiques
Présentation de bonnes pratiques pour optimiser le modèle en vue du reporting