• FNE

Formation Data Warehousing sur AWS (cours officiel)

Durée 3 jours
Niveau Intermédiaire
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence IADW
Éligible CPF Non
Cours officiel Amazon Web Services AWS

Cette formation est délivrée en partenariat avec un APN Training Partner, formateur AAI, labs et supports de cours officiels fournis par l’organisme ATP.

Cette formation Data Warehousing sur AWS vous apprend les concepts, les stratégies et les meilleures pratiques de conception d'une solution de Data Warehousing basée sur le Cloud via Amazon Redshift, le data warehouse de capacité Peta-Byte dans AWS. Vous apprenez également à collecter, stocker et préparer les données pour le data warehousing en utilisant les services AWS tels que Amazon DynamoDB, Amazon EMR, Amazon Kinesis Firehose et Amazon S3. Vous abordez en outre l'utilisation des outils de Business Intelligence pour améliorer les analyses de vos données.

Objectif opérationnel : 

Savoir appréhender les concepts, les stratégies et les meilleures pratiques de conception d'une solution Data Warehousing sur AWS.

Objectifs pédagogiques :

Concrètement, à l'issue de cette formation Data Warehousing sur AWS vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Présenter les concepts principaux du Data Warehousing
  • Évaluer les relations entre Amazon Redshift et les autres systèmes Big Data
  • Savoir présenter les différentes charges de travail exploitables dans une solution de Data warehouse à base de AWS dans analytics, grâce à l'observation d’études de cas
  • Choisir un type de nœud Amazon Redshift et le dimensionner en fonction des besoins en données
  • Présenter les fonctionnalités de sécurité qui appartiennent à Amazon Redshift, telles que le cryptage, les permissions IAM et les permissions de bases de données
  • Lancer un cluster Amazon Redshift et utiliser les composants et les fonctionnalités pour mettre en œuvre un datawarehouse dans le cloud
  • Utiliser les données AWS et les services analytiques tels que Amazon DynmaoDB, Amzon EMR, Amazon Kinesis Firehose et Amazon E3 pour constituer la solution de data warehouse
  • Évaluer les approches et les méthodologies pour concevoir des data warehouse
  • Identifier les sources de données et les besoins en accès qui affectent la conception du data warehouse
  • Concevoir le data warehouse pour une utilisation efficace de la compression des données, la distribution des données et les méthodes de tri
  • Charger et décharger les données et améliorer les tâches de maintenance des données
  • Écrire les requêtes et évaluer les plans d’exécution pour en optimiser la performance
  • Configurer la base de données pour allouer des ressources, telles que la mémoire des files d’attente de requêtes, et définir les critères pour router certains types de requêtes
  • Utiliser les fonctionnalités et les services, tels que l’audit des base de données Amazon Redshift, Amazon CloudTrail, Amazon CloudWatch et Amazon SNS (Simple Notification Service), pour auditer, surveiller et recevoir les notifications d’évènements concernant les activités dans le data warehouse
  • Préparer les tâches opérationnelles, tels que le redimensionnement des clusters Amazon Redshift et utiliser les snapshots pour sauvegarder et restaurer les clusters
  • Utiliser l’application de Business Intelligence pour améliorer l’analyse des données et les tâches de création de rapports.

Public :

Ce cours est destiné aux architectes, aux administrateurs, aux développeurs de bases de données ainsi qu'aux analystes de données.

Prérequis :

Pour suivre cette formation, il est nécessaire d'avoir des connaissances sur les bases de données relationnelles et les concepts de conception de bases de données.

Introduction à l'entreposage de données

Bases de données relationnelles
Concepts d'entreposage de données
L'intersection entre l'entreposage de données et le big data
Présentation de la gestion des données dans AWS
AtelierIntroduction à Amazon Redshift

Introduction à Amazon Redshift

Aperçu du concept
Cas d'utilisation réels
AtelierLancement d'un cluster Amazon Redshift

Lancer des clusters

Construire le cluster
Connexion au cluster
Contrôle d'accès
Sécurité de la base de données
Charger les données
AtelierOptimisation des schémas de base de données

Conception du schéma de la base de données

Schémas et types de données
Compression colonnaire
Styles de distribution des données
Méthodes de tri des données

Identification des sources de données

Présentation des sources de données
Amazon S3
Amazon DynamoDB
Amazon DME
Amazon Kinesis Data Firehose
Chargeur de base de données AWS Lambda pour Amazon Redshift
AtelierChargement de données en temps réel dans une base de données Amazon Redshift

Chargement des données

Préparation des données
Chargement des données à l'aide de COPY
Tenue des tableaux
Opérations d'écriture simultanées
Dépannage des problèmes de charge
AtelierCharger des données avec la commande COPY

Écriture de requêtes et optimisation des performances

Amazon Redshift SQL
Fonctions définies par l'utilisateur (UDF)
Facteurs affectant les performances des requêtes
La commande EXPLAIN et les plans de requête
Gestion de la charge de travail (WLM)
AtelierConfiguration de la gestion de la charge de travail

Amazon Redshift Spectrum

Spectre Amazon Redshift
Configuration des données pour Amazon Redshift Spectrum
Requêtes Amazon Redshift Spectrum
Utilisation d'Amazon Redshift Spectrum

Maintenance des clusters

Journalisation des audits
Suivi des performances
Événements et notifications
Redimensionnement des clusters
Sauvegarde et restauration des clusters
Étiquetage des ressources et limites et contraintes
AteliersAudit et monitoring des clusters
Sauvegarde, restauration et redimensionnement des clusters

Analyser et visualiser les données

Puissance des visualisations
Création de tableaux de bord
Éditions et fonctionnalités d'Amazon QuickSight
Date de mise à jour du programme : 01/03/2024

Dates et lieux

Du 18 au 20 novembre 2024
Lieu
Distanciel
Durée
3 jrs
2510 € HT
Du 18 au 20 novembre 2024
Lieu
Paris
Durée
3 jrs
2510 € HT
Du 13 au 15 janvier 2025
Lieu
Distanciel
Durée
3 jrs
2510 € HT


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB