Formation AWS : Créer des solutions d'analyse de données par lots sur Amazon Web Services (cours officiel) Building Batch Data Analytics Solutions on AWS

Durée 1 jour
Niveau Intermédiaire
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence ILOT
Éligible CPF Non
Cours officiel Amazon Web Services (AWS)

Cette formation AWS Analyse de données vous apprend à construire des solutions d'analyse de données par lots à l'aide d'Amazon EMR, un service géré Apache Spark et Apache Hadoop de niveau entreprise. Vous découvrirez comment Amazon EMR s'intègre aux projets open source tels que Apache Hive, Hue et HBase, ainsi qu'aux services AWS tels que AWS Glue et AWS Lake Formation. 

La formation aborde les composants de collecte, d'ingestion, de catalogage, de stockage et de traitement des données dans le contexte de Spark et Hadoop. Vous utiliserez EMR Notebooks pour prendre en charge les charges de travail d'analyse et d'apprentissage automatique. Enfin, vous appliquerez les meilleures pratiques de sécurité, de performance et de gestion des coûts au fonctionnement d'Amazon EMR.

Objectif opérationnel :

Savoir construire des solutions d'analyse de données par lots à l'aide d'Amazon EMR.

Objectifs pédagogiques : 

À l'issue de cette formation AWS Analyse de données vous aurez acquis les connaissances et les compétences nécessaires pour : 

  • Comparer les caractéristiques et les avantages des entrepôts de données, des lacs de données et des architectures de données modernes
  • Concevoir et mettre en œuvre une solution d'analyse de données par lots
  • Identifier et appliquer les techniques appropriées, notamment la compression, pour optimiser le stockage des données
  • Sélectionner et déployer les options appropriées pour ingérer, transformer et stocker les données
  • Sélectionner les types d'instances et de nœuds, les clusters, la mise à l'échelle automatique et la topologie réseau appropriés pour un cas d'utilisation particulier
  • Comprendre comment le stockage et le traitement des données affectent les mécanismes d'analyse et de visualisation nécessaires pour obtenir des informations commerciales exploitables
  • Décrire comment sécuriser les données au repos et en transit
  • Surveiller les charges de travail analytiques afin d'identifier et de résoudre les problèmes
  • Identifier les meilleures pratiques de gestion des coûts

Public :

Ce cours AWS Analyse de données s'adresse aux ingénieurs de plateforme de données et architectes et opérateurs qui construisent et gèrent des pipelines d'analyse de données.

Prérequis :

Pour suivre cette formation AWS Analyse de données, il est recommandé de posséder au moins un an d'expérience dans la gestion de frameworks de données open source tels que Apache Spark ou Apache Hadoop.

Il est nécessaire d'avoir suivi la formation AWS : Notions techniques de base sur Amazon Web Services (IANT) ou de posséder les connaissances équivalentes.

Aperçu de l'analyse des données et du pipeline de données

Cas d'utilisation de l'analyse de données
Utilisation du pipeline de données pour l'analyse

Introduction à Amazon EMR

Utilisation d'Amazon EMR dans les solutions analytiques
Architecture du cluster Amazon EMR
Démo interactive 1 : Lancement d'un cluster Amazon EMR
Stratégies de gestion des coûts

Pipeline d'analyse de données utilisant Amazon EMR (Ingestion et Stockage)

Optimisation du stockage avec Amazon EMR
Techniques d'ingestion de données

Analyse de données par lots haute performance avec Apache Spark sur Amazon EMR

Cas d'utilisation d'Apache Spark sur Amazon EMR
Pourquoi Apache Spark sur Amazon EMR ?
Concepts de Spark interactive 2 : Connectez-vous à un cluster EMR et exécutez des commandes Scala à l'aide du shell Spark
Transformation, traitement et analyse
Utilisation de notebooks avec Amazon EMR
Atelier 1  Analyse de données à faible latence avec Apache Spark sur Amazon EMR

Traitement et analyse de données par lots avec Amazon EMR et Apache Hive

Utilisation d'Amazon EMR avec Hive pour traiter des données par lots
Transformation, traitement et analyse
Atelier 2Traitement de données par lots à l'aide d'Amazon EMR et Hive
Introduction à Apache HBase sur Amazon EMR

Traitement des données sans serveur

Traitement, transformation et analyse des données sans serveur
Utilisation d'AWS Glue avec les charges de travail Amazon EMR
Atelier 3  Orchestrer le traitement des données dans Spark à l'aide d'AWS Step Functions

Sécurité et surveillance des clusters Amazon EMR

Sécurisation des clusters EMR
Démonstration interactive 3 : cryptage côté client avec EMRFS
Surveillance et dépannage des clusters Amazon EMR
Démo : Examen de l'historique du cluster Apache Spark

Conception de solutions d'analyse de données par lots

Cas d'utilisation de l'analyse de données par lotsActivité 4  Conception d'un flux de travail d'analyse de données par lots

Développement d'architectures de données modernes sur AWS

Architectures de données modernes
Date de mise à jour du programme : 18/03/2024

Dates et lieux

Le 28 mai 2024
Lieu
Distanciel
Durée
1 jr
820 € HT
Le 25 juin 2024
Lieu
Distanciel
Durée
1 jr
820 € HT
Le 10 septembre 2024
Lieu
Distanciel
Durée
1 jr
820 € HT
Le 17 septembre 2024
Lieu
Distanciel
Durée
1 jr
820 € HT
Le 05 novembre 2024
Lieu
Distanciel
Durée
1 jr
820 € HT


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB