• éligibleCPF

Formation Microsoft Azure - Ingénierie de données

Durée 4 jours
Niveau Intermédiaire
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence DP-203
Éligible CPF Code 331067
Cours officiel Microsoft
Certification Microsoft Data Engineering on Microsoft Azure

Cette formation Microsoft Azure Ingénierie de données vous permettra de découvrir les modèles et les pratiques d'ingénierie des données dans le cadre de solutions analytiques entemps réel et par lots utilisant les technologies de la plate-forme de données Azure.

Vous découvrirez les technologies de calcul et de stockage de base qui sont utilisées pour construire une solution analytique, et explorerezensuite comment concevoir des couches de service analytiques et se concentrer sur les considérations d'ingénierie des données pour travailleravec des fichiers sources.

Vous apprendrez à explorer de manière interactive les données stockées dans des fichiers dans un lac de données, les différentes techniquesd'ingestion qui peuvent être utilisées pour charger des données à l'aide de la fonctionnalité Apache Spark présente dans Azure SynapseAnalytics ou Azure Databricks, ou comment ingérer à l'aide d'Azure Data Factory ou des pipelines Azure Synapse.

Vous aborderez également les différentes façons de transformer les données à l'aide des mêmes technologies que celles utilisées pourl'acquisition des données et apprendront à surveiller et à analyser les performances des systèmes analytiques afin d'optimiser lesperformances des charges de données ou des requêtes émises sur les systèmes.

Enfin, vous comprendrez l'importance de la mise en œuvre de la sécurité pour garantir la protection des données au repos ou en transit.

Objectif opérationnel :

Savoir aborder les modèles et les pratiques d'ingénierie des données dans le cadre de solutions analytiques en temps réel et par lots utilisant les technologies de la plate-forme de données Azure.

 

Objectifs pédagogiques :

Cette formation Microsoft Azure Ingénierie de données vous donne les connaissances et compétences nécessaires pour :

  • Explorer les options de calcul et de stockage pour les charges de travail d'ingénierie des données dans Azure
  • Concevoir et mettre en œuvre la couche de service
  • Comprendre les considérations relatives à l'ingénierie des données
  • Exécuter des requêtes interactives à l'aide de pools SQL sans serveur
  • Explorer, transformer et charger des données dans l'entrepôt de données à l'aide d'Apache Spark.
  • Effectuer l'exploration et la transformation des données dans Azure Databricks
  • Ingérer et charger des données dans l'entrepôt de données
  • Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines
  • Intégrer les données des ordinateurs portables avec Azure Data Factory ou Azure Synapse Pipelines
  • Optimiser les performances des requêtes avec des pools SQL dédiés dans Azure Synapse
  • Analyser et optimiser le stockage dans l'entrepôt de données
  • Prendre en charge le traitement analytique transactionnel hybride (HTAP) avec Azure Synapse Link
  • Assurer la sécurité de bout en bout avec Azure Synapse Analytics
  • Effectuer un traitement de flux en temps réel avec Stream Analytics
  • Créer une solution de traitement en continu avec Event Hubs et Azure Databricks
  • Créer des rapports à l'aide de l'intégration Power BI avec Azure Synpase Analytics
  • Exécuter des processus d'apprentissage automatiques intégrés dans Azure Synapse Analytics

Public :

Ce cours d'adresse aux aux professionnels des données, aux architectes de données et aux professionnels de la veille stratégique qui souhaitent se familiariser avec l'ingénierie des données et la création de solutions analytiques à l'aide des technologies de plateforme de données qui existent sur Microsoft Azure. Mais aussi aux Data Analyst et les Data Scientist qui travaillent avec des solutions analytiques construites sur Microsoft Azure.

Prérequis :

Pour suivre cette formation il est préférable d'avoir une connaissance du cloud computing et des concepts de données de base et une expérience professionnelle des solutions de données.

Explorer les options de calcul et de stockage pour les charges de travail d'ingénierie des données

Introduction à Azure Synapse Analytics
Décrire Azure Databricks
Introduction au stockage Azure Data Lake
Décrire l'architecture Delta Lake
Travailler avec des flux de données à l'aide d'Azure Stream Analytics

Concevoir et mettre en oeuvre la couche de service

Concevoir un schéma multidimensionnel pour optimiser les charges de travail analytiques
Transformation sans code à grande échelle avec Azure Data Factory
Remplir les dimensions à évolution lente dans les pipelines Azure Synapse Analytics

Considérations d'ingénierie des données pour les fichiers source

Concevoir un entrepôt de données moderne à l'aide d'Azure Synapse Analytics
Sécuriser un entrepôt de données dans Azure Synapse Analytics

Exécuter des requêtes interactives à l'aide de pools SQL sans serveur Azure Synapse Analytics

Découvrir les fonctionnalités des pools SQL sans serveur Azure Synapse
Interroger des données dans le lac à l'aide de pools SQL sans serveur Azure Synapse
Créer des objets de métadonnées dans des pools SQL sans serveur Azure Synapse
Sécuriser les données et gérer les utilisateurs dans les pools SQL sans serveur Azure Synapse

Explorer, transformer et charger des données dans l'entrepôt de données à l'aide d'Apache Spark

Comprendre l'ingénierie du Big Data avec Apache Spark dans Azure Synapse Analytics
Ingérer des données avec des blocs-notes Apache Spark dans Azure Synapse Analytics
Transformer les données avec DataFrames dans Apache Spark Pools dans Azure Synapse Analytics
Intégrer les pools SQL et Apache Spark dans Azure Synapse Analytics

Exploration et transformation des données dans Azure Databricks

Décrire Azure Databricks
Lire et écrire des données dans Azure Databricks
Utiliser des DataFrames dans Azure Databricks
Utiliser les méthodes avancées DataFrames dans Azure Databricks

Ingérer et charger des données dans l'entrepôt de données

Utiliser les meilleures pratiques de chargement de données dans Azure Synapse Analytics
Ingestion à l'échelle du pétaoctet avec Azure Data Factory

Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines

Intégration de données avec Azure Data Factory ou Azure Synapse Pipelines
Transformation sans code à grande échelle avec Azure Data Factory ou Azure Synapse Pipelines

Orchestrer le mouvement et la transformation des données dans Azure Synapse Pipelines

Orchestrer le mouvement et la transformation des données dans Azure Data Factory

Optimiser les performances des requêtes avec des pools SQL dédiés dans Azure Synapse

Optimiser les performances des requêtes d'entrepôt de données dans Azure Synapse Analytics
Comprendre les fonctionnalités pour les développeurs de l'entrepôt de données d'Azure Synapse Analytics

Analyser et optimiser le stockage de l'entrepôt de données

Analyser et optimiser le stockage de l'entrepôt de données dans Azure Synapse Analytics

Prise en charge du traitement analytique transactionnel hybride (HTAP) avec Azure Synapse Link

Concevoir un traitement transactionnel et analytique hybride à l'aide d'Azure Synapse Analytics
Configurer Azure Synapse Link avec Azure Cosmos DB
Interroger Azure Cosmos DB avec des pools Apache Spark
Interroger Azure Cosmos DB avec des pools SQL sans serveur

Sécurité de bout en bout avec Azure Synapse Analytics

Sécuriser un entrepôt de données dans Azure Synapse Analytics
Configurer et gérer les secrets dans Azure Key Vault
Mettre en oeuvre des contrôles de conformité pour les données sensibles

Traitement de flux en temps réel avec Stream Analytics

Activez une messagerie fiable pour les applications Big Data à l'aide d'Azure Event Hubs
Travailler avec des flux de données à l'aide d'Azure Stream Analytics
Ingérer des flux de données avec Azure Stream Analytics

Créer une solution de traitement de flux avec Event Hubs et Azure Databricks

Traiter les données de streaming avec le streaming structuré Azure Databricks

Créer des rapports à l'aide de l'intégration de Power BI avec Azure Synapse Analytics

Créer des rapports avec Power BI à l'aide de son intégration avec Azure Synapse Analytics

Effectuer des processus d'apprentissage automatique intégrés dans Azure Synapse Analytics

Utiliser le processus d'apprentissage automatique intégré dans Azure Synapse Analytics

Tous les chapitres sont accompagnés de travaux pratiques.

Cette formation vous permet de passer l'examen DP-203 : Data Engineering on Microsoft Azure.

L'examen DP-203 mesure les compétences suivantes:

  • Concevoir et mettre en œuvre le stockage des données (40-45%)
  • Concevoir et développer le traitement des données (25-30%)
  • Concevoir et mettre en œuvre la sécurité des données (10-15%)
  • Surveiller et optimiser le stockage et le traitement des données (10-15%)


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB