• FNE
  • FSE

Formation Managing a Data Mesh with Dataplex

Durée 2 jours
Niveau Fondamental
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence MDMD
Éligible CPF Non

Qu'est-ce que "Managing a Data Mesh with Dataplex" ?
Le Data Mesh est une architecture de gestion de données moderne qui permet aux entreprises de distribuer la propriété des données entre plusieurs équipes, tout en assurant la cohérence et l’accessibilité des informations. Google Dataplex est une solution dédiée à la gouvernance et à la gestion des données dans un environnement cloud, facilitant la création d'un Data Mesh. Cette formation fournit les compétences essentielles pour organiser et gouverner les données dans un environnement Data Mesh grâce aux fonctionnalités avancées de Dataplex.

Pourquoi suivre une formation "Managing a Data Mesh with Dataplex" ?
Aujourd’hui, les organisations collectent d’importants volumes de données issues de diverses sources. La gestion centralisée de ces données devient complexe, voire inefficace. Le modèle Data Mesh, associé à l'outil Dataplex de Google, permet de résoudre cette problématique en distribuant la gouvernance des données aux équipes tout en garantissant un accès contrôlé et unifié. Cette formation vous apprendra à organiser, partager et gouverner efficacement les données distribuées dans un Data Mesh, améliorant ainsi l’agilité et la réactivité de vos projets data.

Objectif opérationnel :

Savoir gérer efficacement un environnement Data Mesh en utilisant les capacités de gouvernance et de gestion de Google Dataplex.

Objectifs pédagogiques :

A l'issue de cette formation Data Mesh Dataplex, vous aurez acquis les connaissances nécessaires pour :

  • Identifier l’importance d’une plateforme de données moderne
  • Configurer et installer Dataplex
  • Sécuriser les lacs de données, les zones et les ressources
  • Mettre en œuvre le balisage des ressources et utiliser des étiquettes pour rechercher des ressources
  • Traiter les données à l’aide des tâches Dataplex
  • Concevoir, exécuter et générer des rapports sur les processus de qualité des données

Public :

Ce cours s'adresse à toutes personnes intéressées par gérer, de surveiller et de gouverner les données et les artefacts d’IA dans les lacs de données, les entrepôts et les bases de données avec Dataplex

Prérequis :

Pour suivre cette formation, il est necessaires d'avoir suivi le cours Data Engineering on Google Cloud (Jour 1 et 2) du parcours d’apprentissage Data Engineer ou avoir une expérience équivalente avec Google Cloud.

Introduction to Dataplex

Plateformes de données modernes et conception orientée données
Piliers de la gouvernance des données
Qu’est-ce que Dataplex ?
Fonctionnalités de Dataplex
Comparaison de Dataplex avec d’autres produits sur Google Cloud

Creating a Data Mesh on Dataplex

Qu’est-ce qu’un datamesh ?
Concepts de Dataplex
Création de lacs et de zones de données
Ressources dans Dataplex
Travaux pratiquesProvisionner un maillage de données à l’aide de Dataplex

Processing Data on Dataplex

Traitement des données sur Dataplex
Tâches de préparation des données
Tâches d’ingestion
Tâches Dataflow et Spark
Travaux pratiquesStandardiser les données à l’aide des tâches Dataplex

Managing Data Security through Dataplex

Autorisations et rôles IAM
Sécurisation de votre lac de données
Gestion des politiques
Sécurité des métadonnées
Travaux pratiquesGérer la sécurité des données à l’aide de Dataplex

Data Tagging and Data Catalog

Introduction au catalogue de données
Métadonnées techniques et métadonnées métier
Etiquettes et templates d’étiquettes
Entrées et groupes d’entrées
Lignée de données
Travaux pratiquesCatalogue de données et lignée de données

Data Quality and Profiling

Tâches de qualité des données et AutoDQ
Rapports sur la qualité des données
Profilage des données
Travaux pratiquesQualité des données et profilage de vos données dans BigQuery

Dataplex Best Practices

Bonnes pratiques
Démonstration de bout en bout
Travaux pratiquesGérer un maillage de données avec Dataplex
Date de mise à jour du programme : 12/11/2024

Ces formations peuvent aussi vous intéresser :

Identifier les procédures de migration vers le cloud et connaître les bonnes pratiques

  • Niveau : Intermédiaire
  • Référence : MGCP

Concevez des solutions fiables et sécurisées sur Google Cloud Platform - Spécialisation Infrastructure

  • Niveau : Intermédiaire
  • Cours officiel : Google
  • Référence : GCPICP

Spécialisation Infrastructure de Google Cloud Platform

  • Niveau : Intermédiaire
  • Certification : Google Cloud Associate Cloud Engineer
  • Cours officiel : Google
  • Référence : GCPIF

Découvrir les options d'infrastructure et de networking disponibles dans la GCP

  • Niveau : Intermédiaire
  • Cours officiel : Google
  • Référence : GCPNET


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB