Formation Google Cloud Platform : Analyse et Visualisation de Données

Durée 2 jours
Niveau Intermédiaire
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence GCPVD
Cours officiel Google

Dans le domaine de l'analyse de données, Google Cloud Platform peut compter sur Google BigQuery, un entrepôt de données cloud rapide, adaptable et entièrement géré (sans serveur) destiné à l'analyse de données et doté de fonctionnalités de machine learning intégrées. Exploitant la spécification SQL de l'ANSI, Google BiqQuery autorise le traitement de pétaoctets de données en quelques secondes, l'adaptation automatique de l'analyse des données à leur volume étant possible à tout moment. Les utilisateurs peuvent ensuite analyser ces données en créant un entrepôt logique sur un stockage en colonnes géré, ainsi que des données issues d'espaces de stockage d'objets et de feuilles de calcul.

Cette formation « Google Cloud Platform : Analyse et Visualisation de Données » explore les différentes fonctionnalités proposées par Google BigQuery afin de donner aux participants les moyens d'extraire, de charger, de visualiser et d'analyser des informations de divers jeux de données. Le cours couvre le chargement des données, le requêtage, la modélisation des schémas, l'optimisation des performances, la tarification des requêtes et la visualisation des données.

À l'issue de cette formation, vous serez à même de :

  • Obtenir des informations pertinentes à partir de données à l'aide des outils d'analyse et de visualisation de Google Cloud Platform
  • Requêter interactivement des jeux de données à l'aide de Google BigQuery
  • Charger, nettoyer et transformer des données à grande échelle
  • Distinguer entre l'analyse exploratoire et explicative, et quand utiliser chaque approche
  • Explorer de nouveaux ensembles de données et obtenir rapidement et efficacement des informations cachées
  • Optimiser des modèles de données et des requêtes par rapport aux coûts et à la performance

Public :

Ce stage en analyse et visualisation de données s'adresse aux analystes de données, analystes d'affaires et professionnels de la veille stratégique ainsi qu'aux ingénieurs des données cloud qui collaborent avec des analystes de données pour créer des solutions de données évolutives sur Google Cloud Platform.

Prérequis :

Pour suivre ce cours Google Cloud Platform, les participants doivent maîtriser les principes de base du langage ANSI SQL.

Introduction à la Data sur Google Cloud Platform

Avant et maintenant : analyse de données scalable dans le cloud
Mettre en évidence les défis analytiques rencontrés par les analystes de données
Comparer Big Data On-Premises et sur le cloud
Apprendre de cas clients réels ayant effectué l'analyse de données sur le cloud

Présentation des outils Big Data

Maîtriser la boîte à outils du Data Analyst :
- Tâches du Data Analyst, défis et introduction aux outils Data de Google Cloud Platform
- Démonstration : analyse de 10 milliards d'enregistrements avec Google BigQuery
- Exploration de 9 fonctionnalités fondamentales Google BigQuery
- Comparaison des outils GCP pour Analysts, Data Scientists et Data Engineers
- Lab : Exploration de jeux de données avec Google BigQuery

Explorer les données avec SQL

Se familiariser avec Google BigQuery et apprendre les meilleures pratiques :
- Comparer les techniques d'exploration de données fréquentes
- Apprendre à coder en SQL standard de haute qualité
- Exploration de de jeux de données publics avec Google BigQuery
- Aperçu de la visualisation : Google Data Studio
- Lab : Résoudre les erreurs SQL courantes

Tarification de Google BigQuery

Calculer les coûts de stockage et de requêtage de Google BigQuery :
- Guide pas à pas d'un job BigQuery
- Calculer les prix BigQuery : coûts de stockage, de requêtage et de streaming
- Optimiser les requêtes par rapport aux coûts
- Aperçu de la visualisation : Google Data Studio
- Lab : Calculer les prix Google BigQuery

Nettoyer et transformer ses données

Faire de données brutes un ensemble de données propre et enrichi :
- Étude des 5 principes de l'intégrité des ensembles de données
- Définir la forme de l'ensemble de données
- Nettoyer et transformer les données en utilisant SQL
- Nettoyer et transformer les données à l'aide d'une nouvelle interface utilisateur : Cloud Dataprep
- Lab : Explorer et mettre en forme des données avec Cloud Dataprep

Stockage et exportation de données

Créer de nouvelles tables et exporter les résultats :
- Comparer les tables permanentes et temporaires
- Enregistrer et exporter les résultats de la requête
- Aperçu des performances : Cache de requête
- Lab : Création de nouvelles tables permanentes

Intégrer de nouveaux jeux de données dans Google BigQuery

Mettre ses données dans le Cloud :
- Requête provenant de sources de données externes
- Éviter les écueils de l'ajout de données
- Ajouter de nouvelles données dans des tables permanentes
- Aperçu des performances : Cache de requête
- Lab : Insérer et requêter de nouveaux ensembles de données

Visualisation de données

Explorer et interpréter efficacement ses données grâce à la visualisation :
- Vue d'ensemble des principes de visualisation des données
- Approches d'analyse exploratoire ou explicative
- Démonstration: interface utilisateur de Google Data Studio
- Connecter Google Data Studio à Google BigQuery
- Lab : Exploration d'un jeu de données dans Google Data Studio

Joindre et fusionner les ensembles de données

Combiner et enrichir ses ensemble de données :
- Fusionner des tables de données historiques avec UNION
- Introduire des caractères génériques de table pour les opérations de fusion facile
- Démonstration: interface utilisateur de Google Data Studio
- Connecter Google Data Studio à Google BigQuery
- Lab : Exploration d'un jeu de données dans Google Data Studio

Fonctions avancées et clauses

Écrire des requêtes avancées avec Google BigQuery :
- Les requêtes conditionnelles SQL
- Les fonctions analytiques et de fenêtrage
- Protection des données avec le cryptage de champs à sens unique
- Les sous-requêtes efficaces et la conception de Common Table Expression (CTE)
- Comparaison entre SQL et fonctions Javascript définies par l'utilisateur
- Lab : obtenir des informations pertinentes avec fonctions SQL avancées

Conception de schémas et structures de données imbriquées

Modéliser ses ensembles de données à grande échelle dans Google BigQuery :
- Comparaison entre Google BigQuery et les systèmes de gestion de base de données relationnels
- Normalisation ou dénormalisation : le compromis de performance
- Tableaux et données imbriquées dans Google BigQuery
- Lab : requêtage de données imbriquées et répétées

Plus de visualisations avec Google Data Studio

Créer des tableaux de bord parfaits au pixel près :
- Créer des expressions conditionnelles et des champs calculés
- Éviter les pièges impactant la performance avec la mise en cache
- Partager des tableaux de bord et problématiques d'accès aux données

Optimiser les performances

Dépanner et résoudre les problèmes de performance des requêtes :
- Éviter les pièges impactant la performance de Google BigQuery
- Empêcher les hotspots dans ses données
- Diagnostiquer les problèmes de performances avec le plan Query Explanation
- Lab : Optimisation et amélioration de la performance des requêtes

Utilisations avancées

Penser, analyser et partager ses analyses comme un Data Scientist :
- Présentation de Cloud Datalab
- Le notebook de Cloud Datalab et ses cellules
- Avantages de Cloud Datalab

Accès aux données

L'impératif de la sécurité des données dans le Cloud :
- Comparaison entre IAM et les rôles dans les ensembles de données BigQuery
- Éviter les problèmes d'accès
- Passage en revue des membres, rôles, organisations, de l'administration de compte et des comptes de service


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB