Formation Google Cloud Platform : Analyse et Visualisation de Données


REFERENCE
 
 
GCPVD
DUREE
 
 
2 jours
TARIFS
 
 
1590 € HT
Niveau : Intermédiaire
Cours à distance: Non
Cours officiel: Google
OBJECTIFS :
 

Dans le domaine de l'analyse de données, Google Cloud Platform peut compter sur Google BigQuery, un entrepôt de données cloud rapide, adaptable et entièrement géré (sans serveur) destiné à l'analyse de données et doté de fonctionnalités de machine learning intégrées. Exploitant la spécification SQL de l'ANSI, Google BiqQuery autorise le traitement de pétaoctets de données en quelques secondes, l'adaptation automatique de l'analyse des données à leur volume étant possible à tout moment. Les utilisateurs peuvent ensuite analyser ces données en créant un entrepôt logique sur un stockage en colonnes géré, ainsi que des données issues d'espaces de stockage d'objets et de feuilles de calcul.

Cette formation « Google Cloud Platform : Analyse et Visualisation de Données » explore les différentes fonctionnalités proposées par Google BigQuery afin de donner aux participants les moyens d'extraire, de charger, de visualiser et d'analyser des informations de divers jeux de données. Le cours couvre le chargement des données, le requêtage, la modélisation des schémas, l'optimisation des performances, la tarification des requêtes et la visualisation des données.

À l'issue de cette formation, vous serez à même de :

  • Obtenir des informations pertinentes à partir de données à l'aide des outils d'analyse et de visualisation de Google Cloud Platform
  • Requêter interactivement des jeux de données à l'aide de Google BigQuery
  • Charger, nettoyer et transformer des données à grande échelle
  • Distinguer entre l'analyse exploratoire et explicative, et quand utiliser chaque approche
  • Explorer de nouveaux ensembles de données et obtenir rapidement et efficacement des informations cachées
  • Optimiser des modèles de données et des requêtes par rapport aux coûts et à la performance
PRÉ-REQUIS :
 

Pour suivre ce cours Google Cloud Platform, les participants doivent maîtriser les principes de base du langage ANSI SQL.

PUBLIC :
 

Ce stage en analyse et visualisation de données s'adresse aux analystes de données, analystes d'affaires et professionnels de la veille stratégique ainsi qu'aux ingénieurs des données cloud qui collaborent avec des analystes de données pour créer des solutions de données évolutives sur Google Cloud Platform.

PROGRAMME :
 

Introduction à la Data sur Google Cloud Platform

Avant et maintenant : analyse de données scalable dans le cloud
Mettre en évidence les défis analytiques rencontrés par les analystes de données
Comparer Big Data On-Premises et sur le cloud
Apprendre de cas clients réels ayant effectué l'analyse de données sur le cloud

Présentation des outils Big Data

Maîtriser la boîte à outils du Data Analyst :
- Tâches du Data Analyst, défis et introduction aux outils Data de Google Cloud Platform
- Démonstration : analyse de 10 milliards d'enregistrements avec Google BigQuery
- Exploration de 9 fonctionnalités fondamentales Google BigQuery
- Comparaison des outils GCP pour Analysts, Data Scientists et Data Engineers
- Lab : Exploration de jeux de données avec Google BigQuery

Explorer les données avec SQL

Se familiariser avec Google BigQuery et apprendre les meilleures pratiques :
- Comparer les techniques d'exploration de données fréquentes
- Apprendre à coder en SQL standard de haute qualité
- Exploration de de jeux de données publics avec Google BigQuery
- Aperçu de la visualisation : Google Data Studio
- Lab : Résoudre les erreurs SQL courantes

Tarification de Google BigQuery

Calculer les coûts de stockage et de requêtage de Google BigQuery :
- Guide pas à pas d'un job BigQuery
- Calculer les prix BigQuery : coûts de stockage, de requêtage et de streaming
- Optimiser les requêtes par rapport aux coûts
- Aperçu de la visualisation : Google Data Studio
- Lab : Calculer les prix Google BigQuery

Nettoyer et transformer ses données

Faire de données brutes un ensemble de données propre et enrichi :
- Étude des 5 principes de l'intégrité des ensembles de données
- Définir la forme de l'ensemble de données
- Nettoyer et transformer les données en utilisant SQL
- Nettoyer et transformer les données à l'aide d'une nouvelle interface utilisateur : Cloud Dataprep
- Lab : Explorer et mettre en forme des données avec Cloud Dataprep

Stockage et exportation de données

Créer de nouvelles tables et exporter les résultats :
- Comparer les tables permanentes et temporaires
- Enregistrer et exporter les résultats de la requête
- Aperçu des performances : Cache de requête
- Lab : Création de nouvelles tables permanentes

Intégrer de nouveaux jeux de données dans Google BigQuery

Mettre ses données dans le Cloud :
- Requête provenant de sources de données externes
- Éviter les écueils de l'ajout de données
- Ajouter de nouvelles données dans des tables permanentes
- Aperçu des performances : Cache de requête
- Lab : Insérer et requêter de nouveaux ensembles de données

Visualisation de données

Explorer et interpréter efficacement ses données grâce à la visualisation :
- Vue d'ensemble des principes de visualisation des données
- Approches d'analyse exploratoire ou explicative
- Démonstration: interface utilisateur de Google Data Studio
- Connecter Google Data Studio à Google BigQuery
- Lab : Exploration d'un jeu de données dans Google Data Studio

Joindre et fusionner les ensembles de données

Combiner et enrichir ses ensemble de données :
- Fusionner des tables de données historiques avec UNION
- Introduire des caractères génériques de table pour les opérations de fusion facile
- Démonstration: interface utilisateur de Google Data Studio
- Connecter Google Data Studio à Google BigQuery
- Lab : Exploration d'un jeu de données dans Google Data Studio

Fonctions avancées et clauses

Écrire des requêtes avancées avec Google BigQuery :
- Les requêtes conditionnelles SQL
- Les fonctions analytiques et de fenêtrage
- Protection des données avec le cryptage de champs à sens unique
- Les sous-requêtes efficaces et la conception de Common Table Expression (CTE)
- Comparaison entre SQL et fonctions Javascript définies par l'utilisateur
- Lab : obtenir des informations pertinentes avec fonctions SQL avancées

Conception de schémas et structures de données imbriquées

Modéliser ses ensembles de données à grande échelle dans Google BigQuery :
- Comparaison entre Google BigQuery et les systèmes de gestion de base de données relationnels
- Normalisation ou dénormalisation : le compromis de performance
- Tableaux et données imbriquées dans Google BigQuery
- Lab : requêtage de données imbriquées et répétées

Plus de visualisations avec Google Data Studio

Créer des tableaux de bord parfaits au pixel près :
- Créer des expressions conditionnelles et des champs calculés
- Éviter les pièges impactant la performance avec la mise en cache
- Partager des tableaux de bord et problématiques d'accès aux données

Optimiser les performances

Dépanner et résoudre les problèmes de performance des requêtes :
- Éviter les pièges impactant la performance de Google BigQuery
- Empêcher les hotspots dans ses données
- Diagnostiquer les problèmes de performances avec le plan Query Explanation
- Lab : Optimisation et amélioration de la performance des requêtes

Utilisations avancées

Penser, analyser et partager ses analyses comme un Data Scientist :
- Présentation de Cloud Datalab
- Le notebook de Cloud Datalab et ses cellules
- Avantages de Cloud Datalab

Accès aux données

L'impératif de la sécurité des données dans le Cloud :
- Comparaison entre IAM et les rôles dans les ensembles de données BigQuery
- Éviter les problèmes d'accès
- Passage en revue des membres, rôles, organisations, de l'administration de compte et des comptes de service

S'INSCRIRE À CETTE
FORMATION GOOGLE CLOUD PLATFORM DATA INSIGHTS

Pas de session programmée pour l'instant.

Contactez-nous pour obtenir les prochaines disponibilités de nos consultants formateurs
Information pratiques sur
LA FORMATION
Lieu de la formation Paris - LA DEFENSE
Nous contacter 01 43 34 90 94
CETTE FORMATION SUR-MESURE Ce cours est réalisable en intra-entreprise, dans vos locaux ou nos salles de cours CONTACTER NOTRE SERVICE INTRA
D'autres formations
SUR LE MÊME THÈME

3 j

 
L'écosystème Google Cloud Platform inclut de nombreux services et API de machine learning permettant de créer des applications cloud natives sécurisées,...

1 j

 
Google Container Engine est un gestionnaire de cluster ainsi qu'un système d'orchestration pour l'exécution de conteneurs Docker. Basé sur le système open...

1 j

 
Cette formation se veut la synthèse des fonctionnalités essentielles de Google Cloud Platform , pensée pour les professionnels d' Amazon Web Services . Elle se concentre...

2 j

 
Pour déployer, exploiter et maintenir son réseau privé, la Google Cloud Platform s'appuie sur des points de présence éparpillés à travers le...
Plus de formations sur le même thème

Des questions ?

ON VOUS RAPPELLE

 

0

Formations
Informatique
et Management
en ligne à ce jour

+ 0

Stagiaires dans nos
salles de cours sur
l'année

0%

De participants
satisfaits ou très
satisfaits de nos
formations

0

Formateurs experts
validés PLB