Formation Google Cloud Plateform : Ingénierie de Données


  • APPRENEZ À CONCEVOIR ET À CONSTRUIRE DES SYSTÈMES DE TRAITEMENT DE DONNÉES.
REFERENCE
 
 
GCPID
DUREE
 
 
4 jours
TARIFS
 
 
2995 € HT
Niveau : Avancé
Classe à distance: Possible
Cours officiel: Google

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

OBJECTIFS :
 

L'ingénierie de données sur Google Cloud Platform se concentre sur les services Big Data et Machine Learning de la plate-forme cloud de Google. L'objectif est d'apprendre aux participants à concevoir des systèmes de traitement de données, à créer des pipelines de données de bout en bout, à analyser des données et à effectuer un apprentissage automatique. Les démonstrations s'appuient sur les différents services proposés par Google Cloud Platform : BigQuery, Dataflow, Tensorflow, CloudML, Dataproc...

À l'issue de cette formation, vous aurez appris à :

  • Concevoir et construire des systèmes de traitement de données sur Google Cloud Platform
  • Traiter des lots de données de diffusion en implémentant des pipelines de données à mise à l'échelle automatique sur Cloud Dataflow
  • Dériver les perspectives commerciales d'extrêmement grandes ensembles de données utilisant Google BigQuery
  • Former, évaluer et prédire en utilisant des modèles d'apprentissage automatique en utilisant Tensorflow et Cloud ML
  • Tirer parti des données non structurées à l'aide des API Spark et ML sur Cloud Dataproc
  • Activer les informations instantanées à partir des données en continu
PRÉ-REQUIS :
 

Pour suivre ce cours, il est nécessaire d'avoir préalablement assisté à la formation Google Cloud Platform : l'essentiel du Big Data et du Machine Learning (GCP100B) ou d'avoir de solides connaissances équivalentes. Il est par ailleurs demandé de connaître un langage de requête commun tel que SQL, d'avoir une expérience de la modélisation, de l'extraction, de la transformation et du chargement de données, de savoir développer des applications en utilisant un langage de programmation commun tel que Python et d'être familiarisé avec le machine learning ou les statistiques.

PUBLIC :
 

Ce stage s'adresse prioritairement aux développeurs expérimentés en charge de la gestion des grandes transformations de données, notamment en ce qui a trait à : l'extraction, le chargement, la transformation, le nettoyage et la validation des données ; la conception de pipelines et d'architectures pour le traitement de données ; la création et le maintien d'un apprentissage automatique et des modèles statistiques ou encore l'interrogation de jeux de données, visualisation des résultats de requête et création de rapports.

PROGRAMME :
 

Analyse de données sans serveur avec BigQuery

Qu'est-ce que BigQuery
Capacités avancées
Performance et prix

Canaux de données Autoscaling sans serveur avec Dataflow

Premiers pas avec le Machine Learning

Qu'est-ce que le machine Learning (ML)
ML efficace : concepts, types
Évaluation de ML
Ensembles de données ML : généralisation

Construire des modèles ML avec Tensorflow

Premiers pas avec TensorFlow
Graphes et boucles TensorFlow + lab
Surveillance de la formation au ML

Mise à l'échelle des modèles ML avec CloudML

Pourquoi Cloud ML?
Emballer un modèle TensorFlow
Formation de bout en bout

Ingénierie des caractéristiques

Créer de bonnes fonctionnalités
Transformer les entrées
Caractéristiques synthétiques
Pré-traitement avec Cloud ML

Architectures ML

Large et profond
L'analyse d'image
Embeddings et séquences
Systèmes de recommandation

Présentation de Google Cloud Dataproc

Présentation de Google Cloud Dataproc
Créer et gérer des clusters
Définition des noeuds maître et de travail
Tirer parti des types de machines personnalisées et des nœuds de travail préemptifs
Création de clusters avec la console Web
Clusters de script avec l'interface de ligne de commande
Utilisation de l'API REST Dataproc
Tarification Dataproc
Mise à l'échelle et suppression des clusters

Exécution de Jobs Dataproc

Contrôle des versions d'application
Soumettre des emplois
Accès à HDFS et GCS
Hadoop
Spark et PySparkCochon et ruche
Journalisation et surveillance des travaux
Accès aux nœuds maîtres et travailleurs avec SSH
Travailler avec PySpark REPL (interpréteur de ligne de commande)

Intégration de Dataproc à Google Cloud Platform

Actions d'initialisation
Programmation des ordinateurs portables Jupyter / Datalab
Accéder à Google Cloud Storage
Exploiter les données relationnelles avec Google Cloud SQL
Lire et écrire des données en streaming avec Google BigTable
Interrogation de données à partir de Google BigQuery
Création d'appels API Google à partir de blocs-notes

Comprendre les données non structurées avec les API d'apprentissage machine de Google

API Google Machine Learning
Cas d'utilisation de ML communs
API Vision
API de langage naturelTraduire
API Speech

Nécessité d'une analyse en continu en temps réel

Qu'est-ce que Streaming Analytics?
Cas d'utilisation
Batch vs Streaming (en temps réel)
Terminologies connexes
Les produits GCP qui aident à construire pour la haute disponibilité, la résilience, le haut débit, les analyses en temps réel (revue de Pub/Sub et Dataflow)

Architecture des pipelines en streaming

Architectures de streaming et considérations
Choisir les bons composants Lumières
Agrégation en continu
Événements, déclencheurs

Diffuser des données et des événements dans PubSub

Sujets et abonnements
Publication d'événements dans Pub / Sub
Options d'abonnement : Push vs Pull
Alertes

Construire un pipeline de traitement de flux

Pipelines, PCollections et Transforms
Windows, événements et déclencheurs
Statistiques d'agrégation
Analyse en continu avec BigQuery
Alertes à faible volume

Haut débit et faible latence avec Bigtable

Considérations de latence
Qu'est-ce que Bigtable
Concevoir des clés de ligne
Considérations de performance

Analyse de flux de données et tableaux de bord

Qu'est-ce que Google Data Studio?
Des données aux décisions

S'INSCRIRE À CETTE
FORMATION GOOGLE CLOUD PLATORM DATA ENGINEERING

Pas de session programmée pour l'instant.

Contactez-nous pour obtenir les prochaines disponibilités de nos consultants formateurs
Information pratiques sur
LA FORMATION
Lieu de la formation Paris - LA DEFENSE
Nous contacter 01 43 34 90 94
CETTE FORMATION SUR-MESURE Ce cours est réalisable en intra-entreprise, dans vos locaux ou nos salles de cours CONTACTER NOTRE SERVICE INTRA
D'autres formations
SUR LE MÊME THÈME

2 j

 
Dans le domaine de l'analyse de données, Google Cloud Platform peut compter sur Google BigQuery , un entrepôt de données cloud rapide, adaptable et entièrement...

3 j

 
L'écosystème Google Cloud Platform inclut de nombreux services et API de machine learning permettant de créer des applications cloud natives sécurisées,...

1 j

 
Cette formation se veut la synthèse des fonctionnalités essentielles de Google Cloud Platform , pensée pour les professionnels d' Amazon Web Services . Elle se concentre...

2 j

 
Pour déployer, exploiter et maintenir son réseau privé, la Google Cloud Platform s'appuie sur des points de présence éparpillés à travers le...
Plus de formations sur le même thème

Des questions ?

ON VOUS RAPPELLE

 

0

Formations
Informatique
et Management
en ligne à ce jour

+ 0

Stagiaires dans nos
salles de cours sur
l'année

0%

De participants
satisfaits ou très
satisfaits de nos
formations

0

Formateurs experts
validés PLB