Formation Hadoop - Cloudera pour administrateur (cours officiel certifiant) Cloudera Administrator Training for Apache Hadoop

Durée 4 jours
Niveau Intermédiaire
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence OAHC
Cours officiel Cloudera
Certification Cloudera Certified Associate Administrator

Dès sa création en 2008, Cloudera a lié son histoire à celle de l’écosystème Hadoop. Avec ses fondations composées à 100 % de logiciels open source et de standards ouverts, la plate-forme Cloudera assure un contrôle des coûts, plus de souplesse et des résultats performants pour l'organisation. CDH, la plate-forme open source de Cloudera, est ainsi devenue la distribution la plus populaire de Hadoop.

De l’installation à la configuration en passant par l’équilibrage de charge et le réglage, cette formation Hadoop - Cloudera pour administrateur (cours officiel certifiant) de quatre jours fournit aux participants une compréhension complète de toutes les étapes nécessaires pour opérer et maintenir un cluster Hadoop à l'aide de Cloudera Manager.

Elle prépare également au passage de l'examen de certification Cloudera Certified Associate Administrator.

Objectifs opérationnels :

Savoir opérer et maintenir un cluster Hadoop à l'aide de Cloudera Manager.
Passer sereinement l'examen de certification Cloudera Certified Associate Administrator.

Objectifs pédagogiques :

À l'issue de cette formation Hadoop Administrateur Cloudera, les participants auront acquis les connaissances et compétences nécessaires pour :

  • Reposer les bases de l’environnement Hadoop, MapReduce, Spark et HDFS
  • Gérer un cluster avec les fonctionnalités de Cloudera Manager
  • Déterminer le matériel et l'infrastructure appropriés pour son cluster
  • Configurer et déployer correctement le cluster pour l'intégration avec le système d’information
  • Charger des données dans le cluster à partir de fichiers générés dynamiquement à l'aide de Flume, ou à partir de SGBDR en utilisant Sqoop
  • Configurer FairScheduler pour répartir les ressources entre plusieurs utilisateurs d'un cluster
  • Préparer et maintenir Apache Hadoop en production en utilisant les bonnes pratiques
  • Dépanner, diagnostiquer, mettre au point et résoudre les problèmes sur Hadoop

Public :

Ce cours Hadoop Cloudera pour administrateur s'adresse essentiellement aux administrateurs système, responsables informatique, architectes système, développeurs, analystes de données ou encore administrateurs de bases de données.
 

Prérequis :

Pour assister à cette formation officielle Administrateur Hadoop Cloudera, il est nécessaire de disposer au préalable d'une connaissance de base de la ligne de commande Linux.

Jour 1

Introduction à Hadoop Cloudera

Cloudera Enterprise Data Hub

Cloudera Enterprise Data Hub
Introduction au CDH
Introduction à Cloudera Manager
Les responsabilités d’un administrateur Hadoop

Installation de Cloudera Manager et du CDH

Introduction à l’installation du cluster
Installation de Cloudera Manager Installation
Installation du CDH
Les services du cluster CDH

Configurer un cluster Cloudera

Introduction
Paramètres de configuration
Modifier la configuration des services
Fichiers de configuration
Gérer les instances de rôle
Ajouter des nouveaux services
Ajouter et supprimer des hôtes

Hadoop Distributed File System

Introduction
Topologie et rôles HDFS
Modifier les logs et le checkpointing
La performance HDFS et la tolérance à la panne
Introduction à la sécurité de HDFS et de Hadoop
Interfaces utilisateurs web pour HDFS
Utiliser la ligne de commande HDFS
Autres outils de ligne de commande

Jour 2

Ingestion de données sur HDFS

Introduction à l’ingestion de données
Formats de fichiers
Ingérer de la donnée en utilisant File Transfer ou les interfaces REST
Ingérer de la donnée d’une base de donnée relationnel avec Sqoop
Ingérer de la donnée d’une source externe avec Flume
Les bonnes pratiques d’ingestion de données

Hive et Impala

Apache Hive
Apache Impala

YARN et MapReduce

Introduction à YARN
Exécuter des applications sur YARN
Explorer les applications YARN
Les logs d’application YARN
Les applications Map Reduce
Réglage mémoire et CPU pour YARN

Apache Spark

Introduction à Spark
Les applications Spark
Comment les applications Spark s'exécutent sur YARN
Monitorer les applications Spark

Jour 3

Dimensionnement de votre cluster Hadoop

Considérations générales relatives au dimensionnement
Choix du matériel
Considérations sur le réseau
Options de virtualisation
Options de déploiement cloud
Configuration des noeuds

Configuration avancé du cluster

Configurer les ports de service
Paramétrer HDFS et MapReduce
Activer la Haute Disponibilité HDFS

Gestion des ressources

Configuration de cgroups avec des centres de services statiques
Le Fair Scheduler
Configurer la gestion dynamique des ressources
Planification des requêtes Impala

Maintenance du cluster

Vérification du statut HDFS
Copier les données entre clusters
Rééquilibrage du cluster
Snapshots de répertoires
Mise à niveau du cluster

Jour 4

Monitoring du cluster

Fonctionnalités de monitoring de Cloudera Manager
Tests de santé
Événements et alertes
Graphiques et rapports
Recommandation de monitoring

Diagnostic du cluster

Introduction
Outils de diagnostic
Exemples de mauvaises configurations

Installer et gérer Hue

Introduction
Gérer et configurer Hue
Authentification et autorisation Hue

Sécurité

Les concepts de sécurité sur Hadoop
Authentification sur Hadoop en utilisant Kerberos
Authorisation sur Hadoop
Chiffrement sur Hadoop
Sécuriser un cluster Hadoop

Conclusion

Les travaux pratiques représentent la moitié du temps de formation.

Cette formation vous prépare au passage de l'examen Cloudera Certified Associate Administrator.

L'examen est composé de 8 à 12 tâches à réaliser sur un cluster Cloudera Enterprise préconfiguré. Deux heures vous sont allouées pour tenter d'obtenir un taux de réussite de 70% minimum.

L'examen se déroule en langue anglaise. Il se déroule ultérieurement à la formation. Les frais d'inscription ne sont pas compris dans le tarif de la formation.


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB