- Référence : DW613G
- Durée : 3 jours (21h)
- Lieu : Au choix. À distance ou en présentiel, à Paris ou en Régions
2390€ HT
Choisir une date et RéserverVous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...
Cette formation IBM InfoSphere BigInsights Les bases présente aux participants une vue d'ensemble de la stratégie Big Data d'IBM et de la solution BigInsights en tant que plateforme pour gérer et obtenir des informations de données. Lors de ce cours les participants vont découvrir la valeur ajoutée à BigInsights incluant Big SQL, BigSheets et Big R. Ils verront ensuite en quoi IBM Open Platform (IOP) avec Apache Hadoop est une plateforme collaborative permettant à des solutions Big Data d'être développées sur un ensemble commun de technologies Apache Hadoop.
Il est également réalisé une présentation détaillée des composants principaux du noyau ODP, à savoir Apache Hadoop (y compris HDFS, YARN et MapReduce) et Apache Ambari, ainsi que leurs traitements.
Objectif opérationnel :
Savoir appréhender les bases d'IBM InfoSphere BigInsights.
Objectifs pédagogiques :
À l'issue de cette formation IBM InfoSphere BigInsights Les Bases, vous aurez acquis les connaissances et compétences nécessaires pour :
Public :
Cette formation est destinée aux professionnels intéressés par le Big Data et la solution IBM BigInsight. Elle concerne plus précisément les ingénieurs data, les data scientists, les développeurs et les administrateurs souhaitant en savoir plus sur la plateforme IBM Open Platform avec Apache Hadoop.
Prérequis :
Afin de profiter pleinement de ce cours, il est recommandé d'avoir des connaissances sur Linux.
Introduction to Big Data
Atelier :
Setting up the lab environment
Introduction to IBM BigInsights
Atelier :
Getting started with IBM BigInsights
IBM BigInsights for Analysts
Atelier :
Working with Big SQL and BigSheets
IBM BigInsights for Data Scientist
Atelier :
Analyzing data with Big R, Jaql, and AQL
IBM BigInsights for Enterprise Management
IBM Open Platform with Apache Hadoop
Atelier :
Exploring the HDFS
Apache Ambari
Atelier :
Managing Hadoop clusters with Apache Ambari
Hadoop Distributed File System
Atelier :
File access & basic commands with HDFS
MapReduce and Yarn
Introduction to MapReduce based on MR1
Limitations of MR1
YARN and MR2
Atelier :
Creating and coding a simple MapReduce job (Possibly a more complex second Exercise)
Apache Spark
Atelier :
Working with Spark's RDD to a Spark job
Coordination, management, and governance
Atelier :
Apache ZooKeeper, Apache Slider, Apache Knox
Data Movement
Atelier :
Moving data into Hadoop with Flume and Sqoop
Storing and Accessing Data
Representing Data : CSV, XML, JSON, and YAML
Open Source Programming Languages: Pig, Hive, and Other (R, Python, etc.)
NoSQL Concepts
Accessing Hadoop data using Hive
Atelier :
Performing CRUD operations using the HBase shell
Querying Hadoop data using Hive
Atelier :
Using Hive to Access Hadoop / HBase Data
Advanced Topics
Controlling job workflows with Oozie
Search using Apache Solr No lab exercises
Formations Informatique
et Management
en ligne à ce jour
+
Stagiaires dans nos salles
de cours sur
l'année
%
De participants satisfaits
ou très satisfaits de nos
formations
Formateurs experts
validés par
PLB