Formation Big Data : Les techniques d'Analyse et de Visualisation


  • HIVE, PIG, IMPALA, SPARK, DRILL, ELASTICSEARCH, LOGSTASH, KIBANA, DATAVIZ
REFERENCE
 
 
OTAV
DUREE
 
 
4 jours
TARIFS
 
 
2390 € HT
Niveau : Fondamental
Classe à distance: Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

OBJECTIFS :
 

L’objectif de cette formation est de vous rendre autonome dans l’analyse et la visualisation des données dans un contexte Big Data.

Un premier premier rappel permet de replacer les technologies dans le contexte du Big Data afin de clairement comprendre pourquoi de nouveaux outils apparaissent par rapport aux standards SQL ou de visualisation.
Ensuite, la progression logique de la formation vous permettra de savoir structurer vos données, les alimenter, les analyser et enfin de les visualiser avec le bon outil. On se situe ainsi dans un scénario cohérent et réaliste autour du cycle de vie des données.
Les nombreuses manipulations réalisées durant la formation vous permettront non seulement de disposer d’une vue générale très précise des différents concepts et outils, y compris sur le plan méthodologique, mais aussi d’être véritablement opérationnel sur les standards du marché tant en terme de langage que de framework de traitement de la donnée. Vous saurez également choisir le bon outil de visualisation pour restituer des présentations dynamiques sur des analyses plus ou moins complexes en communiquant de manière efficace et accessible (Dataviz, Data Storytelling).

PRÉ-REQUIS :
 

Des connaissances de base sur le langage SQL, le développement et les statistiques (de niveau scolaire) sont nécessaires pour suivre ce cours.

PUBLIC :
 

Cette formation est destinée aux statisticiens, analystes de données (Data Analyst), consultants en informatique décisionnelle (BI), dataminers, développeurs, chefs de projets.

PROGRAMME :
 

Comprendre les spécificités du Big Data

Les origines du Big Data
Les données au cœur des enjeux (volume, diversité, IoT etc.)
Les limites des architectures actuelles et de la BI
Sécurité, éthique, environnement juridique (données personnelles, CNIL, accords internationaux, etc.)

Les concepts fondamentaux et technologies associées du Big Data (stockage, recherche, visualisation)

Le concept de Datalake
L’écosystème Hadoop, quel outil pour quel usage ?
Comprendre Hadoop et ses composants
Le système de fichiers répartis HDFS
Philosophie MapReduce
Quelles différences entre les distributions pour l’analyste ?
Différentes catégories de bases NoSQL (clé/valeur, documents, colonnes, graphes)
La philosophie open source et les alternatives propriétaires
Python, langage phare du Big Data
Solution Cloud ou on Premise, quels impacts ?
Moteur de recherche et Big Data, quand utiliser la stack Elasticsearch, Logstash, Kibana (ELK) ?
Impacts techniques et organisationnel

Gestion des données structurées ou non

Exemples de données non structurées
Manipuler les données avec différents formats de fichiers :
HDFS
Fichiers plats : CSV, JSON
Structures optimisées : Parquet, Avro
Organisation relationnelle : Hive metastore
Le Master Data Management (MDM) pour réconcilier les référentiels
Structurer vos données avec Hive (bases, tables, etc.)

La collecte et exploration des données

Intégrer les données avec un ETL
La phase de collecte des données
Les outils dédiés à la collecte:
Utiliser Scoop pour intégrer les données depuis une base de données relationnelle
Travailler en streaming avec Kafka et Spark Streaming
Utiliser le langage Pig latin pour intégrer les données
Utiliser Spark pour la collecte et l’exploration

L’analyse des données

Analyse en contexte Big Data
Vue générale des différentes méthodes d’analyse (exploration, segmentation, classification, estimation, prédiction)
Data Science et Machine Learning:
quels rôles pour quels usages ?
phase d’un projet de Data Science
domaines d’application
Interagir avec Hadoop en temps réel (traitement parallèle avec Impala, interroger les données Hive avec Spark)
Les frameworks orientés « analyse de données »

La visualisation des données (Dataviz)

Ce que les statistiques ne disent pas
Les objectifs de la visualisation
Quels graphes pour quels usages ?
Représentation de données complexes (encodage visuel, visualisation interactive)
Savoir communiquer sur les analyses de données (Data Storytelling)

REMARQUES :
 

Il est possible de suivre cette formation Big Data à distance. Vous participez en temps réel à la même session en même temps que les autres participants présents eux en salle de cours. Un kit spécial formation à distance vous sera envoyé avec notamment le matériel (casque micro). Vous n’avez besoin que d’un navigateur et d’une connexion internet pour suivre dans les meilleures conditions ce cours à distance Big Data. Contactez-nous pour plus d’informations sur cette formation en direct de chez vous ou depuis votre bureau.

TRAVAUX PRATIQUES :
 

Ce stage est illustré par diverses études de cas permettant de une pratique concrete des différentes phases de la chaine globale de traitement des données et pas seulement sur la partie analyse. TP introductif les base de Python, gestion et exploration de données avec Hive, l’ETL et le traitement des données avec Pig ou Spark, analyse et visualisation de données avec Python, Analyse et visualisation de logs avec l’Elastic stack (ELK).

Les avis figurant ci-dessous sont issus des fiches d’évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions. Avis des participants à la formation Big Data : Les techniques d'Analyse et de Visualisation : Note moyenne : 4,4/5
4/5
Avis certifié A suivi un cours chez PLB

PA

Mon avis sur le contenu du stage :

"Bon aperçu de toute la chaine de traitement, de l'acquisition à la visualisation"

Mon avis sur le formateur :

"Intervenant très pédagogue et prenant le temps d'éclaircir les points complexes"

4/5
Avis certifié A suivi un cours chez PLB

CLERC-GHERARDI Arthur

Mon avis sur le contenu du stage :

"Baignant dans le technique, j'aurai aimé des exercices plus compliqués techniquement ! Je comprends tout à fait que ça ne soit pas le cas avec des participants pouvant ne pas être technique du tout :) Un peu de Spark aurait pu être cool"

Mon avis sur le formateur :

"Peut-être essayer de faire participer un peu plus les participants, mais j'avoue que pas grand monde semblait répondant pendant le formation. Je suis déjà tombé sur des groupes plus animés ! Manques de quelques explications dans les TPs, sur PIG par exemple, il fallait avoir la doc à côté (ce qui ne me gêne pas vraiment)."

Mon avis sur la salle de formation :

"La formation à distance s'est très bien déroulée malgré mon appréhension (de la distance). Différents sujets abordés techniques comme un peu moins (visu). "

4/5
Avis certifié A suivi un cours chez PLB

EL HILA Mohammed

Mon avis sur le formateur :

"Merci beaucoup"

Lire tous les avis

5/5
Avis certifié A suivi un cours chez PLB

GM

Mon avis sur le contenu du stage :

"Nous avons vu le programme annoncé, ça correspondait à mes attentes"

Mon avis sur le formateur :

"J'ai beaucoup apprécié l'intervenant, Maxime, qui a su s'adapter à nos niveaux et rendre accessible un domaine très vaste et parfois encore un peu abstrait. J'ai également apprécié que l'on accorde un peu de temps à réfléchir ensemble à des problématiques bigdata que nous rencontrons dans nos entreprises respectives, c'était très intéressant."

Ce que j'ai le plus apprécié :

"Le stylo clef usb avec le cours dessus : super idée :)"

5/5
Avis certifié A suivi un cours chez PLB

CJ

Mon avis sur le contenu du stage :

"Je trouve toujours plus pertinent de travailler sur des cas concrets auxquels nous sommes exposés dans notre entreprise que d'utiliser des exemple. Ceci dit les exemples fournis dans les supports sont de bonnes qualités."

Ce que j'ai le plus apprécié :

"La salle de pause est vraiment au top. La gratuité du café et autres est au top, FÉLICITATIONS"

Ce que j'ai le moins apprécié :

"Aucun… Manière de ne pas laisser la case vide, le robinet qui ne se coupe pas tout seul ;-) mais l'information à ce sujet passe bien."

S'INSCRIRE À CETTE
FORMATION BIG DATA ANALYSE VISUALISATION
Cliquez sur une date pour vous inscrire
Information pratiques sur
LA FORMATION
Lieu de la formation Paris - LA DEFENSE
Nous contacter 01 43 34 90 94
CETTE FORMATION SUR-MESURE Ce cours est réalisable en intra-entreprise, dans vos locaux ou nos salles de cours CONTACTER NOTRE SERVICE INTRA
D'autres formations
SUR LE MÊME THÈME

3 j

 
Le métier de Data Scientist est apparu ces dernières années pour faire face à la multiplication des données, à la diversité de leurs formes et de...

3 j

 
Dans l'univers du Big Data, le rôle du data scientist joue est primordial pour valoriser les données. Cette formation Data Scientist de niveau avancé vous apprend les...

3 j

 
Cette formation s’adresse aux personnes qui participent à des projets Big Data, Data Mining ou décisionnel et qui souhaitent soit comprendre le vocabulaire des statisticiens,...

1 j

 
La DataViz ou encore Data Visualisation ou enfin en français la visualisation des données regroupe les techniques permettant de comprendre plus facilement la signification des...
Plus de formations sur le même thème

Des questions ?

ON VOUS RAPPELLE

Votre formation Big Data prise en charge à 100% ! *

Depuis Janvier 2017, Atlas (ex Fafiec) a sélectionné PLB Consultant pour vous proposer les meilleures formations autour du Big Data.

Sessions inter-entreprise sur  Paris, Lyon et Lille. 

Sessions intra-entreprise sur  toute la France.

*100% des coûts pédagogiques, offre valable dans la limite des fonds mutualisés dédiés aux actions collectives, en application des critères de prise en charge en vigueur (voir conditions détaillées sur le site d'Altas)

 

0

Formations
Informatique
et Management
en ligne à ce jour

+ 0

Stagiaires dans nos
salles de cours sur
l'année

0%

De participants
satisfaits ou très
satisfaits de nos
formations

0

Formateurs experts
validés PLB