- Référence : OTAV
- Durée : 4 jours (28h)
- Lieu : Au choix. À distance ou en présentiel, à Paris ou en Régions
2390€ HT
Choisir une date et Réserver4.4 sur 5 étoiles
Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...
L’objectif de cette formation est de vous rendre autonome dans l’analyse et la visualisation des données dans un contexte Big Data.
Un premier premier rappel permet de replacer les technologies dans le contexte du Big Data afin de clairement comprendre pourquoi de nouveaux outils apparaissent par rapport aux standards SQL ou de visualisation.
Ensuite, la progression logique de la formation vous permettra de savoir structurer vos données, les alimenter, les analyser et enfin de les visualiser avec le bon outil. On se situe ainsi dans un scénario cohérent et réaliste autour du cycle de vie des données.
Les nombreuses manipulations réalisées durant la formation vous permettront non seulement de disposer d’une vue générale très précise des différents concepts et outils, y compris sur le plan méthodologique, mais aussi d’être véritablement opérationnel sur les standards du marché tant en terme de langage que de framework de traitement de la donnée. Vous saurez également choisir le bon outil de visualisation pour restituer des présentations dynamiques sur des analyses plus ou moins complexes en communiquant de manière efficace et accessible (Dataviz, Data Storytelling).
Objectifs opérationnels :
Être autonome dans l'analyse et la visualisation des données dans un contexte Big Data.
Objectifs pédagogiques :
À l'issue de cette formation Big Data Analyse Visualisation, vous aurez acquis les connaissances et compétences nécessaires pour :
Public :
Cette formation est destinée aux statisticiens, analystes de données (Data Analyst), consultants en informatique décisionnelle (BI), dataminers, développeurs, chefs de projets.
Prérequis :
Des connaissances de base sur le langage SQL, le développement et les statistiques (de niveau scolaire) sont nécessaires pour suivre ce cours.
Les origines du Big Data
Les données au cœur des enjeux (volume, diversité, IoT etc.)
Les limites des architectures actuelles et de la BI
Sécurité, éthique, environnement juridique (données personnelles, CNIL, accords internationaux, etc.)
Le concept de Datalake
L’écosystème Hadoop, quel outil pour quel usage ?
Comprendre Hadoop et ses composants
Le système de fichiers répartis HDFS
Philosophie MapReduce
Quelles différences entre les distributions pour l’analyste ?
Différentes catégories de bases NoSQL (clé/valeur, documents, colonnes, graphes)
La philosophie open source et les alternatives propriétaires
Python, langage phare du Big Data
Solution Cloud ou on Premise, quels impacts ?
Moteur de recherche et Big Data, quand utiliser la stack Elasticsearch, Logstash, Kibana (ELK) ?
Impacts techniques et organisationnel
Exemples de données non structurées
Manipuler les données avec différents formats de fichiers :
HDFS
Fichiers plats : CSV, JSON
Structures optimisées : Parquet, Avro
Organisation relationnelle : Hive metastore
Le Master Data Management (MDM) pour réconcilier les référentiels
Structurer vos données avec Hive (bases, tables, etc.)
Intégrer les données avec un ETL
La phase de collecte des données
Les outils dédiés à la collecte:
Utiliser Scoop pour intégrer les données depuis une base de données relationnelle
Travailler en streaming avec Kafka et Spark Streaming
Utiliser le langage Pig latin pour intégrer les données
Utiliser Spark pour la collecte et l’exploration
Analyse en contexte Big Data
Vue générale des différentes méthodes d’analyse (exploration, segmentation, classification, estimation, prédiction)
Data Science et Machine Learning:
quels rôles pour quels usages ?
phase d’un projet de Data Science
domaines d’application
Interagir avec Hadoop en temps réel (traitement parallèle avec Impala, interroger les données Hive avec Spark)
Les frameworks orientés « analyse de données »
Ce que les statistiques ne disent pas
Les objectifs de la visualisation
Quels graphes pour quels usages ?
Représentation de données complexes (encodage visuel, visualisation interactive)
Exemple de visualisations avec les standards du marché (Tableau, Power BI)
Savoir communiquer sur les analyses de données (Data Storytelling)
Ce stage est illustré par diverses études de cas permettant de une pratique concrete des différentes phases de la chaine globale de traitement des données et pas seulement sur la partie analyse. TP introductif les base de Python, gestion et exploration de données avec Hive, l’ETL et le traitement des données avec Pig ou Spark, analyse et visualisation de données avec Python, Analyse et visualisation de logs avec l’Elastic stack (ELK).
Votre formation Big Data prise en charge jusqu'à 100% des coûts pédagogiques ! *
Depuis 2017, Atlas (ex-Fafiec) a sélectionné PLB Consultant pour vous proposer les meilleures formations autour du Big Data.
- Sessions inter-entreprise sur Paris, Lyon et Lille.
- Sessions intra-entreprise sur toute la France.
* jusqu'à 100% des coûts pédagogiques selon votre branche d'activité dans la limite des fonds mutualisés dédiés aux actions collectives et en application des critères de prise en charge en vigueur (cf conditions détaillées sur le site d'Atlas)
Les avis figurant ci-dessous sont issus des fiches d’évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions.
Mon avis sur le contenu du stage :
"Baignant dans le technique, j'aurai aimé des exercices plus compliqués techniquement ! Je comprends tout à fait que ça ne soit pas le cas avec des participants pouvant ne pas être technique du tout :) Un peu de Spark aurait pu être cool"
Mon avis sur le formateur :
"Peut-être essayer de faire participer un peu plus les participants, mais j'avoue que pas grand monde semblait répondant pendant le formation. Je suis déjà tombé sur des groupes plus animés ! Manques de quelques explications dans les TPs, sur PIG par exemple, il fallait avoir la doc à côté (ce qui ne me gêne pas vraiment)."
Mon avis sur la salle de formation :
"La formation à distance s'est très bien déroulée malgré mon appréhension (de la distance). Différents sujets abordés techniques comme un peu moins (visu). "
Mon avis sur le contenu du stage :
"Nous avons vu le programme annoncé, ça correspondait à mes attentes"
Mon avis sur le formateur :
"J'ai beaucoup apprécié l'intervenant, Maxime, qui a su s'adapter à nos niveaux et rendre accessible un domaine très vaste et parfois encore un peu abstrait. J'ai également apprécié que l'on accorde un peu de temps à réfléchir ensemble à des problématiques bigdata que nous rencontrons dans nos entreprises respectives, c'était très intéressant."
Ce que j'ai le plus apprécié :
"Le stylo clef usb avec le cours dessus : super idée :)"
Mon avis sur le contenu du stage :
"Je trouve toujours plus pertinent de travailler sur des cas concrets auxquels nous sommes exposés dans notre entreprise que d'utiliser des exemple. Ceci dit les exemples fournis dans les supports sont de bonnes qualités."
Ce que j'ai le plus apprécié :
"La salle de pause est vraiment au top. La gratuité du café et autres est au top, FÉLICITATIONS"
Ce que j'ai le moins apprécié :
"Aucun… Manière de ne pas laisser la case vide, le robinet qui ne se coupe pas tout seul ;-) mais l'information à ce sujet passe bien."
Mon avis sur le contenu du stage :
"Très instructif!"
Mon avis sur le formateur :
"Bon pédagogue, laisse le temps d'explorer lors des TP."
Ce que j'ai le plus apprécié :
"L'exploration lors des TP, les petites anecdotes et cas d'usages possibles."
Ce que j'ai le moins apprécié :
"RAS"
Mon avis sur le contenu du stage :
"Trop de commentaire de code au lieu de coder réellement, mais je peux comprendre qu'il soit difficile en termes de temps de faire autrement."
Mon avis sur le formateur :
"Formateur compétent, agréable, impliqué et sérieux."
Mon avis sur le contenu du stage :
"Bon aperçu de toute la chaine de traitement, de l'acquisition à la visualisation"
Mon avis sur le formateur :
"Intervenant très pédagogue et prenant le temps d'éclaircir les points complexes"
Mon avis sur le formateur :
"Très bon formateur, à l'écoute et très pédagogue"
Mon avis sur le formateur :
"Merci beaucoup"
Formations Informatique
et Management
en ligne à ce jour
+
Stagiaires dans nos salles
de cours sur
l'année
%
De participants satisfaits
ou très satisfaits de nos
formations
Formateurs experts
validés par
PLB