Formation Big Data : Développement d'applications et Data Visualisation


  • HADOOP, MAPREDUCE, SPARK, MACHINE LEARNING, R, PYTHON, DATAVIZ
REFERENCE
 
 
ODAB
DUREE
 
 
4 jours
TARIFS
 
 
2390 € HT
Niveau : Fondamental
Classe à distance: Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

OBJECTIFS :
 

Cette formation vous présente les principales technologies concernant le développement d’applications Big Data. Elle forme un ensemble cohérent dans la mesure où, dans un premier temps, elle replace le cadre global du Big Data et se conclut par la visualisation des données que les programmes développés avec les technologies présentées dans cette formation sont capables d’extraire.

Nous n’avons volontairement pas fait le choix d’un langage particulier. En effet, qu’il s’agisse de MapReduce, Spark ou du Machine Learning, la philosophie est précisément d’être indépendant du langage. Cependant, afin d’être concret et de valider le discours théorique, les exemples seront exposés en Java , Python, Scala ou R.

PRÉ-REQUIS :
 

La connaissance d’un langage de programmation est impérative.
Les exemples seront présentés avec les langages suivants : Java, Python, Scala et R.

PUBLIC :
 

Ce cours s'adresse aux développeurs ainsi qu'aux chefs de projets.

PROGRAMME :
 

Comprendre les spécificités du Big Data

Les origines du Big Data
Les données au cœur des enjeux (volume, diversité, IoT, etc.)
Les limites des architectures actuelles et de la BI
Sécurité, éthique, environnement juridique

Les technologies Big Data (Hadoop)

Comprendre Hadoop et ses composants
Le système de fichiers répartis HDFS (Hadopp Filesystem)
Philosophie de MapReduce
L’apport de YARN (Yet Another Resource Negotiator)
Quelles différences entre les distributions (Hortonworks, Cloudera, MapR) pour le développeur ?
Différentes catégories de bases NoSQL (clé/valeur, documents, colonnes, graphes)
Indexer et rechercher des données avec Elasticsearch
Les visualiser à l’aide de KIBANA
Quand utiliser le couplage Elasticsearch, Logstash, Kibana (ELK) ?
Le moteur de recherche SolR
SAS VA et autres solutions mixtes Cloud/On Premice pour explorer vos données
IBM Watson (fédération des informations)
Solution BI Classique
Impacts techniques et financiers des différentes solutions (savoir-faire, coûts, etc.)

Le développement (Mapreduce, Spark)

Philosophie et contraintes du pattern MapReduce (Hadoop)
Concrètement quelles briques logicielles pour le développeur ?
Exemple de pseudo-code pour les opérations map et reduce
Limites de MapReduce et émergence de Spark
Les différentes versions de Spark (Scala, Python et Java)
Des traitements en mémoire et tolérants aux pannes RDD (Resilient Distributed Datasets)
Les modes de travail en cluster de Spark
Exemples :
- Développement d’un wordcount avec MapReduce Spark dans différents langages (Java, Python, Scala, R)
- Calcul d’une jointure sur deux grandes tables

Machine Learning

Qu’est-ce que le Machine Learning ?
Les points de vigilance par rapport au Big Data
Les différents types de machine learning
Les principaux algorithmes
Utiliser SparkML pour faire du Machine Learning de manière distribuée
Créer un système de catégorisation
Comprendre la différence entre Deep Learning et Machine Learning
Réseaux de neurones et Deep Learning
Utiliser le deep learning pour faire de la reconnaissance de caractère avec Tensorflow en Python

La visualisation des données (Dataviz)

Ce que les statistiques ne disent pas
Les objectifs de la visualisation
Quels graphes pour quels usages ?
Représentation de données complexes (encodage visuel, visualisation interactive)
Savoir communiquer sur les analyses de données (Data Storytelling)

Études de cas

Analyse de profils clients avec l’utilisation de Spark (domaine Banque et Assurance)
Classification de conducteur dans une agence de transport
Proposition de produits par rapport à une liste d’achats (Machine Learning)

 

REMARQUES :
 

Il est possible de suivre cette formation Big Data à distance. Vous participez en temps réel à la même session en même temps que les autres participants présents eux en salle de cours. Un kit spécial formation à distance vous sera envoyé avec notamment le matériel (casque micro). Vous n’avez besoin que d’un navigateur et d’une connexion internet pour suivre dans les meilleures conditions ce cours à distance Big Data. Contactez-nous pour plus d’informations sur cette formation en direct de chez vous ou depuis votre bureau.

TRAVAUX PRATIQUES :
 

Des études de cas illustrent cette formation sur les sujets suivants :
- Analyse de profils clients avec l’utilisation de Spark (domaine Banque et Assurance)
- Classification de conducteur dans une agence de transport
- Proposition de produits par rapport à une liste d’achats (Machine Learning).
De nombreux travaux pratiques courts viennent en complément de ceux réalisés sur l’étude de cas.

 

Les avis figurant ci-dessous sont issus des fiches d’évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions. Avis des participants à la formation Big Data : Développement d'applications et Data Visualisation : Note moyenne : 4,7/5
5/5
Avis certifié A suivi un cours chez PLB

AKHRAZ Ahmed

Mon avis sur le formateur :

"J'ai beaucoup apprécié le formateur qui répond à toutes les questions."

Mon avis sur la salle de formation :

"Possibilité d'avoir des encas moins caloriques/industrielle"

Ce que j'ai le plus apprécié :

"PC a disposition"

5/5
Avis certifié A suivi un cours chez PLB

RM

Mon avis sur le contenu du stage :

"travaux pratiques consistants qui permettent d'assimiler les bases du développement d'applications bigData"

Mon avis sur le formateur :

"personnel aimable et professionnel"

Ce que j'ai le plus apprécié :

"Très bonne qualité de formation, personnel professionnel"

Ce que j'ai le moins apprécié :

"Cuisine mal équipée"

5/5
Avis certifié A suivi un cours chez PLB

PJC

Mon avis sur le contenu du stage :

"Malgré un manque de ma part sur les pré-requis techniques, formation très intéressante et complexe qui m'a permis de me plonger dans ce domaine (culture générale, vision technique nécessaire, bonnes pratiques)"

Mon avis sur le formateur :

"parfaite connaissance du sujet, animateur professionnel du domaine, et très bonne maîtrise des techniques pédagogiques"

Mon avis sur la salle de formation :

"A distance, quelques lags avec Adobe Connect"

Lire tous les avis

4/5
Avis certifié A suivi un cours chez PLB

AMA

Mon avis sur le contenu du stage :

"J'aurais aimé avoir plus de pratique dans la partie machine learning."

Ce que j'ai le plus apprécié :

"L'environnement bien préparé et prêt pour les travaux pratiques."

4/5
Avis certifié A suivi un cours chez PLB

GACHET Rudy

Mon avis sur le contenu du stage :

"Les gros plus de la formation sont la compétence et la richesse des expériences d'Olivier. Les concepts sont imagés d'exemples souvent issus d'expériences vécues ce qui est très important pour apprécier correctement à quoi répond ou ne répond pas la problématique bigdata et les pièges à éviter. Les concepts et algorithmes de la partie Machine Learning sont ceux que j'ai le plus apprécié. Le point négatif pour moi est la partie pratique, il aurait ete préférable de disposer d'un accès à une sandbox pour tout les participants afin de pratiquer davantage... Mais ce n'était peut-être pas le but premier de cette introduction au bigdata."

Mon avis sur la salle de formation :

"Salles petites"

5/5
Avis certifié A suivi un cours chez PLB

NGUYEN François

Mon avis sur le contenu du stage :

"Cours qui balaye l'ensemble du BigData avec des exemples concrets et des cas pratiques (présentation et utilisation d'outil concret) "

Mon avis sur le formateur :

"Formateur très compétent, qui a su répondre aux questions. Formateur très pédagogue, qui a également su vulgariser les termes techniques. "

Mon avis sur la salle de formation :

"Etant à l'extérieur, il m'est difficile de juger concrètement les salles. L'accueil par François et Maxime a été super !"

Ce que j'ai le plus apprécié :

"Bonne qualité de son, et dans le cas de soucis technique, Maxime a été très réactif."

Ce que j'ai le moins apprécié :

"Quelques exercices sur papier. Il faudrait prévoir des exercices sur d'autre support tel que des drives par exemple. "

S'INSCRIRE À CETTE
FORMATION BIG DATA DÉVELOPPEMENT
Cliquez sur une date pour vous inscrire
Information pratiques sur
LA FORMATION
Lieu de la formation Paris - LA DEFENSE
Nous contacter 01 43 34 90 94
CETTE FORMATION SUR-MESURE Ce cours est réalisable en intra-entreprise, dans vos locaux ou nos salles de cours CONTACTER NOTRE SERVICE INTRA
D'autres formations
SUR LE MÊME THÈME

4 j

 
À l'issue de cette formation Apache Spark avec Python ou Scala, les participants auront acquis les connaissances et les compétences nécessaires pour : Identifier...

4 j

 

Big Data - BI

Splunk
Dans un proche passé, le problème était de trouver l’information. Les capacités de collecte et de partage de nos outils informatiques ont changé le...

3 j

 
ElasticSearch est le moteur de recherche que les entreprises attendaient. D'une simplicité de mise en place époustouflante, il permet d'indexer du contenu issu de sources...

3 j

 
Plus précisément à l’issue de cette formation vous aurez acquis les connaissances et les compétences pour : Comprendre les problématiques de...
Plus de formations sur le même thème

Des questions ?

ON VOUS RAPPELLE

Votre formation Big Data prise en charge à 100% ! *

Depuis Janvier 2017, Atlas (ex Fafiec) a sélectionné PLB Consultant pour vous proposer les meilleures formations autour du Big Data.

Sessions inter-entreprise sur  Paris, Lyon et Lille. 

Sessions intra-entreprise sur  toute la France.

*100% des coûts pédagogiques, offre valable dans la limite des fonds mutualisés dédiés aux actions collectives, en application des critères de prise en charge en vigueur (voir conditions détaillées sur le site d'Altas)

 

0

Formations
Informatique
et Management
en ligne à ce jour

+ 0

Stagiaires dans nos
salles de cours sur
l'année

0%

De participants
satisfaits ou très
satisfaits de nos
formations

0

Formateurs experts
validés PLB