Aller au contenu principal

Big Data : Architecture et Infrastructure

Mise en œuvre du Big Data avec Hadoop et Spark
REF : OAIH
Prochaine session garantie : 10/06/2026
Regroupe des participants de différentes entreprises autour d'un même programme, à dates fixes.
Durée :
3 jours
Niveau :
Fondamental
Lieu :
Paris
Format :
Présentiel / Distanciel

1 990€ HT


Description de la formation Big Data Architecture Infrastructure

Cette formation Big Data Architecture Infrastructure vous présente l’architecture et l’infrastructure sous-jacente d’un projet Big Data. Elle commence par définir le cadre des projets Big Data puis explique en quoi la nature des données manipulées et leur volume impactent l’architecture, que ce soit au niveau du stockage ou du traitement. Concrètement, quels sont les changements par rapport aux standards (serveur, SGBD, système de fichiers, etc.) et qu’apportent concrètement des solutions NoSQL ou des produits comme Hadoop ?

Mais quelle que soit votre architecture, se posera le problème de la « qualité » des données. Nous vous montrons donc comment la gérer avec des ETL, le master data management, les bases multiples, etc. Vous disposerez donc d’une vue claire et opérationnelle sur la façon de disposer de données « propres » pour l’analyse des données de votre infrastructure tout en étant sensibilisé aux obligations des entreprises sur les aspects éthiques, sécurité et responsabilité.

Ensuite nous vous présentons l’éventail des technologies Big Data en termes d’infrastructure pour accueillir ces données afin de vous aider à vous repérer et faire les bons choix en fonction des projets (Cloud, On premise, Hadoop, NoSQl, etc.). Le calcul distribué étant au cœur du Big Data, vous comprenez comment mettre à la disposition des développeurs des architectures distribuées scalables et performantes (HDFS, MapReduce, etc.). Parmi les standards du marché les deux solutions sont Hadoop et Spark. Aussi, vous comprenez leur complémentarité et leur concurrence dans le cadre d’une architecture complète que vous mettez en œuvre. Concrètement, vous apprenez à installer un cluster Hadoop à plusieurs nœuds, à le paramétrer, à le sécuriser, le surveiller (monitoring), et donc, au final, à proposer une infrastructure de qualité aux développeurs et aux analystes.

La formation se termine par le déploiement d’un traitement Hadoop/Spark sur l’architecture que nous avons conçue afin de valider votre vision globale et concrète d’une architecture Big Data.

Programme de la formation

Date de mise à jour du programme : 15/12/2025

Dates et lieux

Période souhaitée
Lieux
Type d'affichage

Témoignages pour cette formation

Les avis figurant ci-dessous sont issus des fiches d'évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions.

C

Avis de CY

MC2I GROUPE

Retour d’expérience

Mon avis sur le contenu du stage :

"Cette formation offre un contenu technique solide, particulièrement pour les aspects Hadoop (HDFS, MapReduce, YARN), Spark, et HBase, avec des exemples pratiques et des commandes détaillées . Cependant, le démarrage abrupt dans la technique dès le premier jour, sans contextualisation ni adaptation à des profils comme le mien (gestion de projet), a été un point négatif majeur. J’ai signalé ce souci en fin de journée 1, et le formateur a tenté d’ajuster en se concentrant sur les slides les jours suivants. Malheureusement, cette transition s’est traduite par une lecture monotone, rendant les sessions peu dynamiques. De plus, les slides, bien que riches en détails techniques, semblent datés et manquent de mises à jour. Pour améliorer, je suggère une introduction stratégique le premier jour, des exercices adaptés aux gestionnaires, et une refonte des supports avec des contenus actuels et interactifs."

Mon avis sur le formateur :

"Cette formation offre un contenu technique solide, particulièrement pour les aspects Hadoop (HDFS, MapReduce, YARN), Spark, et HBase, avec des exemples pratiques et des commandes détaillées . Cependant, le démarrage abrupt dans la technique dès le premier jour, sans contextualisation ni adaptation à des profils comme le mien (gestion de projet), a été un point négatif majeur. J’ai signalé ce souci en fin de journée 1, et le formateur a tenté d’ajuster en se concentrant sur les slides les jours suivants. Malheureusement, cette transition s’est traduite par une lecture monotone, rendant les sessions peu dynamiques. De plus, les slides, bien que riches en détails techniques, semblent datés et manquent de mises à jour. Pour améliorer, je suggère une introduction stratégique le premier jour, des exercices adaptés aux gestionnaires, et une refonte des supports avec des contenus actuels et interactifs."

Ce que j'ai le moins apprécié :

"Le démarrage abrupt dans la technique dès le premier jour, sans contextualisation ni adaptation à des profils comme le mien (gestion de projet), a été un point négatif majeur."

CY

MC2I GROUPE

4/5
D

Avis de DM

Retour d’expérience

Mon avis sur le contenu du stage :

"Formation de très bon niveau. Dommage qu'elle ait été déséquilibrée avec le dernier jour de pratique trop dense pour une appropriation adéquate. De fait, frustrant pour ma part car beaucoup de retours à la case départ et un décrochage par rapport au groupe "

Mon avis sur le formateur :

"La formatrice a été d'un excellent niveau avec beaucoup d'apports. Dommage que la formation ait été indiquée comme à distance à cette dernière qui s'attendait à du présentiel. Un mode hybride tout de même positif. La note moyenne est plus liée au décalage avec le gap entre les 2 premiers jours et le 3ème jour."

Ce que j'ai le plus apprécié :

"Des apports théoriques très riches"

Ce que j'ai le moins apprécié :

"Un trop grand décalage entre le rythme des 2 premiers jours et le 3ème. Pas de marge pour rattraper un décrochage. Prévoir la transmission de l'ensemble des ressources en un seul endroit pour pouvoir pratiquer par la suite."

DM

4/5
C

Avis de CM

Retour d’expérience

Mon avis sur le contenu du stage :

"bonne alternance théorie / pratique. le 3è jour dédié à l'installation d'un cluster hadoop était peut être un peu trop technique par rapport à mes attentes. heureusement que j'avais des bases sinon ça aurait été plus difficile"

Mon avis sur le formateur :

"excellente formatrice, très pédagogue, patiente et sympathique"

Mon avis sur la salle de formation :

"j'ai assisté en présentiel et heureusement, je ne vois pas comment suivre cette formation dans de bonnes conditions en distanciel"

Ce que j'ai le plus apprécié :

"cadre de formation très agréable"

Ce que j'ai le moins apprécié :

"dommage que nous étions si peu en présentiel, cela ne favorisait pas les échanges"

CM

5/5

Questions fréquentes