Aller au contenu principal

Machine Learning distribué avec Spark ML

Développer, optimiser et déployer des modèles de machine learning distribués avec Apache Spark
REF : MLSP
Regroupe des participants de différentes entreprises autour d'un même programme, à dates fixes.
Durée :
3 jours
Niveau :
Fondamental
Lieu :
Paris
Format :
Présentiel / Distanciel

2 090€ HT


Description de la formation Spark ML

L'entraînement de modèles de machine learning sur de grands volumes de données se heurte rapidement aux limites d'une machine unique. Spark ML, la bibliothèque de machine learning d'Apache Spark, répond à cet enjeu en distribuant les traitements sur l'ensemble d'un cluster, du prétraitement des données jusqu'à l'entraînement et l'évaluation des modèles.

Articulée autour de l'API DataFrame et du concept de pipeline, Spark ML offre une approche cohérente et industrialisable : transformation des données, construction de features, entraînement d'algorithmes supervisés et non supervisés, réglage des hyperparamètres et déploiement, le tout à l'échelle. Cette unification facilite le passage du prototype à la production.

Cette formation rend les participants capables de développer, optimiser, évaluer et déployer des modèles de machine learning distribués avec Spark ML. L'approche par la pratique, structurée autour d'ateliers progressifs sur un cluster fil rouge, permet de construire dès le premier jour des pipelines de préparation de données, puis d'aborder en confiance la modélisation distribuée, l'optimisation des performances de calcul et l'industrialisation des modèles.

Programme de la formation

Date de mise à jour du programme : 22/05/2026

Dates et lieux

Période souhaitée
Lieux
Type d'affichage

Questions fréquentes