Cette formation est-elle adaptée à mon niveau ?

Chaque fiche indique le niveau requis (Fondamental, Intermédiaire, Avancé) ainsi que les prérequis détaillés. En cas de doute, un test d'auto-évaluation est disponible directement sur la page.

La formation est-elle orientée théorie ou pratique ?

Nos formations alternent apports théoriques et travaux pratiques, pour mettre immédiatement en application les notions abordées.

Puis-je suivre cette formation à distance ?

Oui, la plupart de nos formations sont disponibles en présentiel et en classe à distance, avec le même contenu et le même niveau d'interaction avec le formateur.

Cette formation est-elle disponible en intra-entreprise ?

Oui. Nous pouvons l'organiser dans vos locaux, dans nos salles ou à distance, avec un programme adapté à votre contexte si nécessaire. Contactez notre service intra pour un devis.

Que se passe-t-il si une session est annulée ?

Nous nous engageons à maintenir les sessions garanties affichées. En cas d'annulation de notre part, nous vous proposons un report sur la prochaine session disponible.

Cette formation est-elle finançable via le CPF ?

Si la formation est éligible CPF, cela est indiqué sur la fiche avec le code de certification correspondant. Vous pouvez retrouver la formation directement sur Mon Compte Formation.

Mon employeur ou mon OPCO peut-il prendre en charge le coût ?

Oui. Contactez-nous pour obtenir une convention de formation et vérifier les possibilités de prise en charge via votre OPCO.

Apache Spark : Optimiser Apache Spark sur Databricks

4,5/5

Avec 2 avis

Description de la formation Apache Spark Optimisation

Apache Spark est un moteur d'analyses unifiées ultra-rapide pour le big data et le machine learning. Depuis sa sortie, il a connu une adoption rapide par les entreprises de secteurs très divers. Des acteurs majeurs tels que Netflix, Yahoo et eBay l'ont déployé à très grande échelle, traitant ensemble plusieurs péta-octets de données sur des clusters de plus de 8 000 nœuds.

Dans cette formation Apache Spark Optimisation, les apprenants exploreront les cinq problèmes majeurs de performance rencontrés dans une application Apache Spark : skew, spill, shuffle, stockage et serialization.
Au travers d'exemples basés sur des datasets de 100Go à 1To, le focus sera mis sur investigation et la réalisation de diagnostic des différentes sources de goulets d'étranglement avec Spark UI, ainsi que sur l'appropriation de stratégies de résolution efficaces.

Enfin, un temps sera également consacré à la découverte des nouvelles fonctionnalités proposées par Spark 3.x qui adressent automatiquement ces problèmes de performance communs.

Date de mise à jour du programme : 10/12/2025

Python avancé sur Databricks : notebooks, PySpark, SQL, visualisation et MLflow

Durée: Durée :4 jours
Niveau: Niveau :Avancé
Certification: Certification :Non

Intra uniquement

Aucune session prévue

Apache Storm - Traitement de flux de données avec Storm

Durée: Durée :2 jours
Niveau: Niveau :Intermédiaire
Certification: Certification :Non

Apache Iceberg

Durée: Durée :3 jours
Niveau: Niveau :Intermédiaire
Certification: Certification :Non

Apache Flink : Traitement de flux en temps réel

Durée: Durée :4 jours
Niveau: Niveau :Fondamental
Certification: Certification :Non

Voir toutes les formations Data Engineering

Apache Spark : Optimiser Apache Spark sur Databricks

Description de la formation Apache Spark Optimisation

Rappel du fonctionnement d'Apache Spark

Méthodes d'optimisation

Questions fréquentes

Apache Spark : Optimiser Apache Spark sur Databricks

Description de la formation Apache Spark Optimisation

Programme de la formation

Objectifs de la formation

Contenu du cours Apache Spark Optimisation

Rappel du fonctionnement d'Apache Spark

Méthodes d'optimisation

Public et prérequis

Ces formations en Data Engineering peuvent aussi vous intéresser

Questions fréquentes

Cette formation est-elle adaptée à mon niveau ?

La formation est-elle orientée théorie ou pratique ?

Puis-je suivre cette formation à distance ?

Cette formation est-elle disponible en intra-entreprise ?

Que se passe-t-il si une session est annulée ?

Cette formation est-elle finançable via le CPF ?

Mon employeur ou mon OPCO peut-il prendre en charge le coût ?

Ces formations en Data Engineering peuvent aussi vous intéresser