Cette formation est-elle adaptée à mon niveau ?

Chaque fiche indique le niveau requis (Fondamental, Intermédiaire, Avancé) ainsi que les prérequis détaillés. En cas de doute, un test d'auto-évaluation est disponible directement sur la page.

La formation est-elle orientée théorie ou pratique ?

Nos formations alternent apports théoriques et travaux pratiques, pour mettre immédiatement en application les notions abordées.

Puis-je suivre cette formation à distance ?

Oui, la plupart de nos formations sont disponibles en présentiel et en classe à distance, avec le même contenu et le même niveau d'interaction avec le formateur.

Cette formation est-elle disponible en intra-entreprise ?

Oui. Nous pouvons l'organiser dans vos locaux, dans nos salles ou à distance, avec un programme adapté à votre contexte si nécessaire. Contactez notre service intra pour un devis.

Que se passe-t-il si une session est annulée ?

Nous nous engageons à maintenir les sessions garanties affichées. En cas d'annulation de notre part, nous vous proposons un report sur la prochaine session disponible.

Cette formation est-elle finançable via le CPF ?

Si la formation est éligible CPF, cela est indiqué sur la fiche avec le code de certification correspondant. Vous pouvez retrouver la formation directement sur Mon Compte Formation.

Mon employeur ou mon OPCO peut-il prendre en charge le coût ?

Oui. Contactez-nous pour obtenir une convention de formation et vérifier les possibilités de prise en charge via votre OPCO.

Kestra : Orchestration et Gestion de Workflows de Données

Maîtrisez Kestra, la plateforme open source d’orchestration pour automatiser vos pipelines de données de bout en bout

Description de la formation Kestra orchestration donnees

Qu’est-ce que Kestra ?

Kestra est une plateforme open source d’orchestration de workflows conçue pour automatiser les traitements de données et les processus métiers à grande échelle. Basée sur une approche déclarative en YAML, Kestra permet de gérer des pipelines complexes, d’assurer leur traçabilité et de les exécuter de manière distribuée et fiable. Elle s’intègre nativement à l’écosystème moderne de la Data (Airbyte, DBT, Snowflake, Kafka…) et s’impose comme une alternative robuste aux orchestrateurs traditionnels comme Airflow ou Prefect.

Pourquoi suivre une formation Kestra ?

Dans un contexte où la fiabilité, la supervision et la scalabilité des flux de données sont essentielles, Kestra offre une solution complète et flexible pour automatiser les pipelines ETL, les processus analytiques et les intégrations entre systèmes. Suivre cette formation Kestra vous permettra de concevoir, déployer et maintenir des workflows data de production, tout en optimisant la résilience, la performance et l’observabilité de vos traitements. C’est une compétence clé pour tout professionnel de la donnée souhaitant maîtriser les architectures Data modernes.

Jour 1

Introduction à l’orchestration de workflows

Rôle et enjeux de l’orchestration dans les pipelines de données
Présentation de Kestra et de son positionnement dans l’écosystème Data
Architecture : exécutants, triggers, scheduler, namespace
Installation et configuration via DockerTravaux pratiquesObjectif :Installer Kestra et exécuter un premier workflow.
Description :Déploiement local sous Docker, création d’un simple workflow d’exécution de script. Comment vérifier les logs et les métriques d’un run ?

Conception de workflows YAML

Structure d’un fichier YAML Kestra
Définition de tâches, variables et dépendances
Gestion des entrées/sorties
Utilisation des namespaces et paramètresTravaux pratiquesObjectif :Créer un workflow multi-étapes avec paramètres.
Description :Construction d’un pipeline de traitement CSV avec logs et gestion des erreurs. Quelle syntaxe adopter pour rendre le workflow réutilisable ?Jour 2

Gestion des exécutions et supervision

Logs, métriques et exécutions dans l’interface Kestra
Gestion des erreurs et relances automatiques
Mise en place d’alertes et notifications (Slack, email, webhook)
Bonnes pratiques de debuggingTravaux pratiquesObjectif :Analyser et corriger un workflow en erreur.
Description :Simulation d’échecs d’exécution et configuration d’alertes. Quelle stratégie adopter pour relancer automatiquement un job échoué ?

Intégration dans un environnement Data

Interaction avec des connecteurs externes (Airbyte, DBT, Snowflake, Kafka)
Définition de triggers (temps, événement, API)
Intégration REST et API Kestra
Gestion des secrets et variables d’environnementTravaux pratiquesObjectif :Créer un pipeline d’intégration complète de données.
Description :Orchestration d’un flux ETL entre Airbyte et DBT, suivi dans Kestra. Comment chaîner plusieurs workflows et suivre leur exécution ?Jour 3

Déploiement en production

Architecture distribuée et scaling horizontal
Déploiement sur Kubernetes
Gestion des exécutants et files de messages (Kafka, RabbitMQ)
Sécurité, rôles et auditTravaux pratiquesObjectif :Déployer Kestra sur un cluster Kubernetes.
Description :Mise en place d’une architecture distribuée et observation du scaling. Comment assurer la haute disponibilité et la tolérance aux pannes ?

Extension et personnalisation

Développement de plugins Kestra
Utilisation de l’API Kestra pour automatiser la configuration
Sauvegarde et mise à jour des workflows
Bonnes pratiques pour la maintenance et la documentationTravaux pratiquesObjectif :Étendre les capacités de Kestra par un plugin personnalisé.
Description :Création d’une tâche personnalisée en Java ou Python. Quelle est la meilleure approche pour industrialiser des workflows réutilisables ?

Date de mise à jour du programme : 28/11/2025

Dates et lieux

Période souhaitée

Lieux

Type d'affichage

Distanciel

29 juin - 1 juillet

7 septembre - 9 septembre

16 novembre - 18 novembre

Paris

29 juin - 1 juillet

7 septembre - 9 septembre

16 novembre - 18 novembre

Fivetran : Automatisation de l’intégration de données cloud

Durée: Durée :2 jours
Niveau: Niveau :Fondamental
Certification: Certification :Non

1590€ HT

Prochaine session : 21/05/2026

Apache Airflow : Automatisation et orchestration de flux de données

Durée: Durée :2 jours
Niveau: Niveau :Intermédiaire
Certification: Certification :Non

Splunk

Durée: Durée :4 jours
Niveau: Niveau :Intermédiaire
Certification: Certification :Non

Splunk Power User Fast Start

Durée: Durée :4 jours
Niveau: Niveau :Intermédiaire
Certification: Certification :Splunk Core Certified Advanced Power User

Voir toutes les formations Data Management & Data Intégration