Cette formation est-elle adaptée à mon niveau ?

Chaque fiche indique le niveau requis (Fondamental, Intermédiaire, Avancé) ainsi que les prérequis détaillés. En cas de doute, un test d'auto-évaluation est disponible directement sur la page.

La formation est-elle orientée théorie ou pratique ?

Nos formations alternent apports théoriques et travaux pratiques, pour mettre immédiatement en application les notions abordées.

Puis-je suivre cette formation à distance ?

Oui, la plupart de nos formations sont disponibles en présentiel et en classe à distance, avec le même contenu et le même niveau d'interaction avec le formateur.

Cette formation est-elle disponible en intra-entreprise ?

Oui. Nous pouvons l'organiser dans vos locaux, dans nos salles ou à distance, avec un programme adapté à votre contexte si nécessaire. Contactez notre service intra pour un devis.

Que se passe-t-il si une session est annulée ?

Nous nous engageons à maintenir les sessions garanties affichées. En cas d'annulation de notre part, nous vous proposons un report sur la prochaine session disponible.

Cette formation est-elle finançable via le CPF ?

Si la formation est éligible CPF, cela est indiqué sur la fiche avec le code de certification correspondant. Vous pouvez retrouver la formation directement sur Mon Compte Formation.

Mon employeur ou mon OPCO peut-il prendre en charge le coût ?

Oui. Contactez-nous pour obtenir une convention de formation et vérifier les possibilités de prise en charge via votre OPCO.

Formation Python programmation parallèle et calcul distribué dans le Cloud

Exploiter le parallélisme, le calcul distribué et le Cloud avec Python

Description de la formation Python calcul distribue

Qu’est-ce que le calcul distribué avec Python ?

Le calcul distribué permet de répartir les traitements lourds sur plusieurs cœurs, machines ou nœuds cloud. Python, grâce à ses bibliothèques modernes (NumPy, Dask, Ray, Airflow…), offre des solutions puissantes pour paralléliser et distribuer des workloads intensifs.

Pourquoi suivre une formation Python, calcul distribué ?

Cette formation répond aux besoins croissants d’optimisation des performances dans les environnements de data science et d’ingénierie logicielle. Elle permet d’apprendre à exploiter efficacement les capacités multicœurs, GPU et Cloud pour exécuter des tâches massives, tout en améliorant la scalabilité et la reproductibilité des pipelines de données.

Jour 1

Parallélisme en Python : modèles, limites et bonnes pratiques

Typologie des workloads :
- CPU-bound
- I/O-bound
- GPU-bound
Scalabilité :
- vertical vs horizontal
- concepts MIMD / SIMD (vision simplifiée)
Modèle d’exécution Python :
- GIL et conséquences sur le parallélisme.
Évolution du langage
- vers un Python no-GIL.
Programmation asynchrone :
- générateurs
- coroutines
- asyncio.
Multithreading :
- accès concurrents
- verrous
- contention et limites liées au GIL
Multiprocessing :
- processus indépendants
- pools de processus
- sérialisation
Profilage CPU :
- cProfile
- line_profiler
- py-spy
Environnements reproductibles :
- création et gestion via uv

Travaux pratiquesOptimisation d’un traitement d’images : comparaison threading vs multiprocessing.Jour 2

Optimisation locale : vectorisation, JIT et GPU

NumPy avancé :
- vectorisation, broadcasting
- élimination des boucles Python
Polars :
moteur multithread Rust
- exécution lazy
- optimisation automatique
Formats colonnes :
- Parquet et Arrow pour le traitement massif.
Compilation JIT Numba :
- mode nopython
- boucles parallèles
- limitations
Accélération GPU :
- kernels Numba CUDA
- blocs/threads

Travaux pratiquesSimulation Monte-Carlo accélérée par Numba.Jour 3

Calcul distribué : Dask, Ray et Airflow

Dask : DataFrame, Bag, Delayed ; scheduler distribué ; tableau de bord.
Dask : gestion des workers, spill-to-disk, shuffle et optimisations.
Ray : tasks, actors, parallélisme dynamique, patterns map/reduce.
Ray : gestion d’état, autoscaling local, debugging distribué.
Airflow : concepts de base — DAG, Operators, Scheduler.
Airflow : orchestration de workflows Python distribués.
Airflow : déclenchement de jobs Dask ou Ray.

Travaux pratiquesCréation d’un DAG Airflow orchestrant un pipeline complet.Jour 4

Cloud : exécution distribuée avec GKE, Cloud Run Jobs et Cloud Batch

Conteneurisation pour workloads calculatoires : Docker multi-stage + uv.
GKE Autopilot : déploiement d’un cluster Dask/Ray sans gestion de noeuds.
Cloud Run Jobs :
- exécution de conteneurs batch
- montée en charge automatique
Cloud Batch :
- exécutions massives CPU/GPU
- parallélisation simple sans orchestration manuelle
Google Cloud Storage :
- stockage Parquet/Arrow
- lecture distribuée
- partitionnement
Monitoring :
- logs job
- métriques
- suivi Dask/Ray dans GKE

Travaux pratiquesExécution d’un job sur des données de la blockchain

Date de mise à jour du programme : 19/02/2026

Dates et lieux

Période souhaitée

Lieux

Type d'affichage

Distanciel

7 septembre - 10 septembre

12 octobre - 15 octobre

7 décembre - 10 décembre

Paris

7 septembre - 10 septembre

12 octobre - 15 octobre

7 décembre - 10 décembre

Machine Learning avec Python

Durée: Durée :4 jours
Niveau: Niveau :Intermédiaire
Certification: Certification :Non

2490€ HT

Prochaine session : 25/08/2026

Déployer un modèle Machine Learning en production avec Python

Durée: Durée :3 jours
Niveau: Niveau :Intermédiaire
Certification: Certification :Non

Intégrer des modèles ChatGPT dans les applications Python

Durée: Durée :3 jours
Niveau: Niveau :Fondamental
Certification: Certification :Non

Python : Automatiser les documents Office

Durée: Durée :2 jours
Niveau: Niveau :Intermédiaire
Certification: Certification :Non

Voir toutes les formations Python