Cette formation est-elle adaptée à mon niveau ?

Chaque fiche indique le niveau requis (Fondamental, Intermédiaire, Avancé) ainsi que les prérequis détaillés. En cas de doute, un test d'auto-évaluation est disponible directement sur la page.

La formation est-elle orientée théorie ou pratique ?

Nos formations alternent apports théoriques et travaux pratiques, pour mettre immédiatement en application les notions abordées.

Puis-je suivre cette formation à distance ?

Oui, la plupart de nos formations sont disponibles en présentiel et en classe à distance, avec le même contenu et le même niveau d'interaction avec le formateur.

Cette formation est-elle disponible en intra-entreprise ?

Oui. Nous pouvons l'organiser dans vos locaux, dans nos salles ou à distance, avec un programme adapté à votre contexte si nécessaire. Contactez notre service intra pour un devis.

Que se passe-t-il si une session est annulée ?

Nous nous engageons à maintenir les sessions garanties affichées. En cas d'annulation de notre part, nous vous proposons un report sur la prochaine session disponible.

Cette formation est-elle finançable via le CPF ?

Si la formation est éligible CPF, cela est indiqué sur la fiche avec le code de certification correspondant. Vous pouvez retrouver la formation directement sur Mon Compte Formation.

Mon employeur ou mon OPCO peut-il prendre en charge le coût ?

Oui. Contactez-nous pour obtenir une convention de formation et vérifier les possibilités de prise en charge via votre OPCO.

Formation Big Data - Python pour l'analyse de données (cours dédié aux actions collectives Atlas)

4,7/5

Avec 26 avis

Description de la formation Big Data Python

Cette formation sur l’analyse de données en Python permet aux participants dans un premier temps de découvrir et apprendre le langage Python puis de comprendre pourquoi Python est particulièrement bien adapté à toutes sortes de problèmes d’analyse de données.

Lors de ce cours les participants aborderont donc le traitement de différents formats de données structurées ou non (tableau, matrice, série, CSV, flux XML ou JSON, etc.) tout en les rendant opérationnel dans l’utilisation des principales bibliothèques Python comme NumPy, Pandas, Matplotlib, IPython, SciPy, etc…

Jour 1

Rappels des bases de Python

Les caractéristiques du langage Python
Pourquoi choisir Python pour l’analyse de données ?
Philosophie de Python (indentation, objet, etc.)
Les types de données
Appels de fonctions et méthodes
Structures de contrôles (boucle, test, exceptions)
Structures de données et séquences (tuple, liste, primitives, dict)
Les principales bibliothèques de Python (NumPy, Pandas, Matplotlib, Ipython, SciPy)AtelierTP de synthèse mettant en œuvre les bibliothèques NumPy, Pandas et SciPy. On utilise un gros fichier CSV des naissances que l’on transforme en tableau (Pandas) et on calcule des statistiques comme le « nombre de Laurent nés en telle année selon les départements », « la moyenne des naissances nationales annuelle et l’écart type par région », etc.

Aspects avancés en Python

Espace de noms, périmètre et fonctions locales
Manipuler les fonctions comme des objets
Les fonctions anonymes (lambda)
Fonction à nombre variable d’arguments (*args, **kwargs)AtelierÉcriture d’une fonction de tri recevant un nombre arbitraire d’arguments
Passage de la fonction heuristique du tri (celle qui précise si un objet est « plus petit » qu’un autre) à la fonction précédente

Acquisition des données

Lecture de fichiers de manière générique et spécifiquement de différents formats courants : CSV, XML, JSON
Utilisation de la bibliothèque requests pour l’acquisition de données externes stockées sur un serveur de l’entreprise ou sur internetAtelierCet atelier donnera l’occasion aux participants de mettre au point un moteur de recherche simple dans le système de fichiers. Une fois le système de fichiers indexé, il y sera possible de rechercher par mot-clef un fichier et son contenu automatiquementJour 2

Bibliothèques d’Analyses Statistiques

Présentation des principales bibliothèques d’analyse de données Python : Pandas, SciPy, IPython (Jupyter)
Fonctions de manipulation et de calcul matriciel (Numpy)
Fonctions de Statistiques Descriptives (SciPy) : quantiles et des fonctions de répartition pour
différentes lois statistiques
Fonctions de comparaison de populations, mesures d’association
Fonctions de classification automatique (SciPy) : k-meansAtelierCet atelier permettra aux participants d’appliquer leurs connaissances à la réalisation d’un « mini atelier » d’Analyse Technique pour la Finance des Marchés :
- Collecte automatique de séries financières
- Calcul d’indicateurs : d’indicateurs simples (moyennes mobiles) à des indicateurs avancés (tel que le RSI et les Bandes de Bollinger)
- Visualisation des résultats

Visualisation de données

Introduction aux bases de la visualisation de données
Focalisation sur la génération de graphes grâce à la librairie Matplotlib : démonstration de l’application de graphes Matplotlib à la visualisation de problèmes concretsAtelierCet atelier permettra de poursuivre les travaux de l’atelier précédent en générant des visualisations graphiques illustrant les analyses de données réalisées (les appels à la bibliothèque Matplotlib sont fournis par le formateur afin de rester concentrer principalement sur l’analyse des données)Jour 3

Régression, Classification et Évaluation des Résultats

Établissement d’un modèle de classification et d’un modèle de régression avec Python pour résoudre deux problèmes distincts
Évaluation du modèle dans son contexte, faux positifs, faux négatifs, matrice de confusion, différents scores de précisionAtelierMise en œuvre d’un modèle de classification et de régression en Python

Deep Learning & Frameworks

Différence entre le machine learning et le deep learning
Introduction aux réseaux de neurones et à la descente de gradient
Introduction aux frameworks de deep learning Tensorflow et Keras de GoogleAtelierCet atelier permettra d’étudier un modèle de deep learning en fonctionnement sur un problème de classification d’image. L’objectif est de se familiariser avec la notion de couche de neurones, d’hyperparamètres et d’entraînement de modèle

Big Data & Traitement de gros volumes de données

Introduction à l’algorithme de MapReduce
Introduction à la parallélisation du code dans le but d’améliorer les performances de calcul
Introduction à Spark
La composante Spark MLAtelierMise en œuvre d’un programme Spark ML en Python afin d’être sensibilisé aux possibilités d’auto apprentissage simple en Python

Date de mise à jour du programme : 17/04/2026

Dates et lieux

Période souhaitée

Lieux

Type d'affichage

Distanciel

8 juillet - 10 juillet

23 septembre - 25 septembre

14 octobre - 16 octobre

4 novembre - 6 novembre

9 décembre - 11 décembre

Paris

8 juillet - 10 juillet

23 septembre - 25 septembre

14 octobre - 16 octobre

4 novembre - 6 novembre

9 décembre - 11 décembre

Témoignages pour cette formation

26 avis

Les avis figurant ci-dessous sont issus des fiches d'évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions.

Avis de BEAUCHET Quentin

Retour d’expérience

Mon avis sur le contenu du stage :

"Le dossier des supports ipynb et csv est un peu trop désordonné avec des fichiers manquants ou avec une version différente du formateur ce qui a rendu la formation un peu plus dur a suivre. Mais c'est un détail facilement réglable. Aussi le fichier /python_data_advanced sur le site PLB laisse a penser une formation sur la Machine Learning sur les 3j mais on est entré dans le sujet qu'au bout du troisième jour. Un quatrième jour de formation n'aurait pas été de trop."

Ce que j'ai le plus apprécié :

"La VM fonctionne parfaitement sans aucun lag."

Ce que j'ai le moins apprécié :

"La formation manque d'une description du contenu sur le site PLB avant le début de celle-ci"

BEAUCHET Quentin

Avis de DESMET Claire

Retour d’expérience

Mon avis sur le contenu du stage :

"répond à mes attentes. Très bon support de cours et TP avec des exemples. Il nous manquait juste un peu de temps pour laisser un peu plus en autonomie pour les premiers TP sur pandas mais c'est lié à la contrainte de tout voir en 3 jours."

Mon avis sur le formateur :

"Explique très bien, a de solides compétences techniques."

Mon avis sur la salle de formation :

"La disposition de la salle un peu particulière (on doit se tourner pour voir l'écran)."

Ce que j'ai le plus apprécié :

"la grande salle"

Ce que j'ai le moins apprécié :

"le fait de devoir se tourner pour voir l'écran"

DESMET Claire

Avis de HT

Retour d’expérience

Mon avis sur le contenu du stage :

"Le formateur a prit en compte nos demande et a ignoré le support de cours pour privilégier des besoins personnalisés"

Ce que j'ai le plus apprécié :

"Les autres participants avaient un niveau et besoins proches du mien, ce qui a permit au formateur d'insister sur les points qui nous intéressaient le plus."

Ce que j'ai le moins apprécié :

"Les VMs étaient assez lentes et le téléchargement de certaines librairies a pris pas mal de temps"

Supervision du Big Data : Grafana, Kibana, Graphite et Prometheus

Durée: Durée :3 jours
Niveau: Niveau :Fondamental
Certification: Certification :Non

2400€ HT

Prochaine session : 02/09/2026

Elastic Kibana Analyst

Durée: Durée :3 jours
Niveau: Niveau :Fondamental
Certification: Certification :Non

Business Intelligence - Les fondamentaux

Durée: Durée :2 jours
Niveau: Niveau :Fondamental
Certification: Certification :Non

Aide à la décision - La Synthèse

Durée: Durée :1 jour
Niveau: Niveau :Fondamental
Certification: Certification :Non

Voir toutes les formations Big Data - Analyse, Visualisation & Décisionnel

Formation Big Data - Python pour l'analyse de données (cours dédié aux actions collectives Atlas)

Description de la formation Big Data Python

Programme de la formation

Objectifs de la formation

Contenu du cours Big Data Python

Rappels des bases de Python

Aspects avancés en Python

Acquisition des données

Bibliothèques d’Analyses Statistiques

Visualisation de données

Régression, Classification et Évaluation des Résultats

Deep Learning & Frameworks

Big Data & Traitement de gros volumes de données

Public et prérequis

Dates et lieux

Distanciel

Paris

Témoignages pour cette formation

Ces formations en Big Data - Analyse, Visualisation & Décisionnel peuvent aussi vous intéresser

Questions fréquentes

Cette formation est-elle adaptée à mon niveau ?

La formation est-elle orientée théorie ou pratique ?

Puis-je suivre cette formation à distance ?

Cette formation est-elle disponible en intra-entreprise ?

Que se passe-t-il si une session est annulée ?

Cette formation est-elle finançable via le CPF ?

Mon employeur ou mon OPCO peut-il prendre en charge le coût ?

Témoignages pour cette formation

Ces formations en Big Data - Analyse, Visualisation & Décisionnel peuvent aussi vous intéresser