• NEW

Formation Apache Avro

Maîtrisez la sérialisation de données performante et interopérable avec Apache Avro
Durée 2 jours
Niveau Fondamental
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence APAV
Éligible CPF Non

Qu’est-ce qu’Apache Avro ?

Apache Avro est un système de sérialisation de données développé dans le cadre du projet Apache Hadoop. Il permet de structurer, stocker et échanger efficacement des données binaires ou JSON dans un format compact et interopérable. Conçu pour la performance et la compatibilité interlangage, Avro repose sur des schémas dynamiques permettant la communication fluide entre applications écrites dans différents langages.

Pourquoi suivre une formation Apache Avro ?

Dans un contexte où les systèmes distribués, le streaming et les architectures orientées données sont omniprésents, maîtriser Apache Avro devient essentiel. Cette formation vous permettra d’exploiter le potentiel d’Avro pour définir des schémas évolutifs, assurer la compatibilité des versions et intégrer Avro dans des environnements tels que Kafka, Spark ou Hadoop. En suivant cette formation, vous apprendrez à sérialiser efficacement vos données tout en garantissant la fiabilité et la scalabilité de vos systèmes Big Data.

Objectif opérationnel :

Savoir concevoir, implémenter et manipuler des schémas de données performants et évolutifs avec Apache Avro.

Objectif pédagogiques :

À l'issue de cette formation Apache Avro, vous aurez acquis les connaissances nécessaires pour :

  • Comprendre le fonctionnement et les concepts fondamentaux d’Apache Avro.
  • Créer, gérer et valider des schémas Avro.
  • Sérialiser et désérialiser des données dans différents formats.
  • Intégrer Avro avec des systèmes distribués comme Kafka ou Hadoop.
  • Gérer l’évolution des schémas et la compatibilité ascendante/descendante.

Public :

Cette formation s’adresse aux développeurs, ingénieurs Big Data, architectes de données et administrateurs système souhaitant manipuler des données structurées avec Apache Avro dans des environnements distribués.

Prérequis :

Avoir des connaissances de base en développement (Java, Python ou équivalent) et une compréhension des formats de données (JSON, XML). Une familiarité avec les environnements Hadoop ou Kafka est un plus pour tirer pleinement parti de la formation.

J’évalue mes connaissances pour vérifier que je dispose des prérequis nécessaires pour profiter pleinement de cette formation en faisant ce test.

Jour 1

Introduction à Apache Avro

Présentation d’Avro et de son positionnement dans l’écosystème Hadoop
Architecture et composants principaux
Les avantages de la sérialisation binaire
Comparaison avec d’autres formats : JSON, Protobuf, Thrift
Travaux pratiquesObjectif :Identifier les caractéristiques clés d’Avro et les comparer à d’autres formats de données. 
Description :Manipulation de fichiers Avro simples, exploration du format binaire et lecture via des outils de ligne de commande. Pourquoi Avro est-il plus performant que JSON ?

Création et gestion de schémas Avro

Structure d’un schéma Avro (types, enregistrements, unions, tableaux)
Définition et validation de schémas
Gestion des champs facultatifs et des valeurs par défaut
Bonnes pratiques de conception de schémas
Travaux pratiquesObjectif :Savoir définir et valider des schémas Avro pour différents cas d’usage. 
Description :Atelier de création de schémas pour des données clients et commandes. Validation automatique via la CLI Avro. Quelle stratégie adopter pour maintenir des schémas évolutifs ?
Jour 2

Sérialisation et désérialisation des données

Lecture et écriture de données Avro en Java et Python
Gestion des fichiers conteneurs Avro
Compression et optimisation des performances
Conversion depuis/vers JSON et autres formats
Travaux pratiquesObjectif :Être capable de sérialiser et désérialiser des données Avro dans plusieurs langages. 
Description :Développement d’un script Python lisant et écrivant des données Avro compressées. Comparaison des tailles de fichiers et des vitesses de traitement.

Intégration d’Avro avec Kafka et Hadoop

Utilisation d’Avro avec Kafka Connect
Schémas Registry et compatibilité des versions
Intégration dans les pipelines Spark et Hadoop
Bonnes pratiques pour la maintenance et le déploiement
Travaux pratiquesObjectif :Connecter Apache Avro à une infrastructure de streaming et de traitement distribuée. 
Description :Mise en œuvre d’un flux Kafka utilisant Avro pour le transport des messages. Comment assurer la compatibilité des schémas entre versions ?

Les travaux pratiques représentent environ 50 % du temps de la formation. Ils s’appuient sur des exercices concrets d’écriture, de lecture et de validation de fichiers Avro, ainsi que sur l’intégration dans des pipelines de données réels.

Date de mise à jour du programme : 28/11/2025

Dates et lieux

Du 26 au 27 janvier 2026
Lieu
Distanciel
Durée
2 jrs
1590 € HT
Du 26 au 27 janvier 2026
Lieu
Paris
Durée
2 jrs
1590 € HT
Du 26 au 27 mars 2026
Lieu
Distanciel
Durée
2 jrs
1590 € HT
Du 26 au 27 mars 2026
Lieu
Paris
Durée
2 jrs
1590 € HT
Du 22 au 23 juin 2026
Lieu
Distanciel
Durée
2 jrs
1590 € HT
Du 22 au 23 juin 2026
Lieu
Paris
Durée
2 jrs
1590 € HT
Du 07 au 08 septembre 2026
Lieu
Distanciel
Durée
2 jrs
1590 € HT
Du 07 au 08 septembre 2026
Lieu
Paris
Durée
2 jrs
1590 € HT
Du 23 au 24 novembre 2026
Lieu
Distanciel
Durée
2 jrs
1590 € HT
Du 23 au 24 novembre 2026
Lieu
Paris
Durée
2 jrs
1590 € HT

Ces formations peuvent aussi vous intéresser :

Bien comprendre le vocabulaire et le rôle de chaque brique de Hadoop

  • Niveau : Fondamental
  • Référence : CB030

Les Distributions Hadoop Data Analyst - Analyse de données en environnement Hadoop

  • Niveau : Intermédiaire
  • Référence : OABD

Développement Hortonworks ou Cloudera

  • Niveau : Intermédiaire
  • Référence : ODOP

  • Niveau : Intermédiaire
  • Référence : OADC


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

4,7/5
94% de nos participants
sont satisfaits ou
très satisfaits


Formateurs experts
validés par
PLB

%
Des participants
recommandent
nos formations