• NEW

Formation Talaxie Open Studio for Data Integration : Initiation

Durée 3 jours
Niveau Fondamental
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence TODI
Éligible CPF Non

Qu’est-ce que la formation Data Integration : Initiation avec Talaxie Open Studio ?

Il s’agit d’une formation d’introduction à Talaxie Open Studio for Data Integration, un outil ETL open source permettant de créer et automatiser des processus d’intégration de données. Cette formation vous guide pas à pas dans la prise en main de l’interface, la connexion à des sources de données variées, la transformation des données et la mise en place de vos premiers flux.

Pourquoi suivre la formation Data Integration : Initiation ?

Parce qu’elle vous permet d’acquérir les bases solides pour comprendre et mettre en œuvre des projets d’intégration de données. Que vous soyez débutant en ETL, en reconversion ou déjà impliqué dans des projets data, cette formation est un excellent point de départ pour monter en compétences avec un outil largement utilisé dans les environnements décisionnels et les architectures orientées données.

Objectif opérationnel : 

Savoir configurer, transformer et charger des données depuis différentes sources en utilisant les fonctionnalités de base de Talaxie Open Studio.

Objectifs pédagogiques : 

A l'issue de cette formation Data Integration : Initiation  vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Comprendre les enjeux de l’intégration de données et situer Talaxie Open Studio dans l’écosystème des outils ETL.
  • Installer et prendre en main l’environnement Talaxie, en explorant l’interface, les vues et la structure des jobs.
  • Créer et exécuter un job simple, en manipulant les composants de base pour lire, transformer et écrire des données.
  • Utiliser les métadonnées, variables et contextes pour structurer les flux de manière souple et maintenable.
  • Orchestrer des traitements ETL en enchaînant des sous-jobs, en gérant les erreurs et en automatisant l’exécution.

Public :

Ce cours s'adresse aux Administrateurs systèmes/BDD, Chefs de projets et Développeurs.

Prérequis :

Des bases en Java et une compréhension des requêtes SQL sont recommandées pour tirer pleinement profit de la formation.

Introduction

Problématique d'intégration de données 
Intégration Opérationnelle et Décisionnelle 
Outils ETL (Extract Transform Load) disponibles 
Talaxie Open Studio : présentation, licences, lien avec Eclipse
Support disponible : documentation, communauté, …
Atelier pratique : Installation et présentation de l'environnement Talaxie Open Studio

Découvrir l'interface

Les perspectives et les vues Talaxie
Les jobs : grille, palette de composants
Les flux principaux (main)
La notion de schéma : types des colonnes
Premiers composants : entrée, sortie, génération de flux
Atelier pratique : Création et exécution d'un job simple, génération de contenu dans un fichier

Les principaux composants de Talaxie

Composants d'entrée (tFileInput, tMysqlInput, …)
Génération de contenu (tRowGenerator, tFixedFlowInput, ...)
Sorties et affichage (tLogRow, tFileOutput, tMysqlOutput, …)
Logique et chaînage des composants
Suivi pas à pas des traces de l'exécution du job
Gestion des rejets
Transformations simples (filtre, tri, remplacement, jointure)
Atelier pratique : Génération de contenu dans une base de données, extraction et traitement des données pour affichage en console

Garantir la pérennité des jobs

Versions et statuts des jobs
Les métadonnées : propriétés et schémas.
La découverte de schéma pour les fichiers CSV
Récupération des schémas de bases de données
Mises à jour des jobs depuis les métadonnées
Atelier pratique : Insérer les sources et cibles de données dans les métadonnées du référentiel

Variables et contextes

Utiliser des variables dans un job (tSetGlobalVar)
Mise en place d'un contexte local au job
Groupes de contexte dans le référentiel
Les métadonnées comme contextes
Atelier pratique : Utiliser une variable dans un job, contextualiser les paramètres d'une métadonnées, créer un contexte de test, et de production

Le mappage de données : tMap

Le composant ETL par excellence
Gérer les entrées : flux principal, secondaires, nommage des flux
Gérer les sorties : l'éditeur intégré de la tMap
Filtrer les données : en entrée, sortie
Sorties conjointes, capture des rejets de sortie, de jointure interne
L'éditeur d'expression
Les performances
Atelier pratique : Extraction multi-sources, multi-destinations avec une tMap, sur un exemple complet

Orchestration des jobs, gestion d'erreurs

Exécutions parallèles de sous-jobs
Déclencheurs Talaxie (triggers)
Enchaînement de sous-jobs et de composants (OnSubjobOK, OnComponentOK)
Gestion des erreurs de composants, sous-job (OnComponentError, OnSubjobError)
Composant de départ, et de fin (tPreJob, tPostJob)
Attraper et lever des erreurs : tWarn, tDie, tLogCatcher
Atelier pratique : Assembler plusieurs jobs en un seul, factoriser la gestion d'erreurs pour générer un fichier de compte-rendu.
Date de mise à jour du programme : 29/07/2025

Ces formations peuvent aussi vous intéresser :

  • Niveau : Fondamental
  • Référence : OETM

  • Niveau : Avancé
  • Référence : OETE

Les fondamentaux de l'ETL Talend Open Studio for Data Integration

  • Niveau : Intermédiaire
  • Cours officiel : Talend
  • Référence : OETB

Implémenter une solution Entrerprise Service Bus avec Open Studio

  • Niveau : Intermédiaire
  • Référence : OESB


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB