Description
Ce programme de formation se concentre sur l'utilisation de Talend pour le traitement et la gestion des données. Il aborde les concepts fondamentaux tels que l'échange inter-applications, la modélisation de flux, ainsi que la transformation et la gestion des données. Les participants apprendront à manipuler des bases de données, à développer des jobs, et à gérer les logs et erreurs. Destiné aux professionnels souhaitant améliorer leurs compétences en intégration de données, ce cursus offre une approche pratique et structurée pour déployer des solutions efficaces.
Objectifs
- Comprendre la philosophie d'un ETL
- Créer des flux de données
- Transformer et gérer la donnée
- Comprendre et corriger les erreurs
Récapitulatif
Public
Professionnels de l'Informatique et développeurs ayant besoin d'implémenter des flux de données inter-applications ou devant alimenter un entrepôt de données
Prérequis
Etre familiarisé avec le langage SQL ainsi que les modèles relationnels d'architecture de tables de base de données
Méthodes et modalités pédagogiques
Formation réalisée en Présentiel, Distanciel ou Dual-Learning selon la formule retenue.
Moyens et supports pédagogiques
Mise à disposition d'un poste de travail sur nos formations en Présentiel.
Mise à disposition de nos environnements de visio sur nos formations en Distanciel
Remise d'une documentation pédagogique numérique pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques et de réflexions
Dans le cas d'une formation sur site Entreprise, le client s'engage à avoir toutes les ressources pédagogiques nécessaires (salle, équipements, accès internet, TV ou Paperboard...) au bon déroulement de l'action de formation conformément aux prérequis indiqués dans le programme de formation
Modalités de suivi et d'évaluations
Auto-positionnement des stagiaires avant la formation
Émargement des stagiaires et formateur par 1/2 journée
Exercices de mise en pratique ou quiz de connaissances tout au long de la formation permettant de mesurer la progression des stagiaires
Auto-évaluation des acquis de la formation par les stagiaires
Questionnaire de satisfaction à chaud et à froid à l'issue de la formation
Programme détaillé
Introduction
- Définition du besoin
EAI/ETL
- Échange inter application
- L'ETL dans un projet décisionnel
- Mise en place de l'outil
- Installation du JDK (kit de développement JAVA)
- Astuces et remarques (premier démarrage)
Environnement de développement
- Découverte de l'interface graphique Eclipse (Écran de démarrage, Connexion au workspace, Création d'un projet, Ouverture d'un projet, Présentation des éléments d'interface, Définition des éléments de référentiel projet
- Initiation aux composants (palette, Énumération des grandes familles de composants)
Développer les premiers flux
- La modélisation de flux par le Business Model
- Le développement de jobs
- Conventions et règles de développement
- tRowGenerator
- tFileOutputExcel
- tFileInputExcel
- tMsgBox
- tSendMail
- Lier les composants entre eux
- Exécuter un job
Transformer et gérer les données
- tFilterRow
- tUniqRow
- tAgregateRow
- tSortRow
- tMap
Mise en place et utilisation des métadonnées
- Définition du concept
- Créer une métadonnée Excel
- Utiliser une métadonnée Excel
- Créer une métadonnée de base de données
- Récupérer les informations d'une base de données
Manipuler une base de données avec Talend
- Définition des composants liés aux bases de données
- tAccessInput / tMySQLInput
- tAccessOutput / tMySQLOuput
Notions et composants avancés
- Définition et utilisation des variables globales
- tBuffer
- tSystem
- tServerAlive
- tUnite
- tReplicate
Les boucles dans Talend
- tFileList
- tInfiniteLoop
- tLoop
- tPOP
- tFlowToIterate
Mise en place de la gestion des logs et des erreurs
- tLogRow
- tDie et tLogCatcher
- tWarn
- tStatCatcher
- tFlowMeter et tFlowMeterCatcher
Gestion des environnements et transformations réutilisables
- Définition de la notion de contexte
- Créer une variable de contexte
- Utiliser une variable de contexte
- Modifier une variable de contexte
- Développement et utilisation de routines
Préparation au déploiement de la solution
- Définition et développement d'un séquenceur
- Génération la documentation du projet
- Construction et automatisation du projet