Apprendre Plus Pour une Vie Meilleure

Formation Talend Open Studio.

Intégrez et synchronisez vos données grâce à l'ELT de Talend et à notre formation Talend Open Studio !

Talend est une solution d’intégration de données Open Source qui permet de modéliser, développer et mettre en œuvre un projet de migration de données au sein de votre système d’information. Grâce à la formation Talend Open Studio vous maîtriserez l’ETL avec une utilisation concrète.

Objectifs pédagogiques.

1Intégrer et synchroniser les données avec Talend Open Studio

2Traiter les données, récupérer et utiliser des bases de données

3Optimiser les jobs

4Travailler avec des données multi-sources

5Gérer les itérations, les logs, les erreurs et les sorties

6Connaître des fonctions avancées

Vous souhaitez une session sur-mesure  ?

Public : Chefs de projet, Administrateurs de base de données, Développeurs

Prérequis: Bases SQL et JAVA

Programme de formation Talend Open Studio.

PDF

Introduction à TOS

Que signifie « Intégration de données » ?
Le modèle Extract – Transform – Load (ETL)
La solution Talend Open Studio. Philosophie du produit
Installer TOS et préférences

Conception d’un premier programme de traitement

Modéliser le besoin avec le Business Modeler
Bonnes pratiques de conception d’un job
Les flux principaux
Les composants de traitement de sources CSV et XML
Utiliser les composants de transformation
Utiliser les composants de traitement des données
Visualiser le code généré
Exécuter le job

Optimisation des jobs

Importer et exporter des métadonnées
Configurer des connexions réutilisables
Créer des fichiers de configuration .ini (Perl) ou .properties (Java)
Configurer des variables
Mettre en place des méthodes de test

Récupération et utilisation de bases de données

Utiliser les composants principaux (tAccessInput/Output…)
Paramétrer les actions et interactions avec les tables
Utiliser les outils de requêtes
Utiliser l’éditeur de requêtes SQL Builder

Travail avec des données multi-sources

Rediriger des données mono-source ou multi-source avec tMap ?
Configurer et mettre en relation des flux d’entrée
Transformer les données (variables, jointures, expressions…)
Qualifier les données grâce aux filtres

Gestion des itérations, logs et erreurs

Boucler les jobs avec tLoop et tInfiniteLoop
Récupération de données e-mails avec tPOP
Récupérer un ensemble de fichiers/dossiers avec tFileList
Gérer les composants de log et d’erreurs (tDie, tWarn et tLogCatcher)

Gestion des sorties

Générer des sorties
Gérer les rejets

Fonctions avancées

Créer et gérer les variables contextuelles
Décomposer le job
Modes d’exécution des jobs
Initiation au débogage

Obtenir des statistiques d’exécution du job