Intégrez et synchronisez vos données grâce à l'ELT de Talend et à notre formation Talend Open Studio !
Talend est une solution d’intégration de données Open Source qui permet de modéliser, développer et mettre en œuvre un projet de migration de données au sein de votre système d’information. Grâce à la formation Talend Open Studio vous maîtriserez l’ETL avec une utilisation concrète.
Objectifs pédagogiques.
1Intégrer et synchroniser les données avec Talend Open Studio
2Traiter les données, récupérer et utiliser des bases de données
3Optimiser les jobs
4Travailler avec des données multi-sources
5Gérer les itérations, les logs, les erreurs et les sorties
Que signifie « Intégration de données » ? Le modèle Extract – Transform – Load (ETL) La solution Talend Open Studio. Philosophie du produit Installer TOS et préférences
Conception d’un premier programme de traitement
Modéliser le besoin avec le Business Modeler Bonnes pratiques de conception d’un job Les flux principaux Les composants de traitement de sources CSV et XML Utiliser les composants de transformation Utiliser les composants de traitement des données Visualiser le code généré Exécuter le job
Optimisation des jobs
Importer et exporter des métadonnées Configurer des connexions réutilisables Créer des fichiers de configuration .ini (Perl) ou .properties (Java) Configurer des variables Mettre en place des méthodes de test
Récupération et utilisation de bases de données
Utiliser les composants principaux (tAccessInput/Output…) Paramétrer les actions et interactions avec les tables Utiliser les outils de requêtes Utiliser l’éditeur de requêtes SQL Builder
Travail avec des données multi-sources
Rediriger des données mono-source ou multi-source avec tMap ? Configurer et mettre en relation des flux d’entrée Transformer les données (variables, jointures, expressions…) Qualifier les données grâce aux filtres
Gestion des itérations, logs et erreurs
Boucler les jobs avec tLoop et tInfiniteLoop Récupération de données e-mails avec tPOP Récupérer un ensemble de fichiers/dossiers avec tFileList Gérer les composants de log et d’erreurs (tDie, tWarn et tLogCatcher)
Gestion des sorties
Générer des sorties Gérer les rejets
Fonctions avancées
Créer et gérer les variables contextuelles Décomposer le job Modes d’exécution des jobs Initiation au débogage