Talend Open Studio Data Integration : Initiation
Wat zijn de doelstellingen van de opleiding?
Opleidingsprogramma
Inleiding
Data integratie vraagstukken
Operationele en Business Intelligence integratie
Beschikbare ETL (Extract TransformLoad) tools
Talend Open Studio: presentatie, licenties, koppeling met Eclipse
Beschikbare ondersteuning: documentatie, community,...
Workshop: Installatie en presentatie van de Talend Open Studio omgeving
Ontdekken van de interface
Talend perspectieven en views
Gebruik van de BusinessModeler
Jobs: grid, component palet
Hoofdstromen
Het begrip schema: kolomtypes
Eerste componenten: input, output, flow generatie
Praktische workshop: een eenvoudige opdracht creëren en uitvoeren, inhoud in een bestand genereren
Talend's belangrijkste componenten
Invoercomponenten (tFileInput,tMysqlInput, ...)
Content generatie (tRowGenerator,tFixedFlowInput, ...)
Output en weergave (tLogRow, tFileOutput,tMysqlOutput, ...)
Logica en chaining van componenten
Stap voor stap traceren van de jobuitvoering
Beheer van projecten
Eenvoudige transformaties (filter, sort, replace, join)
Praktische workshop: inhoud genereren in een database, gegevens extraheren en verwerken voor weergave in de console
Waarborgen van de duurzaamheid van banen
Versies en status van jobs
Metadata: eigenschappen en schema's.
Schema zoeken voor CSV-bestanden
Schema's ophalen uit databases
Taken bijwerken op basis van metagegevens
Praktische workshop: gegevensbronnen en -doelen invoegen in de metagegevens van het archief
Variabelen en contexten
Variabelen gebruiken in een taak (tSetGlobalVar)
Een context lokaal voor de taak instellen
Contextgroepen in het archief
Metadata als context
Praktische workshop: gebruik van een variabele in een job, contextualiseren van de parameters van een metagegevens, creëren van een test- en productiecontext
Gegevens mapping: tMap
De ETL-component bij uitstek
Inputs beheren: primaire en secundaire streams, naamgeving van streams
Outputs beheren: de geïntegreerde editor van tMap
Gegevens filteren: input, output
Gezamenlijke outputs, outputweigeringen vastleggen, interne join
De expressie-editor
Prestaties
Praktische workshop: multi-bron, multi-bestemming extractie met een tMap, op een compleet voorbeeld
Job orchestratie, foutenbehandeling
Parallelle uitvoering van sub-jobs
Triggers
Sequencing van subjobs en componenten (OnSubjobOK, OnComponentOK)
Behandeling van fouten bij componenten en subjobs (OnComponentError, OnSubjobError)
Starten en beëindigen van componenten (tPreJob, tPostJob)
Opvangen en verwijderen van fouten: tWarn, tDie, tLogCatcher
Praktische workshop: samenvoegen van verschillende jobs tot één, foutafhandeling om een rapportbestand te genereren.