Talend Open Studio Data Integration : Initiation + Approfondissement
Wat zijn de doelstellingen van de opleiding?
Opleidingsprogramma
Inleiding
Data integratie vraagstukken
Operationele en Business Intelligence integratie
Beschikbare ETL (Extract TransformLoad) tools
Talend Open Studio: presentatie, licenties, koppeling met Eclipse
Beschikbare ondersteuning: documentatie, community,...
Workshop: Installatie en presentatie van de Talend Open Studio omgeving
Ontdekken van de interface
Talend perspectieven en views
Gebruik van de BusinessModeler
Jobs: grid, component palet
Hoofdstromen
Het begrip schema: kolomtypes
Eerste componenten: input, output, flow generatie
Praktische workshop: een eenvoudige opdracht creëren en uitvoeren, inhoud in een bestand genereren
Talend's belangrijkste componenten
Invoercomponenten (tFileInput,tMysqlInput, ...)
Content generatie (tRowGenerator,tFixedFlowInput, ...)
Output en weergave (tLogRow, tFileOutput,tMysqlOutput, ...)
Logica en chaining van componenten
Stap voor stap traceren van de jobuitvoering
Beheer van projecten
Eenvoudige transformaties (filter, sort, replace, join)
Praktische workshop: inhoud genereren in een database, gegevens extraheren en verwerken voor weergave in de console
Waarborgen van de duurzaamheid van banen
Versies en status van jobs
Metagegevens: eigenschappen en schema's.
Schema zoeken voor CSV-bestanden
Schema's ophalen uit databases
Taken bijwerken op basis van metagegevens
Praktische workshop: gegevensbronnen en -doelen invoegen in de metagegevens van het archief
Variabelen en contexten
Variabelen gebruiken in een taak (tSetGlobalVar)
Een context lokaal voor de taak instellen
Contextgroepen in het archief
Metadata als context
Praktische workshop: gebruik van een variabele in een job, contextualiseren van de parameters van een metagegevens, creëren van een test- en productiecontext
Gegevens mapping: tMap
De ETL-component bij uitstek
Inputs beheren: primaire en secundaire streams, naamgeving van streams
Outputs beheren: de geïntegreerde editor van tMap
Gegevens filteren: input, output
Gezamenlijke outputs, outputweigeringen vastleggen, interne join
De expressie-editor
Prestaties
Praktische workshop: multi-bron, multi-bestemming extractie met een tMap, op een compleet voorbeeld
Job orchestratie, foutenbehandeling
Parallelle uitvoering van sub-jobs
Talend triggers
Opeenvolging van subjobs en componenten (OnSubjobOK, OnComponentOK)
Behandeling van fouten bij componenten, subjobs (OnComponentError, OnSubjobError)
Starten en beëindigen van componenten (tPreJob, tPostJob)
Fouten opvangen en verwijderen: tWarn, tDie, tLogCatcher
Praktische workshop: verschillende jobs samenvoegen tot één, foutafhandeling om een rapportbestand te genereren
Programmeringsstromen: iterate links
Onderscheid maken tussen hoofd- en iteratiestromen
Loops en scheduling via tLoop, tForeach
Overschakelen van een hoofdstroom naar een iteratiestroom, en vice versa (tFlowToIterate, tIterateToFlow)
Synchroniseren van jobs met tWaitForFile, tWaitForSocket, tWaitForSQL
Praktische workshop: paralleliseren van sub-jobs, synchroniseren van jobs met een eventénementexterne
Geavanceerd gebruik
Geavanceerde componenten gebruiken : Java of reguliere expressies
De specificiteit van XML-feeds in Talend
Hergebruik van code: routines
Workshop: Gebruik van tJavaRow, tJavaFlex componenten, gebruik van de embedded Java editor, een aangepaste routine implementeren
Debuggen in Talend
Herinneringen over het debuggen van sporen
Gebruik van de DebugJava-modus: Debug-perspectief, stapsgewijze modus
Variabelen bekijken en hot-modificeren
Workshop: Basis debuggen/voortzetten van taken
Stationering en industrialisering
Herinnering over contexten
Exporteren van jobs voor uitvoering op een server
Context schakelen tussen jobs, tijdens runtime
Gebruik van een bestand om de context te laden (tContextLoad)
Workshop: Taken inzetten en dynamische context laden
Geavanceerd gebruik
Gebruik van geavanceerde componenten: Java of reguliere expressies
Specifieke logs maken
XML-streams beheren
Code hergebruiken
Workshop: Gebruik van de componenten tJavaRow, tJavaFlex -creatie van logs met tCatch, tDie ... - met behulp van de ingebouwde Java-editor
Talend componenten
Essentiële concepten om Talend Open Studio uit te breiden
Creëren van de component mockup met tJavaFlex / grafische interface
Ontdekking van de Talend forge en zijn community-componenten
Integreren van gedownloade of gemaakte plugins in Talend Open Studio
Workshop: Creëren van van een eenvoudig onderdeel via tJavaFlex, integratie van Talend's smeden componenten