Talend Open Studio Data Integration : Initiation + Approfondissement

Loader DigitalCityEen ogenblik, aub...

Talend Open Studio Data Integration : Initiation + Approfondissement

(Réf.305)
35
Uur/Uren
Werkzoekende
Betalend

Georganiseerd door:

Wat zijn de doelstellingen van de opleiding?

Het data-integratieproces begrijpen - De Talend Open Studio tool en de componentenbibliotheek beheersen

Opleidingsprogramma

Inleiding

Data integratie vraagstukken
Operationele en Business Intelligence integratie
Beschikbare ETL (Extract TransformLoad) tools
Talend Open Studio: presentatie, licenties, koppeling met Eclipse
Beschikbare ondersteuning: documentatie, community,...

Workshop: Installatie en presentatie van de Talend Open Studio omgeving

Ontdekken van de interface

Talend perspectieven en views
Gebruik van de BusinessModeler
Jobs: grid, component palet
Hoofdstromen
Het begrip schema: kolomtypes
Eerste componenten: input, output, flow generatie

Praktische workshop: een eenvoudige opdracht creëren en uitvoeren, inhoud in een bestand genereren

Talend's belangrijkste componenten

Invoercomponenten (tFileInput,tMysqlInput, ...)
Content generatie (tRowGenerator,tFixedFlowInput, ...)
Output en weergave (tLogRow, tFileOutput,tMysqlOutput, ...)
Logica en chaining van componenten
Stap voor stap traceren van de jobuitvoering
Beheer van projecten
Eenvoudige transformaties (filter, sort, replace, join)

Praktische workshop: inhoud genereren in een database, gegevens extraheren en verwerken voor weergave in de console

Waarborgen van de duurzaamheid van banen

Versies en status van jobs
Metagegevens: eigenschappen en schema's.
Schema zoeken voor CSV-bestanden
Schema's ophalen uit databases
Taken bijwerken op basis van metagegevens

Praktische workshop: gegevensbronnen en -doelen invoegen in de metagegevens van het archief

Variabelen en contexten

Variabelen gebruiken in een taak (tSetGlobalVar)
Een context lokaal voor de taak instellen
Contextgroepen in het archief
Metadata als context

Praktische workshop: gebruik van een variabele in een job, contextualiseren van de parameters van een metagegevens, creëren van een test- en productiecontext

Gegevens mapping: tMap

De ETL-component bij uitstek
Inputs beheren: primaire en secundaire streams, naamgeving van streams
Outputs beheren: de geïntegreerde editor van tMap
Gegevens filteren: input, output
Gezamenlijke outputs, outputweigeringen vastleggen, interne join
De expressie-editor
Prestaties

Praktische workshop: multi-bron, multi-bestemming extractie met een tMap, op een compleet voorbeeld

Job orchestratie, foutenbehandeling

Parallelle uitvoering van sub-jobs
Talend triggers
Opeenvolging van subjobs en componenten (OnSubjobOK, OnComponentOK)
Behandeling van fouten bij componenten, subjobs (OnComponentError, OnSubjobError)
Starten en beëindigen van componenten (tPreJob, tPostJob)
Fouten opvangen en verwijderen: tWarn, tDie, tLogCatcher

Praktische workshop: verschillende jobs samenvoegen tot één, foutafhandeling om een rapportbestand te genereren

Programmeringsstromen: iterate links

Onderscheid maken tussen hoofd- en iteratiestromen
Loops en scheduling via tLoop, tForeach
Overschakelen van een hoofdstroom naar een iteratiestroom, en vice versa (tFlowToIterate, tIterateToFlow)
Synchroniseren van jobs met tWaitForFile, tWaitForSocket, tWaitForSQL

Praktische workshop: paralleliseren van sub-jobs, synchroniseren van jobs met een eventénementexterne

Geavanceerd gebruik

Geavanceerde componenten gebruiken : Java of reguliere expressies
De specificiteit van XML-feeds in Talend
Hergebruik van code: routines

Workshop: Gebruik van tJavaRow, tJavaFlex componenten, gebruik van de embedded Java editor, een aangepaste routine implementeren

Debuggen in Talend

Herinneringen over het debuggen van sporen
Gebruik van de DebugJava-modus: Debug-perspectief, stapsgewijze modus
Variabelen bekijken en hot-modificeren

Workshop: Basis debuggen/voortzetten van taken

Stationering en industrialisering

Herinnering over contexten
Exporteren van jobs voor uitvoering op een server
Context schakelen tussen jobs, tijdens runtime
Gebruik van een bestand om de context te laden (tContextLoad)

Workshop: Taken inzetten en dynamische context laden

Geavanceerd gebruik

Gebruik van geavanceerde componenten: Java of reguliere expressies
Specifieke logs maken
XML-streams beheren
Code hergebruiken

Workshop: Gebruik van de componenten tJavaRow, tJavaFlex -creatie van logs met tCatch, tDie ... - met behulp van de ingebouwde Java-editor

Talend componenten

Essentiële concepten om Talend Open Studio uit te breiden
Creëren van de component mockup met tJavaFlex / grafische interface
Ontdekking van de Talend forge en zijn community-componenten
Integreren van gedownloade of gemaakte plugins in Talend Open Studio

Workshop: Creëren van van een eenvoudig onderdeel via tJavaFlex, integratie van Talend's smeden componenten

Deze cursus verschijnt in de catalogus Dawan maar er zijn nog geen data gepland.