Deze tekst werd automatisch vertaald door een online vertaler (DeepL) om als leidraad te dienen, om de inhoud van de informatie over de opleiding te helpen begrijpen. Wij wijzen alle verantwoordelijkheid voor de inhoud ervan af. Indien u wenst te reageren op deze vertaling, kunt u een e-mail sturen naar helpdesk@digitalcity.brussels.
ETL avec Talend
Beschrijving
Data warehousing bestaat uit het beschikbaar maken van informatie uit een of meer databases in een vorm die gemakkelijk en snel kan worden gebruikt door de verschillende gekoppelde rapporten. ETL is het instrument dat het mogelijk maakt een datawarehouse op te bouwen uit relationele brongegevensbanken.
Deze training betreft de werking van de Talend ETL tool. Tijdens deze opleiding zullen de deelnemers in staat zijn om: een datawarehouse te modelleren, transformatie regels van relationele databases te definiëren, de integratie te plannen en de resultaten te valideren.
De technische inhoud van deze cursus is
- Logisch ontwerp van een data warehouse
- Fysiek ontwerp van een data warehouse
- ETL met Talend
- Optimalisatie
- Variabelen, uitdrukkingen en joins
- Runtime statistieken
Wat zijn de doelstellingen van de opleiding?
De opleiding is gericht op de volgende vaardigheden
- Ontwerpen en ontwikkelen van jobs in de Talend ETL-applicatie
- Optimaliseer de ontwikkelde banen door gebruik te maken van contexten en datasets
- Complexere transformaties uitvoeren met variabelen, expressies en joins
- Een opdracht uitvoeren en debuggen, uitvoeringsstatistieken plotten
Wat moet je weten om de cursus te volgen?
Geen vereisten.
Opleidingsprogramma
Modeleer de behoefte, ontwerp een eerste baan
- Business Modeler. Job Ontwerper
- Hoofdverbindingen. CSV- en XML-componenten
- Eenvoudige transformatiecomponenten
- Gegenereerde code bekijken, een opdracht uitvoeren
Optimaliseer de ontwikkeling van de werkgelegenheid
- Configureer herbruikbare verbindingen met behulp van metadata
- Update metadata en propageer ze naar jobs, importeer/exporteer metadata
- Taken opzetten met contexten
- Externaliseer context variabelen in ".properties" en ".ini" bestanden
- Creëer en beheer eigen variabelen
- Genereer gegevensreeksen voor tests
Werken met databanken
- Ondersteunde databases en hoofdcomponenten
- Het opzetten van operaties op tabellen
- Metagegevens en verbindingscontext naar een databaseschema
- Delen van verbindingen en transactiebeheer
- Query's maken met SQLBuilder
Werken met gegevens uit meerdere bronnen
- Inleiding tot de tMap component
- Invoerstromen opzetten, joins maken
- Transformaties uitvoeren met variabelen, expressies en joins
- Gegevens kwalificeren met filters
- Genereren van meerdere outputs, beheren van afkeuringen
Aanvullingen
- Een job opsplitsen in sub-jobs, met behulp van de tRunJob. Taken starten vanaf de opdrachtregel. Periodieke uitvoering
- Debuggen van een opdracht, traceren van uitvoeringsstatistieken
- Rapportage tJasperOutput