Introduction au Data Mining
Beschrijving
De cursus omvat de volgende technische inhoud:
-
Inleiding
-
De belangrijkste technieken
-
Evaluatie van modellen
Wat zijn de doelstellingen van de opleiding?
De doelstellingen van deze cursus zijn als volgt:
-
De basisprincipes en het belang van datamining in een professionele context begrijpen.
-
Vertrouwd raken met de belangrijkste dataminingmethoden en -tools.
-
De resultaten van datamining kunnen analyseren en interpreteren.
-
Een begin maken met de praktische toepassing van datamining op echte gegevens.
Wat moet je weten om de cursus te volgen?
-
Basiskennis statistiek en IT
-
Basiskennis Python
Opleidingsprogramma
Inleiding tot datamining
Wat is datamining?
Geschiedenis en ontwikkeling
Toepassingen en voordelen op de werkplek
Het dataminingproces
○ Het CRISP-DM proces (Cross-Industry Standard Process for Data Mining)
○ Verzamelen en voorbereiden van gegevens
De gegevens begrijpen
Basistechnieken en -methoden
Classificatie
Regressie
Clusteren
Geavanceerde dataminingtechnieken
Associatie en associatieregels (bijv. Apriori algoritme)
○ Technieken voor dimensiereductie (bijv. PCA)
-
Modelevaluatie
○ Kruisvalidatietechnieken
○ Prestatiemetingen (precisie, recall, AUC-ROC, enz.)
Praktische oefeningen
○ Praktische workshop over een zakelijke casestudy (bijvoorbeeld analyse van klantloyaliteit).
○ Analyse en interpretatie van resultaten.
Perspectieven en trends
○ De rol van AI in datamining
○ Integratie van datamining in de bedrijfsstrategie
Praktische oefeningen
De oefeningen die tijdens de trainingen worden voorgesteld, richten zich op elk concept dat tijdens de training wordt gepresenteerd. De oefeningen benaderen de concepten en de moeilijkheidsgraad op een progressieve manier. Aan het einde van de cursus krijgen de deelnemers een samenvattende oefening om hen te helpen de concepten te integreren. De oefeningen zijn als volgt:
-
Verkennende gegevensanalyse: Gebruik een set gegevens om een beschrijvende analyse uit te voeren. (bijvoorbeeld: gemiddelde, mediaan, modus, standaardafwijking)
-
Gebruik van een dataminingtool: Voer met behulp van software een eenvoudige classificatie uit op een gegevensset.
-
Clustering: Een dataset gebruiken om verschillende groepen of segmenten te identificeren.
-
Associatieregels: Op basis van een transactiedataset bepalen welke artikelen vaak samen worden gekocht.
-
Modelevaluatie: Evalueer de prestaties van een classificatiemodel op een testdataset.



Een ogenblik, aub...