Machine Learning et Data Mining avec Python
Beschrijving
Python is een van de populairste talen voor Data Science. Naast de makkelijk te leren syntaxis, zijn er talloze bijdragen van de community die bibliotheken aanbieden die het makkelijk maken om gegevens te verwerken, visualiseren en modelleren.
Deze cursus is bedoeld voor iedereen die betrokken is bij datamanagementprojecten of die wil weten hoe Machine Learning en Data Mining werken.
Wat zijn de doelstellingen van de opleiding?
Deze cursus geeft een inleiding tot de concepten en methoden van gegevensanalyse. Het presenteert de gebruikelijke methodologie en de meest gebruikte technieken voor het extraheren van essentiële informatie uit grote hoeveelheden gegevens.
De cursus behandelt de volgende vaardigheden:
- Concepten en technieken voor gegevensanalyse ter ondersteuning van de besluitvorming
- De verschillende stadia en tools voor het exploiteren en verwerken van gegevens
- De belangrijkste dataminingmethoden
De technische inhoud van deze cursus is als volgt
- Gegevensanalyse
- Voorbereiding van gegevens
- Validatiemodellen
- Belangrijkste algoritmen
Wat moet je weten om de cursus te volgen?
Kennis van Python
Opleidingsprogramma
Gegevens voorbereiden
- Data Marts en datawarehouse
- Opschonen van gegevens
Belangrijkste methoden voor gegevensanalyse
- Gesuperviseerde vs. ongesuperviseerde classificatie
- Clusteren
- Classificatie
- Regressie
- Neurale netwerken
- Toepassingskaders en voorbeelden
Validatie van resultaten
- Technieken voor het valideren van resultaten: trainingsset en testset
Praktische oefeningen
De oefeningen die tijdens de trainingssessies worden voorgesteld, zijn gericht op elk concept dat tijdens de cursus wordt gepresenteerd. De oefeningen benaderen de concepten en de moeilijkheidsgraad progressief. Aan het einde van de cursus krijgen de deelnemers een samenvattende oefening om hen te helpen de concepten te integreren.