Data Science
Beschrijving
Deze cursus geeft inzicht in de belangrijkste technieken, methoden en tools die worden gebruikt bij gegevensanalyse. De cursus behandelt: gegevensverzameling, gegevensanalyse, gegevensvisualisatie en het inzetten van gegevens voor gebruikers.
Deze cursus is bedoeld voor mensen met basiskennis van gegevensbeheer.
Wat zijn de doelstellingen van de opleiding?
Deze cursus biedt deelnemers een uitgebreid overzicht van de Data Science-benadering die in het bedrijfsleven kan worden toegepast.
De cursus behandelt de volgende inhoud:
-
De aanpak van gegevenskwaliteit
-
R voor het verwerken van gegevens
-
Voorbeelden van Data Mining en Machine Learning projecten
Wat moet je weten om de cursus te volgen?
Basiskennis van statistiek en algoritmen
Opleidingsprogramma
Gegevensbeheer
- Een inventarisatie maken van de gegevens die in bedrijven worden gebruikt
- De kwaliteit van gegevens controleren
- Gegevensverwerking en -voorbereiding
Een herinnering aan statistiek
- Statistische benadering
- Modelleren
- Tests en betrouwbaarheidsintervallen
De R-taal gebruiken voor prototyping
- Inleiding tot R
- Statistische analyseprogramma's met R
- Gegevens bewerken en visualiseren in R
Datamining in de praktijk brengen
- Een project organiseren
- Stadia
- Belangrijkste technieken
o Classificatie
o Associatie
o Segmentatie
- Beschrijvende methoden
- Beschrijvende methoden
- Classificatie
- Gegevensverwerking