Description
Data Science avec le langage R
What are the aims of the training?
What do you need to know to follow the training?
Training programme
Importation et manipulation des données
Importer des données de formats variés
CSV avec readr, base R
Excel avec readxl
JSON avec jsonlite
Connexion bases de données (dbplyr, DBI)
Aperçu des packages : haven (SPSS, Stata)
Atelier pratique : Importer différents formats de données
Maîtriser la manipulation des données dans R
Filtrage, sélection, mutation
Agrégation et group_by
Tri et réorganisation
Jointures (left_join, inner_join, etc.)
Gestion des valeurs manquantes : is.na, replace_na
Nettoyage des formats de colonnes (dates, facteurs, strings)
Atelier pratique : pipeline complet avec dplyr et tidyr
Visualisation des données
Principes de la data visualisation
Importance de la visualisation exploratoire
Types de graphiques adaptés aux données
Représentations graphiques classiques et avancées
Création de graphiques avec ggplot2
Syntaxe de base
Types : histogrammes, boxplots, scatterplots, bar charts
Facets et thèmes
Atelier pratique : Créer des graphiques statiques avec ggplot2
Visualisations interactives
Introduction à plotly pour ggplot
Cartes interactives avec leaflet (optionnel)
Atelier pratique : Transformer un ggplot en graphique interactif
Statistiques descriptives et inférentielles
Écrire des statistiques descriptives à l'aide de R
Moyenne, médiane, écart-type
Résumés et quantiles
Tableaux de fréquence
Outils pour la description statistique
Atelier pratique : Résumer un jeu de données réelles
Tests d’hypothèses
t-tests (une ou deux échantillons)
ANOVA
Test du chi-deux
Corrélation de Pearson et Spearman
Packages : base R, broom
Atelier pratique : Réaliser et interpréter des tests statistiques
Modélisation statistique et Machine Learning
Analyse descriptive des datasets multivariés et techniques de réduction dimensionnelle
ACP (Analyse en Composantes Principales)
Packages : FactoMineR, factoextra
Analyse Factorielle des Correspondances (AFC)
Atelier pratique : Réaliser une ACP et interpréter les axes
Algorithmes supervisés avec études de cas sur R
Régression linéaire simple et multiple (lm)
Régression logistique (glm)
Analyse des résidus
Visualisation des résultats
Exemple pratique sur un jeu de données
Atelier pratique : Ajuster et interpréter des modèles supervisés
Algorithmes non supervisés avec études de cas sur R
K-means clustering
Préparation des données
Choix du nombre de clusters
Visualisation des clusters
Atelier pratique : Segmenter des données avec k-means
Introduction à l’Analyse des séries temporelles
Composantes d’une série
Modèles ARIMA, SARIMA avec forecast
Visualisation des prévisions
Atelier pratique : Prévoir des valeurs avec ARIMA



Chargement...