Formation Logiciel R - L'indispensable de la Data Science avec R

Durée 4 jours
Niveau Intermédiaire
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence ARDS

La Data Science avec R repose sur la maîtrise de techniques d'exploration de données fondamentales : statistiques descriptives, prédictives ou exploratoires. Ce stage pratique vous présentera les méthodes indispensables en Data Science sous RStudio.

Concrètement, ce cours Data Science avec R vous apprendra à :

  • Savoir utiliser des méthodes d’exploration de données
  • Comprendre le principe de la modélisation statistique
  • Choisir entre la régression et la classification
  • Mettre en œuvre une évaluation des performances prédictives d'un modèle

Public :

Cette formation Data Science avec R s'adresse aux responsables infocentres (Datamining, Marketing, Qualité...), aux utilisateurs et gestionnaires métiers de bases de données, ainsi qu'aux futurs Data Scientists.

Prérequis :

Pour suivre cette formation à la Data Science avec R, il est nécessaire d'avoir des connaissances de base du logiciel R ainsi qu'en statistiques. La formation Logiciel R - Prise en main (réf. ARPM) et la formation Comprendre les statistiques pour le Big Data ou la Business Intelligence (réf. ACST) peuvent vous apporter ces connaissances.

Rappels du langage R

Les types de données dans R
Importation et exportation de données
Techniques pour tracer des courbes et des graphiques

Analyse en composantes

Analyse en composantes principales
Analyse factorielle des correspondances
Analyse des correspondances multiples

Exercices

La modélisation

Les algorithmes supervisés et non supervisés
Le choix entre la régression et la classification
Les étapes de construction d'un modèle

Les algorithmes non supervisés

Le clustering hiérarchique
Le clustering non hiérarchique
Les approches mixtes

Exercices

Les algorithmes supervisés

Le principe de régression linéaire univariée
La régression multivariée
La régression polynomiale
La régression logistique
Le Naive Bayes
L’arbre de décision
Les K plus proches voisins

Exercices

Procédures d'évaluation de modèles

Les techniques de ré-échantillonnage en jeu d'apprentissage, de validation et de test
Mesures de performance des modèles prédictifs
Matrice de confusion, de coût et la courbe ROC et AUC

Exercices

Analyse de donnees textuelles

Quelques packages utiles
Cas de la régression linéaire multiple
Cas de l'analyse en composantes principales ACP
Cas de la classification CAH

Exercices


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB