- Référence : ARDS
- Durée : 4 jours (28h)
- Lieu : Au choix. À distance ou en présentiel, à Paris ou en Régions
2390€ HT
Choisir une date et Réserver4.5 sur 5 étoiles
Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...
La Data Science avec R repose sur la maîtrise de techniques d'exploration de données fondamentales : statistiques descriptives, prédictives ou exploratoires.
Cette formation Logiciel R vous présentera les méthodes indispensables en Data Science sous RStudio.
Objectif opérationnel :
Savoir maîtriser les méthodes indispensables en Data Science sous RStudio.
Objectifs pédagogiques :
Concrètement, à l'issue de cette formation Logiciel R vous aurez acquis les connaissances et les compétences nécessairesp pour :
Public :
Cette formation Data Science avec R s'adresse aux responsables infocentres (Datamining, Marketing, Qualité...), aux utilisateurs et gestionnaires métiers de bases de données, ainsi qu'aux futurs Data Scientists.
Prérequis :
Pour suivre cette formation à la Data Science avec R, il est nécessaire d'avoir des connaissances de base du logiciel R ainsi qu'en statistiques. La formation Logiciel R - Prise en main (réf. ARPM) et la formation Comprendre les statistiques pour le Big Data ou la Business Intelligence (réf. ACST) peuvent vous apporter ces connaissances.
Les types de données dans R
Importation et exportation de données
Techniques pour tracer des courbes et des graphiques
Analyse en composantes principales
Analyse factorielle des correspondances
Analyse des correspondances multiples
Exercices
Les algorithmes supervisés et non supervisés
Le choix entre la régression et la classification
Les étapes de construction d'un modèle
Le clustering hiérarchique
Le clustering non hiérarchique
Les approches mixtes
Exercices
Le principe de régression linéaire univariée
La régression multivariée
La régression polynomiale
La régression logistique
Le Naive Bayes
L’arbre de décision
Les K plus proches voisins
Exercices
Les techniques de ré-échantillonnage en jeu d'apprentissage, de validation et de test
Mesures de performance des modèles prédictifs
Matrice de confusion, de coût et la courbe ROC et AUC
Exercices
Quelques packages utiles
Cas de la régression linéaire multiple
Cas de l'analyse en composantes principales ACP
Cas de la classification CAH
Exercices
Les avis figurant ci-dessous sont issus des fiches d’évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions.
Formations Informatique
et Management
en ligne à ce jour
+
Stagiaires dans nos salles
de cours sur
l'année
%
De participants satisfaits
ou très satisfaits de nos
formations
Formateurs experts
validés par
PLB