Formation Logiciel R - Maîtriser le logiciel R

Durée 5 jours
Niveau Intermédiaire
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence ARMM
Éligible CPF Non

R est un logiciel open source dans le domaine des statistiques disponible sur toutes les plate-formes. Il propose toutes les fonctions utiles pour la statistique courante ainsi que de nombreuses extensions (paquets).

Cette formation Maîtriser le logiciel R vous apprend dans un premier temps à programmer avec R ainsi qu’avec les extensions proposées. Elle vous propose ensuite de vous transmettre le savoir-faire d’un développeur R professionnel au niveau de son organisation (à tous les niveaux des bonnes pratiques) et de ses choix techniques.

Cette seconde partie suit le « scénario idéal » qu’il faudrait mettre en œuvre pour livrer le plus rapidement possible un programme efficace et facile à maintenir. Concrètement, vous y apprendrez à maîtriser la configuration de votre environnement (R Studio, dossiers, etc.) puis à faire les bons choix en termes de structures de données et de packages/fonctions pour les manipuler selon un spectre de besoins que l’on a voulu représentatif du quotidien dans l’analyse de données.

Vous donnerez ensuite vie à vos données sous forme de graphiques ou de rapports générés de façon efficace, esthétique et automatisée. Le dernier chapitre vous montrera la puissance de la programmation fonctionnelle et son intérêt dans le cadre de l’analyse de données.

Objectifs opérationnels :

Programmer en R.

Objectifs pédagogiques :

À l'issue de cette formation Maîtriser le logiciel R, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Installer et utiliser l’environnement R
  • Manipuler des données et des objets
  • Programmer avec R
  • Appliquer des méthodes d’analyses statistiques courantes
  • Organiser son environnement de travail pour fluidifier son processus d’analyse
  • Connaître les packages utilisés dans les projets professionnels
  • Manipulaer des données avec les package dplyr, forecast, stringr, lubridate, etc.
  • Assembler les données (jointure)
  • Représenter graphiquement les données avec le package ggplot2
  • Générer dynamiquement un rapport d’analyse avec rmarkdown
  • Comprendre la programmation fonctionnelle (purrr)

Public :

Ce cours Maîtriser le logiciel R s'adresse à tout développeur en environnement statistique ainsi qu'aux utilisateurs futurs du logiciel R, souhaitant tout à la fois le découvrir et en connaître les bonnes pratiques.

Prérequis :

Pour suivre cette formation Maîtriser le logiciel R, il est demandé d'avoir des connaissances préalables de base en statistiques (régression linéaire, échantillonnage) ainsi que des connaissances de base en programmation (variables, boucles, etc.).

Présentation du logiciel R

Introduction au logiciel R
Découvrir le langage R
Le langage R et la concurrence
Mettre en oeuvre le téléchargement et l'installation

Première prise en main du logiciel R

Les Objets

Les Vecteurs
Les Tableaux
Les Listes
Les Matrices
Les Data Frames
Les Tables de contingences

Les Fonctions et programmation R

Fonctions mathématiques
Fonction de manipulation des objets
Opérations ensemblistes
Fonctions dates et chaînes

Génération, gestion et visualisation des données

Analyses statistiques

Régressions linéaires
Analyse en composante principale (ACP)
Classification ascendante hiérarchique

Organiser son travail sous R

Travailler en projet R : notion de working directory, workspace, history
Architecture de son projet R : data, plots, images, scripts, etc..
Bonnes pratiques pour la création de fichiers de données
Importation et exportation de fichiers avec le package here
Mettre à jour ses packages
Mettre à jour R et R Studio

Manipuler facilement ses données avec le package dplyr

Introduction au package tidyverse et à la notion de pipe
Filtrer des lignes avec la fonction filter()
Sélectionner des colonnes (variable) avec la fonction select()
Création de nouvelles variables avec la fonction mutate()
Renommer ses variables avec la fonction rename()
Calcul de paramètres par sous-groupes : fonctions group_by() et summarise()
Passage du format wide au format long

Exercices

Manipulation des variables catégorielles avec le package forecats

Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
Modifier l’ordre des modalités
Modifier le nom des modalités

Exercices

Manipuler les chaînes de caractères avec le package stringr

Détection de patterns
Découpage
Gestion des longueurs
Remplacement

Exercices

Manipuler des données de date : utilisation du package lubridate

Convertir les données au format YYYY-MM-DD et HH:MM:SS
Décomposer les éléments d’année, de mois et de jour
Calculer des différences de dates et les exprimer en jours, ou heures

Exercices

Assemblage de tables

Les différentes jointures (par colonne): left join, right join, inner join et full join
Assemblage par lignes
Exemple d’applications pour l’analyse de données

Exercices

Réaliser des représentations graphiques performantes avec le package ggplot2

Le principe des couches successives de ggplot2
Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
Gestion des couleurs, titres, axes et légendes
Représentation des séries temporelles
Utilisation du format long et facetting
Ajouter du texte sur un graphique (ex : équation)
Exporter son graphique : format et résolution
Utilisation des addins esquisse et Colour Picker

Générer dynamiquement son rapport d’analyse avec R Markdown

Principe, formats de sorties (html, docx, pdf)
Les différents éléments d’un fichier Rmd : en-tête, chunk, etc. . .
Gestion des éléments de texte : gras, italique, titre
Gestion des tables
Gestion des images
Gestion des graphiques
Gestion des options des éléments de code
Gestion de la table des matières et numérotation
Les rapports paramétrés : automatisation des rapports d’analyse par sous groupe

Introduction à la programmation fonctionnelle avec le package purrr

Les list
Les fonctions map()
Nested data

Exercices

Date de mise à jour du programme : 11/12/2020

Dates et lieux

Du 27 au 31 mai 2024
Lieu
Distanciel
Durée
5 jrs
2675 € HT
Du 27 au 31 mai 2024
Lieu
Paris
Durée
5 jrs
2675 € HT
Du 29 juillet au 02 août 2024
Lieu
Distanciel
Durée
5 jrs
2675 € HT
Du 29 juillet au 02 août 2024
Lieu
Paris
Durée
5 jrs
2675 € HT
Du 30 septembre au 04 octobre 2024
Lieu
Distanciel
Durée
5 jrs
2675 € HT
Du 30 septembre au 04 octobre 2024
Lieu
Paris
Durée
5 jrs
2675 € HT
Du 25 au 29 novembre 2024
Lieu
Distanciel
Durée
5 jrs
2675 € HT
Du 25 au 29 novembre 2024
Lieu
Paris
Durée
5 jrs
2675 € HT


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB