Formation Logiciel R - Perfectionnement et bonnes pratiques Analyse de données, R studio, dplyr, forecast, stringr, lubridate, jointure, ggplot2, rmarkdown, purrr

Durée 3 jours
Niveau Intermédiaire
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence ARPB

Cette formation Logiciel R - Perfectionnement et bonnes pratiques propose de vous transmettre le savoir-faire d’un développeur R professionnel au niveau de son organisation (à tous les niveaux des bonnes pratiques) et de ses choix techniques. Concrètement, la formation suit le « scénario idéal » qu’il faudrait mettre en œuvre pour livrer le plus rapidement possible un programme efficace et facile à maintenir.

La progression logique commence donc par vous apprendre à maîtriser la configuration de votre environnement (R Studio, dossiers, etc.) puis à faire les bons choix en termes de structures de données et de packages/fonctions pour les manipuler selon un spectre de besoins que l’on a voulu représentatif du quotidien dans l’analyse de données.
Ensuite, vous donnez vie à vos données sous forme de graphiques ou de rapports générés de façon efficace, esthétique et automatisée.
Le dernier chapitre vous montre la puissance de la programmation fonctionnelle et son intérêt dans le cadre de l’analyse de données.

Concrètement à l'issue de cette formation vous serez en mesure de :

  • Savoir organiser son environnement de travail pour fluidifier son processus d’analyse
  • Connaître les packages utilisés dans la plupart des projets professionnels
  • Savoir utiliser les bonnes structures de données pour les manipuler efficacement
  • Savoir visualiser de façon élégante et rapide les données
  • Maîtriser la manipulation des données avec les package dplyr, forecast, stringr, lubridate, etc.
  • Savoir assembler les données (jointure)
  • Savoir représenter graphiquement les données avec le package ggplot2
  • Savoir générer dynamiquement son rapport d’analyse avec rmarkdown
  • Comprendre la programmation fonctionnelle (purrr)

Public :

Ce cours Logiciel R perfectionnement cible les utilisateurs du logiciel R qui souhaitent approfondir leurs connaissances et maîtriser les bonnes pratiques du logiciel R.

Prérequis :

Pour suivre cette formation Logiciel R Perfectionnement, il est important d'avoir des connaissances de base sur le logiciel R : création et manipulation des objets sous R, importation des données, utilisation simple de R en mode console, création de graphiques simples. La formation Logiciel R - Prise en main (ARPM) constitue une excellente portée d'entrée.

Organiser son travail sous R

Travailler en projet R : notion de working directory, workspace, history
Architecture de son projet R : data, plots, images, scripts, etc..
Bonnes pratiques pour la création de fichiers de données
Importation et exportation de fichiers avec le package here
Mettre à jour ses packages
Mettre à jour R et R Studio

Manipuler facilement ses données avec le package dplyr

Introduction au package tidyverse et à la notion de pipe
Filtrer des lignes avec la fonction filter()
Sélectionner des colonnes (variable) avec la fonction select()
Création de nouvelles variables avec la fonction mutate()
Renommer ses variables avec la fonction rename()
Calcul de paramètres par sous-groupes : fonctions group_by() et summarise()
Passage du format wide au format long

Exercices

Manipulation des variables catégorielles avec le package forecats

Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
Modifier l’ordre des modalités
Modifier le nom des modalités

Exercices

Manipuler les chaînes de caractères avec le package stringr

Détection de patterns
Découpage
Gestion des longueurs
Remplacement

Exercices

Manipuler des données de date : utilisation du package lubridate

Convertir les données au format YYYY-MM-DD et HH:MM:SS
Décomposer les éléments d’année, de mois et de jour
Calculer des différences de dates et les exprimer en jours, ou heures

Exercices

Assemblage de tables

Les différentes jointures (par colonne): left join, right join, inner join et full join
Assemblage par lignes
Exemple d’applications pour l’analyse de données

Exercices

Réaliser des représentations graphiques performantes avec le package ggplot2

Le principe des couches successives de ggplot2
Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
Gestion des couleurs, titres, axes et légendes
Représentation des séries temporelles
Utilisation du format long et facetting
Ajouter du texte sur un graphique (ex : équation)
Exporter son graphique : format et résolution
Utilisation des addins esquisse et Colour Picker

Générer dynamiquement son rapport d’analyse avec R Markdown

Principe, formats de sorties (html, docx, pdf)
Les différents éléments d’un fichier Rmd : en-tête, chunk, etc. . .
Gestion des éléments de texte : gras, italique, titre
Gestion des tables
Gestion des images
Gestion des graphiques
Gestion des options des éléments de code
Gestion de la table des matières et numérotation
Les rapports paramétrés : automatisation des rapports d’analyse par sous groupe

Introduction à la programmation fonctionnelle avec le package purrr

Les list
Les fonctions map()
Nested data

Exercices


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB