- Référence : MDSA
- Durée : 3 jours (21h)
- Lieu : Au choix. À distance ou en présentiel, à Paris ou en Régions
2500€ HT
Choisir une date et RéserverVous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...
Dans l'univers du Big Data, le rôle du data scientist joue est primordial pour valoriser les données.
Cette formation Data Scientist Avancé vous apprend les modèles statistiques et les techniques d'analyse des données qui vous aideront à exploiter vos données.
Ce cours est animé par des data scientists en activité. Ils vous font bénéficier de leur retour d'expérience de modèles réels mis en place chez leurs clients et de leur expérience des compétitions de Data Science.
Objectif opérationnel :
Savoir exploiter vos données.
Objectifs pédagogiques :
À l'issue de cette formation Data Scientist Avancé vous aurez acquis les connaissances et compétences nécessaires pour :
Public :
le cours s'adresse aux data scientists, analystes, statisticiens, architectes et développeurs souhaitant approfondir leurs connaissances sur la Data Science.
Prérequis :
Pour suivre cette formation, il est recommandé d'avoir des connaissances de base en programmation ou en scripting. Il faut également avoir suivi la Formation "Fondamentaux de la Data Science" (OFDS) ou avoir les connaissances équivalentes.
Ecosystème du Big Data et Data Scientist
Comment modéliser un problème de data science ?
Les différentes familles d’algorithmes (supervisé : classification/régression, non supervisé)
Les algorithmes classiques
Comment évaluer la performance ?
Sur apprentissage et compromis biais/variance
Rappels
Pourquoi ça fonctionne ? Raisons théoriques
Introduction au stacking
Architecture et promesses du stacking
Feature weighted stacking
Mise en application
Un modèle de représentation : le bag of words
Normalisations usuelles
Stemming, lemmatization
Distances (Levenshtein, Hamming, Jaro-Winkler)
Word2Vec
Normalisation
Qu’est ce que la normalisation ?
Quand l’utiliser ?
Réduction de dimension (ACP, TSNE, LSA, etc.)
Transformation et interactions entre variables
Traitement des variables catégorielles à haute dimensionnalité
Création de variables extraites d’arbres (Facebook Trick)
L’origine : le perceptron
Les réseaux de neurones
Deep learning
Objectif : s’affranchir du feature engineering manuel
Convolution
Réseaux récurrent
Cas concret
Reconnaissance de chiffres
Synthèse des points abordés les deux premiers jours
Approfondissement des sujets sélectionnés avec l’intervenant
Le dernier jour de ce stage est entièrement consacré à des mises en pratique
Sélection et participation à une compétition
Le formateur sélectionnera une compétition en cours sur Kaggle qui sera démarrée en jour 3 par l’ensemble des participants
Des travaux pratiques ainsi que des mises en situations concrètes viennent ponctuer cette formation afin de lier théorie à la pratique pour être autonome à l'issue du cours.
Formations Informatique
et Management
en ligne à ce jour
+
Stagiaires dans nos salles
de cours sur
l'année
%
De participants satisfaits
ou très satisfaits de nos
formations
Formateurs experts
validés par
PLB