- Référence : DNLP
- Durée : 3 jours (21h)
- Lieu : Au choix. À distance ou en présentiel, à Paris ou en Régions
2500€ HT
Choisir une date et RéserverVous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...
Les données non structurées issues du langage sont omniprésentes en entreprise (mails, appels téléphoniques, visio, réunions, avis, commentaires, etc.) mais ne sont que rarement utilisées. Les progrès en Deep Learning ont toutefois permis de rendre plus accessible l'exploitation des données voix et texte.
Cette formation Data Science NLP & Speech Recognition prépare les data scientists à maîtriser les données texte et voix au sein d'un contexte technologique innovant et en particulier au cours d'un projet d'Intelligence Artificielle.
À travers des exercices, vous apprendrez à structurer et créer des modèles de machine learning sur ces données du langage. À la fin de la session, vous disposerez d'une compréhension solide du potentiel et de l'état de l'art en Natural Language Processing (NLP) et en Speech Processing. Les mises en pratique vous permettront d'être indépendant pour déployer et créer de la valeur sur ces données, et devenir un expert du traitement automatique du langage écrit et parlé.
Objectif opérationnel :
Savoir structurer des modèles de machine learning et maîtriser le traitement automatique du langage écrit et parlé.
Objectifs pédagogiques :
À l'issue de cette formation Data Science NLP & Speech Recognition, vous aurez acquis les connaissances et compétences nécessaires pour :
Public :
Ce cours Data Science NLP & Speech Recognition s'adresse aux :
Prérequis :
Pour suivre cette formation Data Science NLP & Speech Recognition, il est nécessaire d'avoir des connaissances générales sur le Machine Learning ainsi qu'en statistiques. Des notions de base en Python sont également demandées.
Il est par ailleurs indispensable d'avoir suivi une formation d'introduction à la Data Science telle que la formation Data Scientist : Les fondamentaux de la Data Science (OFDS).
Introduction au domaine de l'analyse du texte et de la voix
NLP, NLU, Speech processing et understanding
Natural Language Processing (NLP)
Les bases du NLP : encoding, regex, tokenisation(n-grams) bag of words
NLP : la réduction de dimensions
Nettoyer le texte : stemming, lemmatisation
Topic modeling : SVD, NMF, LDA
Word embedding : Word2vec, FastText, etc.
Information Retrieval (IR) : créer un moteur de recherche
Indexation de contenu, moteur recherche simple
Réaliser un moteur de recherche intelligent
Natural Language Understanding (NLU)
Les cas d’usages au travers de mises en pratique :
- Créer un modèle simple d’analyse de sentiments
- Créer un modèle simple de détection d’intention
- Créer un modèle simple de détection d'entités NER
Méthodologie avancée :
- Mettre en place un modèle de machine learning sur du texte (analyse de sentiment, etc.)
- Modélisation deep learning : Sequence, Bert, HuggingFace
Consommer une API de NLP :
- Utiliser une API externe
Speech Processing
Introduction à la donnée audio : signal numérique, encodage
Speech recognition :
- Entraîner un modèle de speech to text (trigger word detection)
- Utiliser un modèle de speech to text complet (API Cloud, modèle pré-entraîné)
Speech Understanding
Les cas d’usages :
- Détection intention
- Analyse de sentiments
Speech analysis :
- Représentation : transformée de Fourier, spectrogramme mel MFCC, (librosa, pyaudio)
- Les particularité du langage parlé : syntaxe, gestion du débit de parole, erreur de transcription
- Speaker Embedding : caractériser le timbre, l’intonation de la voix
Les avis figurant ci-dessous sont issus des fiches d’évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions.
Formations Informatique
et Management
en ligne à ce jour
+
Stagiaires dans nos salles
de cours sur
l'année
%
De participants satisfaits
ou très satisfaits de nos
formations
Formateurs experts
validés par
PLB