• FNE

Formation Data Science : Natural Language Processing (NLP) et Speech Recognition

Devenir un expert du langage écrit et parlé avec Python

5 sur 5 étoiles

5 étoiles
100%
4 étoiles
0%
3 étoiles
0%
2 étoiles
0%
1 étoile
0%
Voir l'avis
(1 avis)
Durée 3 jours
Niveau Intermédiaire
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence DNLP
Éligible CPF Non

Les données non structurées issues du langage sont omniprésentes en entreprise (mails, appels téléphoniques, visio, réunions, avis, commentaires, etc.) mais ne sont que rarement utilisées. Les progrès en Deep Learning ont toutefois permis de rendre plus accessible l'exploitation des données voix et texte.

Cette formation Data Science NLP & Speech Recognition prépare les data scientists à maîtriser les données texte et voix au sein d'un contexte technologique innovant et en particulier au cours d'un projet d'Intelligence Artificielle.

À travers des exercices, vous apprendrez à structurer et créer des modèles de machine learning sur ces données du langage. À la fin de la session, vous disposerez d'une compréhension solide du potentiel et de l'état de l'art en Natural Language Processing (NLP) et en Speech Processing. Les mises en pratique vous permettront d'être indépendant pour déployer et créer de la valeur sur ces données, et devenir un expert du traitement automatique du langage écrit et parlé.

Objectif opérationnel :

Savoir structurer des modèles de machine learning et maîtriser le traitement automatique du langage écrit et parlé.

Objectifs pédagogiques :

À l'issue de cette formation Data Science NLP & Speech Recognition, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Savoir structurer les données texte et voix
  • Savoir analyser un volume conséquent de données texte et/ou voix et appliquer des modèles de machine learning
  • Savoir traiter de la voix et/ou du texte en temps réel
  • Savoir mettre en place une recherche intelligente dans des documents et/ou enregistrements audio
  • Savoir créer des modèles de détection d'intention, d'entités

Public :

Ce cours Data Science NLP & Speech Recognition s'adresse aux :

  • Analystes
  • Statisticiens
  • Architectes
  • Développeurs
  • Data scientists
  • Machine Learning Engineers

Prérequis :

Pour suivre cette formation Data Science NLP & Speech Recognition, il est nécessaire d'avoir des connaissances générales sur le Machine Learning ainsi qu'en statistiques. Des notions de base en Python sont également demandées.
Il est par ailleurs indispensable d'avoir suivi une formation d'introduction à la Data Science telle que la formation Data Scientist : Les fondamentaux de la Data Science (OFDS).

Jour 1

Introduction au domaine de l'analyse du texte et de la voix

NLP, NLU, Speech processing et understanding

Natural Language Processing (NLP)

Les bases du NLP : encoding, regex, tokenisation(n-grams) bag of words
NLP : la réduction de dimensions
Nettoyer le texte : stemming, lemmatisation
Topic modeling : SVD, NMF, LDA
Word embedding : Word2vec, FastText, etc.

Information Retrieval (IR) : créer un moteur de recherche

Indexation de contenu, moteur recherche simple
Réaliser un moteur de recherche intelligent

Jour 2

Natural Language Understanding (NLU)

Les cas d’usages au travers de mises en pratique :
- Créer un modèle simple d’analyse de sentiments
- Créer un modèle simple de détection d’intention
- Créer un modèle simple de détection d'entités NER
Méthodologie avancée :
- Mettre en place un modèle de machine learning sur du texte (analyse de sentiment, etc.)
- Modélisation deep learning : Sequence, Bert, HuggingFace
Consommer une API de NLP :
- Utiliser une API externe

Jour 3

Speech Processing

Introduction à la donnée audio : signal numérique, encodage
Speech recognition :
- Entraîner un modèle de speech to text (trigger word detection)
- Utiliser un modèle de speech to text complet (API Cloud, modèle pré-entraîné)

Speech Understanding

Les cas d’usages :
- Détection intention
- Analyse de sentiments
Speech analysis :
- Représentation : transformée de Fourier, spectrogramme mel MFCC, (librosa, pyaudio)
- Les particularité du langage parlé : syntaxe, gestion du débit de parole, erreur de transcription
- Speaker Embedding : caractériser le timbre, l’intonation de la voix

Date de mise à jour du programme : 08/04/2024

Dates et lieux

Du 09 au 11 décembre 2024
En bonne voie de maintien
Lieu
Paris
Durée
3 jrs
2500 € HT

Avis des participants à la formation Data Science : Natural Language Processing (NLP) et Speech Recognition

Note moyenne de 5/5(1)

Les avis figurant ci-dessous sont issus des fiches d’évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions.

GRAIRIA Mohamed
5/5


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB