• NEW
  • FNE

Formation Dataiku Data Science Studio (DSS) : exploitez vos données grâce aux méthodes prédictives

Étudier, exploiter, traiter et convertir ses données en modèles prédictifs
Durée 2 jours
Niveau Fondamental
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence DDSS
Éligible CPF Non

Développée par la société française Daitaku, Daitaiku Data Science Studio (DSS) est une plateforme d'analyse des données spécialisée dans les méthodes prédictives en environnement Big Data. Cette plateforme couvre la mise en production, la compliance, la préparation des données et bien sûr leur exploitation.

Daitaku Science Studio se caractérise notamment par son aspect collaboratif autorisant plusieurs collaborateurs à travailler sur un projet commun de Data Science. Les développeurs peuvent intervenir dessus via les langages R, Python ou encore SQL mais il est aussi possible de la déployer intégralement sur un acteur de cloud (AWS par exemple). Différents plugins viennent quant à eux élargir la personnalisation de l'interface par le biais de composants tels que la traduction linguistique, la météo ou encore les systèmes de recommandation.

Cette formation Daitaku vous apprend à configurer et à utiliser Dataiku Data Science Studio pour tirer le plus grand bénéfice de vos données grâce aux méthodes prédictives.

Objectif opérationnel :

Savoir installer, configurer et utiliser Dataiku DSS depuis l'interface web ou des API.

Objectifs pédagogiques :

À l'issue de cette formation Dataiku, vous aurez acquis les connaissances nécessaires pour :

  • Installer et configurer Dataiku DSS
  • Savoir utiliser le logiciel depuis l'interface ou depuis des API
  • Être capable de préparer vos données dans Dataiku DSS
  • Comprendre comment manipuler les graphiques et les statistiques

Public :

Ce cours s'adresse aux chefs de projets, développeurs, data scientists et utilisateurs de Dataiku DSS.

Prérequis :

Pour suivre cette formation Dataiku, il est nécessiare d'avoir des connaissances des principes de la manipulation de données et du machine learning.

Présentation et concepts de Dataiku DSS

Fonctionnalités
Mise à disposition des méthodes et outils de data-sciences à partir d'une interface graphique ou de langages de requêtage ou de programmation (Python, SQL, R), principe de "Self Service Analytics"
Cluster DSS : Design, Deployer, Api, Automation et Govern Nodes
Notions de projet, data, dataset, recipes
Outils collaboratif : Wiki, tags, discussions...
Premiers pas avec Dataiku DSS : exemples

Connexion aux données

Connecteurs disponibles, formats de fichiers, formats spécifiques Hadoop/Spark
Chargement des fichiers, emplacement des fichiers,
Système de fichiers, HDFS, Amazon S3, stockage Google Cloud, etc ...
FTP, connexion ssh, connexion aux bases de données SQL
Autres stockages : Cassandra, MongoDB, Elasticsearch, ...

Préparation des données

Scripts de préparation, échantillonnage, exécution
Les différents moteurs d'exécution: DSS, Spark, base de données SQL

Graphiques et statistiques

Présentation des types de graphiques disponibles et configuration
Échantillonnage et exécution, graphiques de base, tables, nuages de points, visualisation cartographique, etc ...
Réalisation d'exercices pratiques
Fonctionnalités statistiques disponibles, démonstrations

Machine learning

Le laboratoire
Fonctionnalités disponibles : apprentissage supervisé et non supervisé, algorithmes utilisés, scoring, deep learning...
Évaluation, optimisation, compréhension du modèle
Déploiement et cycle de vie du modèle

Flow / Recipes

Interface graphique de gestion des cycles de traitement, des datasets, des traitements, paramètrage de l'exécution en parallèle, des données géographiques, export en format pdf ou images, etc ...Travaux pratiques

Interfaces de programmation

Présentation des différentes interfaces : SQL, Python, R
Exemples d'interrogations SQL et Python
Interfaçage avec Spark
Date de mise à jour du programme : 10/06/2024

Dates et lieux

Aucune session programmée actuellement.

Ces formations peuvent aussi vous intéresser :

  • Niveau : Fondamental
  • Référence : ACST

Big Data, Datavisualisation, VOSviewer

  • Niveau : Intermédiaire
  • Référence : AGEP

  • Niveau : Fondamental
  • Référence : DIGU

  • Niveau : Intermédiaire
  • Référence : OAPO


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB