Formation Cassandra Avancé Maîtriser les fonctionnalités avancées d'Apache Cassandra

Durée 3 jours
Niveau Avancé
Classe à distance
Possible

Vous pouvez suivre cette formation en direct depuis votre domicile ou votre lieu de travail. Plus d'informations sur notre solution de classe à distance...

Référence CASA

Cassandra est une base de données distribuée NoSQL connue pour ses capacités à savoir gérer sans défaillance de très grosses quantités de données structurées.

Cette formation explore les fonctionnalités avancées de Cassandra pour vous permettre d'en approfondir votre niveau de maîtrise : mise en place d'un cluster, communication multi-DC, tuning des performances, sécurisation...

Objectifs Opérationnels :

Maîtriser les aspects avancés de la base de données NoSQL Cassandra.

Objectifs Pédagogiques:

  • Savoir mettre en place un cluster Cassandra
  • Connaître le cycle de vie d'une lecture/écriture sur Cassandra
  • Maîtriser les notions de backup, de restauration et de mouvement des données
  • Savoir comment superviser et dépanner Cassandra
  • Connaître l'aspect sécurité de Cassandra

Public :

Ce cours Cassandra avancé s'adresse aux chefs de projet, gestionnaires de bases de données et administrateurs qui souhaitent maîtriser les aspects avancés d'Apache Cassandra.

Prérequis :

Pour suivre cette formation Cassandra avancé dans de bonnes conditions, il est conseillé d'avoir suivi la formation Cassandra (réf.OCAS) ou d'en posséder les connaissances équivalentes.

Rappel de l’architecture Cassandra

Cluster / Node / Datacenter / Rack
Réplication / Protocole Gossip
Snitches
Noeuds Seeds
Memtables, SSTables et CommitLogs
Niveau de consistance
Hinted Handoff

Query by Design

Data-Driven versus Query-Driver
Liens entre tables et intégrité référentielle
Duplication de données
Étapes de conception d’un keyspace

Mise en place d’un cluster Cassandra

Choix de mémoire, CPU
Contraintes réseau
Choix du stockage
Configuration du cluster (Datacenter, Rack et autres)
Gestion du cycle de vie du cluster

Cycle de vie d’une lecture/écriture sur Cassandra

Mémoire Off-Heap / JVM-Heap et disque
Comprendre le flush, memtable et commitLog
Chemin d’écriture des données
Chemin de lecture des données
Le Read-repair, Merkel Tree et Anti-Entropy

Communication multi-DC sur Cassandra

Raisons de choix d’une architecture multi-DC
Communication synchrone vs asynchrone entre DCs
Gestion de la défaillance d’un DC
Utilisation des Racks au lieu de Datacenter

Backup, restauration et mouvement des données

Backup incrémental et full
Restauration des données à partir d’un Snapshot
Restauration de données avec sstableLoader
Import/Export des données en masse

Supervision et troubleshooting

Gestion des nœuds d’un cluster
Monitoring avec l’outil nodetool
Configuration et exploitation des logs

Tuning des performances de Cassandra

Utilisation de Tracing pour analyser les performances
Tracer les lectures et les écritures
Tuning des Bloom Filtres
Cache de données
Paramètres globaux de gestion de cache
Tests de montée en charge avec cassandra-stress

Stratégies de compaction

SizeTieredCompactionStrategy
LeveledCompactionStrategy
TimeWindowCompactionStrategy
Tuning de la JVM

Sécurisation de Cassandra

Configuration Authentification
Gestion des rôles
Cryptage de la communication dans Cassandra avec SSL
Activation du cryptage inter-nœuds
Activation du chiffrement client


Formations Informatique
et Management
en ligne à ce jour

+
Stagiaires dans nos salles
de cours sur
l'année

%
De participants satisfaits
ou très satisfaits de nos
formations


Formateurs experts
validés par
PLB