La base de données colonne HBase


Module C7

La formation “Programmation de la base de données HBase” a vocation à former des développeurs au stockage de données avec la base orientée colonnes HBase de Hadoop.

Cette formation s’adresse à des populations de formation en informatique (développeurs) ayant une solide connaissance du Java et à l’aise avec les outils de développement Java comme Eclipse ou IntelliJ, Maven etc.

Programme

Jour 1 : Tour HBase

  • Rappels rapides sur l’écosystème Hadoop
  • L’historique de HBase
  • Les bases de données NoSQL et la nécessité de la dé-normalisation des données
  • La représentation des données : les régions et HFiles
  • Le principe de partitionnement automatique
  • L’architecture de HBase : HBase master, regions serveurs et zookeeper
  • L’installation de HBase en mono serveur et multi serveurs avec TP
  • Le Shell de HBase avec les primitives principales (création de tables, destruction de
  • Le pré-partitionnement des tables HBase en bulk load
  • La surveillance et la gestion des régions

Jour 2 : Programmation de Hbase en Java

  • L’API Java de HBase avec TP
  • Interface avec Hadoop Map Reduce avec TP
  • Interface avec Hadoop Spark avec TP

Jour 3 : Le SQL avec Hbase

  • Le driver Phoenix
  • Requêter HBase en SQL
  • Intégrer HBase avec des outils de visualisation