
Module C7
La formation “Programmation de la base de données HBase” a vocation à former des développeurs au stockage de données avec la base orientée colonnes HBase de Hadoop.
Cette formation s’adresse à des populations de formation en informatique (développeurs) ayant une solide connaissance du Java et à l’aise avec les outils de développement Java comme Eclipse ou IntelliJ, Maven etc.
Programme
Jour 1 : Tour HBase
- Rappels rapides sur l’écosystème Hadoop
- L’historique de HBase
- Les bases de données NoSQL et la nécessité de la dé-normalisation des données
- La représentation des données : les régions et HFiles
- Le principe de partitionnement automatique
- L’architecture de HBase : HBase master, regions serveurs et zookeeper
- L’installation de HBase en mono serveur et multi serveurs avec TP
- Le Shell de HBase avec les primitives principales (création de tables, destruction de
- Le pré-partitionnement des tables HBase en bulk load
- La surveillance et la gestion des régions
Jour 2 : Programmation de Hbase en Java
- L’API Java de HBase avec TP
- Interface avec Hadoop Map Reduce avec TP
- Interface avec Hadoop Spark avec TP
Jour 3 : Le SQL avec Hbase
- Le driver Phoenix
- Requêter HBase en SQL
- Intégrer HBase avec des outils de visualisation