
Module M18
La formation « BI avec Spark SQL » a vocation à former des analystes au développement d’analyses et de rapports de types BI avec Spark SQL et des outils uniquement open source.
Cette formation s’adresse à des populations de formation en informatique ayant une solide connaissance du SQL.
Programme BI avec Spark SQL et Hive
- Eléments de Spark permettant de faire du Spark SQL : les Data Frames
- Lire ses données depuis les fichiers les plus utilisés (PARQUET, JSON, CSV etc.) ou les outils les plus utilisés (Elastic Search ou autres) avec TP
- Transformer ses données en Data Frames avec TP
- Mêmes principes pour Hive avec le Hive context
- Appliquer des requêtes SQL avec TP
- Visualiser ses données avec les outils tels que Zeppelin ou Jupyter avec TP
- Analyser ses données avec les outils de data science: clustering avec TP
Pré-requis : Module M1 & Connaissance de SQL