BI avec Spark SQL


Module M18

La formation « BI avec Spark SQL » a vocation à former des analystes au développement d’analyses et de rapports de types BI avec Spark SQL et des outils uniquement open source.

Cette formation s’adresse à des populations de formation en informatique ayant une solide connaissance du SQL.


Programme BI avec Spark SQL et Hive

  • Eléments de Spark permettant de faire du Spark SQL : les Data Frames
  • Lire ses données depuis les fichiers les plus utilisés (PARQUET, JSON, CSV etc.) ou les outils les plus utilisés (Elastic Search ou autres) avec TP
  • Transformer ses données en Data Frames avec TP
  • Mêmes principes pour Hive avec le Hive context
  • Appliquer des requêtes SQL avec TP
  • Visualiser ses données avec les outils tels que Zeppelin ou Jupyter avec TP
  • Analyser ses données avec les outils de data science: clustering avec TP

Pré-requis : Module M1 & Connaissance de SQL