Devenir Data Scientist en 3 jours


Module C19

La formation “Devenir Data Scientist en 3 jours” a vocation à former de futurs analystes ou encore “data scientists” à savoir des spécialistes de la science de l’analyse de données sur des grosses volumétries. Elle fait rentrer le stagiaire dans un monde d’algorithmes en réalité assez compréhensibles par tous et pouvant être très rapidement mis en pratique grâce à la plateforme Spark.

Elle s’adresse à des populations de formation technique (informaticiens, mathématiciens, physiciens, économistes ou tout autre domaine) ayant eu au moins une expérience de développement dans un langage de programmation quel qu’il soit et à l’aise avec des notions mathématiques du niveau terminale S (vecteurs, matrices, probabilités etc.).

Avec très peu de pré-requis elle est la formation idéale pour aborder le Big Data en toute facilité et en montrer l’énorme puissance.


Programme

Jour 1: apprentissage de Scala et de Spark

  • Les structures de données et instructions du langage Scala avec TP.
  • Les instructions du langage Spark (les fonctions, les RDDs) avec TP.
  • Spark et Hadoop: comment les utiliser ensemble

Jour 2 et 3: la Data Science avec Spark MLLib , TensorFlow ou PyTorch

  • Les statistiques de base avec TP
  • Le clustering avec TP
  • La classification et les régressions avec TP
  • La prédiction avec TP
  • Le filtrage collaboratif (ou encore recommendations) avec TP
  • Le mining de pattern avec TP l’extraction de features
  • Les fréquents item-sets
  • Le réduction en dimensionalité avec TP
  • Le deep learning (RNN, CNN, LSTM) avec TP
  • Evaluer la performance de son modèle avec TP