Les notions qu’il faut avoir comprises ou vues

Pour un profil plutôt économiste

Economie

Ce qu’il faut maîtriser

  • Les bases du langage Python : boucles, tests, fonctions, listes, dictionnaires, modules, expressions régulières.
  • Le calcul matriciel, les dataframes, les graphes, les cartes.
  • Les valeurs manquantes.
  • Le langage SQL.
  • La transformation des données textuelles.
  • Quelques projections (ACP), la normalisation, le clustering.
  • Les problèmes classiques de machine learning (classification, régression, ranking, recommandation, séries temporelles).
  • Scraping.

Ce qu’il faut connaître

  • Quelques solutions pour de gros volumes de données.
  • Les graphes en javascript.
  • La création d’un site web avec Django ou Flask.
  • Machine learning éthique.
  • Transfer Learning.
  • Optimisation des hyperparamètres.
  • Accélération de code type numba, cython.

Pour un profil plutôt data scientist

Statistique

Ce qu’il faut maîtriser

  • Les bases du langages : boucles, tests, fonctions, listes, dictionnaires, modules, expressions régulières, classes.
  • Le calcul matriciel, les dataframes, les graphes, les cartes, valeurs manquantes.
  • La notion d’itérateurs pour le traitement de gros volumes de données.
  • La parallélisation.
  • Le langage SQL.
  • La transformation des données textuelles, les projections (ACP, t-SNE), la normalisation, notions d’embeddings (texte, images, deep learning), de pipelines.
  • Le clustering.
  • Les problèmes classiques de machine learning (classification, régression, ranking, recommandation, séries temporelles).
  • Optimisation des hyperparamètres.
  • Transfer learning, autoencoders
  • Scraping.

Ce qu’il faut connaître

  • Deep learning, quelques problèmes résolus, Kaggle.
  • Reinforcement learning,
  • Algorithmes de streaming.
  • Machine learning sur des données cryptées.
  • Les tests unitaires.
  • Git.
  • Des exercices de type Google Jam.
  • Des accélérations du langage comme Cython, C++, numba.
  • Créer un site web avec Flask, Javacript.