Les notions qu’il faut avoir comprises ou vues#
Pour un profil plutôt économiste#
Ce qu’il faut maîtriser
Les bases du langage Python : boucles, tests, fonctions, listes, dictionnaires, modules, expressions régulières.
Le calcul matriciel, les dataframes, les graphes, les cartes.
Les valeurs manquantes.
Le langage SQL.
La transformation des données textuelles.
Quelques projections (ACP), la normalisation, le clustering.
Les problèmes classiques de machine learning (classification, régression, ranking, recommandation, séries temporelles).
Scraping.
Ce qu’il faut connaître
Quelques solutions pour de gros volumes de données.
Les graphes en javascript.
La création d’un site web avec Django ou Flask.
Machine learning éthique.
Transfer Learning.
Optimisation des hyperparamètres.
Accélération de code type numba, cython.
Pour un profil plutôt data scientist#
Ce qu’il faut maîtriser
Les bases du langages : boucles, tests, fonctions, listes, dictionnaires, modules, expressions régulières, classes.
Le calcul matriciel, les dataframes, les graphes, les cartes, valeurs manquantes.
La notion d’itérateurs pour le traitement de gros volumes de données.
La parallélisation.
Le langage SQL.
La transformation des données textuelles, les projections (ACP, t-SNE), la normalisation, notions d’embeddings (texte, images, deep learning), de pipelines.
Le clustering.
Les problèmes classiques de machine learning (classification, régression, ranking, recommandation, séries temporelles).
Optimisation des hyperparamètres.
Transfer learning, autoencoders
Scraping.
Ce qu’il faut connaître
Deep learning, quelques problèmes résolus, Kaggle.
Reinforcement learning,
Algorithmes de streaming.
Machine learning sur des données cryptées.
Les tests unitaires.
Git.
Des exercices de type Google Jam.
Des accélérations du langage comme Cython, C++, numba.
Créer un site web avec Flask, Javacript.