Feuille de route 2019 (2A)

en constante élaboration

Page principale du cours

Les cours et séances se déroulent sur 9 séances de 3h mardi matin. Le cours est divisé en deux pistes Stat et Eco qui correspondent aux profils décrits dans Les notions qu’il faut avoir comprises ou vues. Voici les principaux thèmes abordés durant le cours :

Commun data scientist - économiste

  • Pratique des principaux problèmes de machines Learning avec scikit-learn (classification, régression, clustering, prétraitement)

  • Visualisation des données

  • Construction d’un module python

  • Traitement des données textuelles (NLP, analyse de sentiments…)

Data scientiste

  • Implémentation de modèles personnalisés avec scikit-learn

  • Déploiement de modèles de machine Learning via des API rest

  • Problèmes moins fréquents de machine learning : apprentissage par renforcement, ranking, recommandation

Economiste

  • Rappel sur les notebooks, les dataframes, pandas, numpy, manipulation de données…

  • Cartographie

  • Ethique des données

  • Webscrapping, API et expressions régulières

  • Séries temporelles

Evaluation

Séance 2 - 17/9

DS - TD : régression quantile - détection d’anomalies

DS - cours

Eco - Cours : rappels pandas numpy matplotlib début scikit-learn

Séance 5 - 8/10

DS

  • Reinforcement learning avec Jean-Baptiste Rémy (amphi à 8h30, TD à 10h15 en amphi), notebooks : Reinforcement_Toys

Eco

Séance 6 - 15/10

Deux notebooks ont été ajoutés pour le projet 2A - Partager un graphe via un module python, ils présentent les deux jeux de données disponibles pour cet exercice si le graphe est choisi. Si c’est l’algorithme, il est possible de s’inspirer de lasso_random_forest_regressor.py qui implémente la réduction d’une random forest à l’aide d’une régression Lasso.

DS - TD

DS - cours

Eco

Prérequis

Autres contenus

Intervenants

Xavier Dupré, Anne Muller, Eliot Barril, Mayeul Picard, Salomé Do, Gilles Cornec, Gabriel Romon, Jean-Baptiste Rémy