Python pour un Data Scientist / Economiste

ENSAE - OMI2F2

Ce cours s’étale sur 24 heures de cours/TD. Les outils proposés sont en langage Python. Ils sont tous open source, pour la plupart disponibles sur GitHub et en développement actif. Python est devenu le premier langage pour les scientifiques et comme c’est un langage générique, il est possible de gérer l’ensemble des traitements appliqués aux données, depuis le traitements des sources de données jusqu’à leur visualisation sans changer de langage. Le cours est prévu pour des profils plutôt statistiques Statistique ou plutôt économiques Economie. Ces images reviendront pour indiquer si les contenus s’adressent plutôt aux uns ou aux autres.

Le terme cheat sheet est un mot-clé plutôt efficace sur Internet pour retrouver les bout de codes les plus fréquents. Cette page regroupe des cheat sheets sur beaucoup de sujet évoqués ci-dessous : Essential Cheat Sheets for Machine Learning and Deep Learning Engineers. Le cours est composés de thèmes associés à un problème ciblé de données ou de machine learning. Les thèmes sont de difficultés croissantes et sont abordés invariablement par :

  • des exercices sous la forme de notebooks (énoncé / correction),
  • des articles,
  • des modules connus.

Thèmes :

Ce cours a commencé en 2014 et n’a cessé de s’enrichir. Il est animé par Xavier Dupré (ENSAE 1999) et Anne Muller (ENSAE 2012). Le cours qui a pour objectif de vous présenter les notions suivantes.

Auteurs et Contributeurs

Ce cours a bénéficié de nombreuses contributions dont les auteurs sont : Xavier Dupré, Anne Muller, Elodie Royant Nicolas Rousset, Jérémie Jakubowicz, Gilles Drigout, Gaël Varoquaux et bien sûr les étudiants de l”ENSAE.

Années passées :