Python pour un Data Scientist / Economiste

ENSAE - OMI2F2

Ce cours s’étale sur 8 séances de cours/TD d’une durée de 3h. Les outils proposés sont en langage Python. Ils sont tous open source, pour la plupart disponibles sur GitHub et en développement actif. Python est devenu le premier langage pour les scientifiques et comme c’est un langage générique, il est possible de gérer l’ensemble des traitements appliqués aux données, depuis le traitements des sources de données jusqu’à leur visualisation sans changer de langage.

Le cours est prévu pour des profils plutôt statistiques Statistique ou plutôt économiques Economie. Ces images reviendront pour indiquer si les contenus s’adressent plutôt aux uns ou aux autres. La présentation ENSAE 2A - Données, Machine Learning et Programmation slideslogo donne un aperçu des thèmes abordés.

Le terme cheat sheet est un mot-clé plutôt efficace sur Internet pour retrouver les bout de codes les plus fréquents. Cette page regroupe des cheat sheets sur beaucoup de sujet évoqués ci-dessous : Essential Cheat Sheets for Machine Learning and Deep Learning Engineers.

Thèmes :

Ce cours a commencé en 2014 et n’a cessé de s’enrichir. Il est animé par Xavier Dupré (ENSAE 1999) et Anne Muller (ENSAE 2012). Il a bénéficié de nombreuses contributions. Parmi les auteurs : Xavier Dupré, Anne Muller, Elodie Royant Nicolas Rousset, Jérémie Jakubowicz, Gilles Drigout, Gaël Varoquaux. La feuille de route 2016 précise le plan suivi pour cette année et les intervenants ayant animé le cours.