Python pour un Data Scientist / Economiste

ENSAE - OMI2F2

Cours animé par : Xavier Dupré (ENSAE 1999) [1], Anne Muller (ENSAE 2012) [1], Elodie Royant (ENSAE 2008) [2], Antoine Thabault (ENSAE 2012) [2], Nicolas Rousset [2], Antoine Ly (ENSAE 2015), Benjamin Donnot (ENSAE 2015), Gaël Varoquaux [2].

Contributeurs : Jérémie Jakubowicz (ENSAE 2002) [3], Gilles Drigout (ENSAE 2013) [4]

Ce cours s’étale sur 6 séances de cours/TD d’une durée de 4h. Les outils proposés sont en langage Python. Ils sont tous open source, pour la plupart disponibles sur GitHub et en développement actif. Python est récemment devenu une alternative plus que probante pour les scientifiques et comme c’est un langage générique, il est possible de gérer l’ensemble des traitements appliqués aux données, depuis le traitements des sources de données jusqu’à leur visualisation sans changer de langage.

Le cours est prévu pour des profils plutôt statistiques Statistique ou plutôt économiques Economie. Ces images reviendront pour indiquer si les contenus s’adressent plutôt aux uns ou aux autres. La présentation ENSAE 2A - Données, Machine Learning et Programmation slideslogo donne un aperçu des thèmes abordés.

Le terme cheat sheet est un mot-clé plutôt efficace sur Internet pour retrouver les bout de codes les plus fréquents. Cette page regroupe des cheat sheets sur beaucoup de sujet évoqué ci-dessous : Essential Cheat Sheets for Machine Learning and Deep Learning Engineers.

Thèmes :

[1](1, 2) Contributeur, encadrant et coordinateur du cours.
[2](1, 2, 3, 4) Contributeur, encadrant.
[3]Contributeur, encadrant des premiers jours (2014-2016).
[4]Contributeur.