Galleries de notebooks

Cette page reprend tous les notebooks disponibles pour ces enseignements et les classes par thèmes. Beaucoup de notebooks se présentent par pairs énoncé - correction car ils servent de supports à des séances de travaux dirigés. Il est préférable de lire l’énoncé d’abord.

Compétitions de machine learning

Une compétition de machine learning a été organisé sur plusieurs semaines pour le cours de Python pour un data scientiste. On trouve dans cette section différents matériaux pour débuter et quelques solutions des étudiants.

Année 2016

L’objectif est de prédire la probabilité de défaut de paiement d’utilisateurs. On dispose de 23 variables et la variable à prédire est binaire. Chaque participant est évalué avec la métrique AUC qui est une métrique standard dans un problème de classification binaire. Les données sont issues de default of credit card clients Data Set et ont été un peu modifiées pour la compétition : apprentissage (X,Y) et test (X). Les étudiants avaient quelques notebooks pour les aider à démarrer. Un notebook présente la solution de l’un d’eux.

Notebooks des étudiants

Ces notebooks viennent des étudiants et illustrent certains aspects du cours.

Année 2014-2015

Ce fut la première année où nous avons demandé aux étudiants de réaliser un projet de programmation distribué. Voici quelques examples écrits en PIG (Hadoop, MapReduce). Il reste quelques imperfections que je vous laisse le soin de découvrir.

Travaux dirigés - Introductions

Tous les énoncés et les corrections des séances d’introduction à la programmation et aux algorithmes.

Travaux dirigés - Data Scientiste / Economiste

Enoncés communs aux data scientistes et aux économistes pour le cours Python pour un Data Scientist / Economiste.

Travaux dirigés - Hadoop

Séances d’introduction aux clusters. Comment manipuler les données depuis ou vers un cluster, premiers job Map Reduce avec le langage PIG. Ces séances requiert un cluster.