Feuille de route 2016 (2A)

Plan

Les cours et séances se déroulent sur 6 séances de 4h lundi matin. Cette année le cours se diversifie avec des pistes :

  • Stat : Les sessions abordent le machine learning, le traitement du langage, le traitement de gros volumes de données, les puzzles algorithmiques. Il est préférable d’avoir déjà programmé, d’avoir déjà utilisé le calcul matriciel.
  • Eco : Les sessions abordent le calcul matriciel, le machine learning, les graphes, le traitement du langage, le webscrapping.

Une compétition sera ouverte le premier jour et fermée à la dernière session où les résultas et les idées seront discutées : Compétition Python 2A ENSAE (voir aussi notebook compétition 2016).

La séance dédiées aux Puzzles algorithmiques requiert la participation de la part des participants : trois exercices seront choisis parmi ceux que vous aurez envoyés par mail. Les exercices doivent être choisis sur le site Google Code Jam.

Séance Stat 8h30 Stat 10h30 Eco 8h30 Eco 10h30
26/9 numpy et le calcul matriciel, pandas, dataframe et premiers graphes, Visualisation (voir Notes) Javascript numpy et le calcul matriciel pandas, dataframe et premiers graphes
3/10 SQL, 2A.i - Modèle relationnel, analyse d’incidents dans le transport aérien, traitement big data, itérateur, dask, 2A.ml - Texte et machine learning, 2A.i - Stratégies et grandes matrices en mémoire SQL lien avec pandas, SQL et Données structurées, 2A.eco - Exercice Python - Eco Séance 2 Visualisation, 2A.data - Matplotlib
10/10 C++, Accélération de code Machine Learning avec Gaël Varoquaux (scikit-learn) cours commun Visualisation et autres rappels Machine Learning avec Gaël Varoquaux (scikit-learn) cours commun
17/10 Problèmes classiques de machine learning, Problèmes pratiques Librairies de machine learning, Deep Learning Web API Web Scraping
7/11 Puzzles algorithmiques, voir notes Puzzles algorithmiques, voir notes ci-dessous expression régulière, format JSON (à venir) NLTK, statistiques textuelles
14/11 travail d’équipe, réarranger la carte électorale (éléments de réponses) retour sur la compétition ML, exemples de compétition Kaggle cours commun construction d’un site web, Flask, Jason, Django retour sur la compétition ML, exemples de compétition Kaggle cours commun

Notes

Visualisation : l’idée de ces séances est d’explorer chacun une librairie différente puis de partager les exemples.

Puzzles algorithmiques : le programme des 4h se répartit comme suit :

  • 8h30-10h00 : 3 puzzles
  • 10h00-10h30 : éléments principaux à retenir (surtout pour les entretiens d’embauche)
  • 11h-12h30 : 3 puzzles
  • 12h30-13h : notions de graphes

Devinettes

Devinettes 2016

Déroulement des séances

Le 7 novembre à 8h30, le but de la séance est de concevoir un plan pour réarranger les cartes électorales et de commencer sa mise en place. Il n’y a pas qu’une seule solution, tout dépend des idées exposées durant la séance.

En ce qui concerne les séances autour des algorithmes, il s’agit d’enrichir sa culture informatique car c’est devenu indispensable pour passer les entretiens d’embauche aujourd’hui. Ces séances sont composés d’exercices et de cours. La présentation ENSAE 2A - Données, Machine Learning et Programmation donne un aperçu des thèmes abordés. slideslogo

Compétition

Compétition 2016

Intervenants

Xavier Dupré, Anne Muller, Elodie Royant, Antoine Thabault, Nicolas Rousset, Antoine Ly, Benjamin Donnot, Gaël Varoquaux.