Feuille de route 2016 (2A)

Plan

Les cours et séances se déroulent sur 6 séances de 4h lundi matin. Cette année le cours se diversifie avec des pistes :

  • Stat : Les sessions abordent le machine learning, le traitement du langage, le traitement de gros volumes de données, les puzzles algorithmiques. Il est préférable d’avoir déjà programmé, d’avoir déjà utilisé le calcul matriciel.

  • Eco : Les sessions abordent le calcul matriciel, le machine learning, les graphes, le traitement du langage, le webscrapping.

Une compétition sera ouverte le premier jour et fermée à la dernière session où les résultas et les idées seront discutées : Compétition Python 2A ENSAE (voir aussi notebook compétition 2016).

La séance dédiées aux Puzzles algorithmiques requiert la participation de la part des participants : trois exercices seront choisis parmi ceux que vous aurez envoyés par mail. Les exercices doivent être choisis sur le site Google Code Jam.

Séance

Stat 8h30

Stat 10h30

Eco 8h30

Eco 10h30

26/9

numpy et le calcul matriciel, pandas, dataframe et premiers graphes,

Visualisation (voir Notes) Javascript

numpy et le calcul matriciel

pandas, dataframe et premiers graphes

3/10

SQL, 2A.i - Modèle relationnel, analyse d’incidents dans le transport aérien, traitement big data, itérateur, dask,

2A.ml - Texte et machine learning, 2A.i - Stratégies et grandes matrices en mémoire

SQL lien avec pandas, SQL et Données structurées, 2A.eco - Exercice Python - Eco Séance 2

Visualisation, 2A.data - Matplotlib

10/10

C++, Accélération de code

Machine Learning avec Gaël Varoquaux (scikit-learn) cours commun

Visualisation et autres rappels

Machine Learning avec Gaël Varoquaux (scikit-learn) cours commun

17/10

Problèmes classiques de machine learning, Problèmes pratiques

Librairies de machine learning, Deep Learning

Web API

Web Scraping

7/11

Puzzles algorithmiques, voir notes

Puzzles algorithmiques, voir notes ci-dessous

expression régulière, format JSON (à venir)

NLTK, statistiques textuelles

14/11

travail d’équipe, réarranger la carte électorale (éléments de réponses)

retour sur la compétition ML, exemples de compétition Kaggle cours commun

construction d’un site web, Flask, Jason, Django

retour sur la compétition ML, exemples de compétition Kaggle cours commun

Notes

Visualisation : l’idée de ces séances est d’explorer chacun une librairie différente puis de partager les exemples.

Puzzles algorithmiques : le programme des 4h se répartit comme suit :

  • 8h30-10h00 : 3 puzzles

  • 10h00-10h30 : éléments principaux à retenir (surtout pour les entretiens d’embauche)

  • 11h-12h30 : 3 puzzles

  • 12h30-13h : notions de graphes

Devinettes

Devinettes 2016

Déroulement des séances

Le 7 novembre à 8h30, le but de la séance est de concevoir un plan pour réarranger les cartes électorales et de commencer sa mise en place. Il n’y a pas qu’une seule solution, tout dépend des idées exposées durant la séance.

En ce qui concerne les séances autour des algorithmes, il s’agit d’enrichir sa culture informatique car c’est devenu indispensable pour passer les entretiens d’embauche aujourd’hui. Ces séances sont composés d’exercices et de cours. La présentation ENSAE 2A - Données, Machine Learning et Programmation donne un aperçu des thèmes abordés. slideslogo

Compétition

Compétition 2016

Intervenants

Xavier Dupré, Anne Muller, Elodie Royant, Antoine Thabault, Nicolas Rousset, Antoine Ly, Benjamin Donnot, Gaël Varoquaux.