|
Cube multidimensionnel - correction |
Manipulation de tables de mortalités façon OLAP, correction des exercices. |
|
Cube multidimensionnel - énoncé |
Ce notebook aborde différentes solutions pour traiter les données qu’on représente plus volontiers en plusieurs dimensions. Le mot-clé associé est OLAP ou cube OLAP. Mondrian est une solution open source, cubes est écrit en python. Kylin propose ce service sur des données stockées sur Hadoop. L’objectif est ici de découvrir pas d’explorer ces solutions. |
|
Données multidimensionnelles SQL - correction |
Correction de la séance sur l’utilisation du SQL depuis un notebook. |
|
Données multidimensionnelles SQL - énoncé |
Ce notebook propose l’utilisation de SQL avec SQLite pour manipuler les données depuis un notebook (avec le module sqlite3. |
|
Données, approches fonctionnelles - correction |
Correction de l’approche fonctionnelle. Elle s’appuie principalement sur des itérateurs et le module cytoolz. |
|
Données, approches fonctionnelles - énoncé |
L’approche fonctionnelle est une façon de traiter les données en ne conservant qu’une petite partie en mémoire. D’une manière générale, cela s’applique à tous les calculs qu’on peut faire avec le langage SQL. Le notebook utilisera des données issues d’une table de mortalité extraite de table de mortalité de 1960 à 2010 (le lien est cassé car data-publica ne fournit plus ces données, le notebook récupère une copie) qu’on récupère à l’aide de la fonction table_mortalite_euro_stat. |
|
Elections et cartes électorales - correction |
Bidouiller les cartes électorales n’est pas facile mais il n’est pas nécessaire d’être très efficace pour orienter la décision dans un sens ou dans l’autre. L’idée principale consiste à bouger des électeurs d’une circoncription à l’autre pour favoriser les candidats d’un seul parti. Il faut que ces candidats sont élus avec une majorité suffisante tandis que les candidats adversaires doivent l’être avec une grande majorité. C’est une façon de donner plus d’importance aux voix d’un seul parti car elles annulent celles des autres. L’objectif visé est la préparation d’une prochaine élection à partir des résultats de la précédente sans que cela se voit trop. Mais nous pourrions essayer de faire basculer les résultats d’une élection dans un camp ou dans l’autre. |
|
Elections et cartes électorales - énoncé |
D’après wikipédia, le Gerrymandering est un terme politique nord-américain pour désigner le découpage des circonscriptions électorales ayant pour objectif de donner l’avantage à un parti, un candidat, ou un groupe donné. Et c’est ce que nous allons faire dans cette séance. C’est un problème tout-à-fait d’actualité : Primaire de la droite : 10 228 bureaux de vote stratégiquement répartis. |
|
Evoluation d’une population (correction) |
Evolution d’une population à partir des tables de mortalités et d’une situation initiale. |
|
Evoluation d’une population - énoncé |
On souhaite ici faire évoluer une population à partir de table de mortalité et d’une situation initiale. Dans ce type d’exercice, on fait souvent un grand nombre de recherche internet pour trouver la fonction qui permet d’aller vite. Avec la pratique, on retient le nom de ces méthodes. La correction propose une solution mais il n’existe pas une façon unique de répondre à ces questions. |
|
Graphes - correction |
Correction des exercices sur les graphes avec matplotlib. |
|
Graphes - énoncé |
Ce notebook introduit matplotlib et d’autres modules Python qui permettent de tracer des graphes et bâtis sur la même logique que matplotlib. |
|
Graphes en machine learning - correction |
Correction (en cours de rédaction) des exercices autour des graphes courants en machine learning. |
|
Graphes en machine learning - énoncé |
Ce notebook propose une série de graphes qu’on utilise fréquemment dans un notebook lorsqu’on fait du machine learning. Cela comprend notamment la courbe ROC pour les problèmes de classification. |
|
Récupération des données |
Ce notebook donne quelques exemples de codes qui permettent de récupérer les données utilisées par d’autres notebooks. Le module actuariat_python est implémenté avec Python 3. Pour les utilisateurs de Python 2.7, il suffira de recopier le code chaque fonction dans le notebook (suivre les liens insérés dans le notebook). |
|
Session 26/6/2017 - machine learning |
Découverte des trois problèmes de machine learning exposé dans l’article Machine Learning - session 6. |
|
Séance big data |
Découverte de plusieurs façons de calculer des statistiques sur des fichiers volumineux. |