{"cells": [{"cell_type": "markdown", "metadata": {}, "source": ["# 2A.eco - Mise en pratique des s\u00e9ances 1 et 2 - Utilisation de pandas et visualisation\n", "\n", "Trois exercices pour manipuler les donner, manipulation de texte, donn\u00e9es v\u00e9lib."]}, {"cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [{"data": {"text/html": ["
run previous cell, wait for 2 seconds
\n", ""], "text/plain": [""]}, "execution_count": 2, "metadata": {}, "output_type": "execute_result"}], "source": ["from jyquickhelper import add_notebook_menu\n", "add_notebook_menu()"]}, {"cell_type": "markdown", "metadata": {}, "source": ["## Donn\u00e9es\n", "\n", "Les donn\u00e9es sont t\u00e9l\u00e9chargeables \u00e0 cette adresse : [td2a_eco_exercices_de_manipulation_de_donnees.zip](https://github.com/sdpython/ensae_teaching_cs/raw/master/_doc/notebooks/td2a_eco/data/td2a_eco_exercices_de_manipulation_de_donnees.zip). Le code suivant permet de les t\u00e9l\u00e9charger automatiquement."]}, {"cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [{"data": {"text/plain": ["['.\\\\Players_WC2014.xlsx',\n", " '.\\\\velib_t1.txt',\n", " '.\\\\velib_t2.txt',\n", " '.\\\\villes.txt']"]}, "execution_count": 3, "metadata": {}, "output_type": "execute_result"}], "source": ["from pyensae.datasource import download_data\n", "files = download_data(\"td2a_eco_exercices_de_manipulation_de_donnees.zip\",\n", " url=\"https://github.com/sdpython/ensae_teaching_cs/raw/master/_doc/notebooks/td2a_eco/data/\")\n", "files"]}, {"cell_type": "markdown", "metadata": {}, "source": ["## Exercice 1 - manipulation des textes\n", "\n", "Dur\u00e9e : 20 minutes\n", "\n", "1. Importer la base de donn\u00e9es relatives aux joueurs de la Coupe du Monde 2014 >> `Players_WC2014.xlsx`\n", "2. D\u00e9terminer le nombre de joueurs dans chaque \u00e9quipe et cr\u00e9er un dictionnaire { \u00e9quipe : Nombre de joueurs}\n", "3. D\u00e9terminer quels sont les 3 joueurs qui ont couvert le plus de distance. Y a t il un biais de s\u00e9lection ?\n", "4. Parmis les joueurs qui sont dans le premier d\u00e9cile des joueurs plus rapides, qui a pass\u00e9 le plus clair de son temps \u00e0 courrir sans la balle ?"]}, {"cell_type": "markdown", "metadata": {}, "source": ["## Exercice 2 - Les villes\n", "\n", "Dur\u00e9e : 40 minutes\n", "\n", "1. Importer la base des villes villes.xls\n", "2. Les noms de variables et les observations contiennent des espaces inutiles (exemple : 'MAJ ') : commnecer par nettoyer l'ensemble des chaines de caract\u00e8res (\u00e0 la fois dans les noms de colonnes et dans les observations)\n", "3. Trouver le nombre de codes INSEE diff\u00e9rents (attention aux doublons)\n", "4. Comment calculer rapidement la moyenne, le nombre et le maximum pour chaque variable num\u00e9rique ? (une ligne de code)\n", "5. Compter le nombre de villes dans chaque Region et en faire un dictionnaire o\u00f9 la cl\u00e9 est la r\u00e9gion et la valeur le nombre de villes\n", "6. Repr\u00e9senter les communes en utilisant \n", "\n", " * matplotlib \n", " * une librairie de cartographie (ex : folium) "]}, {"cell_type": "markdown", "metadata": {}, "source": ["## Exercice 3 - Disponibilit\u00e9 des v\u00e9libs\n", "\n", "Dur\u00e9e : 30 minutes\n", "\n", "1. Importer les donn\u00e9es sous la forme d'un dataFrame \n", "\n", " - `velib_t1.txt` - avec les donn\u00e9es des stations \u00e0 un instant $t$\n", " - `velib_t2.txt` - avec les donn\u00e9es des stations \u00e0 un instant $t + 1$\n", "\n", "2. Repr\u00e9senter la localisation des stations v\u00e9lib dans Paris\n", "\n", " - repr\u00e9senter les stations en fonction du nombre de places avec un gradient\n", "\n", "3. Comparer pour une station donn\u00e9e l'\u00e9volution de la disponibilit\u00e9 (en fusionnant les deux bases $t$ et $t+1$)\n", "\n", " - repr\u00e9senter les stations qui ont connu une \u00e9volution significative (plus de 5 changements) avec un gradient de couleurs "]}, {"cell_type": "code", "execution_count": 3, "metadata": {"collapsed": true}, "outputs": [], "source": []}], "metadata": {"kernelspec": {"display_name": "Python 3", "language": "python", "name": "python3"}, "language_info": {"codemirror_mode": {"name": "ipython", "version": 3}, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.1"}}, "nbformat": 4, "nbformat_minor": 2}