BASE 0.9.3095
  • XD
  • blog
  • index
  • Site
      • 1. Algorithmes et programmation
        • TD - Les bases
          • Premiers pas en Python
          • Variables, boucles
          • Dictionnaires, fonctions
          • Fichiers, modules, expressions régulières
          • Classes, héritages
          • Premiers algorithmes
          • 1A.1 - Liste, tuple, ensemble, dictionnaire, liste chaînée, coût des opérations
          • 1A.algo - Calculer le nombre de façons de monter une échelle.
          • Algo - Calculs de surface et autres calculs
          • Algo - jeux de dictionnaires, plus grand suffix commun
          • Exemples classiques
          • 1A.1 - D’une structure de données à l’autre
          • 1A.1 - Calculer un chi 2 sur un tableau de contingence
          • 1A.1 - Histogramme et dictionnaire
          • 1A.1 - Simuler une loi multinomiale
          • Produit matriciel avec une matrice creuse
          • Jeux de coloriage
        • TD - Algorithmes
          • 1A.algo - Recherche dichotomique
          • Heap
          • Algo - les k premiers éléments
          • Survol algorithmique
          • Problèmes NP-complets
          • Graphes
          • Programmation dynamique
          • Programmation dynamique
          • Arbre, Trie, Graphes
          • Optimisation sous contrainte
          • Algorithmes en streaming
          • Images
          • Questions TD 2014
          • 1A.algo - Calculer x**n le plus rapidement possible
          • 1A.algo - Calculer le nombre de façons de monter une échelle.
          • 1A.algo - Décoder du Morse sans espaces
          • 1A.algo - La sous-séquence de plus grande somme
          • 1A.algo - Tri plus rapide que prévu
          • S’amuser avec les algorithmes
        • TD - calcul matriciel, graphes, données - data science
          • Tech - expressions régulières
          • 1A.data - DataFrame et Matrice
          • 1A.data - DataFrame et Matrice (correction)
          • 1A.data - Décorrélation de variables aléatoires
          • 1A.data - Décorrélation de variables aléatoires - correction
          • 1A.soft - Calcul numérique et Cython
          • 1A.soft - Calcul numérique et Cython - correction
          • 1A.data - Visualisation des données
          • 1A.data - Visualisation des données - cartes
          • 1A.data - Visualisation des données - graphes interactifs
          • 1A.data - visualisation des données - correction
          • S’amuser avec des données
        • TD - Site web et pratiques logicielles
          • Site Web, exemple avec Flask
          • Génie logiciel : coder facilement, coder à plusieurs, qualité du code, gestion de projets
          • 2A.soft - Git depuis le notebook
          • 1A.soft - Exemple de profiling
          • Tech - profiling
          • 2A.soft - Convert a notebook into a document
          • 2A.soft - Custom Magics for Jupyter
          • Python et C++, stratégies
          • Tests Unitaires, Continuous Integration
          • Langages, SQL
          • Cython
        • Les notions qu’il faut avoir comprises ou vues
          • Pour un profil plutôt analyste
          • Pour un profil plutôt ingénieur
          • Séance notée
        • Getting started
        • Bibliographie
        • Intervenants
        • A propos du cours
          • Feuille de route 2018 (1A)
          • Feuille de route 2019 (1A)
          • Feuille de route 2020 (1A)
      • 2. Python pour un Data Scientist / Economiste
        • Agilité avec les données
          • Agilité avec les données
        • Machine Learning - les briques de bases
          • Machine learning - les briques de bases
        • Machine learning - extensions
          • Machine learning - extensions
        • Galleries de problèmes résolus ou presque
        • Algorithmes, Optimisation, Programmation
          • Algorithmes, Optimisation, Programmation
        • Bibliographie
          • Bibliographie
        • A propos du cours
          • Les notions qu’il faut avoir comprises ou vues
          • Feuille de route 2016 (2A)
          • Feuille de route 2017 (2A)
          • Feuille de route 2018 (2A)
          • Feuille de route 2019 (2A)
          • Exposés (2A)
          • Compétitions
      • 3. Eléments logiciels pour le traitement des données massives
        • Eléments techniques
          • Anatomie et histoire d’un ordinateur
          • CPU
          • GPU
          • BLAS, LAPACK, calcul matriciel
          • Optimisations logicielles
          • Autres que CPU, GPU
        • Eléments théoriques
          • Crypographie, block chain
          • Algorithmes Distribués
          • Compilateur, compilation à la volée, JIT
        • Eléments logiciels
          • Structures de données
          • Threads et synchronisation
          • Plus proches voisins en grandes dimensions
          • Distribution des calculs, stratégies de stockage, SQL NoSQL
          • Compression des données
          • Workflow de données
          • Deep Learning
          • Framework de deep learning
          • Données massives avec python
        • Map Reduce
          • Map Reduce en pratique
          • avec PIG
          • avec Spark et Spark SQL
        • Getting started, installation, setup
          • PIG
          • SPARK
        • Bibliographie
        • Feuilles de routes des années passées
          • Feuille de route 2017 (3A)
          • Python rapide avec cython
          • Feuille de route 2019 (3A)
      • 4. Projets informatiques
        • 1A - Projets informatiques
          • Extraits des projets informatiques de première année à l’ENSAE en 2015
          • Sujets proposés
          • Travail attendu
          • Que faut-il en attendre ?
          • Références
          • Ce que vous ne lisez jamais mais que j’observe chaque année
        • 2A - Projets informatiques - Data Scientist - Economiste
          • Data Scientist
          • Travail attendu
          • Barème approximatif
          • Liens
          • Questions
          • Retours des projets des années précédentes
        • 3A - Projets informatiques
          • Travail attendu
          • Suggestions d’articles
          • Exemples d’implémentation d’algorithme en PIG
          • Code de survie
      • 5. Examens
        • Révisions rapides
        • Séances notées
        • Interrogations rapides
          • 2016-2017 - Interrogation écrite - 21 octobre 2016
        • Examens écrits
        • Corrections sous forme de notebooks
          • interrogations écrites
          • TD notés, éléments de code donnés dans l’énoncé
          • TD notés, correction
        • Autres sources d’énoncés d’examens
      • 6. Découvrir
        • Culture algorithmique
        • Algorithmes illustrés
          • Stratégie automatique de trading en finance
          • Circuit hamiltonien et Kohonen
          • Circuit hamiltonien et Kruskal
          • 3A.mr - Graphes et Map Reduce
          • 3A.mr - Random Walk with Restart (système de recommandations)
          • 2A.algo - Réflexions autour du voyage de commerce (TSP)
          • Problème de dès et problème de flots
          • Image de synthèse, lancer de rayon
          • Simulation d’une corde qui chute
          • 1A.algo - Casser le code de Vigenère
          • 2A.algo - L’énigme d’Einstein et sa résolution
          • Résolution d’un puzzle
          • L’énigme d’Hermionne, Harry Potter tome 1
          • Résolution d’un sudoku
          • 2A.algo - Hash et distribution
          • 2A.algo - Algorithmes de streaming : généralités
        • Machine learning illustré
          • 2A.i - Table de mortalité dans plusieurs containers
          • 2A.i - Huge datasets, datasets hiérarchiques
          • 2A.algo - Parcourir les rues de Paris
          • Evolution d’un voisinage, d’une population
          • Optimisation sous contraintes appliquée au calcul du report des voix
      • 7. Visualisation
        • Modules et exemples
        • Galleries
        • Trucs et astuces
      • 8. Modules, Bibliographie, Articles, FAQ...
        • Articles, Références, Blogs
          • Bibliographies associées à chaque cours
          • Autres suggestions
        • Ressources, Evénements, Source de données
          • Source de données
          • Compétition, Codes
          • Evénements, Médias
          • Incubateurs
        • FAQ
          • FAQ cvxopt
          • FAQ Cython
          • FAQ Geo coordinates and Maps
          • FAQ Hadoop
          • FAQ Jupyter
          • FAQ matplotlib
          • FAQ pandas
          • FAQ python
          • FAQ web
          • FAQ Windows
        • Questions
          • Questions TD 2014
          • Questions Projets 2014
          • Questions Projets 2015
          • Questions 2016
        • Devinettes
          • Devinettes 2016
        • Bien démarrer un projet de machine learning
          • Etape 1 : quel est le type de problème ?
          • Etape 2 : quelles sont les données ?
          • Etape 3 : séparation train/test
          • Etape 4 : apprentissage d’un modèle
          • Etape 5 : mesure de la performance
          • Etape 6 : ajouter des variables
          • Etape 7 : jouer à Hercule Poirot
          • Etape 8 : validation du modèle
      • 9. Getting started
        • Notes
          • 2018-2019
          • 2017-2018
        • En résumé : Anaconda
        • Windows
          • Linux en ligne de commande / MacOS
          • IDE
          • Editeur de texte
        • Installer un module
          • pip, python et ligne de commande
          • conda ou pip
          • Dépendances
          • Installer un module avec pymy_install
          • Désinstallation des modules implémentés pour ce cours
          • Configuration pour ces cours
          • Compiler un module
        • Distributions
        • Modules incournables pour un data scientist
        • Outils, ressources pour développer
          • En vrac
          • Générer une documentation comme ce cours
          • Setup pour déveloper ce cours (Windows)
        • Maintenir sa distribution Python à jour
        • Liste exhaustive de modules Python
      • 10. Galleries d'exemples
        • Anti-sèches
          • Automatisation
          • sklearn_ensae_course
        • Collection d’examples
          • Automatisation
          • Computer Science, Machine Learning
          • Geek
        • Exemples classiques
          • Python, constructions classiques
        • Blog Gallery
          • blog 0
          • blog 1
          • blog 2
          • blog 3
          • blog 4
          • blog 5
          • blog 6
          • blog 7
          • blog 8
          • blog 9
          • blog 10
          • blog 11
          • blog 12
          • blog 13
          • blog 14
          • blog 15
          • blog 16
          • blog 17
          • blog 18
          • blog 19
          • blog 20
          • blog 21
          • blog 22
          • blog 23
          • blog 24
          • blog 25
          • blog 26
          • blog 27
          • blog 28
          • blog 29
          • blog 30
          • blog 31
          • blog 32
          • blog 33
          • blog 34
          • blog 35
          • blog 36
          • blog 37
          • blog 38
          • blog 39
          • blog 40
          • blog 41
          • blog 42
          • blog 43
          • blog 44
          • blog 45
          • blog 46
          • blog 47
          • blog 48
          • blog 49
          • blog 50
          • blog 51
          • blog 52
          • blog 53
          • blog 54
          • blog 55
          • blog 56
          • blog 57
          • blog 58
          • blog 59
          • blog 60
          • blog 61
          • blog 62
          • blog 63
          • blog 64
          • blog 65
          • blog 66
          • blog 67
          • blog 68
          • blog 69
          • blog 70
          • blog 71
          • blog 72
          • blog 73
          • blog 74
          • blog 75
          • blog 76
          • blog 77
          • blog 78
          • blog 79
          • blog 80
          • blog 81
          • blog 82
          • blog 83
          • blog 84
          • blog 85
          • blog 86
          • blog 87
          • blog 88
          • blog 89
          • blog 90
          • blog 91
          • blog 92
          • blog 93
          • blog 94
          • blog 95
          • blog 96
          • blog 97
          • blog 98
          • blog 99
          • blog 100
          • blog 101
          • blog 102
          • blog 103
          • blog 104
          • blog 105
          • blog 106
          • blog 107
          • blog 108
          • blog 109
          • blog 110
          • blog 111
          • blog 112
          • blog 113
          • blog 114
          • blog 115
          • blog 116
          • blog 117
          • blog 118
          • blog 119
          • blog 120
          • blog 121
          • blog 122
          • blog 123
          • blog 124
          • blog 125
          • blog 126
          • blog 127
          • blog 128
          • blog 129
          • blog 130
          • blog 131
          • blog 132
          • blog 133
          • blog 134
          • blog 135
          • blog 136
          • blog 137
          • blog 138
          • blog 139
          • blog 140
          • blog 141
          • blog 142
          • blog 143
          • blog 144
        • Automatisation
          • Set up or update Jenkins Jobs
          • Copy documentation
          • Exécuter des scripts python envoyé en pièce jointe
          • Send many mails
          • Publish documentation
          • Récupérer des mails d’étudiants en pièce jointe (1:1)
        • Galleries de notebooks
          • 1A - Exposés, exercices pour apprendre la programmation et les algorithmes
          • 2A - Exposés, techniques de data scientiste
          • Compétitions de machine learning
          • Données
          • 1A - Examens et solutions
          • Exposés
          • Notebooks des étudiants
          • Année 2014-2015
          • Année 2016-2017
          • Année 2017-2018
          • Année 2018-2019
          • 2A - sklearn_ensae_course
          • 1A - Travaux dirigés - Introductions
          • 1A - Travaux dirigés autour des algorithmes
          • 1A - Travaux dirigés autour des données
          • td1a_home
          • 1A - Travaux dirigés autour des pratiques logiciels
          • 2A - Travaux dirigés - Data Scientiste / Economiste
          • 2A - Travaux dirigés - Algorithmes
          • 2A - Travaux dirigés - Economistes (1)
          • 2A - Travaux dirigés - Economistes (2)
          • 2A - Travaux dirigés - Machine Learning
      • 11. Index
        • README
          • ensae_teaching_cs: teaching materials, algorithmic, machine learning
          • History
          • page de blog - 1/13
          • Glossaire
          • License
          • Dépendances
        • A propos de ce module
          • Changes
          • All indexes
          • Statistics on code
          • Modules
      • 12. API
        • Automatisation
          • Examens
          • Web
        • Données
          • Jeux de données
          • Outils
        • Exercices
          • 1A
          • 2A
          • Promenades
        • Outils
          • Code
          • Cython
          • Conversion
          • Dataframes
          • Graphes
          • Image
          • Outils
          • pygame
          • Web
        • Outils
          • Code
        • TD 1A
        • TD 2A
        • Inclassable
          • Algorithme
          • Animation
          • Enigme
          • Géométrie
          • Vraiment inclassable
      • 13. Command lines
  • Page
      • Agilité avec les données
        • Rappels de programmation
        • Matrices et DataFrames - numpy pandas SQL
        • Visualisation
        • Données massives

Liens

  • Blog
  • Index
  • Module
  • API

Contenu

  • 1. Algorithmes et programmation
  • 2. Python pour un Data Scientist / Economiste
  • 3. Eléments logiciels pour le traitement des données massives
  • 4. Projets informatiques
  • 5. Examens
  • 6. Découvrir
  • 7. Visualisation
  • 8. Modules, Bibliographie, Articles, FAQ...
  • 9. Getting started
  • 10. Galleries d'exemples
  • 11. Index
  • 12. API
  • 13. Command lines

Information

  • FAQ
  • Glossaire
  • README
  • Changements
  • Licence
  • « Python pour u...
  • 2A.eco - Rapp... »
  • Source

    Agilité avec les données¶

    Faire du machine learning veut d’abord dire être capable de manipuler les données comme bon vous semble et les représenter à l’aide de graphiques.

    • Rappels de programmation

    • Matrices et DataFrames - numpy pandas SQL

    • Visualisation

    • Données massives

    Rappels de programmation¶

    Notebooks

    • 2A.eco - Rappel de ce que vous savez déjà mais avez peut-être oublié
      • Les quelques règles de Python
      • Les outputs de Python : l’opération, le print et le return
      • Type de base : variables, listes, dictionnaires …
      • A retenir
      • Questions pratiques :
      • Objets : méthodes et attributs
      • Les opérations et méthodes classiques des listes
      • Les méthodes des listes
      • A retenir et questions
      • Passer des listes, dictionnaires à pandas

    Matrices et DataFrames - numpy pandas SQL¶

    Import/export de données dans un DataFrame, manipulation selon une logique SQL, utilité des index, lambda function, premiers graphiques, commandes magiques.

    De nombreux livres ont été écrits sur la manipulation des données en Python. En voici un : Python Data Science Handbook.

    • Agilité avec les données
    • Array, Matrix

    Visualisation¶

    • Graphes
    • Cartes
    • Graphes pour des statisticiens
    • Visualiser pour comprendre

    Données massives¶

    • Séquence de traitemements de données
    • Workflows - Data Pipelines
    • Données massives avec Python

    Back to top

    Source

    Mis à jour le 2020-12-23.