2023-02-17 Plan séance 5#

Voici le plan prévu pour la cinquième séance du cours de machine learning pour l’économie et la finance.

Comment manipuler de gros jeux de données ?

séries temporelles

anomalie

  • densité

  • GAN

  • prédictions aberrantes

  • astuce : comment s’assurer que la base d’apprentissage et de test sont semblables ?

éthique

mise en production

  • Mise en production : déploiement de modèles de machine learning

  • algorithmes, plus court chemin dans un graphe, recherche dichotomique ?

  • carte avec geopandas

Les projets sont à rendre pour le 30 juin 2023, à faire par groupe de deux ou trois.

projet 1

26 septembre 2019 : Incendie de l’usine Lubrizol à Rouen

Données : Demandes de valeurs foncières, voir aussi DVF.

Il faut répondre à une des questions suivantes :

  • Quel est l’impact de l’accident sur le foncier autour de l’indicent ?

  • Les prix de l’immobilier ont-ils augmenté dans les villes gares TGV après le confinement ?

projet 2

Données Résultats du contrôle sanitaire de l’eau distribuée commune par commune, voir aussi Ce que l’on sait des résidus de pesticides dans l’eau du robinet de milliers de communes (et des incertitudes sur leur toxicité), Achats de pesticides par code postal, Prix de l’eau par commune

Il faut répondre à une des questions suivantes :

  • Sur un département donné, peut-on prédire le prix de l’eau ?