2023-02-17 Plan séance 5#
Voici le plan prévu pour la cinquième séance du cours de machine learning pour l’économie et la finance.
Comment manipuler de gros jeux de données ?
séries temporelles
prédictions
décomposition, Holt Winters
détection des changements de régime
packages prophet, statsmodels, ruptures, tslearn
anomalie
densité
prédictions aberrantes
astuce : comment s’assurer que la base d’apprentissage et de test sont semblables ?
éthique
machine learning éthique, Latanya Sweeney: How technology impacts humans and dictates our civic future
mise en production
Mise en production : déploiement de modèles de machine learning
algorithmes, plus court chemin dans un graphe, recherche dichotomique ?
carte avec geopandas
Les projets sont à rendre pour le 30 juin 2023, à faire par groupe de deux ou trois.
projet 1
26 septembre 2019 : Incendie de l’usine Lubrizol à Rouen
Données : Demandes de valeurs foncières, voir aussi DVF.
Il faut répondre à une des questions suivantes :
Quel est l’impact de l’accident sur le foncier autour de l’indicent ?
Les prix de l’immobilier ont-ils augmenté dans les villes gares TGV après le confinement ?
projet 2
Données Résultats du contrôle sanitaire de l’eau distribuée commune par commune, voir aussi Ce que l’on sait des résidus de pesticides dans l’eau du robinet de milliers de communes (et des incertitudes sur leur toxicité), Achats de pesticides par code postal, Prix de l’eau par commune
Il faut répondre à une des questions suivantes :
Sur un département donné, peut-on prédire le prix de l’eau ?