.. blogpost:: :title: Plan séance 5 :keywords: plan :date: 2023-02-17 :categories: session Voici le plan prévu pour la cinquième séance du cours de machine learning pour l'économie et la finance. Comment manipuler de gros jeux de données ? **séries temporelles** * prédictions * décomposition, `Holt Winters `_ * détection des changements de régime * `Filtre de Kalman `_ * `SSA `_ * packages `prophet `_, `statsmodels `_, `ruptures `_, `tslearn `_ **anomalie** * densité * `GAN `_ * prédictions aberrantes * astuce : comment s'assurer que la base d'apprentissage et de test sont semblables ? **éthique** * `interprétabilité `_ * `machine learning éthique `_, `Latanya Sweeney: How technology impacts humans and dictates our civic future `_ **mise en production** * Mise en production : déploiement de modèles de machine learning * algorithmes, plus court chemin dans un graphe, recherche dichotomique ? * carte avec `geopandas `_ Les projets sont à rendre pour le 30 juin 2023, à faire par groupe de deux ou trois. **projet 1** 26 septembre 2019 : `Incendie de l'usine Lubrizol à Rouen `_ Données : `Demandes de valeurs foncières `_, voir aussi `DVF `_. Il faut répondre à une des questions suivantes : * Quel est l'impact de l'accident sur le foncier autour de l'indicent ? * Les prix de l'immobilier ont-ils augmenté dans les villes gares TGV après le confinement ? **projet 2** Données `Résultats du contrôle sanitaire de l'eau distribuée commune par commune `_, voir aussi `Ce que l'on sait des résidus de pesticides dans l'eau du robinet de milliers de communes (et des incertitudes sur leur toxicité) `_, `Achats de pesticides par code postal `_, `Prix de l'eau par commune `_ Il faut répondre à une des questions suivantes : * Sur un département donné, peut-on prédire le prix de l'eau ?