Economie Statistique

Séquence de traitemements de données

Il est très rare qu’un modèle de machine learning puisse être appliqué sur des données brutes. Il y a toujours une étape de nettoyages, de traitements des valeurs manquantes. Ce sont souvent des étapes qu’on effectue dans plusieurs cellules distinctes d’un notebook et qu’on exécute à chaque fois que les données sont rafraîchies. On peut néanmoins vouloir les assembler en un seul objet afin de simplifier le code, on peut aussi souhaiter optimiser certains paramètres, un traitement particulier au sein d’une séquence de traitements. C’est ainsi que la notion de pipeline, c’est un objet qui conserve la mémoire d’une séquence de traitements tout en lui donnant l’apparence d’un seul.

(à venir)

Lecture

Modules