Sélection de variables#
La sélection de features peut paraître de moindre importance dans un contexte où la puissance de calcul ne cesse d’augmenter mais cette puissance est de plus en plus accessible via la parallélisation qui nécessite quelques ajustements algorithmiques. L’ajout de features complique également l’interprétation des résultats.
Notebooks
2A.ml - Réduction d’une forêt aléatoire - énoncé, 2A.ml - Réduction d’une forêt aléatoire - correction
Lectures
Consistent Feature Selection for Pattern Recognition in Polynomial Time (boruta)
Variable selection using pseudo-variables : l’article utilise la pénalisation pour classer les variables par importance, plus le modèle est pénalisé (type Lasso), plus il réduit le nombre de variables.
Modules