2018-11 - 1/1 Blog article (8) articles (3) cours (6) module (7) paper (3)
2018-11 - 1/1#
Quelques modules intéressants#
Machine et sécurité#
2018-11-15
Recommandation depuis PyParis : Malware Data Science: Attack Detection and Attribution, Joshua Saxe with Hillary Sanders.
KBinsDiscretizer#
2018-11-15
Le modèle linéaire est facilement interprétable mais ne marche pas aussi bien qu’une random forest. Pourquoi le pas utiliser des modèles linéaires par morceaux. Il suffit juste de découper l’espace des features en morceaux ce que fait le KBinsDiscretizer. Et ça marche plutôt bien, particulièrement lorsque les données sont peu nombreuses.
dirty-cat(égories)#
2018-11-15
Je suis assis à côté de Gaël Varoquaux qui me raconte son dernier papier sur dirty-cat pour traiter des colonnes catégorielles avec beaucoup de catégories et qui se ressemblent :
…
2018-11 - 1/1 2022-10 (1) 2022-12 (2) 2023-01 (1) 2023-02 (1) 2023-04 (1)