RSS machine learning - 1/2 ==> Blog article (8) articles (3) cours (6) module (7) paper (3)


machine learning - 1/2#

Machine et sécurité#

2018-11-15

Recommandation depuis PyParis : Malware Data Science: Attack Detection and Attribution, Joshua Saxe with Hillary Sanders.

article

KBinsDiscretizer#

2018-11-15

Le modèle linéaire est facilement interprétable mais ne marche pas aussi bien qu’une random forest. Pourquoi le pas utiliser des modèles linéaires par morceaux. Il suffit juste de découper l’espace des features en morceaux ce que fait le KBinsDiscretizer. Et ça marche plutôt bien, particulièrement lorsque les données sont peu nombreuses.

article

dirty-cat(égories)#

2018-11-15

Je suis assis à côté de Gaël Varoquaux qui me raconte son dernier papier sur dirty-cat pour traiter des colonnes catégorielles avec beaucoup de catégories et qui se ressemblent :

article

Représenter un arbre de décision#

2018-09-27

Deux pistes :

article

Biblio : articles ajoutés récemment, interprétabilité des modèles#

2018-03-24

Dans Interprétabilité des modèles :

article

Pourquoi pandas et numpy, pourquoi pas seulement pandas (2A) ?#

2017-09-19

Voici quelques questions abordées durant la première séance. L’instruction pandas.read_csv n’a pas toujours fonctionné. Deux principales raisons à cela, la première à cause du chemin. Un chemin peut être absolu, il commence par c:\ ou \ sous Windows ou / sous Linux, ou relatif, il commence par un nom. Le chemin absolu ne pose pas de difficulté en Python sauf dans quelques cas où le chemin est un chemin réseau (commençant par \\). Par défaut, Python cherche les données à partir de l’emplacement du programme si le chemin est relatif. Cet emplacement est aussi l’emplacement courant pour le programme. Il suffit de placer les fichiers dans ce répetoire pour n’utiliser que le nom du fichier. On l’obtient en exécutant :

article

Combiner des random forest#

2017-02-15

C’est une astuce que m’ont fait découvrir deux étudiants dans leur projet associé au cours de troisième année Eléments logiciels pour le traitement des données massives. Ils ont utilisé une propriété rendue possible par l’implémentation des random forest de scikit-learn : il est possible de construire une random forest issue de l’assemblage de deux random forest. De là à paralléliser l’apprentissage d’une random forest, il n’y a qu’un pas. L’article en question : Combining random forest models in scikit learn.

article

Annoter des images#

2017-01-05

Construire une application qui reconnaît des images implique qu’on sache localiser un visage et le reconnaître. Pour appendre, il faut disposer d’une base images annotées ou labellisées dans lesquelles on connaît l’information à trouver. Voici l’image tirée de wikipédia : Détection de visage.

article

Tranformer les variables catégorielles et contrastes#

2016-11-30

Certains modèles de machine learning requiert de transformer les variables catégorielles en variables numériques. Il existe plusieurs façons de faire cela : Patsy: Contrast Coding Systems for categorical variables. Les extensions de scikit-learn incluent un module qui fait cela aussi mais façon scikit-learn : category_encoders implémente les transformations suivantes :

article

Tutoriel sur les réseaux de neurones#

2015-08-27

Le module neural-python implémente les réseaux de neurones. Il propose une interface similaire à celle de scikit-learn mais sa documentation est réussie.

article


RSS machine learning - 1/2 ==> 2022-10 (1) 2022-12 (2) 2023-01 (1) 2023-02 (1) 2023-04 (1)