RSS <== page de blog - 2/11 ==> Blog modules (9)


page de blog - 2/11

KBinsDiscretizer

2018-11-15

Le modèle linéaire est facilement interprétable mais ne marche pas aussi bien qu’une random forest. Pourquoi le pas utiliser des modèles linéaires par morceaux. Il suffit juste de découper l’espace des features en morceaux ce que fait le KBinsDiscretizer. Et ça marche plutôt bien, particulièrement lorsque les données sont peu nombreuses.

article

dirty-cat(égories)

2018-11-15

Je suis assis à côté de Gaël Varoquaux qui me raconte son dernier papier sur dirty-cat pour traiter des colonnes catégorielles avec beaucoup de catégories et qui se ressemblent :

article

Fairness - fairlearn - classification

2018-10-24

Je suis tombé sur ce module fairlearn qui s’appuie sur l’article A Reductions Approach to Fair Classification. L’article définit mathématiquement l’aspect éthique qu’il souhaite vérifier dans des modèles de machine learning dédiés à la classification. L’article commence par définir le triplet (X,A,Y)A est l’ensemble des attributs protégés, X l’ensemble des variables, Y la chose à prédire. On note h(X) la prédiction du classifieur binaire. L’article définit ensuite la parité \pr{h(X) = \hat{y} | A = a} = \pr{h(X) = \hat{y}} \; \forall a, \hat{y} \in \{0, 1\}, puis l’égalité des chances : \pr{h(X) = \hat{y} | A = a, Y = y} = \pr{h(X) = \hat{y} | Y = y}. L’article propose une façon d’apprendre un modèle respectant ces contraintes qui s’expriment sous la forme d’un ensemble de contraintes linéaires.

article

English content

2018-10-13

Most of the content is written in French. Two reaons for that, my teachings are in French, most of the content available on the internet is already in English. However, there exist some English content. A good start would be the lectures by Gaël Varoquaux :. :ref:`l-ml-skgael. I wrote some challenges in English one about algorithmic, the other one about unsupervized machine learning : Computer Science Challenges. The main goal of this course is to introduce many standard machine learning problems and play with them. I suggest doing one competition or study with a known datasets (Kaggle, UCI).

article

Représenter un arbre de décision

2018-09-27

Deux pistes :

article

Plan séance 1 - Algorithmie

2018-09-04

Plan de la première séance 4 septembre.

article

Notebooks testés sur Debian 9

2018-08-22

Tous les notebooks et modules proposés lors des enseignements sont dorénavants testés sur une distribution Debian 9 (voir 2018-2019) et non plus sur Windows comme l’année dernière. La principale raison à cela est le coût…

article

Ecrire du code rapide

2018-08-21

Le titre n’est pas très évocateur mais l’article qui suit Bing.com runs on .NET Core 2.1! explique comment un service web, en l’occurence le moteur de recherche Bing, a été accéléré. Et l’explication repose sur six optimisation d’implémentation reliés à chaque à ce qu’on appelle une pull request. Les deux suivantes qui font partie des six ne sont pas trop compliqués à lire en particulier la deuxième qui révèle que le moteur de recherche parse énormément d’urls à la recherche de caractères /. A priori, la modification implique que la recherche de deux ou trois charactères et très souvent utilisée et que cela vaut le coup d’écrire spécifique dans ce cas. Le test qui choisit l’un ou l’autre cas apparaît d’un surcoût négligeable.

article

Quelques articles intéressants

article

Quelques articles intéressants

2018-08-01

Presque un cours.

article


RSS <== page de blog - 2/11 ==> 2018-11 (4) 2018-12 (1) 2019-01 (4) 2019-02 (2) 2019-05 (1)