:orphan: |rss_image| **machine learning - 1/2** :ref:`==> ` :ref:`Blog ` :ref:`article (8) ` :ref:`articles (3) ` :ref:`cours (6) ` :ref:`module (7) ` :ref:`paper (3) ` .. |rss_image| image:: feed-icon-16x16.png :target: ../_downloads/rss.xml :alt: RSS ---- .. index:: machine learning .. _ap-cat-machine_learning-0: machine learning - 1/2 ++++++++++++++++++++++ .. blogpostagg:: :title: Machine et sécurité :date: 2018-11-15 :keywords: security,machine learning :categories: machine learning :rawfile: 2018/2018-11-15_malware.rst Recommandation depuis `PyParis `_ : `Malware Data Science: Attack Detection and Attribution `_, Joshua Saxe with Hillary Sanders. .. blogpostagg:: :title: KBinsDiscretizer :date: 2018-11-15 :keywords: KBinsDiscretizer,modèle interprétable :categories: machine learning :rawfile: 2018/2018-11-15_kbins.rst Le modèle linéaire est facilement interprétable mais ne marche pas aussi bien qu'une random forest. Pourquoi le pas utiliser des modèles linéaires par morceaux. Il suffit juste de découper l'espace des features en morceaux ce que fait le `KBinsDiscretizer `_. Et ça marche plutôt bien, particulièrement lorsque les données sont peu nombreuses. .. blogpostagg:: :title: dirty-cat(égories) :date: 2018-11-15 :keywords: dirty-cat,variable catégorielle :categories: machine learning :rawfile: 2018/2018-11-15_dirtycat.rst Je suis assis à côté de Gaël Varoquaux qui me raconte son dernier papier sur :epkg:`dirty-cat` pour traiter des colonnes catégorielles avec beaucoup de catégories et qui se ressemblent : ... .. blogpostagg:: :title: Représenter un arbre de décision :date: 2018-09-27 :keywords: decision tree :categories: machine learning :rawfile: 2018/2018-09-27_tree.rst Deux pistes : ... .. blogpostagg:: :title: Biblio : articles ajoutés récemment, interprétabilité des modèles :date: 2018-03-24 :keywords: interprétabilité,eli5 :categories: machine learning :rawfile: 2018/2018-03-24_interpretabilite.rst Dans :ref:`l-interpretabilite-ml` : ... .. blogpostagg:: :title: Pourquoi pandas et numpy, pourquoi pas seulement pandas (2A) ? :date: 2017-09-19 :keywords: machine learning,pandas,numpy,matplotlib :categories: machine learning :rawfile: 2017/2017-09-19_pandas_numpy.rst Voici quelques questions abordées durant la première séance. L'instruction :epkg:`pandas:read_csv` n'a pas toujours fonctionné. Deux principales raisons à cela, la première à cause du **chemin**. Un chemin peut être absolu, il commence par ``c:\`` ou ``\`` sous Windows ou ``/`` sous Linux, ou relatif, il commence par un nom. Le chemin absolu ne pose pas de difficulté en :epkg:`Python` sauf dans quelques cas où le chemin est un chemin réseau (commençant par ``\\``). Par défaut, :epkg:`Python` cherche les données à partir de l'emplacement du programme si le chemin est relatif. Cet emplacement est aussi l'emplacement courant pour le programme. Il suffit de placer les fichiers dans ce répetoire pour n'utiliser que le nom du fichier. On l'obtient en exécutant : ... .. blogpostagg:: :title: Combiner des random forest :date: 2017-02-15 :keywords: scikit-learn,machine learning,random forest :categories: machine learning :rawfile: 2017/2017-02-15_randomforest.rst C'est une astuce que m'ont fait découvrir deux étudiants dans leur projet associé au cours de troisième année :ref:`l-td3a`. Ils ont utilisé une propriété rendue possible par l'implémentation des `random forest `_ de `scikit-learn `_ : il est possible de construire une random forest issue de l'assemblage de deux random forest. De là à paralléliser l'apprentissage d'une random forest, il n'y a qu'un pas. L'article en question : `Combining random forest models in scikit learn `_. .. blogpostagg:: :title: Annoter des images :date: 2017-01-05 :keywords: images,annotations,labels :categories: machine learning :rawfile: 2017/2017-01-05_image.rst Construire une application qui reconnaît des images implique qu'on sache localiser un visage et le reconnaître. Pour appendre, il faut disposer d'une base images *annotées* ou *labellisées* dans lesquelles on connaît l'information à trouver. Voici l'image tirée de wikipédia : `Détection de visage `_. ... .. blogpostagg:: :title: Tranformer les variables catégorielles et contrastes :date: 2016-11-30 :keywords: categorie,scikit-learn :categories: machine learning :rawfile: 2016/2016-11-30_encoding_category.rst Certains modèles de machine learning requiert de transformer les variables catégorielles en variables numériques. Il existe plusieurs façons de faire cela : `Patsy: Contrast Coding Systems for categorical variables `_. Les `extensions de scikit-learn `_ incluent un module qui fait cela aussi mais façon `scikit-learn `_ : `category_encoders `_ implémente les transformations suivantes : ... .. blogpostagg:: :title: Tutoriel sur les réseaux de neurones :date: 2015-08-27 :keywords: réseau de neurones,neural network :categories: machine learning,tutoriel :rawfile: 2015/2015-08-27_nn.rst Le module `neural-python `_ implémente les `réseaux de neurones `_. Il propose une `interface `_ similaire à celle de `scikit-learn `_ mais sa `documentation `_ est réussie. ---- |rss_image| **machine learning - 1/2** :ref:`==> ` :ref:`2022-10 (1) ` :ref:`2022-12 (2) ` :ref:`2023-01 (1) ` :ref:`2023-02 (1) ` :ref:`2023-04 (1) `