Galleries

Notebooks Coverage

Le petit coin des data scientists

Ce sont quelques notebooks sur des points particuliers qui surgissent au quotidien quand on traite des données.

_images/classification_multiple.thumb.png

Classification multiple

Explorations autour d’un problème de classification multiple.

_images/correlation_non_lineaire.thumb.png

Corrélations non linéaires

Les corrélations indiquent si deux variables sont linéairement équivalentes. Comment étendre cette notion à des variables liées mais pas de façon linéaire.

_images/file_dattente_ex.thumb.png

File d’attente, un exemple simple

Cet exemple vient illustrer le paragraphe sur les files d’attente et l’espérance de vie des ampoules.

_images/discret_gradient.thumb.png

Le gradient et le discret

Les méthodes d’optimisation à base de gradient s’appuie sur une fonction d’erreur dérivable qu’on devrait appliquer de préférence sur des variables aléatoires réelles. Ce notebook explore quelques idées.

_images/regression_lineaire.thumb.png

Régression linéaire et résultats numériques

Ce notebook s’intéresse à la façon d’interpréter les résultats d’une régression linéaire lorsque les variables sont corrélées puis il explore une façon d’associer arbre de décision et régression linéaire pour construire une régression linéaire par morceaux.

_images/quantile_regression_example.thumb.png

Régression quantile illustrée

La régression quantile est moins sensible aux points aberrants. Elle peut être définie comme une régression avec une norme L1 (une valeur absolue). Ce notebook explore des régressions avec des quantiles différents.

_images/split_train_test.thumb.png

Répartir en base d’apprentissage et de test

C’est un problème plutôt facile puisqu’il s’agit de répartir aléatoirement les lignes d’une base de données d’un côté ou de l’autre. Lorsque le problème de machine learning à résoudre est un problème de classification, il faut s’assurer que chaque côté contient une proportion raisonnable de chaque classe.

Métriques

_images/roc_example.thumb.png

ROC

A few graphs about ROC on the iris datasets.

_images/pvalues_examples.thumb.png

p-values

Compute p-values.

Machine Learning

_images/benchmark.thumb.png

Benchmark

Ce notebook compare différents modèles depuis un notebook.

_images/mf_acp.thumb.png

Factorisation et matrice et ACP

Un exemple pour montrer l’équivalence entre l’ACP et une factorisation de matrice.

_images/piecewise_linear_regression.thumb.png

Régression linéaire par morceaux

La régression linéaire par morceaux a l’avantage de produire un modèle localement interprétable. Mais ce n’est pas évident d’estimer un tel modèle quand on ne connaît pas les morceaux par avance.

_images/regression_no_inversion.thumb.png

Régression sans inversion

Ce notebook mesure le temps de calcul dans deux algorithmes pour résoudre une régression linéaire, le premier inverse un matrice, le second le fait sans inverser une matrice, le troisième reprend l’idée du second mais utilise une décomposition QR puis inverse la matrice R.

_images/reseau_neurones.thumb.png

Réseaux de neurones

Réseaux de neurones avec scikit-learn.

_images/valeurs_manquantes_mf.thumb.png

Valeurs manquantes et factorisation de matrices

Réflexion autour des valeur manquantes et de la factorisation de matrice positive.

_images/logreg_voronoi.thumb.png

Voronoï et régression logistique

Le notebook étudie la pertinence d’un modèle de régression logistique dans certaines configurations. Il regarde aussi le diagramme de Voronoï associé à une régression logistique à trois classes. Il donne quelques intuitions sur les modèles que la régression logistique peut résoudre.

NLP - Natural Language Processing

_images/completion_trie_long.thumb.png

Completion Trie and metrics

Evaluation of a completion system on wikpedia pages.

_images/completion_profiling.thumb.png

Completion profiling

Profiling avec cProfile, memory_profiler, pyinstrument, snakeviz.

_images/completion_trie.thumb.png

Complétion

Comparaion de plusieurs algorithmes pour implémenter un système de complétion.

_images/completion_simple.thumb.png

Complétion Simple

Evaluation d’une métrique pour un système de complétion sur quelques cas simples.