Galleries

Notebooks Coverage

Le petit coin des data scientists

Ce sont quelques notebooks sur des points particuliers qui surgissent au quotidien quand on traite des données.

_images/classification_multiple.thumb.png Classification multiple Explorations autour d’un problème de classification multiple.
_images/correlation_non_lineaire.thumb.png Corrélations non linéaires Les corrélations indiquent si deux variables sont linéairement équivalentes. Comment étendre cette notion à des variables liées mais pas de façon linéaire.
_images/file_dattente_ex.thumb.png File d’attente, un exemple simple Cet exemple vient illustrer le paragraphe sur les files d’attente et l’espérance de vie des ampoules.
_images/discret_gradient.thumb.png Le gradient et le discret Les méthodes d’optimisation à base de gradient s’appuie sur une fonction d’erreur dérivable qu’on devrait appliquer de préférence sur des variables aléatoires réelles. Ce notebook explore quelques idées.
_images/regression_lineaire.thumb.png Régression linéaire et résultats numériques Ce notebook s’intéresse à la façon d’interpréter les résultats d’une régression linéaire lorsque le résultat de l’interprétation est connu à l’avance.
_images/split_train_test.thumb.png Répartir en base d’apprentissage et de test C’est un problème plutôt facile puisqu’il s’agit de répartir aléatoirement les lignes d’une base de données d’un côté ou de l’autre. Lorsque le problème de machine learning à résoudre est un problème de classification, il faut s’assurer que chaque côté contient une proportion raisonnable de chaque classe.

Métriques

_images/roc_example.thumb.png ROC A few graphs about ROC on the iris datasets.
_images/pvalues_examples.thumb.png p-values Compute p-values.

Machine Learning

_images/benchmark.thumb.png Benchmark Ce notebook compare différents modèles depuis un notebook.
_images/mf_acp.thumb.png Factorisation et matrice et ACP Un exemple pour montrer l’équivalence entre l’ACP et une factorisation de matrice.
_images/reseau_neurones.thumb.png Réseaux de neurones Réseaux de neurones avec scikit-learn.
_images/valeurs_manquantes_mf.thumb.png Valeurs manquantes et factorisation de matrices Réflexion autour des valeur manquantes et de la factorisation de matrice positive.

NLP - Natural Language Processing

_images/completion_trie_long.thumb.png Completion Trie and metrics Evaluation of a completion system on wikpedia pages.
_images/completion_profiling.thumb.png Completion profiling Profiling avec cProfile, memory_profiler, line_profiler, pyinstrument, snakeviz.
_images/completion_trie.thumb.png Complétion Comparaion de plusieurs algorithmes pour implémenter un système de complétion.
_images/completion_simple.thumb.png Complétion Simple Evaluation d’une métrique pour un système de complétion sur quelques cas simples.