:orphan: |rss_image| :ref:`<== ` **page de blog - 2/14** :ref:`==> ` :ref:`Blog ` :ref:`cours (3) ` .. |rss_image| image:: feed-icon-16x16.png :target: ../_downloads/rss.xml :alt: RSS ---- .. _ap-main-1: page de blog - 2/14 +++++++++++++++++++ .. blogpostagg:: :title: Online machine learning :date: 2020-07-09 :keywords: sprint,scikit-learn,online machine learning :categories: library :rawfile: 2020/2020-07-09_creme.rst A découvrir : `creme `_ pour faire de l'online machine learning (streaming). ... .. blogpostagg:: :title: In a sprint from home :date: 2020-06-23 :keywords: sprint,scikit-learn :categories: sprint :rawfile: 2020/2020-06-23_sklearn_sprint.rst Quelques liens... Sinon, ce n'est pas évident de faire un sprint à distance. Ca reste, dans mon esprit un événement festif. ... .. blogpostagg:: :title: Outils pour trucs chiants :date: 2020-06-19 :keywords: outils,automatisation :categories: automatisation :rawfile: 2020/2020-06-19_tools.rst Il existe beaucoup de trucs chiants qu'on fait régulièrement quand on programme. Par exemple, pour ces cours, maintenir à jour tous les notebooks en dépit des nombreuses mises à jour de pandas, scikit-learn, numpy et j'en passe... C'est très chiant, surtout si on envisage de le faire manuellement (il y a plus de 200 notebooks). Alors c'est quand même beaucoup moins chiants de réfléchir à une façon de l'automatiser. Quand j'ai commencé il y a cinq ans à réfléchir à tout ça, il n'existait pas tous les outils dont on dispose aujourd'hui. J'ai fourré plein de codes dans un module :epkg:`pyquickhelper` qui m'aide à faire tourner tous les notebooks chaque semaine avec :epkg:`Jenkins` pour m'assurer qu'ils fonctionnent encore. Mais aujourd'hui, je vous dirais qu'il existe un outil pour à peu près tout car il est très probable que, quelque soit votre besoin, quelqu'un ait eu le même. Il suffit de chercher. ... .. blogpostagg:: :title: Parallélisation avec pathos :date: 2020-05-04 :keywords: pathos,livre,tutoriel :categories: module :rawfile: 2020/2020-05-04_reading.rst * `pathos `_ * `interlap `_ * `BayesianOptimization `_, optimisation bayésienne en pure python Le livre suivant a l'air pas mal du tout : `Mastering Large Datasets with Python `_. ... .. blogpostagg:: :title: Quelques vidéos de PyCon :date: 2020-05-01 :keywords: pycon,conférences :categories: papers :rawfile: 2020/2020-05-01_pycon.rst Première vidéo à propos de "privacy" ou protection des données : `tensorflow_privacy `_, `Practical privacy-preserving machine learning in Python `_. ... .. blogpostagg:: :title: Worst case scenarios :date: 2020-04-08 :keywords: tree,branch bound :categories: papers :rawfile: 2020/2020-04-08_paper.rst J'ai découvert les publications de `Maria-Florina Balcan `_ aujourd'hui. Un de ses axes de recherches est - je cite - **Analysis of Algorithms beyond the Worst Case**. Celui-ci propose une amélioration de la construction d'arbres utilisés pour optimiser la recherche d'éléments dans un espace vectoriel : `Learning to Branch `_. Je recommande aussi les livres cités sur la page de son cours : `Advanced Introduction to Machine Learning `_. Parmi ceux que j'ai envie de lire : `The Power of Localization for Efficiently Learning Linear Separators with Noise `_, `Data Driven Resource Allocation for Distributed Learning `_, `Learning Valuation Functions `_, `Dispersion for Data-Driven Algorithm Design, Online Learning, and Private Optimization `_. ... .. blogpostagg:: :title: Articles :date: 2020-02-20 :keywords: articles :categories: papers :rawfile: 2020/2020-02-24_review.rst La librairie `deslib `_ implémente plusieurs algorithme de sélection de modèles sur des problèmes de classifications. Mais plutôt que de sélectionner un modèle ou un ensemble de modèle sur toutes la base, elle sélectionne les meilleurs modèles localement. On appelle cela la `sélection dynamique de classifieurs `_ (voir :ref:`l-dynamic-selection-ml`). ... .. blogpostagg:: :title: Kaggle... :date: 2019-12-05 :keywords: exercice :categories: kaggle :rawfile: 2019/2019-12_05_kaggle.rst :epkg:`Kaggle` propose des sujets principalement académiques depuis quelques années. Est-ce une bonne source de données pour un projet étudiant ? Ca l'a été. Maintenant, les étudiants n'ont plus grand chose à faire pour sortir de ce qui a déjà été fait. Le sujet `soccer `_ a été étudié sous toutes les coutures par beaucoup de gens qui laissent le fruit de leur travail sur le site. Un des derniers parus `Match Outcome Prediction Project `_ correspond à ce qu'on attend d'un futur datascientist. Il faudrait que je regarde ce que le site contient avant de me pencher sur le projet d'un étudiant qui a choisi ce jeu de données. Il serait possible de bannir *kaggle* de la liste des sources de données admissibles ou faire confiance aux étudiants. J'avoue qu'à leur âge, je ne lisais pas beaucoup, internet n'existait pas il est vrai. Mais ça m'amusait plus d'inventer mes propres trucs que de réutiliser ceux des autres qui marchaient pourtant bien. C'est comme ça que j'ai recodé plein de trucs inutiles pour le principe de faire quelque chose qui m'appartienne. Ou alors ça me paraissait plus simple d'inventer un truc nouveau que de comprendre le travail des autres. .. blogpostagg:: :title: Notebook maintenance :date: 2019-09-21 :keywords: exercice :categories: maintenance :rawfile: 2019/2019-09-21_issues.rst Je dis souvent en cours qu'un notebook pète tous les quinze jours. Le dernier :ref:`mltablemortaliterst` plante sur une instruction qui me fait penser que j'attendrais la prochaine version avant de me pencher dessus car je n'en comprends pas la logique. Je l'ai laissée avec une exception et j'ai ajouté une ligne équivalente mais très probablement moins efficace. Tout cela à cause de :epkg:`xarray`. Le monde open source est pavé de bonnes intentions. .. blogpostagg:: :title: Créer un exécutable :date: 2019-06-15 :keywords: setup,innosetup,pyinstaller :categories: installation :rawfile: 2019/2019-06-15_exe.rst On me pose parfois la question, comment faire pour créer son propre exécutable et ne pas avoir à installer python chez un client pour faire tourner ce qu'on a fait pour lui. Cet article y répond : `Making a Stand Alone Executable from a Python Script using PyInstaller `_. ... ---- |rss_image| :ref:`<== ` **page de blog - 2/14** :ref:`==> ` :ref:`2020-09 (1) ` :ref:`2020-10 (2) ` :ref:`2020-11 (2) ` :ref:`2020-12 (1) ` :ref:`2021-02 (2) `