<== page de blog - 4/16 ==> Blog article (8) articles (3) cours (6) module (7) paper (3)
page de blog - 4/16#
Packages glanés au fil des lectures#
2020-10-05
DESlib : assembler différents modèles de machine learning
pyts : classification de séries temporelles
tslearn : dynamic time warping, classification, clustering, plus proches voisins, étude de sous-séquences
GraKeL : algorithmes sur les graphes, plus court chemin, marches aléatoires, méthodes à noyaux
scikit-network : de nombreux algorithmes comme PageRank, Louvain, …
pyDML : apprentissage de distances métriques
metric-learn : apprentissage de distances métriques
Deux articles intéressants pour optimiser les calculs :
…
Un article simple sur le profiling#
2020-09-24
Un article simple sur plusieurs écriture de la même fonction de façon de plus en plus efficace : Understanding the FFT Algorithm.
Schéma de données de modélisation de risques#
2020-08-10
Je suis tombé dessus par hasard : RDOS. Ce ne sont pas des données mais des schémas de données qui permettent de modéliser différents risques financiers liés à la propriétés. Cela donne des idées pour qui voudrait faire quelque chose dans ce sens. Ce ne sont pas des données, mais ça donne une idée des données qu’il faudrait aller chercher.
Plagiat#
2020-08-08
Je suis tombé dessus par hasard : pycode_similar. Je n’ai pas essayé.
Online machine learning#
In a sprint from home#
2020-06-23
Quelques liens… Sinon, ce n’est pas évident de faire un sprint à distance. Ca reste, dans mon esprit un événement festif.
…
Outils pour trucs chiants#
2020-06-19
Il existe beaucoup de trucs chiants qu’on fait régulièrement quand on programme. Par exemple, pour ces cours, maintenir à jour tous les notebooks en dépit des nombreuses mises à jour de pandas, scikit-learn, numpy et j’en passe… C’est très chiant, surtout si on envisage de le faire manuellement (il y a plus de 200 notebooks). Alors c’est quand même beaucoup moins chiants de réfléchir à une façon de l’automatiser. Quand j’ai commencé il y a cinq ans à réfléchir à tout ça, il n’existait pas tous les outils dont on dispose aujourd’hui. J’ai fourré plein de codes dans un module pyquickhelper qui m’aide à faire tourner tous les notebooks chaque semaine avec Jenkins pour m’assurer qu’ils fonctionnent encore. Mais aujourd’hui, je vous dirais qu’il existe un outil pour à peu près tout car il est très probable que, quelque soit votre besoin, quelqu’un ait eu le même. Il suffit de chercher.
…
Parallélisation avec pathos#
2020-05-04
BayesianOptimization, optimisation bayésienne en pure python
Le livre suivant a l’air pas mal du tout : Mastering Large Datasets with Python.
…
Quelques vidéos de PyCon#
2020-05-01
Première vidéo à propos de « privacy » ou protection des données : tensorflow_privacy, Practical privacy-preserving machine learning in Python.
…
Worst case scenarios#
2020-04-08
J’ai découvert les publications de Maria-Florina Balcan aujourd’hui. Un de ses axes de recherches est - je cite - Analysis of Algorithms beyond the Worst Case. Celui-ci propose une amélioration de la construction d’arbres utilisés pour optimiser la recherche d’éléments dans un espace vectoriel : Learning to Branch. Je recommande aussi les livres cités sur la page de son cours : Advanced Introduction to Machine Learning. Parmi ceux que j’ai envie de lire : The Power of Localization for Efficiently Learning Linear Separators with Noise, Data Driven Resource Allocation for Distributed Learning, Learning Valuation Functions, Dispersion for Data-Driven Algorithm Design, Online Learning, and Private Optimization.
…
<== page de blog - 4/16 ==> 2022-10 (1) 2022-12 (2) 2023-01 (1) 2023-02 (1) 2023-04 (1)