<== page de blog - 2/4 ==> Blog plan (12)
page de blog - 2/4#
Année 2022, séance 3#
2022-02-08
Séance découpée en trois parties.
…
Année 2022, séance 2#
2022-02-07
Séance découpée en trois parties.
…
Année 2022, séance 1#
2022-01-10
Séance découpée en trois parties.
…
Hackathon - Institut des Actuaires#
2017-09-11
Crésus accompagne les personnes en situation de surendettement. Les personnes en situation financière difficile commencent par envoyer un dossier qui précisent les éléments principaux de leur situation. C’est ce que contiennent les bases dossier, budget. Un ou plusieurs rendez-vous téléphonique suit pour renseigné les tables agenda et crédit. Deux colonnes sont utilisées pour qualifier la nature de la situation (diagnostic) et l’orientation donnée au dossier. Il faudra prédire l’orientation et ne pas tenir compte de la nature. Pour ce faire, les tables sont été divisés en apprentissage et test selon deux ensembles disjoints dans le temps de dossiers. La base de dossier ne contient pas d’historique. C’est une vue de la situation au moment où le dossier est orienté.
…
Machine Learning - session 6#
2017-06-25
Exercices
- Sélection de features
Comparaison des tests de coefficients pour un modèle linéaire OLS, et des features importance
Résultat au niveau d’une observation treeinterpreter
Données : Housing, Forest Fire
- Prédiction et séries temporelles
Comparaison d’un modèle ARIMA et d’une random forest avec les séries décalées lagmat, pandas.shift
Données : DowJones, Google Trends
Notebooks : Timeseries et machine learning
- Text
- Données :
- Notebooks :
Plan
- Modules
- Classique
- Extension
Extension de scikit-learn (category_encoders, …)
interprétation d’une prédiction treeinterpreter
- Auto learning
- Graphes
Graphes (ROC, plus de maths, sklearn.metrics.roc_curve)
- Données cryptées
- Revue des différents problèmes de machine learning
- Texte
Aperçu de traitement du langage Texte et machine learning
Cheat Sheets#
2017-06-24
Quand quelqu’un s’amuse à regrouper plusieurs cheat sheets au même endroit, il faut absolument garder le lien quelque part, Essential Cheat Sheets for Machine Learning and Deep Learning Engineers, et son répertoire GitHub. C’est une façon très simple d’attirer pas mal de monde au même endroit car cela nous évite pas mal d’aller retour vers un moteur de recherche.
Préparation pour la séance 5, données out of memory#
2017-05-23
Certains jeux disponibles sur data.gouv.fr sont très volumineux. C’est l’occasion de voir comment se débrouiller quand les données ne tiennent pas en mémoire. Pour la prochaine, nous utiliserons un des fichiers disponibles sur cette page : DAMIR, de préférence un des plus récents. Il faudra le télécharger avant la séance. Nous verrons différentes options pour le manipuler.
…
Références et plan pour la séance 4#
2017-04-18
Plan suivi pour cette séance :
…
Mettre à jour un module sous Windows#
2016-11-15
Comme il n’existe pas de compilateur par défaut sous Windows, l’installation ou la mise à jour des modules requiert de passer toujours par les mêmes étapes. Si la distribution Anaconda est installée et que le module est maintenu, il faut toujours exécuter :
…
Télécharger en Python via un proxy#
2016-10-10
Il n’est pas facile de télécharger des données via un proxy. Je retranscris différents essais reçu par mail. La fonction urllib.request.urlopen ne fonctionne pas pour ce genre d’usage. Il faut utiliser le module python-requests. Ce qui ne marche pas avec un proxy :
…
<== page de blog - 2/4 ==> 2022-05 (1) 2023-01 (2) 2023-02 (1) 2023-03 (2) 2023-04 (1)