:orphan: |rss_image| :ref:`<== ` **page de blog - 2/4** :ref:`==> ` :ref:`Blog ` :ref:`plan (12) ` .. |rss_image| image:: feed-icon-16x16.png :target: ../_downloads/rss.xml :alt: RSS ---- .. _ap-main-1: page de blog - 2/4 ++++++++++++++++++ .. blogpostagg:: :title: Année 2022, séance 3 :date: 2022-02-08 :keywords: python :categories: plan :rawfile: 2022/2022-02-08_session3.rst Séance découpée en trois parties. ... .. blogpostagg:: :title: Année 2022, séance 2 :date: 2022-02-07 :keywords: python :categories: plan :rawfile: 2022/2022-02-07_session2.rst Séance découpée en trois parties. ... .. blogpostagg:: :title: Année 2022, séance 1 :date: 2022-01-10 :keywords: python :categories: plan :rawfile: 2022/2022-01-10_session1.rst Séance découpée en trois parties. ... .. blogpostagg:: :title: Hackathon - Institut des Actuaires :date: 2017-09-11 :keywords: python,machine learning :categories: hackathon :rawfile: 2017/2017-09-11_hackathon.rst `Crésus `_ accompagne les personnes en situation de surendettement. Les personnes en situation financière difficile commencent par envoyer un dossier qui précisent les éléments principaux de leur situation. C'est ce que contiennent les bases *dossier*, *budget*. Un ou plusieurs rendez-vous téléphonique suit pour renseigné les tables *agenda* et *crédit*. Deux colonnes sont utilisées pour qualifier la nature de la situation (diagnostic) et l'orientation donnée au dossier. Il faudra prédire l'orientation et ne pas tenir compte de la nature. Pour ce faire, les tables sont été divisés en apprentissage et test selon deux ensembles disjoints dans le temps de dossiers. La base de dossier ne contient pas d'historique. C'est une vue de la situation au moment où le dossier est orienté. ... .. blogpostagg:: :title: Machine Learning - session 6 :date: 2017-06-25 :keywords: python,machine learning :categories: session :rawfile: 2017/2017-06-25_plan_session6.rst **Exercices** * Sélection de features * Comparaison des tests de coefficients pour un modèle linéaire `OLS `_, et des `features importance `_ * Résultat au niveau d'une observation `treeinterpreter `_ * Données : `Housing `_, `Forest Fire `_ * Prédiction et séries temporelles * Comparaison d'un modèle `ARIMA `_ et d'une `random forest `_ avec les séries décalées `lagmat `_, `pandas.shift `_ * Données : `DowJones `_, `Google Trends `_ * Notebooks : `Timeseries et machine learning `_ * Text * Comparer une `LDA `_ avec `word2vec `_ + `kmeans `_ * Données : * `tweets `_ * Notebooks : * `Texte et machine learning `_ **Plan** * Modules * Classique * `pandas `_, `numpy `_, `scipy `_ * `scikit-learn `_, `xgboost `_ * `statsmodels `_, * `prince `_, `fbpca `_ * `nltk `_, `gensim `_ * Extension * Extension de scikit-learn (`category_encoders `_, ...) * `imbalanced-learn `_ * `polylearn `_, `lightfm `_ * `edward `_ * `pyflux `_ * interprétation d'une prédiction `treeinterpreter `_ * `pyfolio `_, `zipline `_ * `lda2vec `_, `spacy `_ * Auto learning * `auto-sklearn `_ * `TPOT `_ * Graphes * Graphes (`ROC `_, `plus de maths `_, `sklearn.metrics.roc_curve `_) * `matplotlib `_, `seaborn `_, `bokeh `_ * Cartes * `basemap `_, * `shapely `_, `pyproj `_ * Données cryptées * `cyphermed `_ * Revue des différents problèmes de machine learning * `Python pour un datascientist `_ * Texte * Aperçu de traitement du langage `Texte et machine learning `_ .. blogpostagg:: :title: Cheat Sheets :date: 2017-06-24 :keywords: python,machine learning,cheat sheet :categories: cheat sheet :rawfile: 2017/2017-06-24_cheatsheets.rst Quand quelqu'un s'amuse à regrouper plusieurs *cheat sheets* au même endroit, il faut absolument garder le lien quelque part, `Essential Cheat Sheets for Machine Learning and Deep Learning Engineers `_, et son répertoire `GitHub `_. C'est une façon très simple d'attirer pas mal de monde au même endroit car cela nous évite pas mal d'aller retour vers un moteur de recherche. .. blogpostagg:: :title: Préparation pour la séance 5, données out of memory :date: 2017-05-23 :keywords: big data, :categories: big data :rawfile: 2017/2017-05-23-seance5.rst Certains jeux disponibles sur `data.gouv.fr `_ sont très volumineux. C'est l'occasion de voir comment se débrouiller quand les données ne tiennent pas en mémoire. Pour la prochaine, nous utiliserons un des fichiers disponibles sur cette page : `DAMIR `_, de préférence un des plus récents. Il faudra le télécharger avant la séance. Nous verrons différentes options pour le manipuler. ... .. blogpostagg:: :title: Références et plan pour la séance 4 :date: 2017-04-18 :keywords: conda,pip,pandas... :categories: pandas :rawfile: 2017/2017-04-18-seance4.rst Plan suivi pour cette séance : ... .. blogpostagg:: :title: Mettre à jour un module sous Windows :date: 2016-11-15 :keywords: update,pip,Windows :categories: module :rawfile: 2016/2016-11-15_update_windows.rst Comme il n'existe pas de compilateur par défaut sous Windows, l'installation ou la mise à jour des modules requiert de passer toujours par les mêmes étapes. Si la distribution `Anaconda `_ est installée et que le module est maintenu, il faut toujours exécuter : ... .. blogpostagg:: :title: Télécharger en Python via un proxy :date: 2016-10-10 :keywords: proxy,urllib,request :categories: internet :rawfile: 2016/2016-10-10_proxy.rst Il n'est pas facile de télécharger des données via un proxy. Je retranscris différents essais reçu par mail. La fonction `urllib.request.urlopen `_ ne fonctionne pas pour ce genre d'usage. Il faut utiliser le module `python-requests `_. Ce qui ne marche pas avec un proxy : ... ---- |rss_image| :ref:`<== ` **page de blog - 2/4** :ref:`==> ` :ref:`2022-05 (1) ` :ref:`2023-01 (2) ` :ref:`2023-02 (1) ` :ref:`2023-03 (2) ` :ref:`2023-04 (1) `