.. blogpost::
:title: Plan séance 1
:keywords: plan
:date: 2023-01-20
:categories: session
Voici le plan prévu pour la première séance
du cours de machine learning pour l'économie et
la finance.
**Séance 1**
* `Python `_,
`Anaconda `_,
:epkg:`pandas`, :epkg:`numpy`, :epkg:`jupyter`,
:epkg:`matplotlib`, expressions régulières, fichiers
* Ressource `www.xavierdupre.fr `_
* `Source de données
`_
* :epkg:`scikit-learn` : API
* :ref:`l-regclass`, multi-classification
* Courbe ROC, AUC, voir :ref:`winescolorrocrst`,
`Courbe ROC `_,
`graphe erreur ROC
`_
* `Ridge, Lasso `_
* Ranking, Clustering
Une discussion recopiée depuis un article sur Linkedin
à propos de `ChatGPT `_
qui montre que c'est un outil efficace mais seulement
un outil.
* **JP :** Hey Chat GPT : La mère de Jean a 4 enfants.
3 des enfants s'appellent Pédro, Caroline et Robert.
Quel est le prénom du quatrième ?
* **ChatGPT :** "Il n'est pas possible de déterminer le prénom
du quatrième enfant de la mère de Jean uniquement
avec l'information donnée."
* **JP :** si c’est possible. c’est dans l'énoncé
* **ChatGPT :** "Il n'y a pas assez d'informations dans l'énoncé pour
déterminer le prénom du quatrième enfant. Il est seulement
mentionné que les trois premiers enfants s'appellent
Pedro, Caroline et Robert."
* **JP :** pourtant il est dit « La mère de Jean» c’est la mère de qui ?
* **ChatGPT :** "Vous avez raison, dans l'énoncé il est mentionné "La mère de Jean",
donc Jean est un individu dont on ne sait rien,
à part qu'il a une mère et qu'elle a 4 enfants."
Cela dit, il est possible que son utilisation change un peu
la donne quant aux moteurs de recherches si ce n'est que son
coût est sans doute encore prohibitif pour un usage si massif.
`Training language models to follow instructions with human feedback
`_
Un article intéressant sur l'inflation :
`De nouveaux indicateurs de perception de l’inflation en France issus des médias
`_.
A quoi ressemble le bruit d'une foule ?
Parmi les sujets abordés cette année :
* expressions régulières, fichiers, calcul matriciel, dataframe, graphes ?
* :epkg:`scikit-learn` : concepts de transformer
et prédicteur, revue des modèles les plus couramment utilisés,
présentation de la validation croisée, et grille de recherche,
notion de pipe-line en machine learning
* valeurs manquantes, problème de classification avec des classes
sous représentées,
* ingénierie logicielle ? tests unitaires, git, pull request,
notebook, librairies, réalisation d'un package pour partager son code,
écrire une documentation. Cette partie est utile si on travaille
à plusieurs sur le même code.
* notions de séries temporelles ? prédiction, analyse de survie.
* Grands jeux de données
* Quelques mots de deep learning : encoding, transfer learning
* Mise en production : déploiement de modèles de machine learning
* machine learning éthique
* algorithmes, plus court chemin dans un graphe, recherche dichotomique ?
La médecine de demain :
* `Intelligence artificielle et médecine, par le Pr. Jean-Emmanuel Bibault
`_,
aide à l'interprétation des images, à la localisation des tumeurs,
assistance chirurgicale
* enregistrement des données en temps réel, détection de symptômes sur des données
qu'on n'avait pas avant
* ...
Ethique
* `IS THERE DISCRIMINATION AGAINST THE POOR?
`_
* `Y-A-T-IL UNE DISCRIMINATION CONTRE LES PAUVRES ?
`_
* `ASSURANCES, VERS UNE UTILISATION ÉTHIQUE DE L’INTELLIGENCE ARTIFICIELLE
`_