2023-03-07 Année 2023, séance 4#

Séance découpée en trois parties.

Partie I : exercices

  • Retour sur les exercices en fin de session, Questions séance 6 mars 2023

  • Comment travailler avec un grand jeu de données qui ne tient pas en mémoire

Partie II : modèle customisé

Les données nécessite un prétraitement spécifiques impossible à trouver dans une librairie. Il faut le coder soi-même de sorte qu’il puisse s’insérer dans un pipeline ?

Partie III : ingénierie logicielle

  • enregister, restorer un modèle de machine learning

  • notion d’ingéniérie logicielle (git, github, pull request, review, intégration continue)

  • partager son travail, package, documentation

  • mise en production docker, onnx