2023-03-06 Année 2023, séance 3#

Séance découpée en trois parties.

Partie I : exercices

Retour sur les exercices en fin de session : Questions séance 6 février 2023.

fonction, notion de coût

  • fonctions : def

<<<

import cProfile

nombres = [9, 7, 5, 4, 6, 7, 3, 1, 7, 8]


def moyenne(ens):
    return sum(ens) / len(ens)


def ecarttype(ens):
    var = [(n - moyenne(ens)) ** 2 for n in ens]
    return (sum(var) / len(var)) ** 0.5


print(moyenne(nombres))
print(ecarttype(nombres))

with cProfile.Profile() as pr:
    for n in range(100000):
        ecarttype(nombres)

pr.print_stats()

  • coût d’un algorithme

  • notation with

Partie II : scikit-learn

Quelques rappels :

  • créer son premier modèle, type de problème résolus, famille de modèles, transformer, pipeline

  • Régression, classification, clustering, réduction de dimensions

Autres modèles :

Partie III : prétraitement

  • variables numériques, faut-il normaliser ou non ?

  • que faire des variables textuelles ?, catégories, texte libre

  • dirty-cat

  • deep learning, embeddings, transfer learning

  • pytorch

Exercices