Machine learning - les briques de bases

Le machine learning avant les années 2000 se résumait à un problème d’optimisation. On définit une fonction d’erreur et on détermine le modèle qui minimise cette erreur. Depuis 2010, le problème d’optimisation s’est mué en une série de problèmes plutôt bien identifiés et correspondant à des cas concrets. Classification, régression, ranking… En pratique, on ne commence plus par modéliser mais plus par trouver le bon assemblage qui correspondent aux besoins.

Transformations des données, Embedding

Construire un embedding consiste le plus souvent à construire une fonction qui convertit un entier, un graphe, un texte en un vecteur réel de dimension fixe exploitable par un modèle de machine learning. Cette partie s’intéresse à construire de meilleures variables que celles issues du problème initiale.