Recommandations sur le web¶

Quelques pistes sur le fonctionnement des moteurs de recommandations sur le web.

In [1]:

from jyquickhelper import add_notebook_menu
add_notebook_menu()

Out[1]:

run previous cell, wait for 2 seconds

Formalisation d’un système de recommandation¶

grid

Ranking similaire à un système de recommandation
- Requête --> résultats conseillés
- Requête --> requêtes associées (Related Searches)
Recommandation pure
- Le système n'utilise pas d'information sur le contenu
- Uniquement basée sur l'évaluation implicite faite par l'utilisateur (le clic)

Système de recommandation pure --> une feature
Features extraites à partir du contenu, du contexte, de l'utilisateur
Utilisation de classifieurs intermédiaires (annotation manuelle, catégorisation)
Apprendre le feedback des utilisateurs, généraliser là où il n'est pas

recsys

Online

Offline

Tout les traitements qui produisent les données que le service online utilisent.
Data workflows
Rafraîchissements fréquents et périodiques

Utilisation de logs d'événements (achats, clic)
Génération de candidats : requête --> liste de résultats, système de recommandation
Extraction de features (requête, résultat, paire requête résultats)
Machine learning, targets construites à partir des des clics

Construction d'une liste de recommandations à utiliser online $\sim O(100M)$.

Always growing.

workflow

Mesurer l'impact d'une modification ?
- Au début du pipeline ?
- A la fin du pipeline ?
Corrélation entre
- La performance offline du pipeline
- Les préférences des utilisateurs (test A/B)
Impact d'une modification sur les données d'apprentissages futures ?

Métrique

Personnalisation renforcée

Apprentissage par renforcement