.. blogpost::
:title: Introduction aux Bag of Words, Statistical Machine Translation
:keywords: bag of words, statistical machine translation
:date: 2015-04-07
:categories: machine learning, natural language processing
Comment fonctionne les logiciels de traduction automatique tels
Bing ou Google proposent ?
L'article
`Being good at programming competitions correlates negatively with being good on the job `_
contient un lien vers une conférence de `Peter Norvig `_
qui travaillent sur ce genre de problèmes chez Google.
Il amène le public de manière assez intuitive depuis les
vers les `bag of words `_
`Statistical Machine Translation `_.
En prenant temps de chercher deux ou trois termes qui traînent sur
certains graphes, on y découvrent également un algorithme :
`Winnow `_
ou des sources de données :
`ImageNet `_,
`WordNet `_.
La présentation montre également un graphe illustrant
l'évolution des performances en fonction du nombre de mots
inclus dans l'ensemble d'apprentissage. Elle montre aussi
que le modéle obtenant les meilleurs performances n'est pas forcément
le même lorsqu'on apprend avec plus de données.