Statistique

Streaming algorithms

Les algorithmes streaming que Wikipédia traduit par Algorithme de fouille de flots de données sont des algorithmes qui s’exécutent sans avoir connaissance de l’ensemble des données ni même combien il y en a. Cela signifie que l’algorithme peut s’arrêter à tout moment et qu’il est capable de retourner un résultat valide sur l’ensemble des données qu’il a traités jusqu’à présent. L’algorithme le plus connu est sans aucun doute Reservoir Sampling qui permet de tirer un échantillon aléatoire dans un jeu de données dont la taille est inconnue à l’avance.

Lectures

Modules