Statistique

Streaming algorithms#

Les algorithmes streaming que Wikipédia traduit par Algorithme de fouille de flots de données sont des algorithmes qui s’exécutent sans avoir connaissance de l’ensemble des données ni même combien il y en a. Cela signifie que l’algorithme peut s’arrêter à tout moment et qu’il est capable de retourner un résultat valide sur l’ensemble des données qu’il a traités jusqu’à présent. L’algorithme le plus connu est sans aucun doute Reservoir Sampling qui permet de tirer un échantillon aléatoire dans un jeu de données dont la taille est inconnue à l’avance.

Lectures

Modules