Streaming algorithms#
Les algorithmes streaming que Wikipédia traduit par Algorithme de fouille de flots de données sont des algorithmes qui s’exécutent sans avoir connaissance de l’ensemble des données ni même combien il y en a. Cela signifie que l’algorithme peut s’arrêter à tout moment et qu’il est capable de retourner un résultat valide sur l’ensemble des données qu’il a traités jusqu’à présent. L’algorithme le plus connu est sans aucun doute Reservoir Sampling qui permet de tirer un échantillon aléatoire dans un jeu de données dont la taille est inconnue à l’avance.
Lectures
Algorithme BJKST Counting distinct elements in a data stream
Confidence Decision Trees via Online and Active Learning for Streaming (BIG) Data
Approximation and Streaming Algorithms for Histogram Construction Problems
Density Estimation with Adaptive Sparse Grids for Large Data Sets
Sliding HyperLogLog: Estimating cardinality in a data stream
Data Streaming Algorithms 2009, Data Streaming Algorithms 2011
Data Stream Management (collection d’articles)
Modules
StreamLib (mas maintenu)