{"cells": [{"cell_type": "markdown", "metadata": {}, "source": ["# 2A.algo - Algorithmes de streaming : g\u00e9n\u00e9ralit\u00e9s\n", "\n", "Les streams (flux) de donn\u00e9es sont aujourd'hui pr\u00e9sents dans de nombreux domaines (r\u00e9seaux sociaux, e-commerce, logs de connexion Internet, etc.). L'analyse rapide et pertinente de ces flux est motiv\u00e9e par l'immensit\u00e9 des donn\u00e9es qui ne peuvent souvent pas \u00eatre stock\u00e9s (du moins facilement) et dont le traitement serait trop lourd (penser au calcul de l'\u00e2ge moyen des 1,86 milliards utilisateurs de Facebook pour s'en convaincre). Ce notebook s'int\u00e9resse particuli\u00e8rement \u00e0 l'algorithme [BJKST](http://info.prelert.com/blog/hashing-and-approximate-distinct-value-counts)."]}, {"cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [{"data": {"text/html": ["
\n", ""], "text/plain": ["