2018-04-10 Streaming et pipelines#

Deux pages qui recensent de nombreuses libraires qui permettent de créer des pipelines et plus généralement de traiter les données en parallèles :

Une dernière page sur d’autres options :

Enfin, un lien sur des notebooks en pyspark sur la compétition Kaggle : 2014 New York City Taxi Trips : Vue d’ensemble de la science des données à l’aide de Spark sur Azure HDInsight.