2018-04-10 Streaming et pipelines#
Deux pages qui recensent de nombreuses libraires qui permettent de créer des pipelines et plus généralement de traiter les données en parallèles :
Une dernière page sur d’autres options :
Enfin, un lien sur des notebooks en pyspark sur la compétition Kaggle : 2014 New York City Taxi Trips : Vue d’ensemble de la science des données à l’aide de Spark sur Azure HDInsight.