Découverte de Hadoop et premier job Map/Reduce (PIG)

Exercices et lectures recommandées

[1]Les exercices des notebooks s’appuient sur le langage PIG-latin qui est un langage haut niveau permettant d’écrire des tâches Map Reduce complexes. Le script est ensuite converti en un ensemble de mapper / reducer. Ce langage suffit dans la plupart des cas et le temps de développement est très réduit par rapport à un langage plus bas niveau. L’autre langage haut niveau est Hive. Sa syntaxe est très proche de celle du SQL. PIG a été choisi car Hive est plus un moyen de lancer rapidement de petites tâches, PIG permet des tâches plus conséquentes pour un coût d’apprentissage très raisonnable.