Streaming, combiner plusieurs langages, job paramétrés

Lectures conseillées

  • Le langage PIG est très proche du SQL et donc limité, le streaming permet de l’étendre.
  • Les deux corrections présentent deux façons de faire du streaming, la seconde méthode (correction avec Azure) est plus rapide car le Python/Jython est transformé en Java et non interprété (Java est le langage de Hadoop/PIG). Cette solution est aussi accessible sous Cloudera : Writing Jython UDFs.