:orphan: |rss_image| **Hadoop - 1/1** :ref:`Blog ` :ref:`article (8) ` :ref:`articles (3) ` :ref:`cours (6) ` :ref:`module (7) ` :ref:`paper (3) ` .. |rss_image| image:: feed-icon-16x16.png :target: ../_downloads/rss.xml :alt: RSS ---- .. index:: Hadoop .. _ap-cat-Hadoop-0: Hadoop - 1/1 ++++++++++++ .. blogpostagg:: :title: Numpy, Hadoop, PIG, Java :date: 2016-01-25 :keywords: Map Reduce,Java,PIG,Hadoop,JyNI,Jep :categories: Hadoop :rawfile: 2016/2016-01-25_numpy_hadoop.rst Le fait qu'on puisse utiliser des scripts `Python `_ dans un script `PIG `_ est un peu trompeur. De là à penser que la librairie `numpy `_ serait utilisable... Tout d'abord, les versions officielles de numpy et Python sont implémentaires en `C `_ voire un peu de `Fortran `_ et Hadoop / PIG est implémenté en `java `_ qui a l'avantage de bénéficier d'un `garbage collector `_ contrairement au langage C. Ceci explique que la version de Python utilisée par PIG pour définir des UDF (User Defined Function) est `Jython `_. Utiliser numpy dans une fonction UDF n'est pas simple. La première direction consiste à utiliser une version java de numpy : ... ---- |rss_image| **Hadoop - 1/1** :ref:`2022-10 (1) ` :ref:`2022-12 (2) ` :ref:`2023-01 (1) ` :ref:`2023-02 (1) ` :ref:`2023-04 (1) `