RSS 2016-01 - 1/1 Blog modules (9)


2016-01 - 1/1

File d’attente sur Azure HD Insight

2016-01-27

La plupart du temps, un job reste coincé dans la file d’attente car celle-ci est pleine. Voici un code pour s’en assurer sur un cluster Azure HDInsight. A exécuter depuis un notebook.

article

Numerical Recipes

2016-01-26

numpy, scipy couvrent la plupart des besoins lorsqu’il s’agit de calcul matriciel. On ne se pose même plus la question de savoir comment c’est implémenté. Cette question revient lorsqu’on a besoin d’un algorithme en particulier et que celui-ci n’est pas disponible dans l’environment dans lequel on programme.

article

Remote Desktop sur une machine Windows depuis un Mac

2016-01-25

Il est possible d’ouvrir une session Remote Desktop sur une machine virtuelle Windows sur Azure depuis un ordinateur Mac. Voici l’astuce : Can’t rdp to Azure on Mac OS X.

article

Numpy, Hadoop, PIG, Java

2016-01-25

Le fait qu’on puisse utiliser des scripts Python dans un script PIG est un peu trompeur. De là à penser que la librairie numpy serait utilisable… Tout d’abord, les versions officielles de numpy et Python sont implémentaires en C voire un peu de Fortran et Hadoop / PIG est implémenté en java qui a l’avantage de bénéficier d’un garbage collector contrairement au langage C. Ceci explique que la version de Python utilisée par PIG pour définir des UDF (User Defined Function) est Jython. Utiliser numpy dans une fonction UDF n’est pas simple. La première direction consiste à utiliser une version java de numpy :

article

DictVectorizer en un peu plus simple

2016-01-19

La classe DictVectorizer n’accepte pas de DataFrame. Le code suivant n’est pas correct :

article

Données sur la musique

2016-01-04

De nouvelles sources de données ont été ajoutés à la page Source de données reproduites ci-dessous :

article


RSS 2016-01 - 1/1 2018-12 (1) 2019-01 (4) 2019-02 (2) 2019-05 (2) 2019-06 (1)