RSS 2016-01 - 1/1 Blog article (8) articles (3) cours (6) module (7) paper (3)


2016-01 - 1/1#

File d’attente sur Azure HD Insight#

2016-01-27

La plupart du temps, un job reste coincé dans la file d’attente car celle-ci est pleine. Voici un code pour s’en assurer sur un cluster Azure HDInsight. A exécuter depuis un notebook.

article

Numerical Recipes#

2016-01-26

numpy, scipy couvrent la plupart des besoins lorsqu’il s’agit de calcul matriciel. On ne se pose même plus la question de savoir comment c’est implémenté. Cette question revient lorsqu’on a besoin d’un algorithme en particulier et que celui-ci n’est pas disponible dans l’environment dans lequel on programme.

article

Remote Desktop sur une machine Windows depuis un Mac#

2016-01-25

Il est possible d’ouvrir une session Remote Desktop sur une machine virtuelle Windows sur Azure depuis un ordinateur Mac. Voici l’astuce : Can’t rdp to Azure on Mac OS X.

article

Numpy, Hadoop, PIG, Java#

2016-01-25

Le fait qu’on puisse utiliser des scripts Python dans un script PIG est un peu trompeur. De là à penser que la librairie numpy serait utilisable… Tout d’abord, les versions officielles de numpy et Python sont implémentaires en C voire un peu de Fortran et Hadoop / PIG est implémenté en java qui a l’avantage de bénéficier d’un garbage collector contrairement au langage C. Ceci explique que la version de Python utilisée par PIG pour définir des UDF (User Defined Function) est Jython. Utiliser numpy dans une fonction UDF n’est pas simple. La première direction consiste à utiliser une version java de numpy :

article

DictVectorizer en un peu plus simple#

2016-01-19

La classe DictVectorizer n’accepte pas de DataFrame. Le code suivant n’est pas correct :

article

Données sur la musique#

2016-01-04

De nouvelles sources de données ont été ajoutés à la page Source de données reproduites ci-dessous :

article


RSS 2016-01 - 1/1 2022-10 (1) 2022-12 (2) 2023-01 (1) 2023-02 (1) 2023-04 (1)