2016-01 - 1/1 Blog article (8) articles (3) cours (6) module (7) paper (3)
2016-01 - 1/1#
File d’attente sur Azure HD Insight#
2016-01-27
La plupart du temps, un job reste coincé dans la file d’attente car celle-ci est pleine. Voici un code pour s’en assurer sur un cluster Azure HDInsight. A exécuter depuis un notebook.
…
Numerical Recipes#
2016-01-26
numpy, scipy couvrent la plupart des besoins lorsqu’il s’agit de calcul matriciel. On ne se pose même plus la question de savoir comment c’est implémenté. Cette question revient lorsqu’on a besoin d’un algorithme en particulier et que celui-ci n’est pas disponible dans l’environment dans lequel on programme.
…
Remote Desktop sur une machine Windows depuis un Mac#
2016-01-25
Il est possible d’ouvrir une session Remote Desktop sur une machine virtuelle Windows sur Azure depuis un ordinateur Mac. Voici l’astuce : Can’t rdp to Azure on Mac OS X.
Numpy, Hadoop, PIG, Java#
2016-01-25
Le fait qu’on puisse utiliser des scripts Python dans un script PIG est un peu trompeur. De là à penser que la librairie numpy serait utilisable… Tout d’abord, les versions officielles de numpy et Python sont implémentaires en C voire un peu de Fortran et Hadoop / PIG est implémenté en java qui a l’avantage de bénéficier d’un garbage collector contrairement au langage C. Ceci explique que la version de Python utilisée par PIG pour définir des UDF (User Defined Function) est Jython. Utiliser numpy dans une fonction UDF n’est pas simple. La première direction consiste à utiliser une version java de numpy :
…
DictVectorizer en un peu plus simple#
2016-01-19
La classe DictVectorizer n’accepte pas de DataFrame. Le code suivant n’est pas correct :
…
Données sur la musique#
2016-01-04
De nouvelles sources de données ont été ajoutés à la page Source de données reproduites ci-dessous :
…
2016-01 - 1/1 2022-10 (1) 2022-12 (2) 2023-01 (1) 2023-02 (1) 2023-04 (1)