RSS 2016-11 - 1/1 Blog modules (9)


2016-11 - 1/1

Tranformer les variables catégorielles et contrastes

2016-11-30

Certains modèles de machine learning requiert de transformer les variables catégorielles en variables numériques. Il existe plusieurs façons de faire cela : Patsy: Contrast Coding Systems for categorical variables. Les extensions de scikit-learn incluent un module qui fait cela aussi mais façon scikit-learn : category_encoders implémente les transformations suivantes :

article

pandas, groupby, nan values

2016-11-20

La fonction groupby ne considère pas (plus) les valeurs manquantes ou NaN. Le notebook groupby et valeur manquantes illustre ce fait et montre comment les corriger.

article

Piloter un drone depuis un notebook

article

Coordonnées des données carroyées

2016-11-03

Les données carroyées sont fournies par l’INSEE et proposent différentes variables économiques agrégées par carreaux : Un carroyage est un découpage de l’espace géographique en mailles régulières de forme carrée et de taille fixe. Il survient toujours un moment où on cherche à représenter ses données qui sont localisées avec un système de coordonnées : Lambert Azimutal Equal Area. Pour les convertir an longitude, latitude, il faut utiliser le module pyproj. Exemple : Conversion de coordonnées. La plupart des systèmes de coordonnées (ou Spatial reference system) sont identifiés par un code EPSG. Dans le cas des données carroyées, le code est EPSG:3035. Il est répertorié sur spatialreference.org qui listent façons de l’écrire avec différents outils. Lorsqu’on télécharge des fichiers shapefiles, elles viennent souvent avec un fichier .prj qui décrit le système de coordonnées utilisé. Le site prj2epsg permet d’obtenir le code EPSG correspondant ouvrant la porte à toutes sortes de conversions.

article


RSS 2016-11 - 1/1 2018-11 (4) 2018-12 (1) 2019-01 (4) 2019-02 (2) 2019-05 (1)