RSS <== page de blog - 2/2 Blog pandas (4)


page de blog - 2/2

Balade d’avril

2016-04-05

  1. Python, Distributions, Module OS

  2. DataFrame

  3. Pause récréative

  4. Algorithme récréatif

http://ecx.images-amazon.com/images/I/81RPCdhb+TL._SL1500_.jpg

article

pandas et SAS

2016-03-12

La fonction read_sas est apparue dans le module pandas version 0.17, améliorée dans la version 0.18 : pd.read_sas() changes.

article

Exam, doubts and poetry

2016-03-03

This is one question we decided to remove from the final exam but I still do like it because it challenges people. How to make a connection between known algorithms and the following code. To your opinion, the following code is closed to:

article

Grandes tables, Guillemets

2015-06-20

Très populaire, le module pandas permet de lire les formats de données les plus classiques ou des formats de fichiers plats inattendus. C’est ce que montre le notebook Tables avec guillemets. Il montre également comment parcourir par petits bouts une table trop grande pour tenir en mémoire.

article

Différence entre matrix et array (numpy)

2015-06-14

Le module numpy propose deux types pour représenter une matrice : array et matrix. Le type matrix hérite du premier mais se comporte différemment dans certaines situations, pour le produit matriciel par exemple. Il est parfois utile de vérifier l’objet qu’on manipule avant de se perdre en conjecture quant à la source de l’erreur. La page Matrix objects est plus explicite à ce sujet.

article

Différence entre numpy et pandas

2015-06-06

Pourquoi deux modules alors qu’ils semblent tous deux manipuler des matrices ? Dans le cas de pandas, ce ne sont pas tout-à-fait des matrices mais des tables de données : la même table peut contenir différentes types de données, des nombres, des chaînes de caractères, des booléens, des dates… Les données se manipulent comme des bases de données et les Dataframe de pandas sont optimisés pour ça. Chaque colonne porte un nom.

article

Data Wrokflow

2015-05-25

Ce terme désigne une façon plutôt de décrire le traitement de données. Weka fut un des premiers outils à ouvrir cette voie, le premier à devenir une référence. Worflow, dataflow, pipeline sont autant de termes anglais qui désigne un assemblage parfois complexe de traitements appliqués à des données. La représentation la plus naturelle est sous forme de graphe. Orange est un outil du même type implémenté en Python :

article


RSS <== page de blog - 2/2 2016-11 (1) 2017-04 (1) 2017-05 (1) 2017-06 (2) 2017-09 (1)