2015-06-06 Différence entre numpy et pandas

Pourquoi deux modules alors qu’ils semblent tous deux manipuler des matrices ? Dans le cas de pandas, ce ne sont pas tout-à-fait des matrices mais des tables de données : la même table peut contenir différentes types de données, des nombres, des chaînes de caractères, des booléens, des dates… Les données se manipulent comme des bases de données et les Dataframe de pandas sont optimisés pour ça. Chaque colonne porte un nom.

numpy propose des matrices à une ou plusieurs dimensions optimisées pour le calcul matriciel. Ces matrices ne contiennent que des nombres et tous du même type.

Pour faire un produit matriciel, on choisit numpy. Pour faire une jointure de table, on choisit pandas.