FAQ: pandas

Lire un fichier CSV enregistré avec Excel

Excel utilise un encoding par défaut qui est souvent iso-8859-1, c’est pourquoi la fonction pandas.read_csv génère parfois des erreurs lorsque le texte contient des accents. Il faut lui donner plus d’information sur le contenu

df2 = pandas.read_csv("base.csv", sep=";" , encoding="iso-8859-1", low_memory=False)

Le low_memory=False est suggéré par un warning de pandas. On peut aussi essayer la version de read_csv implémentée en python (en non C). Elle est moins rapide mais gère plus de cas (il faut lire le code pour comprendre pourquoi car la documentation est avare en informations à ce sujet).

df2 = pandas.read_csv("base.csv", sep=";" , engine="python")

see file faq_pandas.py