%matplotlib inline


import matplotlib
matplotlib.get_backend()

'module://matplotlib_inline.backend_inline'


import matplotlib.pyplot as plt
import matplotlib
matplotlib.get_backend()

'module://matplotlib_inline.backend_inline'


from jyquickhelper import add_notebook_menu
add_notebook_menu()


from urllib.error import URLError
import pyensae.datasource
from pyensae.datasource import dBase2df, DownloadDataException
files = ["etatcivil2012_nais2012_dbase.zip",
         "etatcivil2012_dec2012_dbase.zip",
         "etatcivil2012_mar2012_dbase.zip" ]

try:
    pyensae.datasource.download_data(files[-1], 
                          website='http://telechargement.insee.fr/fichiersdetail/etatcivil2012/dbase/')
except (DownloadDataException, URLError, TimeoutError):
    # backup plan
    pyensae.datasource.download_data(files[-1], website="xd")

df = dBase2df("mar2012.dbf")
df.shape, df.columns

((246123, 16),
 Index(['ANAISH', 'DEPNAISH', 'INDNATH', 'ETAMATH', 'ANAISF', 'DEPNAISF',
        'INDNATF', 'ETAMATF', 'AMAR', 'MMAR', 'JSEMAINE', 'DEPMAR', 'DEPDOM',
        'TUDOM', 'TUCOM', 'NBENFCOM'],
       dtype='object'))


df.head()


from pyensae.datasource import dBase2df
vardf = dBase2df("varlist_mariages.dbf")
vardf.shape, vardf.columns

((16, 4), Index(['VARIABLE', 'LIBELLE', 'TYPE', 'LONGUEUR'], dtype='object'))


vardf


# df["colonne"] = df.apply (lambda r:  int(r["colonne"]), axis=1)  # pour changer de type
# df["difference"] = ...


# df.plot(...)


df["nb"] = 1
dep = df[["DEPMAR","nb"]].groupby("DEPMAR", as_index=False).sum().sort_values("nb",ascending=False)
ax = dep.plot(kind = "bar", figsize=(14,6))
ax.set_xlabel("départements", fontsize=16)
ax.set_title("nombre de mariages par départements", fontsize=16)
ax.legend().set_visible(False)  # on supprime la légende

# on change la taille de police de certains labels
for i,tick in enumerate(ax.xaxis.get_major_ticks()):
    if i > 10 :
        tick.label.set_fontsize(8)


import random
import networkx as nx
G=nx.Graph()
for i in range(15) :
    G.add_edge ( random.randint(0,5),  random.randint(0,5) )

import matplotlib.pyplot as plt
f, ax = plt.subplots(figsize=(8,4))
nx.draw(G, ax = ax)


import random, os
from graphviz import Digraph
from IPython.display import Image
from pyquickhelper.helpgen import find_graphviz_dot
bin = os.path.dirname(find_graphviz_dot())
if bin not in os.environ["PATH"]:
    os.environ["PATH"] = os.environ["PATH"] + ";" + bin

dot = Digraph(comment='random graph', format="png")
for i in range(15) :
    dot.edge ( str(random.randint(0,5)),  str(random.randint(0,5)) )

img = dot.render('t_random_graph.gv')
Image(img)

	ANAISH	DEPNAISH	INDNATH	ETAMATH	ANAISF	DEPNAISF	INDNATF	ETAMATF	AMAR	MMAR	JSEMAINE	DEPMAR	DEPDOM	TUDOM	NBENFCOM
0	1982	75	1	1	1984	99	2	1	2012	01	1	29	99	9	N
1	1956	69	2	4	1969	99	2	4	2012	01	3	75	99	9	N
2	1982	99	2	1	1992	99	1	1	2012	01	5	34	99	9	N
3	1985	99	2	1	1987	84	1	1	2012	01	4	13	99	9	N
4	1968	99	2	1	1963	99	2	1	2012	01	6	26	99	9	N

	VARIABLE	LIBELLE	TYPE	LONGUEUR
0	AMAR	Année du mariage	CHAR	4
1	ANAISF	Année de naissance de l'épouse	CHAR	4
2	ANAISH	Année de naissance de l'époux	CHAR	4
3	DEPDOM	Département de domicile après le mariage	CHAR	3
4	DEPMAR	Département de mariage	CHAR	3
5	DEPNAISF	Département de naissance de l'épouse	CHAR	3
6	DEPNAISH	Département de naissance de l'époux	CHAR	3
7	ETAMATF	État matrimonial antérieur de l'épouse	CHAR	1
8	ETAMATH	État matrimonial antérieur de l'époux	CHAR	1
9	INDNATF	Indicateur de nationalité de l'épouse	CHAR	1
10	INDNATH	Indicateur de nationalité de l'époux	CHAR	1
11	JSEMAINE	Jour du mariage dans la semaine	CHAR	1
12	MMAR	Mois du mariage	CHAR	2
13	NBENFCOM	Enfants en commun avant le mariage	CHAR	1
14	TUCOM	Tranche de commune du lieu de domicile des époux	CHAR	1
15	TUDOM	Tranche d'unité urbaine du lieu de domicile de...	CHAR	1

1A.data - Visualisation des données¶

Matplotlib, pandas¶

Récupération des données¶

Exercice 1 : écart entre les mariés¶

Exercice 2 : graphe de la distribution avec pandas¶

matplotlib¶

Exercice 3 : distribution des mariages par jour¶

Réseaux, graphes¶

networkx¶

Graphviz¶

Exercice 4 : dessin d'un graphe avec networkx¶