.. _td1acorrectionsession8wikirootrst: ********************************************************** 1A.algo - Parcours dans un graphe (wikipédia) - correction ********************************************************** .. only:: html **Links:** :download:`notebook `, :downloadlink:`html `, :download:`PDF `, :download:`python `, :downloadlink:`slides `, :githublink:`GitHub|_doc/notebooks/td1a_algo/td1a_correction_session8_wikiroot.ipynb|*` Correction du notebook du même titre. On part d’une page, on explore les liens des pages liées à la première et on continue. On utilise le module `beautifulsoup4 `__ (`web scrapping `__) pour parser les pages. .. code:: ipython3 from jyquickhelper import add_notebook_menu add_notebook_menu() .. contents:: :local: Solution de `Félix Revert `__. Exercice 1 : lire une page web ------------------------------ .. code:: ipython3 import urllib.request as ulib def get_html(address, source="https://fr.wikipedia.org/wiki/"): with ulib.urlopen(source+address) as u: return u.read() get_html("http://www.xavierdupre.fr", source="")[:100] .. parsed-literal:: b'\r\n\r\n\r\n