.. _2018-10-02scrapingrecupererimagesrst: ========================================================= 2018-10-02 - Scraping, récupérer une image depuis LeMonde ========================================================= .. only:: html **Links:** :download:`notebook <2018-10-02_scraping_recuperer_images.ipynb>`, :downloadlink:`html <2018-10-02_scraping_recuperer_images2html.html>`, :download:`python <2018-10-02_scraping_recuperer_images.py>`, :downloadlink:`slides <2018-10-02_scraping_recuperer_images.slides.html>`, :githublink:`GitHub|_doc/notebooks/notebook_eleves/2018-2019/2018-10-02_scraping_recuperer_images.ipynb|*` Le notebook suivant récupère le contenu d’une page du journal `Le Monde `__, extrait les urls d’images à l’aide d’une expression régulière puis télécharge les images pour les stocker dans un répertoire. Le notebook extrait les images d’une personnalité. Première étape, on récupère automatiquement le contenu d’une page. .. code:: ipython3 %matplotlib inline .. code:: ipython3 import urllib.request as ulib def get_html(source): with ulib.urlopen(source) as u: return u.read() page = get_html("https://www.lemonde.fr") page[:500] .. parsed-literal:: b'