.. image:: pystat.png :height: 20 :alt: Statistique :target: http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx/td_2a_notions.html#pour-un-profil-plutot-data-scientist .. _l-td2a-reinforcement-learning: Reinforcement Learning ++++++++++++++++++++++ ou *apprentissage par renforcement* *(année prochaine)* *Lectures* * `Deep Reinforcement Learning through Policy Optmization `_ (vu dans `Highlights of NIPS 2016: Adversarial learning, Meta-learning, and more `_) * `The Nuts and Bolts of Deep RL Research `_ * `A Comprehensive Survey on Safe Reinforcement Learning `_ * `RLPy: A Value-Function-Based Reinforcement Learning Framework for Education and Research `_ * `UCL Course on RL `_ * `Reinforcement Learning Part I `_ `Reinforcement Learning Part II `_ * `Strategic Attentive Writer for Learning Macro-Actions `_ * `Temporal difference learning `_ * `Renewal Monte Carlo: Renewal theory based reinforcement learning `_ * `AlphaGo Zero - How and Why it Works `_ * `Open AI Spinning up `_ *Lectures sur des applications* * `Universal Planning Networks `_ : utilisation de l'apprentissage par renforcement pour caler la progression du bras d'un robot vers la saisie d'une pièce lorsque le chemin est obstrué. *Exemples* * `pg-pong.py `_ * `Reinforcement_Toys `_, notebooks pour découvrir l'apprentissage par renforcement *Modules* * `Ray RLlib `_ (ray - rllib) * `keras-rl `_ * `gym `_ *Environnements* * `OpenAI Gym `_, l'outil propose une formalisation qui permet de tester les algorithmes d'apprentissage par renforcements pour ses propres expériences ou pour des contextes ou jeu prédéfinies. Cela peut aboutir à ce type d'expérience : `OpenAI Gym for NES games + DQN with Keras to learn Mario Bros. from raw pixels `_.