Skip to content

Releases: manjavacas/rl-temario

v1.1.0

18 Nov 12:44
ba6ddd6
Compare
Choose a tag to compare

What's Changed

Full Changelog: v1.0...v1.1.0

v1.0.0

18 Jul 07:30
Compare
Choose a tag to compare

Esta primera versión del temario incluye:

  • La teoría correspondiente a métodos tabulares (I Tabular Solution Methods en Sutton & Barto (2018)).
    • Bandits, programación dinámica, métodos basados en muestreo, y planificación / model-based RL.
  • Código referenciado en el texto, con ejemplos representativos de los métodos de RL vistos en la parte teórica:
    • Iteración de la política en Gridworld, Monte Carlo en el entorno de Gymnasium Frozen Lake, comparativa entre SARSA, Q-learning y Expected SARSA en Cliffwalk, e implementación de Dyna-Q en GridMaze.