Enfoques de Bajo Rango para Resolver MDPs y Problemas de RL
- Tesis/Trabajos de Grado [299]
2022-12-14
En el presente trabajo se estudian algunas consecuencias de la hipótesis de bajo rango en el contexto de MDPs y Aprendizaje por Refuerzo en general, desde trabajos recientes como los de [Zhu et al., 2021], [Agarwal et al., 2020] y [Uehara et al., 2021] hasta implementaciones de los algoritmos descritos en dichos papers
con algunas modificaciones propuestas. Se hablará también de las complejidades
teóricas de dichos algoritmos, sus supuestos y limitaciones prácticas, y de los
resultados experimentales obtenidos en cada implementación.