Aprendizaje por refuerzo Código:  M2.883    :  6
Consulta de los datos generales   Consulta de los recursos de aprendizaje de los que dispone la asignatura   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.
Métodos de Montecarlo PDF
Métodos de diferencia temporal PDF
Introducción a OpenAI Gym PDF
Deep Q-networks PDF
Procesos de decisión de Markov PDF
Programación dinámica PDF
El método actor-crítico PDF
Introducción al aprendizaje por refuerzo PDF
Gradientes de política PDF
Introducción a las soluciones aproximadas PDF
N-step bootstrapping PDF

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt