|
Aprendizaje por refuerzo
|
Código:
M2.883 :
6
|
|
Consulta de los datos generales
Consulta de los recursos de aprendizaje de los que dispone la asignatura
Consulta del modelo de evaluación
|
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios. |
|
|
|
Métodos de Montecarlo |
PDF |
Métodos de diferencia temporal |
PDF |
Introducción a OpenAI Gym |
PDF |
Deep Q-networks |
PDF |
Procesos de decisión de Markov |
PDF |
Programación dinámica |
PDF |
El método actor-crítico |
PDF |
Introducción al aprendizaje por refuerzo |
PDF |
Gradientes de política |
PDF |
Introducción a las soluciones aproximadas |
PDF |
N-step bootstrapping |
PDF |
|
La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC).
La calificación final de la asignatura es la nota obtenida en la EC.
|
|