Tarea - Seleccionando el setpoint óptimo de una máquina mediante el aprendizaje por refuerzo

Contenido bloqueado

Contenido solo para miembros. Registrate en la plataforma para poder acceder a él.

Registrarme

General
Objetivo
Veremos cómo entrenar un agente que vaya decidiendo o actuando en base a lo que va percibiendo
Dificultad Difícil
Identificador 264
Tiempo estimado 2 h 55 m
Puntos: 71
Comentarios
Debes estar registrado para poder comentar