En los deportes competitivos para dos jugadores, como el boxeo y la esgrima, los atletas a menudo demuestran movimientos eficientes y tácticos durante una competición. En este artículo, desarrollamos un marco de aprendizaje que genera políticas de control para atletas físicamente simulados que tienen muchos grados de libertad. Nuestro marco utiliza un enfoque de dos pasos, el aprendizaje de habilidades básicas y el aprendizaje de estrategias de nivel de combate, con un profundo aprendizaje de refuerzo, que se inspira en la forma en que las personas aprenden deportes competitivos. Desarrollamos un modelo de política basado en una estructura de codificador-decodificador que incorpora una variable latente autorregresiva y un decodificador de mezcla de expertos. Para mostrar la efectividad de nuestro marco, implementamos dos deportes competitivos, boxeo esgrima, y demostramos las políticas de control aprendidas por nuestro marco que pueden generar comportamientos tanto tácticos como naturales. También evaluamos las políticas de control con comparaciones con otras configuraciones de aprendizaje y con estudios de ablación.

Por Juan Carlos

Periodista enfocado a TICs desde hace más de una década. Investigando ando UNAM, DGTIC

Deja un comentario