FYI.

This story is over 5 years old.

informática

Este programa de computadora se enseñó a sí mismo a correr

Si puede aprender la mejor manera de correr, es cuestión de tiempo antes de que aprenda la mejor manera de matarnos.
Imagen: Michiel van de Panne

Nada nos trae más alegría que ver a alguien aprender a caminar, correr, caerse y volver a intentarlo. Es el viaje clásico del héroe. Hasta ahora, esa alegría estaba reservada principalmente a ver niños pequeños y cachorros.

Video completo: Michiel van de Panne/YouTube.

Un equipo de programadores crearon un algoritmo que permite a los personajes de computadora —y potencialmente a los robots del futuro— enseñarse a caminar, correr e incluso driblar un balón de futbol. La clave es dejar que aprendan de sus errores a medida que realizan la acción.

Publicidad

Según Michiel van de Panne, profesor de informática en la Universidad de Columbia Británica que presentó su trabajo en SIGGRAPH 2017, una importante conferencia sobre gráficos de computadora, el proyecto, llamado DeepLoco, utiliza un "aprendizaje por refuerzo profundo", donde un sistema prueba distintos métodos para alcanzar una meta y finalmente encuentra la mejor manera de realizar su tarea.

"Lo mágico del aprendizaje por refuerzo es que puedes proporcionar retroalimentación directa, y el programa eventualmente averigua la mejor estrategia general", me dijo van de Panne por teléfono.

El programa de computadora define un adorable modelo de movimiento cuadrado que van de Panne llama "el bípedo", que tiene la capacidad de aprender a caminar por sí solo, y escanear su entorno y decidir a dónde ir.


Relacionados: Ahora se puede programar una bacteria como una computadora


Además, dijo que el bípedo tarda un par de días en aprender a caminar, y cerca de cinco en aprender a dirigir correctamente sus movimientos, con base en la zona: ya sea un terreno inclinado o algún objeto en movimiento. En los videos de presentación de van de Panne, se observa al bípedo caminar (y caerse) por pasajes estrechos, mientras trata de mantener el equilibrio bajo el bombardeo constante de cubos. También se le puede ver driblando un balón de futbol de una manera que podría enorgullecer a cualquier entrenador.

"Mientras prueba diferentes estrategias en su fase de entrenamiento, el programa experimenta muchas situaciones incómodas que tiene que superar ", dijo Van de Panne. "Es un poco como un bebé que aprende a caminar. A diferencia de ti y de mí, quedará fuera de balance en más ocasiones".

En lugar de seguir el desplazamiento mediante la captura de movimiento o la escritura de líneas de código para reaccionar a todos los posibles resultados, DeepLoco aprende cómo adaptarse y crear movimientos a medida que avanza. Van de Panne explica que esto es más detallado y realista.

"El problema con [captura de movimiento] es que estás cortando y pegando piezas existentes de movimiento", dijo. Eso como crear nuevas imágenes al cortar y pegar piezas de fotografías. En algún momento te será imposible capturar todos los escenarios necesarios, así que el uso de la física es la respuesta correcta".

Esta tecnología podría utilizarse para enseñarle a los robots cómo navegar por una zona de forma independiente en el futuro, así como proporcionar modelos simulados para estudiar el movimiento humano. Esto es especialmente relevante en los campos de la biomecánica y el diseño prostético.