28 de marzo de 2024

Robots aprenden a desplazarse por sí solos

27 de octubre de 2020
27 de octubre de 2020

Usando algoritmos de aprendizaje automático orientados hacia la inteligencia artificial (IA), a través de un sistema de penalización y recompensas es posible planear rutas autónomas de desplazamiento de un robot en espacios interiores.

“El proceso es comparable con el entrenamiento de un animal al que con estímulos positivos y negativos se le enseña a realizar una determinada labor, es decir que reacciona según las penalizaciones y recompensas que recibe por sus acciones”.

Así explica su desarrollo el ingeniero de sistemas Diego León Ramírez, de la Universidad Nacional de Colombia (UNAL) Sede Medellín en su tesis “Diseño de una estrategia para la planeación de rutas de navegación autónoma de un robot móvil en entornos interiores usando un algoritmo de aprendizaje automático”, presentada para optar al título de magíster en Ingeniería de Sistemas de la UNAL y que fue calificada como meritoria.

Estos robots se pueden usar en el suministro de insumos para materia prima y productos terminados en empresas manufactureras; en los hospitales, para el transporte de alimentos e implementos médicos como parte de protocolos de bioseguridad, y en el transporte logístico de paquetes en las empresas.

“Prácticamente tuve que empezar desde cero, pues en Colombia este es un tema novedoso y poco explorado; yo diría que en el país son pocos los que investigan sobre la IA aplicada a la robótica, la cual es una tendencia mundial en investigación”, señaló el magíster.

Su director de tesis, el profesor Jovani Alberto Jiménez, del Grupo de Investigación y Desarrollo en Inteligencia Artificial (Gidia) de la UNAL Sede Medellín, y su codirector Gustavo Acosta, del Semillero de investigación Gribot de Ícaro (Grupo de Investigación en Instrumentación, Control Automático y Robótica) del Politécnico Jaime Isaza Cadavid, fueron sus asesores expertos.

“Aprendimos a usar estos algoritmos en dominios diferentes a la robótica; antes de implementarlos en un robot hicimos simulaciones en videojuegos”, destacó el magíster Ramírez.

Por ejemplo, la integración de estos algoritmos en videojuegos demuestra que el aprendizaje por refuerzo implementado con redes neuronales (sistemas computacionales de “neuronas” artificiales conectadas para transmitir señales) permite proponer nuevas estrategias de competición, con igual o mejor precisión que un humano.

“En la industria de los videojuegos se aplican estos algoritmos desde hace mucho tiempo para estimular la experiencia del usuario y plantearle un reto mayor al jugador. En esta investigación se buscó cómo implementar dichos algoritmos en máquinas que pueden modificar el mundo real”, indicó el investigador.

Validando la estrategia

A los robots se les debe preparar para operar en diversos entornos con una gran variedad de estructuras y obstáculos en movimiento; los algoritmos tradicionales no permiten enfrentar la cantidad de problemas que se pueden presentar. Por ello es más práctico y conveniente implementar métodos de aprendizaje automático que le permitan al robot aprender de la exploración de su ambiente.

En la investigación caracterizaron estrategias de la literatura y especificaron el algoritmo de aprendizaje automático DQN para implementarlo en la plataforma robótica Turtlebot del simulador Gazebo.

Además hicieron experimentos cambiando los parámetros del algoritmo para validar la estrategia, que muestra cómo la plataforma robótica, por medio de la exploración del ambiente y la posterior explotación de conocimiento, hace una planeación eficaz de la ruta.

Se utilizaron diferentes simuladores con softwares Open Source como Gazebo y Open AI GYM. Así mismo se experimentó con diferentes algoritmos, en especial el DQN, que permitió explorar el paradigma de la IA en la navegación autónoma de robots.

El robot utilizado en el experimento es el Turtlebot3 Burguer del simulador Gazebo, diseñado con fines educativos con un tamaño de 138 mm x 178 mm x 192 mm (L x W x H), uno de los robots más pequeños de la línea Turtlebot.

El algoritmo planeó las rutas con cierto nivel de tolerancia. Hizo una trayectoria asimétrica con longitud, curvatura y tiempo diferente al ideal, pero logró llegar a la meta el 93 % de las veces.

En este sentido, el diseño de la estrategia propuesta permitió implementar el algoritmo DQN, que busca la meta de manera competente y evita obstáculos en forma eficaz.

En síntesis, se formuló una estrategia para seleccionar un algoritmo de aprendizaje automático aplicado a la planeación de trayectorias, y en el diseño de rutas al robot, se logró un buen resultado.

Estos algoritmos pueden tener un impacto importante en el sector productivo porque facilitan la implementación de robots en procesos industriales, generan nuevas posibilidades de investigación en la robótica y contribuyen en el ámbito académico con algoritmos validados de aprendizaje automático.

“La idea es implementarlos en diferentes tipos de robots y analizar el comportamiento, porque se trabajó la planeación de ruta, pero existen otros comportamientos que se pueden investigar para que aprenda a hacer otras cosas que hacen los humanos”, indicó el magíster Ramírez.

“En el futuro se espera desafiar las plataformas robóticas con retos diferentes a la planeación de rutas que permita analizar su comportamiento y acercarnos cada vez más a satisfacer las necesidades de los seres humanos”, concluye el investigador.

Agencia de Noticias UN – Unimedios