Control de navegación de un dron usando aprendizaje por refuerzo
Citas bibliográficas
Enlace de Referencia
Autores
Director
Autor corporativo
Recolector de datos
Otros/Desconocido
Director audiovisual
Editor/Compilador
Fecha
Resumen en español
Este proyecto de grado tratará sobre el problema de la navegación de un robot móvil y específicamente de un dron en simulación usando técnicas de aprendizaje por refuerzo. Para lograr la navegación de drones por medio de técnicas de machine learning, se trabajó con Q-Learning tabular y en segunda instancia, con la técnica de DQN: Deep Q Network. Para este proyecto se usó el simulador: V-rep (Coppelia-Sim) , el lenguaje de programación Python y una librería para la implementación del algoritmo DQN: stable baselines3. En este documento se mostrará el proceso para realizar cada una de las dos implementaciones. Los resultados fueron buenos en el algoritmo tabular y también con el DQN, dando este último como el mejor algoritmo. Se consiguió que el dron en simulación lograra ir de un punto A a un punto B esquivando obstáculos mediante la política aprendida. Esta política hace que el dron llegue al objetivo obteniendo una tasa de éxito de 90 %, esta medición se realizó sobre 1000. En el siguiente link se pueden observar los resultados obtenidos y las pruebas adicionales realizadas: https://youtu.be/N7BogcedDzo
Resumen en inglés
This degree project will deal with the problem of navigation of a mobile robot and specifically of a drone in simulation using reinforcement learning techniques. To achieve drone navigation through machine learning techniques, we worked with Q-Learning tabular and in second instance, with the DQN technique: Deep Q Network. For this project the simulator was: V-rep (Coppelia-Sim) , the Python as programming language and a library for the implementation of the DQN: stable baselines3. This document will show the process to carry out each the implementations. The results were good in the tabular algorithm and also with the DQN, being this last the best algorithm. The drone on simulation will be able to go from point A to point B dodging obstacles through learned politics. This policy makes that the drone reaches the target obtaining a success rate of 90%, this measurement was performed on 1000. In the following link you can see the results obtained and the aditional tests: https://youtu.be/N7BogcedDzo