Control de navegación de un dron usando aprendizaje por refuerzo

Villamil Paz, Santiago

Control de navegación de un dron usando aprendizaje por refuerzo

Portada

5.11 MB

24390.pdf

PDF

VER

Citas bibliográficas

Gestores Bibliográficos

Indexadores

Fecha

2021

Resumen en español

Este proyecto de grado tratará sobre el problema de la navegación de un robot móvil y específicamente de un dron en simulación usando técnicas de aprendizaje por refuerzo. Para lograr la navegación de drones por medio de técnicas de machine learning, se trabajó con Q-Learning tabular y en segunda instancia, con la técnica de DQN: Deep Q Network. Para este proyecto se usó el simulador: V-rep (Coppelia-Sim) , el lenguaje de programación Python y una librería para la implementación del algoritmo DQN: stable baselines3. En este documento se mostrará el proceso para realizar cada una de las dos implementaciones. Los resultados fueron buenos en el algoritmo tabular y también con el DQN, dando este último como el mejor algoritmo. Se consiguió que el dron en simulación lograra ir de un punto A a un punto B esquivando obstáculos mediante la política aprendida. Esta política hace que el dron llegue al objetivo obteniendo una tasa de éxito de 90 %, esta medición se realizó sobre 1000. En el siguiente link se pueden observar los resultados obtenidos y las pruebas adicionales realizadas: https://youtu.be/N7BogcedDzo

Resumen en inglés

This degree project will deal with the problem of navigation of a mobile robot and specifically of a drone in simulation using reinforcement learning techniques. To achieve drone navigation through machine learning techniques, we worked with Q-Learning tabular and in second instance, with the DQN technique: Deep Q Network. For this project the simulator was: V-rep (Coppelia-Sim) , the Python as programming language and a library for the implementation of the DQN: stable baselines3. This document will show the process to carry out each the implementations. The results were good in the tabular algorithm and also with the DQN, being this last the best algorithm. The drone on simulation will be able to go from point A to point B dodging obstacles through learned politics. This policy makes that the drone reaches the target obtaining a success rate of 90%, this measurement was performed on 1000. In the following link you can see the results obtained and the aditional tests: https://youtu.be/N7BogcedDzo

Tipo de Contenido

Trabajo de grado - Pregrado

Colecciones

Tesis/Trabajos de Grado 875

Página completa del ítem Ver Estadísticas de uso