Metodología para el monitoreo de cultivos a partir de imágenes satelitales con Machine Learning
2020
El desarrollo de esta metodología permitió la integración de los procesos de teledetección, análisis, clasificación e implementación de algoritmos de aprendizaje automático cómo Random Forest(RF) y Máquinas de soporte vectorial (SVM) a infraestructuras que toleran procesamiento sobre big data cómo el Open Data Cube (ODC). Esta metodología integra la creación de un modelo que permite clasificar 11 clases de cobertura terrestre y el cultivo del arroz (Orytza sativa) en 4 etapas fenológicas. Además contempla la infraestructura del ODC para el procesamiento masivo enfocado en análisis de series de tiempo. A partir de la construcción del conjunto de datos se implementan los modelos de aprendizaje con los algoritmos de RF y SVM presentando grandes resultados en sus procesos de clasificación. Se obtiene como resultado del algoritmo SVM una media de 82% de precisión para todas la clases y con RF se obtuvo un 98% de exactitud promedio de las mismas. La integración de estos modelos en el \textit{ODC} permitió la clasificación de múltiples series de tiempo y el impacto en la eficiencia de estos algoritmos se vio determinado por el modelo creado a través del algoritmo RF, clasificando escenas tiempos menores a los 20 Segundos. Esta metodología optimiza los tiempos en procesamiento y validación en campo disminuyendo los costos operativos en los que incurren estas actividades The development of this methodology allowed the integration of the remote sensing processes, analysis, classification and implementation of machine learning algorithms such as Random Forest (RF) and Vector Support Machines (SVM) to infrastructures. They tolerate overbig data processing as the Open DataCube (ODC). This methodology integrates the creation of a model that allows classifying 11 land cover classes and the cultivation of rice (Orytza sativa) in 4 phenological stages. In addition, it contemplates the ODC infrastructure for mass processing focused on time series analysis. From the construction of the data set, the learning models are implemented with the \textit{RF and SVM }algorithms, presenting great results in their classification processes. As a result of the \textit{SVM} algorithm, an average of 82\% precision was obtained for all classes and with RF, 98\% of average accuracy was obtained. The integration of these models in the \textit{ODC }allowed the classification of multiple time series. and the impact on the efficiency of these algorithms was determined by the model created through the \textit{ RF } algorithm, classifying scenes less than 20 seconds. This methodology optimizes the processing and validation times in the field, reducing the operating costs incurred by these activities