Aplicación de técnicas supervisadas en la búsqueda de estrellas variables en campos seleccionados del VVV Survey
Citas bibliográficas
Enlace de Referencia
Autor corporativo
Recolector de datos
Otros/Desconocido
Director audiovisual
Editor/Compilador
Fecha
Resumen
Recientemente, los métodos supervisados de aprendizaje han sido usados en la búsqueda de estrellas variables, basándose en las propiedades de sus curvas de luz. Estos métodos desarrollan el proceso de clasificación a partir de una muestra de entrenamiento previamente clasificada. El algoritmo de clasificación usado en este trabajo es construido escogiendo propiedades estadísticas de cada elemento de la muestra de entrenamiento. Los métodos usados en este trabajo son: k-vecinos más cercanos, árboles de clasificación, bosques aleatorios, y máquinas de soporte vectorial. Se usan datos en infrarrojo cercano de un campo seleccionado del Bulbo Galáctico, recolectado por el proyecto Vista Variables in the Via Lactea Survey. Para el conjunto de magnitudes en banda Ks de cada estrella, son computados los estadísticos robustos: mediana, desviación absoluta mediana, sesgo octil y pesos de sus colas. Los estadísticos escogidos no dependen del cálculo del periodo (obtenido vía análisis de Fourier, análisis de varianzas u otro algoritmo) así que los métodos supervisados descritos en este trabajo son una alternativa a los métodos convencionales. Usando los métodos de clasificación supervisados desarrollados, se clasifican los tipos de estrellas variables RR Lyræ y Binarias Eclipsantes W Ursæ majoris. Una vez entrenados los algoritmos, su eficacia es estimada de acuerdo a su desempeño sobre una muestra ya clasificada. La afinidad de cada método para detectar tipos específicos de variabilidad también es estimada
Resumen
Recently, supervised learning methods have been used to search for variable stars, based on the properties of the light curves. These methods develop the process of classification using a previous classified training set. The classification algorithm used in this project, is built by choosing statistic, properties of each element of the training sample. In this work the methods used are k-nearest neighbors, support vector machines, classification trees, and random forests. We use near infrared data of a selected field in the Galactic Bulge, collected by the Vista Variables in the Via Lactea Survey. For the set of magnitudes in the K s band of each star, we compute the robust statistics: median, median absolute deviation, octile skewness and tails weight. The statistics selected do not depend on a calculation of the period (obtained via Fourier analysis, analysis of variance or any of the algorithm), so the learning methods described in this project, are an alternative for the conventional methods. Using the supervised learning methods developed, we classify the types of variable stars such as RR Lyræ and Eclipsing Binaries W Ursæ majoris. Once trained the algorithms, their efficacy is estimated according of their performance in a previously classified sample. The affinity of each method for detecting specific classes of variability is also estimated