Análisis de algoritmos de clustering para datos categóricos
2018
En el campo de la estadística, el análisis de clusters se puede definir como la tarea de encontrar grupos relevantes de una población a partir de una muestra, de modo que los miembros de cada grupo sean más similares entre si que con respecto a los miembros de otros grupos en algún sentido. Nuestro objetivo principal para este proyecto fue analizar algoritmos de clustering adaptados a datos con atributos categóricos. Con este fin, realizamos una lectura crítica del planteamiento del algoritmo ROCK, un algoritmo moderno basado en la atractiva idea de considerar la vecindad que rodea a cada uno de los datos. Finalmente, propusimos una modificación a este algoritmo y comparamos su desempeño con el original (y otros algoritmos clásicos de clustering) mediante conjuntos de datos simulados. "Cluster analysis can be defined as the task of finding relevant groups in a population given a sample, in such a way that the members of each group are more similar (in some sense) to each other than to members of other groups. Our main objective for this project was to analyze clustering algorithms that are well adapted to data with categorical attributes. To this end, we did a critical reading of the paper that introduced the ROCK algorithm, a modern algorithm based on the attractive idea of considering the neighborhood surrounding each data point. Finally, we proposed a modification for this algorithm and compared its performance to the original one (as well as other classical algorithms) using simulated datasets."--Tomado del Formato de Documento de Grado.
- Tesis/Trabajos de Grado [317]