Análisis de varianza para determinar el número óptimo de clases en clasificadores no supervisados usando gráficas suaves.
2018Profesores: Dr. Pedro Lara Velázquez y Dr. Sergio Gerardo de los Cobos Silva
Resumen: La coloración de gráficas suaves es una generalización del problema de coloración en el que se busca encontrar una coloración que minimice la dureza en la gráfica, o dicho de otra forma, reducir la suma de distancias entre vértices con colores idénticos (Lara-Velázquez, et al., 2015). Este modelo se utiliza en la programación de eventos susceptibles de cambios, asignación estable de frecuencias del espectro electromagnético, calendarización de actividades, asignación de recursos en organizaciones, en reconocimiento de patrones en general y en particular en un algoritmo clasificador no supervisado (Flores, 2017). Se ha demostrado que es un problema de tipo NP-Duro, aunque para grafos de orden menor o igual a 20, se pueden utilizar algoritmos exactos que resuelven el problema; caso contrario es necesario el uso de técnicas heurísticas (De los Cobos, 2010) que dan buenas soluciones.
El objetivo de este proyecto es formalizar este proceso haciendo uso del análisis de varianza en los resultados de resiliencia. Cuando se tienen todos los valores posibles, se puede hacer un análisis de varianza de las resiliencias candidatas y determinar si todas pertenecen a la misma población (no hay una cantidad óptima de clases por utilizar) Y concluir que los datos carecen de estructura, o bien se puede descomponer en dos o más poblaciones (la población importante es para nosotros el conjunto de elementos con mayor resiliencia).
Objetivo general
- Utilizar la ANOVA para determinar el mejor conjunto de clases en clasificadores no supervisados.
Objetivos específicos
- Estudio de los elementos a utilizar en este trabajo (clasificadores no supervisados, gráficas
suaves, ANOVA). - Recopilar instancias de prueba pseudoaleatorias y aplicadas utilizadas en trabajos anteriores (ver referencias).
- Estudiar el algoritmo de solución a utilizar (híbrido k-medias / GRASP).
- Ejecución del algoritmo de solución en las instancias seleccionadas.
- Uso de la ANOVA para determinar el (los) número(s) de clases adecuadas.
- Escritura de un artículo para congreso nacional.
- Reportar los resultados obtenidos en la Idónea Comunicación de Resultados (ICR).
Ultima actualización 13/08/2022 por pcyti