Minería de datos para descubrir tendencias en la clasificación de los trabajos de titulación
DOI:
https://doi.org/10.24133/cctespe.v13i1.739Abstract
La minería de datos tiene como fin encontrar patrones que expliquen la tendencia de los datos, es por ello que con el objetivo de extraer conocimiento de los trabajos de titulación de la Facultad de Ciencias de la Escuela Superior Politécnica de Chimborazo; se aplicaron cinco modelos de clasificación: Máquinas de Soporte Vectorial, Redes Neuronales, Árbol de Decisión, Bosque Aleatorio y Potenciación; considerando las líneas Diseño de Experimentos y Análisis Multivariable. Para identificar el modelo óptimo se aplicó Rattle, se calcularon tres medidas de rendimiento, las precisiones: global, positiva y negativa; siendo la curva ROC y los Árboles de Decisión, gráficas que permitieron visualizar el modelo de predicción con mejor ajuste, así como los programas que caracterizan las líneas de investigación. Los resultados mostraron que para la línea Diseño de Experimentos, el modelo con mayor precisión fue Bosque Aleatorio, con un 71,48% de predicciones que son correctas respecto al total; mientras que al considerar la línea Análisis Multivariable no se evidenció diferencia significativa en la precisión global, fluctuando en el 97%; esto significa que con el 97% de certeza la línea de investigación de Análisis Multivariable y con el 71,48% de precisión la línea de Diseño de Experimentos se enmarcan en los programas de investigación institucionales. En el modelo Árbol de Decisión, el nodo principal fue la Carrera cuando se consideró la línea Diseño de Experimentos, debido a que en Bioquímica y Farmacia se impulsa la utilización de estudios de este tipo; y en el caso de la línea Análisis Multivariable fue el programa Consumo Humano para mejorar las condiciones de nutrición y salud, debido a que los trabajos de titulación tienen una baja utilización de técnicas multivariable.Downloads
Published
Issue
Section
License
Los autores que publican en el Congreso de Ciencia y Tecnología están de acuerdo con los siguientes términos: Los autores conservan los derechos de autor y garantizan al congreso el derecho de ser la primera publicación del trabajo al igual que licenciado bajo una Creative Commons Attribution License que permite a otros compartir el trabajo con un reconocimiento de la autoría del trabajo y la publicación inicial en el congreso. Los autores pueden establecer por separado acuerdos adicionales para la distribución no exclusiva de la versión de la obra publicada en el congreso (por ejemplo, situarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en este congreso. Se permite y se anima a los autores a difundir sus trabajos electrónicamente (por ejemplo, en repositorios institucionales o en su propio sitio web) antes y durante el proceso de envío, ya que puede dar lugar a intercambios productivos, así como a una citación más temprana y mayor de los trabajos publicados.