Métodos de agrupamiento LA & SIA: Comparación computacional

Resumen

Las analíticas de aprendizaje son y siguen siendo una tecnología emergente según el informe Horizon del 2016, es por ello por lo que el estudio y la búsqueda de nuevas técnicas de análisis es importante. El análisis Estadístico Implicativo permite descubrir R-reglas de la forma a → b sobre un conjunto de variables o sujetos. Las reglas se representan gráficamente por dendogramas que sirven como una nueva herramienta clustering basada en el concepto de cohesión. El Clustering es una de las técnicas más utilizadas en Learning Analytics para la exploración de datos para condensarlos en grupos heterogéneos de objetos similares entre sí. El objetivo de este artículo es comparar desde la ocupación de memoria las funciones cluster utilizadas en Learning Analytics hclust.vector, dendro.variables y diana y las funciones callHierarchyTree y callSimilarityTree utilizadas en el Análisis Estadístico Implicativo, esto permitirá determinar las ventajas de las nuevas técnicas de análisis cluster basadas en el Análisis Estadístico Implicativo. El análisis comparativo se realizó mediante un diseño cuasi experimental bifactorial del tipo RGXO, para controlar las variables exógenas se utilizó similares arquitecturas de hardware (Procesador Core I7, Velocidad 2,2 Ghz y Memoria RAM 8Gb) y de software (Windows 8, Ubuntu 16.04, MacOS Sierra 10.12, R v3.4.1 y RStudio v1.0.153). El colectivo de estudio estuvo conformado por 100000 bases de datos de 1000 observaciones y 100 variables dicotómicas. Se utilizó un método de muestreo aleatorio simple, el tamaño de muestra utilizado fue de 383 bases de datos. Los resultados demuestran que no existe diferencia significativa en la ocupación de memoria entre los métodos simlrty, dendro_diana y hclust_vector, es decir estadísticamente los tres métodos son equivalentes y son los que menos memoria ocupan. El método hrarchy ocupa el segundo lugar en mayor ocupación de memoria y el método que más memoria utiliza es dendro_variables.

PDF

Referencias

[1] R. Gras, "Panorama du développement de l’ASI à partir de situations fondatrices," Actes des Troisièmes Rencontres Internationale ASI Analyse Statistique Implicative, Volume Secondo supplemento al, pp. 9-33, 2005.

[2] Y. Le Bras13, P. Meyer13, P. Lenca13, and S. Lallich, "A robustness measure of association rules."

[3] R. Pazmiño, "Aproximación al Análisis Estadístico Implicativo desde sus Aplicaciones Educativas," 2014.

[4] R. A. Pazmiño-Maji, F. J. García-Peñalvo, and M. Á. Conde-González, "Is it possible to apply Statistical Implicative Analysis in hierarchical cluster Analysis? Firsts issues and answers," 2017.

[5] R. Couturier and R. Gras, "CHIC: traitement de données avec l'analyse implicative," in EGC, 2005, pp. 679-684.

[6] R. Pazmiño, F. J. García-Peñalvo, R. Coutrier, and M. Conde-González, "Statistical implicative analysis for educational data sets: 2 analysis with RCHIC," 2015.

[7] P. Baepler and C. J. Murdoch, "Academic analytics and data mining in higher education," International Journal for the Scholarship of Teaching and Learning, vol. 4, p. 17, 2010.

[8] R. Ferguson, "Learning analytics: drivers, developments and challenges," 2016.

[9] L. C. Briand, Y. Labiche, M. D. Penta, and H. Yan-Bondoc, "An experimental investigation of formality in UML-based development," IEEE Transactions on Software Engineering, vol. 31, pp. 833-849, 2005.

[10] D. T. Campbell and J. C. Stanley, Experimental and quasi-experimental designs for research, 1966.

[11] R. A. Pazmiño-Maji, F. J. García-Peñalvo, and M. A. Conde-González, "Comparing Hierarchical Trees in Statistical Implicative Analysis & Hierarchical Cluster in Learning Analytics," in Proc. of the 5th International Conference on Technological Ecosystems for Enhancing Multiculturality, 2017, p. 49.

Los autores que publican en el Congreso de Ciencia y Tecnología están de acuerdo con los siguientes términos: Los autores conservan los derechos de autor y garantizan al congreso el derecho de ser la primera publicación del trabajo al igual que licenciado bajo una Creative Commons Attribution License que permite a otros compartir el trabajo con un reconocimiento de la autoría del trabajo y la publicación inicial en el congreso. Los autores pueden establecer por separado acuerdos adicionales para la distribución no exclusiva de la versión de la obra publicada en el congreso (por ejemplo, situarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en este congreso. Se permite y se anima a los autores a difundir sus trabajos electrónicamente (por ejemplo, en repositorios institucionales o en su propio sitio web) antes y durante el proceso de envío, ya que puede dar lugar a intercambios productivos, así como a una citación más temprana y mayor de los trabajos publicados.