Results obtained in a data mining process applied to a database containing bibliographic information concerning four segments of science

Esther Marina Ruiz Lobaina, Pedro Lazaro Romero Suarez

Abstract


The objective of this work is to improve the quality of the information that belongs to the database CubaCiencia, of the Institute of Scientific and Technological Information. This database has bibliographic information referring to four segments of science and is the main database of the Library Management System. The applied methodology was based on the Decision Trees, the Correlation Matrix, the 3D Scatter Plot, etc., which are techniques used by data mining, for the study of large volumes of information. The results achieved not only made it possible to improve the information in the database, but also provided truly useful patterns in the solution of the proposed objectives.
Keywords: Data Mining, Text Mining, Bibliomining, Knowledge Discovery, Special Libraries




RESUMEN

Este trabajo presenta los resultados obtenidos con un proceso de minería de datos aplicado a una base de datos que contiene información bibliográfica referida a cuatro segmentos de la ciencia. Fue de interés la aplicación de varias técnicas de minería de datos a la información, ya que la base de datos se encontraba en ese momento sujeta a revisión sobre la calidad de su contenido y se tomaron decisiones sobre las técnicas de minería de datos a aplicar, en correspondencia con los resultados que ofrecieron cada una. Los resultados intermedios logrados son imprescindibles, para que el investigador pueda evaluar si los patrones logrados satisfacen los objetivos de la investigación o si es necesario aplicar cambios en cuanto a los datos que conforman la base de datos, y a las técnicas que se van a aplicar a la información, para lograr patrones verdaderamente útiles en la solución de los objetivos propuestos.
Palabras Claves: Minería de Datos, Minería de Textos, Bibliominería, Descubrimiento de conocimientos, Bibliotecas especializadas.

Keywords


Minería de Datos; Minería de Textos; Bibliominería; Descubrimiento de conocimientos; Bibliotecas especializadas; Data Mining, Text Mining, Bibliomining, Knowledge Discovery, Special Libraries

Full Text:

PDF (Español)

References


Candás Romero, J. (2006). Minería de datos en bibliotecas: bibliominería. from http://www.ub.edu/bid/17canda2.htm

Doug Bennett. (2014). "Cómo calcular la desviación estándar de un conjunto de datos",. Educación y Ciencia. from http://www.ehowenespanol.com/calcular-desviacion-estandar-conjunto-datos-como_169981/

Escudero Maximiliano, J., Lujan Ganuza, M., Wilberger, D., Martig, Sergio R. (2013). Scatter Plot 3D. from http://sedici.unlp.edu.ar/bitstream/handle/10915/20366/Documento_completo.pdf?sequence=1

Febles Rodríguez, J. P. , González Pérez, A. . (2002). Aplicación de la minería de datos en la bioinformática. ACIMED 02 2002. from http://bvs.sld.cu/revistas/aci/vol10_2_02/aci03202.htm

Gutiérrez Rodríguez, A.E., García Borroto, M. & Martínez Trinidad, J.F ( 2012). Algoritmo de agrupamiento basado en patrones utilizando árboles de decisión no supervisados. from http://3c.inaoep.mx/portalfiles/CCC-12-002.pdf

Herrera Varela, R (2006). Bibliomining: minería de datos y descubrimiento de conocimiento en bases de datos aplicados al ámbito bibliotecario. from http://lemi.uc3m.es/est/forinf@/index.php/Forinfa/article/view/122/127

Madrid, Universidad Carlos III de. (2009). Análisis de Cluster y Arboles de Clasificación. from http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/tema6dm.pdf

Nicholson, S.). Balancing Evidence-Based Librarianship and Protecting Patron Privacy through the Bibliomining Process. from http://www.powershow.com/view/a7a0c-MmI3Z/Balancing_EvidenceBased_Librarianship_and_Protecting_Patron_Privacy_through_the_Bibliomining_Process_powerpoint_ppt_presentation

Nicholson, S. (2003). Bibliomining for automated collection development in a digital library setting: Using data mining to discover web-based scholarly research works. Journal of the American Society for Information Science and Technology,54(12). from http://bibliomining.com/nicholson/asisdiss.html

Nicholson, S. (2006). The Basis for Bibliomining: Frameworks for Bringing Together Usage-Based Data Mining and Bibliometrics through Data Warehousing in Digital Library Services. from http://bibliomining.com/nicholson/nicholsonbibliointro.html

Nicholson, S. , Stanton, J. (2003). Gaining strategic advantage through bibliomining: data mining for management decisions in corporate, special, digital, and traditional libraries. from http://www.bibliomining.com/nicholson/odmcom.html

Rueda Clausen CF, Villa Roel C, Rueda Clausen CE. (2005). Indicadores bibliométricos: origen, aplicación, contradicción y nuevas propuestas. MedUNAB, Vol 8, No 1 (2005). from http://revistas.unab.edu.co/index.php?journal=medunab&page=article&op=view&path[]=208&path[]=191

Suárez Ibujes, Mario O. (2008). Conceptos básicos de Probabilidades y Estadística Inferencial. from http://www.monografias.com/trabajos95/conceptos-basicos-probabilidades-y-estadistica-inferencial/conceptos-basicos-probabilidades-y-estadistica-inferencial.shtml

Yat Pop, O (2008). Regresión y Correlación. from http://oscarmanuelyatpop.blogspot.com/2008/06/regresion-y-correlacion.html




DOI: http://dx.doi.org/10.4301/S1807-1775201815003

Copyright (c) 2018 Journal of Information Systems and Technology Management

Licensed under