martes, 29 de octubre de 2019



La indagación sobre Herramientas de minería de textos como apoyo en el análisis cualitativo desde un revisión y análisis documental, permitió evidenciar un número considerable de software de apoyo desde la minería de textos. Se destaca la existencia de software tanto propietario como de código abierto. De esta manera, se puede realizar un análisis más riguroso sobre las fuentes documentales en una investigación, al evidenciar que existen diversas herramientas que permiten aportar una consistencia y veracidad sobre el análisis realizado sobre los datos. El presente trabajo recopila una serie de fuentes que permitirá tanto a docentes como estudiantes, iniciar con la selección de una herramienta en sus trabajos. En la Tabla se presenta el link de acceso para revisar la herramienta o software. De igual manera, en los fundamentos teóricos se establece una conceptualización sobre la MT ubicada en el análisis de texto y su diferencia con el proceso de búsqueda de información. Finalmente, se considera se aporta desde un marco de trabajo de referencias sobre el uso de herramientas para análisis de textos desde la Minería de Textos. Por otra parte, es importante destacar como la tecnología se configura como un apoya a fortalecer las competencias investigativas (Silva & Montañez, 2019), de esta manera, el aporte del presente trabajo de investigación Herramientas de minería de textos para el análisis cualitativo: Una revisión y análisis documental, se enmarca en un aporte de innovación para el contexto educativo del siglo XXI, por medio de estrategias innovadoras (Silva, Mendoza, & Girado, 2018) para los procesos de enseñanza y aprendizaje.

SOFTWARE PROPIETARIO

SOFTWARE PROPIETARIO




































SOFTWARE LIBRES

SOFTWARE LIBRES






Software Libres y Propios

Softwares Libre


Softwares Propietario



Minería de textos


Minería de Textos (MT)

Es importante diferenciar la minería de textos (Text mining) de la recuperación de la información Esta última consiste en la recuperación automática de fuentes documentales mediante indizaciones de textos, clasificación, categorización.  Por otra parte, la minería de textos, se ocupa de un proceso de revisión y análisis en profundidad de fuentes textuales, la cual se apoya desde técnicas como la categorización de texto, el procesamiento de lenguaje natural, la extracción y recuperación de la información o el aprendizaje automático. También se define como la generación de nueva información a partir de grandes cantidades de texto, en la que la información puede ser no estructurada (diferentes tipos de formatos de archivos) (Rochina, 2017). En una revisión general, se identifican herramientas, tales como: TextAnalyst, twURL, T-LAB, LexiQuest Mine, Text Miner y Weka. Las anteriores, se clasifican desde herramientas de código libre (software libre).

Gestión de la información



La Gestión de la información se define como un proceso investigativo sobre la información, que permite evaluar, presentar, comparar los datos en un determinado contexto. Por otra parte, la Gestión del Conocimiento, se orienta desde los procesos y acciones de detección, selección, organización, filtrado, presentación y uso de la información por parte de los sectores de una organización (Torres, 2015). Este último permite transformar los datos, en información y finalmente en Conocimiento. De esta manera, los procesos investigativos, se apoyan en herramientas, técnicas e instrumentos que permiten transformar los datos en nuevo conocimiento, se puede decir que aportan como proceso a la gestión de la información y finalmente hacia la transformación en conocimiento. Por lo anterior, es importante proponer herramientas y técnicas que faciliten la investigación y le aporten un rigor metodológico.
  
Desde el planteamiento anterior, se identifica la Minería de Textos (MT), en la fase final sobre Organización y análisis de la información. Es en esta fase donde se propone utilizar la MT para profundizar en el análisis de contenidos, para apoyar las investigaciones, sobre todo de tipo cualitativo.

Gestión de la Información y el Conocimiento



Gestión de la Información y el Conocimiento

La noción de sociedad del conocimiento (SC) ocupa un lugar estratégico en la discusión actual de un mundo globalizado y una sociedad permeada por la Cibercultura y un campo de actuación ubicado en el ciberespacio. Entendiendo que la SC se percibe como una innovación de las Tecnologías de la Información y las Comunicaciones (TIC), donde el aumento de la información modificó, en diversos aspectos, la manera en que se desarrollan las actividades en la sociedad moderna. La revolución de las tecnologías de la información, traspasaron todas las actividades humanas, es así que en la década de 1970 se constituyó un nuevo paradigma tecnológico organizado en torno a la tecnología de la información, iniciando en los Estados Unidos, en donde, la interacción con la economía global y la geopolítica mundial, materializó un modo nuevo de producir, comunicar, gestionar y vivir (Castells, 1997).  Aunque se menciona, que la SC, es reciente en su aparición, este fenómeno va de la mano con el surgimiento de la computación y la Internet, especialmente con la revolución de la World Wide Web, que ha originado los grandes volúmenes de información. En este sentido, el fácil, rápido y cambiante acceso a la información, ha transformado los esquemas educativos, especialmente por la sobre abundancia en las fuentes de información.

Introducción Minería de Textos



 INTRODUCCIÓN

La tecnología con el pasar de los tiempos ha revolucionado el manejo de la información, facilitando su acceso. De igual manera, el volumen de información ha crecido de manera exponencial, estos cambios han permitido magnificar y recopilar datos que antes se pensaban eran inaccesibles.  Aunado a lo anterior, La Internet, los buscadores, metabuscadores, las bases de datos especializadas y distintos sitios web han generado nuevas fuentes de información que proveen datos más que suficientes para establecer un punto de partida en la revisión de antecedentes o en la construcción de un estado del arte. Lo anterior, más que una ventaja se ha constituido en una dificultad, en el sentido que se magnifica la actividad del investigador, para revisar y analizar la cantidad de información. Por otra parte, las fuentes se han diversificado, no solo se encuentran de tipo textual, se pueden obtener fuentes gráficas, imágenes, multimedia. Según estudios adelantados por la consultora Internacional Data Coporration (IDC), el volumen de datos a nivel mundial alcanzaría 175 zettabytes en 2025 (ver Figura 1), lo que significa el equivalente a 175 veces la información generada desde 2011. Estas cifras confirman la realidad sobre el crecimiento vertiginoso de la cantidad de información  (Internacional Data Coporation IDC, 2018).





Figura 1. Proyección del crecimiento anual de la información a nivel mundial
Fuente: (Internacional Data Coporation IDC, 2018)