La
indagación sobre Herramientas de minería de textos como apoyo en el análisis
cualitativo desde un revisión y análisis documental, permitió evidenciar un
número considerable de software de apoyo desde la minería de textos. Se
destaca la existencia de software tanto propietario como de código abierto. De
esta manera, se puede realizar un análisis más riguroso sobre las fuentes
documentales en una investigación, al evidenciar que existen diversas
herramientas que permiten aportar una consistencia y veracidad sobre el
análisis realizado sobre los datos. El presente trabajo recopila una serie de
fuentes que permitirá tanto a docentes como estudiantes, iniciar con la
selección de una herramienta en sus trabajos. En la Tabla se presenta el link
de acceso para revisar la herramienta o software. De igual manera, en
los fundamentos teóricos se establece una conceptualización sobre la MT ubicada
en el análisis de texto y su diferencia con el proceso de búsqueda de
información. Finalmente, se considera se aporta desde un marco de trabajo de
referencias sobre el uso de herramientas para análisis de textos desde la
Minería de Textos. Por otra parte, es importante destacar como la tecnología se
configura como un apoya a fortalecer las competencias investigativas (Silva & Montañez,
2019) ,
de esta manera, el aporte del presente trabajo de investigación Herramientas
de minería de textos para el análisis cualitativo: Una revisión y análisis
documental, se enmarca en un aporte de innovación para el contexto
educativo del siglo XXI, por medio de estrategias innovadoras (Silva, Mendoza, &
Girado, 2018)
para los procesos de enseñanza y aprendizaje.
martes, 29 de octubre de 2019
Minería de textos
Minería de Textos (MT)
Es
importante diferenciar la minería de textos (Text mining) de la recuperación de la información Esta última
consiste en la recuperación automática de fuentes documentales mediante
indizaciones de textos, clasificación, categorización. Por otra parte, la minería de textos, se ocupa
de un proceso de revisión y análisis en profundidad de fuentes textuales, la
cual se apoya desde técnicas como la categorización de texto, el procesamiento
de lenguaje natural, la extracción y recuperación de la información o el aprendizaje
automático. También se define como la generación de nueva información a partir
de grandes cantidades de texto, en la que la información puede ser no
estructurada (diferentes tipos de formatos de archivos) (Rochina, 2017) . En una revisión general, se
identifican herramientas, tales como: TextAnalyst,
twURL, T-LAB, LexiQuest Mine, Text Miner y Weka. Las anteriores, se
clasifican desde herramientas de código libre (software libre).
Gestión de la información
La
Gestión de la información se define
como un proceso investigativo sobre la información, que permite evaluar,
presentar, comparar los datos en un determinado contexto. Por otra parte, la Gestión del Conocimiento, se orienta
desde los procesos y acciones de detección, selección, organización, filtrado,
presentación y uso de la información por parte de los sectores de una
organización (Torres, 2015) . Este último permite
transformar los datos, en información y finalmente en Conocimiento. De esta
manera, los procesos investigativos, se apoyan en herramientas, técnicas e
instrumentos que permiten transformar los datos en nuevo conocimiento, se puede
decir que aportan como proceso a la gestión de la información y finalmente
hacia la transformación en conocimiento. Por lo anterior, es importante
proponer herramientas y técnicas que faciliten la investigación y le aporten un
rigor metodológico.
Desde
el planteamiento anterior, se identifica la Minería de Textos (MT), en la fase
final sobre Organización y análisis de la
información. Es en esta fase donde se propone utilizar la MT para
profundizar en el análisis de contenidos, para apoyar las investigaciones,
sobre todo de tipo cualitativo.
Gestión de la Información y el Conocimiento
Gestión de la Información y el Conocimiento
La
noción de sociedad del conocimiento (SC) ocupa un lugar estratégico en la
discusión actual de un mundo globalizado y una sociedad permeada por la
Cibercultura y un campo de actuación ubicado en el ciberespacio. Entendiendo
que la SC se percibe como una innovación de las Tecnologías de la Información y
las Comunicaciones (TIC), donde el aumento de la información modificó, en
diversos aspectos, la manera en que se
desarrollan las actividades en la sociedad moderna. La revolución de las tecnologías de la información,
traspasaron todas las actividades humanas, es así que en la década de 1970 se
constituyó un nuevo paradigma tecnológico organizado en torno a la tecnología
de la información, iniciando en los Estados Unidos, en donde, la interacción
con la economía global y la geopolítica mundial, materializó un modo nuevo de
producir, comunicar, gestionar y vivir (Castells, 1997) . Aunque se menciona, que la SC, es reciente en
su aparición, este fenómeno va de la mano con el surgimiento de la computación
y la Internet, especialmente con la revolución de la World Wide Web, que ha originado los grandes volúmenes de información.
En este sentido, el fácil, rápido y cambiante acceso a la información, ha
transformado los esquemas educativos, especialmente por la sobre abundancia en
las fuentes de información.
Introducción Minería de Textos
INTRODUCCIÓN
La
tecnología con el pasar de los tiempos ha revolucionado el manejo de la
información, facilitando su acceso. De igual manera, el volumen de información
ha crecido de manera exponencial, estos cambios han permitido magnificar y
recopilar datos que antes se pensaban eran inaccesibles. Aunado a lo anterior, La Internet, los buscadores,
metabuscadores, las bases de datos especializadas y distintos sitios web han
generado nuevas fuentes de información que proveen datos más que suficientes
para establecer un punto de partida en la revisión de antecedentes o en la
construcción de un estado del arte. Lo anterior, más que una ventaja se ha
constituido en una dificultad, en el sentido que se magnifica la actividad del
investigador, para revisar y analizar la cantidad de información. Por otra parte,
las fuentes se han diversificado, no solo se encuentran de tipo textual, se
pueden obtener fuentes gráficas, imágenes, multimedia. Según estudios
adelantados por la consultora Internacional Data Coporration (IDC), el
volumen de datos a nivel mundial alcanzaría 175 zettabytes en 2025 (ver
Figura 1), lo que significa el equivalente a 175 veces la información generada desde
2011. Estas cifras confirman la realidad sobre el crecimiento vertiginoso de la
cantidad de información (Internacional Data Coporation IDC, 2018) .
Figura 1. Proyección del crecimiento anual de la
información a nivel mundial
Fuente: (Internacional Data Coporation IDC, 2018)
Suscribirse a:
Entradas (Atom)












































