martes, 29 de octubre de 2019

Minería de textos


Minería de Textos (MT)

Es importante diferenciar la minería de textos (Text mining) de la recuperación de la información Esta última consiste en la recuperación automática de fuentes documentales mediante indizaciones de textos, clasificación, categorización.  Por otra parte, la minería de textos, se ocupa de un proceso de revisión y análisis en profundidad de fuentes textuales, la cual se apoya desde técnicas como la categorización de texto, el procesamiento de lenguaje natural, la extracción y recuperación de la información o el aprendizaje automático. También se define como la generación de nueva información a partir de grandes cantidades de texto, en la que la información puede ser no estructurada (diferentes tipos de formatos de archivos) (Rochina, 2017). En una revisión general, se identifican herramientas, tales como: TextAnalyst, twURL, T-LAB, LexiQuest Mine, Text Miner y Weka. Las anteriores, se clasifican desde herramientas de código libre (software libre).

No hay comentarios:

Publicar un comentario