Adriana Aparicio Sicsú Ayres do Nascimento

Título


Metodologia para recuperação de documentos através da associação entre termos

Orientador(es)


Alexandre Gonçalves Evsukoff
Neide dos Santos

Resumo


Esta tese tem como objetivo desenvolver uma metodologia que visa  a recuperação de documentos através da associação entre termos.  Nas ferramentas de busca, normalmente, o usuário realiza consulta, digitando palavras-chave relacionadas à sua necessidade de informação. Ocorre que, nem sempre, ele conhece os termos presentes no conteúdo dos documentos que compõem a base de dados, restringindo sua consulta a poucas palavras-chave ou a palavras-chave não específicas do universo de interesse levando o usuário muita das vezes a resultados pouco produtivos ou documentos não relevantes, devido ao retorno de muitos documentos.  A metodologia foi desenvolvida em três módulos distintos, sendo eles: (1) Módulo de Preparação e Extração de Termos: trabalha com o processo de mineração de textos, envolvendo a obtenção, extração e estruturação dos termos candidatos; (2) Módulo de  Identificação de Termos Relevantes: identifica os termos relevantes de uma determinada coleção de documentos e seus relacionamentos, através da técnica de regras de associação aplicada a mineração de textos; (3)   Módulo de Recuperação de Documentos: permite a recuperação de documentos através de uma busca direcionada e encadeada, apresentando, a cada interação do usuário, os termos relacionados com a consulta  que está sendo montada.

Abstract


This thesis aims at developing a methodology for document retrieval using terms association.  The search engine user,  in general,  searches for information by typing correlated key words. The user, however, does not always know the terminology of the documents comprising the database. This limits the search to few or non-specific key words, leading to unproductive results due to excessive matching or selection of irrelevant documents. The new methodology was developed in 3 distinct modules: (1) Set up and word selection - data mining, including gathering, selection and structuring; (2) Relevant key word finding: keyword identification of a particular collection of documents and related documents through  the  technique of associated rules applied to data mining; (3)  Document retrieval module:  document retrieval through a directed and interlinked search that presents, at each interaction, the terms related to the query words.

Imprimir