Miguel Angelo Zaccur de Figueiredo

 

Título

Método para Representação de Conceitos por Meio de Técnicas de Análise de Textos em Sequencia Temporal

Orientador(es)


Alexandre Gonçalves Evsukoff

Resumo


Esta tese apresenta um método para representação de conceitos baseado em técnicas de mineração de textos em sequências temporais de documentos. O método apresentado resulta num modelo computacional que identifica determinadas expressões chave em um texto que, de alguma forma, estejam relacionadas a um conceito. O objetivo principal de elaborar um método para representação de conceitos de qualquer natureza, a partir de um conjunto de termos linguísticos selecionados, foi alcançado. Foram realizados vinte e cinco experimentos sobre três áreas distintas. Após análise dos resultados, em 80% dos casos onde há uma série original de referência, as séries geradas acompanharam a comportamento da original, em 13% dos casos as séries geradas anteciparam o comportamento e em 7% as séries geradas refletiram o comportamento posteriormente. Nos experimentos onde não havia uma série original de referência, em 90% dos casos houve indicação de sucesso do método, e em 66% desses casos essa indicação pode ser verificada.

Abstract


This thesis consists of a method for representing concepts based on techniques of text mining in temporal sequences of documents. The presented method results in a computational model that identifies certain key expressions in a text, that somehow, are related to a concept. The main objective of elaborating a method for representing concepts of any nature, from a set of selected linguistic terms, has been reached. Twenty-five experiments were carried out on three distinct areas. After analyzing the results, in 80% of cases where there is an original reference series, the series generated followed the behavior of the original; in 13% of the cases the series generated anticipated the behavior and in 7% the series generated reflected the behavior later. In the experiments where there was no original reference series, in 90% of cases there was indication of success of the method, and in 66% of these cases this indication can be verified.

Save

Save

Save

Save

Print