Marcello Sandi Pinheiro
Resumo
Nesta pesquisa desenvolve-se uma nova abordagem baseada no uso de descritores de textos conhecidos como Sintagmas Nominais na etapa de pré-processamento da Mineração de Textos, mais precisamente na tarefa Mineração de Opiniões. Tem como objeto de estudo estes descritores de informação com relação ao seu uso adequado, e como meio de melhorar o desempenho e a interpretabilidade em Agrupamento de Textos. Parte-se do princípio que um termo ou palavra, simples e isolada, não exprime qualquer informação sintática ou semântica, dificultando a interpretação e influenciando o processo de tomada de decisão. Foi utilizado o algoritmo K-Means padrão devido ao amplo número de aplicações que o utilizam, permitindo, dessa forma, comparar e constatar os resultados desta pesquisa com as demais que usam a abordagem tradicional em Mineração de Textos. Como resultado desta pesquisa, foi desenvolvido um processo inovador para a etapa de pré-processamento de textos, mais fácil que o tradicional, com melhor desempenho e interpretação, além do seu potencial de aplicação a diferentes áreas do conhecimento. Adicionalmente, as análises comparativas dos resultados comprovam que a abordagem proposta com o uso de Sintagmas Nominais em Mineração de Opiniões produz agrupamentos de melhor interpretação e desempenho que a abordagem tradicional.
Abstract
This research develops a new approach based on the use of descriptors of texts known as Noun Syntagmas in the stage of pre-word processing in Text Mining, more specifically in Opinion Mining task. It’s object of study is the descriptors of information with respect to its proper use, and as a means of improving the performance and interpretation of the clustering texts. It is assumed that a term or word, simple and isolated, does not express any syntactic or semantic information, making it difficult to interpreting and influencing the decision making process. Default K-Means algorithm was applied due to the large number of applications that use it, allowing thus to compare and see the results of this research related to others which use the traditional approach of Text Mining. As a result of this research, an innovative process was developed to the stage of pre-word processing, easier than the traditional, with better performance and interpretation and a potential for application to different areas of knowledge. In addition, the comparative analysis of results shows that the use of Noun Syntagmas in Opinion Mining produce clusters with better levels of interpretatin and performance than the traditional approach.