Marcello Sandi Pinheiro

Título



Uma Abordagem Usando Sintagmas Nominais como Descritores no Processo de Mineração de Opiniões

Orientador(es)



Nelson Francisco Favilla Ebecken

Resumo



Nesta pesquisa desenvolve-se uma nova abordagem baseada no uso de descritores de textos conhecidos como Sintagmas Nominais na etapa de pré-processamento da Mineração de Textos, mais precisamente na tarefa Mineração de Opiniões. Tem como objeto de estudo estes descritores de  informação com  relação ao seu uso  adequado,  e  como meio de melhorar o desempenho  e  a  interpretabilidade  em Agrupamento  de  Textos.  Parte-se do princípio que um termo ou palavra, simples e isolada, não exprime qualquer informação sintática ou semântica, dificultando a interpretação e influenciando o processo de tomada de decisão.  Foi utilizado o algoritmo K-Means padrão devido ao amplo número de aplicações que o utilizam, permitindo, dessa forma, comparar e constatar os resultados desta pesquisa com as demais que usam a abordagem tradicional em Mineração de Textos. Como resultado desta pesquisa, foi desenvolvido um processo inovador para a etapa de pré-processamento de textos, mais fácil que o tradicional, com melhor desempenho e interpretação, além do seu potencial de aplicação a diferentes áreas do conhecimento. Adicionalmente, as análises comparativas dos resultados comprovam que a abordagem proposta com o uso de Sintagmas Nominais em Mineração de Opiniões produz agrupamentos de melhor interpretação e desempenho que a abordagem tradicional.

Abstract



This research develops a new approach based on the use of descriptors of  texts known as  Noun  Syntagmas  in  the  stage  of  pre-word  processing  in  Text  Mining,  more specifically in Opinion Mining task. It’s object of study is the descriptors of information  with  respect  to  its  proper  use,  and  as  a  means  of  improving  the  performance  and interpretation  of  the  clustering  texts.  It  is  assumed  that  a  term  or  word,  simple  and isolated, does not express any syntactic or semantic  information, making  it difficult  to interpreting  and  influencing  the decision making process. Default K-Means  algorithm was  applied  due  to  the  large  number  of  applications  that  use  it,  allowing  thus  to compare and see  the  results of  this  research  related  to others which use  the  traditional approach  of  Text  Mining.  As  a  result  of  this  research,  an  innovative  process  was developed  to  the  stage of  pre-word  processing,  easier  than  the  traditional, with better performance  and  interpretation  and  a  potential  for  application  to  different  areas  of knowledge. In addition, the comparative analysis of results shows that the use of Noun Syntagmas  in Opinion Mining produce clusters with better  levels of  interpretatin and performance than the traditional approach.

Imprimir