Maria Luiza Castro Passini

Título


Mineração de Textos para Organização de Documentos em Centrais de Atendimento



Orientador(es)


Nelson Francisco Favilla Ebecken

Resumo


Este trabalho  apresenta uma estratégia de Mineração de Textos para organização de conteúdos de documentos e examina o seu desempenho em um
estudo de caso de uma Central de Atendimento que presta serviço a uma empresa de petróleo. Em uma Central de Atendimento, a organização e a facilidade na localização
de informações são fundamentais para proporcionar maior qualidade e eficiência durante um atendimento. Os procedimentos,  normalmente em formato texto, são
armazenados em uma Base de Conhecimento, e atualizados manualmente, de acordo com a demanda dos serviços prestados. As técnicas e tarefas de Mineração de Textos
foram aplicadas para organizar os documentos da língua portuguesa, a partir de uma base de textos reais. Também são utilizadas duas abordagens recentes: o  modelo de
tópicos, que representa uma coleção de documentos através de tópicos probabilísticos contendo as palavras-chaves e o mecanismo  de seleção  imune-supressor, que
envolve a seleção dos documentos mais representativos.  Os resultados mostram que as palavras mais representativas do modelo de tópicos podem ser comparadas ao
melhor resultado obtido pela rotulação automática dos grupos. Além disso, a seleção desses documentos apresenta resultados satisfatórios em grandes bases de
documentos.


Abstract


This work presents a Text Mining strategy for the organization of documents contents and examines its performance in a case study of a Contact Center, which
provides service to an oil company. In a Contact Center, the organization and facility to find  information  are essential to provide  higher quality and  efficiency during  a call.  The
procedures,  usually  in text format,  are stored in  a  knowledge base and are manually updated, according to  the demand  of  services. The techniques and  tasks of  Text
Mining  were applied  to organize documents  in the portuguese language, from actual textual databases. It also utilizes two  recent approaches:  the model of  topic that
represents a collection  of documents through  probabilistic  topics  containing  the keywords  and  immune-suppressive  mechanism,  which  involves  the selection of the
most representative documents. The results show that the most significant words of the type of topic model can be compared to the best result obtained by automatic labeling
clusters. Moreover, by choosing these documents achieved  satisfactory results with large databases.

Print