Maria Luiza Castro Passini
Resumo
Este trabalho apresenta uma estratégia de Mineração de Textos para organização de conteúdos de documentos e examina o seu desempenho em um
estudo de caso de uma Central de Atendimento que presta serviço a uma empresa de petróleo. Em uma Central de Atendimento, a organização e a facilidade na localização
de informações são fundamentais para proporcionar maior qualidade e eficiência durante um atendimento. Os procedimentos, normalmente em formato texto, são
armazenados em uma Base de Conhecimento, e atualizados manualmente, de acordo com a demanda dos serviços prestados. As técnicas e tarefas de Mineração de Textos
foram aplicadas para organizar os documentos da língua portuguesa, a partir de uma base de textos reais. Também são utilizadas duas abordagens recentes: o modelo de
tópicos, que representa uma coleção de documentos através de tópicos probabilísticos contendo as palavras-chaves e o mecanismo de seleção imune-supressor, que
envolve a seleção dos documentos mais representativos. Os resultados mostram que as palavras mais representativas do modelo de tópicos podem ser comparadas ao
melhor resultado obtido pela rotulação automática dos grupos. Além disso, a seleção desses documentos apresenta resultados satisfatórios em grandes bases de
documentos.
Abstract
This work presents a Text Mining strategy for the organization of documents contents and examines its performance in a case study of a Contact Center, which
provides service to an oil company. In a Contact Center, the organization and facility to find information are essential to provide higher quality and efficiency during a call. The
procedures, usually in text format, are stored in a knowledge base and are manually updated, according to the demand of services. The techniques and tasks of Text
Mining were applied to organize documents in the portuguese language, from actual textual databases. It also utilizes two recent approaches: the model of topic that
represents a collection of documents through probabilistic topics containing the keywords and immune-suppressive mechanism, which involves the selection of the
most representative documents. The results show that the most significant words of the type of topic model can be compared to the best result obtained by automatic labeling
clusters. Moreover, by choosing these documents achieved satisfactory results with large databases.