Lúcio Pereira de Andrade

Título

Procedimento Interativo de Agrupamento de Dados

Orientador

Nelson Francisco Favilla Ebecken

Resumo

Este trabalho realiza a implementação de um procedimento interativo para agrupamento de dados amparado em estudos sobre métodos de segmentação, critérios de avaliação da qualidade da formação dos agrupamentos e técnicas de visualização. A segmentação das bases de dados pode ser obtida pela aplicação de um método hierárquico aglomerativo, sendo visualizada na forma de dendrograma, ou através do método particional “K-Means”, cuja qualidade dos resultados, avaliada pelo critério estatístico de Calinski e Harabasz leva à busca interativa do número ideal de grupos. A técnica de visualização “Coordenadas Estrela” torna possível a representação de objetos com n dimensões em um plano bidimensional, permitindo a observação de características espaciais das bases de dados. Alguns estudos de caso, sobre três bases de dados, foram realizados para análise e comparação com outras metodologias e softwares comerciais existentes.

Abstract

The object ive of this work is the implementation of an interactive procedure for data clustering including the analysis of the usual methods and techniques of visualization. The clustering analysis is performed by an aglomerative hierarchical method, being visualized in the form of dendrogram, or through the partitional "K-Means" method, using the Calinski and Harabasz statistical criterium to obtain ideal number of groups. The visualization "Star Coordinates" technique is used to the object representation with n dimensions in a two-dimensional domain. Several cases are studed to compare with another strategies available in commercial tools.

Imprimir