Cláudio Luiz Curotto

Título



Integração de Recursos de Data Mining com Gerenciadores de Bancos de Dados Relacionais

Orientador(es)



Nelson Francisco Favilla Ebecken

Resumo



O processo de descoberta de conhecimento em bancos de dados é abordado sob a ótica da integração com um sistema gerenciador de banco de dados relacional de uso comercial. As etapas que compõem este processo, ou seja, a consolidação de dados, a preparação e seleção de dados, a mineração de dados, a avaliação e a interpretação do conhecimento obtido, são delineadas. A etapa de mineração de dados é realizada através de um classificador incremental Bayesiano. Este classificador é formulado para considerar problemas com atributos de dados contínuos e múltiplos atributos de predição discretos com atualização incremental dos dados de treinamento. A implementação deste classificador, como um provedor de recursos de mineração de dados, é apresentada em detalhes. As árvores de decisão produzidas pelo classificador são visualizadas graficamente através de um Browser desenvolvido especialmente para esta finalidade. Experimentos computacionais são realizados para avaliar o comportamento e o desempenho da implementação em comparação com outros classificadores.

Abstract



The process of knowledge discovery in databases is approached from the perspective of the integration with a commercial relational database management system. The steps that compose this process: consolidation of data, preparation and selection of data, data mining, evaluation and interpretation of the achieved knowledge, are outlined. The data mining step is carried out by an incremental Bayesian classifier. This classifier is formulated to deal with problems with continuous input attributes and multiple discrete prediction attributes using incremental update of the training data set. The implementation of this classifier, as a data mining provider, is shown in details. The decision trees produced by the classifier are visualized graphically through a Browser developed specially for this purpose. Computational experiments are made to evaluate the behavior and the performance of the implementation in comparison with other classifiers.