Douglas Adriano Augusto

Título

Co-Evolução Amostra-Classificador Integrada à Programação Genética Gramatical para a Classificação de Dados

Orientador(es)

Nelson Francisco Favilla Ebecken

Resumo

A tarefa de classicação de dados dedica-se a garimpar amostras de dados à procura e extração de conhecimento. Propõe-se a sintetizar a essência das semelhanças que moldam as diferentes classes ou categorias de um certo problema. O êxito desta tarefa depende de algoritmos e técnicas que exerçam com qualidade e exatidão a descoberta do conhecimento implícito em um conjunto de dados. O presente trabalho trata a tarefa de classicação de dados via técnicas de computação evolucionária, empregando-se essencialmente três abordagens: programação gené- tica, co-evolução competitiva e gramática livre de contexto. Explora-se a robustez e a qualidade simbólica/interpretativa da programação genética visando a construção, por evolução darwiniana, de árvores classicadoras. A estrutura formal e flexível da gramática livre de contexto substitui a forma representativa tradicional da programação genética, descrevendo uma linguagem capaz de codicar, de forma precisa e estruturalmente semântica, árvores de qualquer complexidade. Finalmente, a co-evolução competitiva integra-se ao sistema promovendo competições entre amostras de dados e árvores classicadoras, no intuito de criar tensões bilaterais positivas que estimulam a aceleração da escalada evolucionária.

Abstract

The task of data classication consists in mining data samples in order to nd and extract knowledge. It seeks to syntesize the essence of the similarities that dene the different classes or categories of a given problem. The success of this task is dependent on algorithms and techniques that perform with efciency and efcacy the discovery of implict knowledge in a data set. The present work treats the data classication task by means of evolutionary computation techniques using specially three approaches: genetic programming, competitive coevolution, and context-free grammar. The robustness and symbolic/interpretative qualities of the genetic programming are employed to construct classication trees via darwinian evolution. The flexible formal structure of the context-free grammar replaces the standard genetic programming representation and describes a language which encodes trees of varying complexity. Finally, competitive coevolution is used to promote competitions between data samples and classication trees in order to create and sustain an evolutionary race for improved solutions.

Imprimir