Douglas Adriano Augusto
Resumo
Este trabalho apresenta um novo método evolucionário de combinação de soluções para classificação de dados. A abordagem é baseada em um algoritmo de programação genética multi-populacional que explora a técnica de co-evolução em dois níveis. No nível inter-populacional as populações cooperam em um regime semi-isolado, enquanto que no nível intra-populacional os classificadores candidatos co-evoluem competitivamente com amostras de treinamento. O classificador final é, ao término do processo evolutivo, um comitê de votação composto pelos melhores membros de todas as populações. Duas principais contribuições resultam desta tese: (i) um novo modelo de algoritmo evolucionário para classificação de dados, como descrito acima; e (ii) uma sofisticada implementação deste algoritmo, disponível livremente, para uso em ambientes de alto desempenho.
Abstract
This work presents a new evolutionary ensemble method for data classification. The approach is based on a multiple-population genetic-programming algorithm which exploits the technique of co-evolution at two levels. On the inter-population level the populations cooperate in a semi-isolated fashion, whereas on the intra-population level the candidate classifiers co-evolve competitively with the training data samples. The final classifier is, after the termination of the evolutionary process, a voting committee composed by the best members of all the populations. Two main contributions result from this thesis: (i) a new evolutionary-algorithm model for data classification, as described above; and (ii) a sophisticated implementation of this algorithm, freely available, to be used in high performance environments.