Ever Pereira da Silva
Título
Desenvolvimento de uma Estratégia de Seleção de Características Encapsulada Utilizando Modelos de Aproximação
Resumo
O problema de classificação trata da construção de discriminantes visando a predição de classes de uma amostragem. Na obtenção dos classificadores, todos os atributos geralmente são considerados, independentemente de sua relevância. Técnicas de seleção de características se apresentam como ferramentas que buscam aumentar a acurácia da discriminação e melhorar o entendimento dos dados avaliados. Estratégias baseadas em filtragem dos dados e, principalmente, modelos encapsulados tem apresentado resultados satisfatórios nesta tarefa. Modelos de seleção de características encapsulados buscam o subconjunto ótimo de atributos através da otimização dos resultados de predição em relação a um classificador pré-determinado, o que torna o processo computacionalmente dispendioso. Modelos de aproximação são estratégias acopladas a problemas que envolvem simulações com alto custo computacional que substituem uma parcela destas simulações por aproximações adequadas destas simulações. Gerenciado de forma eficiente, o modelo de aproximação produz resultados similares ao problema original com menor demanda computacional. Um modelo de aproximação para seleção de característica encapsulada, baseado em algoritmos evolucionistas e codificação binária é apresentado visando a redução do custo computacional, sem perda expressiva na qualidade de predição. Experimentos numéricos são realizados utilizando classificadores com propriedades diversas no encapsulamento, bem como um conjunto de bancos de dados bastante heterogêneo, para atestar a eficiência e robustez do modelo.
Abstract
Classification problems treats with the task of construct discriminants that predict the classes of a given sampling with efficient accuracy. Usually, all attributes or features, independent of its relevance, are considered to obtain the classifier. Feature selection techniques are tools applied on databases in order to enhance the classifier accuracy and to increase the knowledge of data behavior. Filter strategies and, mainly, wrapper models have presented satisfactory results for this task. Wrapper models search for an optimum feature subset by means of an optimization prediction process in relation to a predefined classifier, usually at a high computational cost. Approximation models are strategies coupled to problems that involves high cost simulations substituting partially the simulations by its estimation by means of an adequate approximation strategy. An efficient management of the approximation produces similar results to the original problems at low computational costs. An approximation model for wrapper feature selection is developed based on evolutionary algorithms and binary encoding objecting to preserve the prediction accuracy and to reduce computational effort. Numerical experiments are performed using classifiers with different properties for the wrapper process and a heterogeneous set of data to attest the efficiency and robustness of the proposed model.