Ever Pereira da Silva

Título



Desenvolvimento de uma Estratégia de Seleção de Características Encapsulada Utilizando Modelos de Aproximação

Orientador(es)



Nelson Francisco Favilla Ebecken e Carlos Cristiano Hasenclever Borges

Resumo



O problema de classificação trata da construção de discriminantes visando a predição de classes de uma amostragem.  Na obtenção dos classificadores, todos os atributos geralmente são considerados, independentemente de sua relevância. Técnicas de seleção de características se apresentam como ferramentas que buscam aumentar a acurácia da discriminação e melhorar o entendimento dos dados avaliados. Estratégias baseadas em filtragem dos dados e, principalmente, modelos encapsulados tem apresentado resultados satisfatórios nesta tarefa.  Modelos de seleção de características encapsulados buscam o subconjunto ótimo de atributos através da otimização dos resultados de predição em relação a um classificador pré-determinado, o que torna o processo computacionalmente dispendioso. Modelos de aproximação são estratégias acopladas a problemas que envolvem simulações com alto custo computacional que substituem uma parcela destas simulações por aproximações adequadas destas simulações. Gerenciado de forma eficiente, o modelo de aproximação produz resultados similares ao problema original com menor demanda computacional.  Um modelo de aproximação para seleção de característica encapsulada, baseado em algoritmos evolucionistas e codificação binária é apresentado visando a redução do custo computacional, sem perda expressiva na qualidade de predição.    Experimentos numéricos são realizados utilizando classificadores com propriedades diversas no encapsulamento, bem como um conjunto de bancos de dados bastante heterogêneo, para atestar a eficiência e robustez do modelo.

Abstract



Classification problems  treats with  the  task of  construct discriminants  that predict the classes of a given  sampling with efficient accuracy. Usually, all attributes or features, independent of  its  relevance,  are  considered  to obtain  the  classifier. Feature  selection techniques are tools applied on databases in order to enhance the classifier accuracy and to  increase  the  knowledge  of  data  behavior.  Filter strategies  and,  mainly,  wrapper models have presented satisfactory results for this task. Wrapper models search for an optimum feature subset by means of an optimization prediction process in relation to a predefined classifier, usually at a high computational cost. Approximation models are strategies coupled to problems that involves high cost simulations substituting partially the simulations by its estimation by means of an adequate approximation strategy. An efficient  management  of  the approximation  produces  similar  results  to  the  original problems  at  low computational  costs.  An  approximation  model  for  wrapper  feature   selection is developed based on evolutionary algorithms and binary encoding objecting to preserve  the  prediction  accuracy  and  to  reduce  computational  effort.  Numerical experiments  are  performed  using  classifiers with  different  properties  for  the wrapper process  and  a  heterogeneous  set  of  data  to  attest  the  efficiency  and robustness  of  the proposed model.

Print