Aretha Felix Thomaz da Silva
Título
Identificação de Regras de Associação Interessantes em uma Base de Dados Sobre Exsudações de Óleo no Golfo do México
Resumo
Esta dissertação tem por objetivo a identificação de regras de associação interessantes em uma base de dados de exsudações de óleo, obtida a partir da interpretação de imagens RADARSAT-1 do Golfo do México, Baía de Campeche. Associação é uma tarefa de mineração de dados que tem sido amplamente utilizada para representação de conhecimento implícito. Porém o grande número de regras que podem ser geradas dificulta o reconhecimento de conhecimento relevante ao usuário. Com propósito de minimizar esse problema, a metodologia proposta é composta por duas etapas principais. Na primeira, foram geradas as regras com o uso do aplicativo CBA; na segunda, foi realizado o pós-processamento das regras com uso de medidas de interesse objetivas e subjetivas de avaliação do conhecimento. Essas medidas foram utilizadas para aquilatar a qualidade das regras e selecionar algumas potencialmente interessantes, conforme a opinião de um especialista na detecção de exsudações de óleo por satélite. Assim, foram identificadas, dentre as regras geradas, aquelas que são realmente interessantes e inovadoras de acordo com o conhecimento obtido durante a avaliação. Como resultado, foi possível estabelecer uma seqüência de procedimentos com potencial para viabilizar o uso operacional da metodologia proposta, assim como definir um conjunto de padrões ambientais e de localização úteis na detecção de exsudações de óleo na área de estudo.
Abstract
The objective of this dissertation is to identify interesting associations rules in a database about oil seeps generated as a result of RADARSAT-1 image interpretation in the Gulf of Mexico, Campeche Bay. Association is a data mining procedure that has been often used to represent intrinsic knowledge. However, the excessive number of rules that can be obtained this way makes difficult the recognition of knowledge that is relevant to the user. With the objective of minimizing such a problem, the methodology herein proposed is constituted of two main steps. In the first one, association rules are generated using the algorithm CBA; in the second one, post-processing of rules is carried out with the aid of objective and subjective interest measures for knowledge evaluation. These measures are used to form an idea of the quality of rules and to select those potentially interesting, according to the opinion of an expert in satellite oil seep detection. Therefore, the association rules that are indeed interesting and innovative are identified according to knowledge acquired during the evaluation process. As a result, it is possible to establish a sequence of procedures with potential to make feasible the operational use of the proposed methodology, as well as to define environmental and shape patterns relevant to oil seep detection in the study area.