Fátima Ferrão dos Santos

Título



Descoberta de Conhecimento em Banco de Dados de Saúde Através da Integração de Mineração de Dados Geográficos e Redes Complexas

Orientador(es)



Nelson Francisco Favilla Ebecken

Resumo



Esta tese se concentra no desenvolvimento de descoberta de conhecimento em um banco de dados de saúde, exclusivamente da epidemia pelo vírus HIV, por meio da integração de mineração de dados geográficos e redes complexas. O presente trabalho é composto de três partes distintas. A primeira parte apresenta uma proposta de medida de dependência espacial, denominada índice de influência espacial. Dependência espacial é o impacto que a variação na localização espacial causa na variação dos atributos, ou seja, é a medida de como os atributos são dependentes do espaço geográfico. A segunda parte apresenta a aplicação do índice nas tarefas de mineração de dados geográficos. Com base nos resultados obtidos com as tarefas de mineração de dados, as fases de evolução da epidemia são identificadas. Essa parte apresenta também a modelagem espaço-temporal e a predição da evolução da epidemia com óbito. Finalmente, a terceira parte integra os conhecimentos obtidos usando a abordagem de redes complexas.

Abstract



This thesis focuses the development of knowledge discovery in a health database, particularly for HIV virus epidemics, through the integration of geographic data mining and complex networks. The present work comprises three different sections. First, a proposal for spatial dependence measure called Spatial Influence Index is presented. Spatial dependence is a measure of the impact caused by a modification in the spatial localization on attribute modification, thus, it measures how attributes are dependent of the geographical space. The second section presents the application of the Index to geographical data mining tasks. The stages of the epidemics evolution are identified based on the results of those data mining tasks. This section also presents a spatio-temporal modeling and a forecast of the evolution of the epidemics with death. Finally the obtained knowledge is integrated using the complex network approach.



 

Print