Antonio Carlos Bodini Junior
Título
Utilização de Técnicas de Data Mining na Detecção de Outliers em Auxílio à Auditoria Operacional com um Estudo de Caso com Dados do Sistema de Informações Hospitalares
Resumo
Uma auditoria busca verificar ocorrência de um desvio nas lides administrativas e, se possível, as razões de sua ocorrência. Os desvios são caracterizados pelo registro de dados anômalos e sua evidenciação em uma base de informações não é fácil, mormente em sistemas de grande volume, e fica subordinada à experiência do auditor. Buscando facilitar a descoberta destes, propõe-se o uso de técnicas de mineração de dados no auxílio de auditagens por intermédio dos algoritmos de Agrupamento Nebuloso (Kernel Possiblistic C-Means), Máquina de Vetor Suporte (SVM – One Class), que permitem a evidenciação dos outliers. Desse estudo, verificou-se o uso viável de um novo algoritmo com o mesmo fim, a Função de Similaridade Média, mais simples e igualmente eficaz nesse objetivo. Submeteram-se os dados do Sistema de Informações Hospitalares aos algoritmos, o que demonstrou a efetividade desses na descoberta de outliers e comprovou a utilidade do novo algoritmo.
Abstract
An audit search in administrative works and, if possible, the reasons for it. It is very hard to discover such errors in large data bases and the discovery is normally based in the analyst’s experience. To make it easier, we propose the use of data mining techniques in order to help auditings: a fuzzy clustering algorithm, Kernel Possibilistic C-Means, and a support vector machine method, SVM One Class. These algorithms are able to discover outliers in a dataset. From this research, it was verified a viability of the use of a new algorithm with the same finality, Mean Similarity Function. The effectiveness of the use of these algorithms was tested in Health Information System’s data in which were discovered outliers.