Marcos Neves do Vale

Título

PREDIÇÃO DA VARIAÇÃO DO ÍNDICE DOW JONES UTILIZANDO MINERAÇÃO DE TEXTOS

Orientador(es)

Nelson Francisco Favilla Ebecken

Resumo

Os recentes avanços nas técnicas de mineração de dados e textos permitem novas pesquisas sobre a previsão do mercado financeiro (TMFP). O objetivo deste trabalho é apresentar um novo modelo de previsão para as tendências do índice Dow Jones ao longo do dia. O modelo foi desenvolvido utilizando o RapidMiner juntamente com scripts SQL. O modelo utiliza-se de processos de mineração de texto existentes e uma nova técnica de alinhamento de dados obtida, de modo geral, a partir da coleta das notícias publicadas pelo Yahoo Finance e pelo Google Finance correspondentes às 5 ações com maior volume de negociações por minuto. A qualidade do modelo é medida pelos índices Precision, Recall e F-Measure. Os resultados obtidos foram excelentes e superam as técnicas descritas até o momento para esse fim. Além disso, o modelo mostrou-se robusto e eficiente, demonstrando que a utilização de técnicas de mineração de texto juntamente com a estratégia correta aplicada no mercado financeiro é uma alternativa a ser considerada e contribui para o estado da arte nessa área de pesquisa.

Abstract

The recent advances in data and text mining techniques are enabling new research on financial market prediction (TMFP). The purpose of this work is to present a new prediction model for Dow Jones index trends throughout the day. The model was developed using RapidMiner along with SQL scripts. The process uses existing text mining processes and a new alignment technique that is briefly made by picking up the news published by YahooFinance and Google Finance corresponded to the 5 stocks with highest trading volume in each minute. The quality of the model is measured by Precision, Recall and F-Measure indices. The results obtained were excellent and surpass existing techniques today and also in the literature for this purpose. The model proved to be robust and efficient, demonstrating that the use of text mining techniques along with the correct strategy applied in the financial market is an alternative to be considered and contributes to the state of the art in this area of research.

Print