Lúcia Helena de Magalhães

 

Título



Uma Análise de Ferramentas para Mineração de Conteúdo de Páginas Web

Orientador(es)



Nelson Francisco Favilla Ebecken

Resumo



A Mineração de Conteúdo na Web é uma técnica para descobrir e analisar informações úteis da Internet. A proposta deste trabalho é apresentar uma análise de ferramentas para mineração de conteúdo de páginas web e analisar os resultados destas técnicas no processo de recuperação e extração da informação. Os modelos de recuperação de informação apresentam estratégias de pesquisa de documentos relevantes através da busca automática da informação. Assim, será feito uma análise comparativa das páginas devolvidas pelos mecanismos de busca, levando em consideração a precisão, organização e a qualidade dos documentos recuperados. Quanto às ferramentas de extração da informação, serão também analisados os resultados relacionados à automatização do processo, funcionalidades para exportação dos dados extraídos e a qualidade do extrato.

Abstract



Web Content Mining is a technique to discover and analyze useful information from the Internet. The proposal of this work is to examine some of the principle tools for web content mining and to analyze the results of these techniques in the recovery process and information extraction. All these information recovery models implement different strategies. In this way, it will be made a comparative analysis of the returned results taking in consideration the precision, organization and the quality of the recovered documents. The extraction information tools will also be analyzed through the results linked to the automation process, functionalities for export the extracted data and the quality of this extract.

Print