CPC 863 - Análise de Informação Não-Estruturada
Ementa
1. Introdução;
2. Dados estruturados e não-estruturados;
3. Convertendo informação textual em vetores;
4. Mineração de textos e busca de informação;
5. Medidas de similaridade;
6. Documentos e web;
7. Análise de documentos: busca de padrões;
8. Classificação de documentos;
9. Estruturas de coleção de documentos;
10. Busca de informação em documentos;
11. Aplicações e Estudo de casos;
12. Ferramentas computacionais.
Bibliografia
1. S.M. Weiss, N. Indurkhya, T. Zhang and F. L. Damerau. Text Mining: Predictive Methods for Analyzing Unstructured Information, Springer, 2005.
2. A. ZANASI (edited by), Text Mining and its Applications to Intelligence, CRM and Knowledge Management, WITPress, 2005.
3. D. Sullivan. Document Warehousing and Text Mining, Wiley, 1998.