Luiz Claudio Marini Silva

Título

Uma Metodologia De Avaliação De Similaridade De Documentos De Patentes

 

Orientador(es)

Nelson Francisco Favilla Ebecken


Resumo

O exame de um pedido de patente é uma tarefa considerada de grande complexidade, que procura avaliar o mérito da matéria reivindicada com relação aos requisitos de patenteabilidade definidos pela legislação brasileira, com base no estado da técnica da área. Levantar e avaliar esse estado da técnica é uma tarefa não trivial, que exige um esforço considerável por parte do pesquisador que examina o pedido.
Em um exame, os pesquisadores utilizam ferramentas que recuperam documentos com base em abordagens clássicas de recuperação de informação, baseadas na classificação dos documentos e no uso de palavras-chave. Essa abordagem se mostra apropriada para se recuperar um primeiro conjunto de documentos. A partir desse ponto, existe a percepção clara por parte dos pesquisadores da necessidade de abordagens de apoio no sentido de otimizar o trabalho de análise manual dos documentos recuperados.
Esse trabalho apresenta uma metodologia escalável, de uso amigável, com distintas abordagens de análise textual, que apresenta resultados relevantes na análise de similaridade de documentos de patentes, para apoiar os pesquisadores no processo de exame, na análise da relevância dos documentos recuperados.
Cabe destacar que o cenário do exame de um pedido de patente foi o grande motivador desse trabalho. Porém, a metodologia de avaliação de similaridade textual desenvolvida pode ser aplicada a documentos variados, de diferentes tipos e formatos, em outros cenários, se configurando em uma metodologia de aplicação bastante ampla na área de mineração de textos.


Abstract

The examination of a patent application is considered a task of great complexity, which seeks to assess the merits of the claimed subject matter with regard to the patentability requirements defined by Brazilian law, based on the state-of-the-art. Find and evaluate this state of the art is non-trivial task that requires considerable effort on the part of the researcher examining the application.
In a examination, researchers use tools that retrieve documents based on classical approaches of information retrieval, based on the documents classification and the use of keywords. This approach proves suitable to recover a first set of documents. From that point, there is a clear perception by the researchers of the need to support approaches to optimize the manual work of analysis of retrieved documents.
This paper presents a scalable methodology, user-friendly, with different textual analysis approaches, which shows relevant results in the similarity analysis of patent documents, to support researchers in the examination process, the analysis of the relevance of retrieved documents.
It should be noted that the scenario of the patent application examination was the main motivator of this work. However, the developed textual similarity assessment methodology can be applied to various documents of different types and formats, in other scenarios, configured in a methodology very broad application in the text mining area.


Save

Imprimir