Cecília de Freitas Vieira Couto
Título
COMPARAÇÃO DE MÉTODOS DE BUSCA DE CONHECIMENTO EM TEXTOS CIENTÍFICOS UTILIZANDO PROCESSAMENTO DE LINGUAGEM NATURAL SUPERVISIONADA
Resumo
Ao longo dos últimos anos, graças principalmente à criação da internet e ao aumento da globalização, ocorreu um grande crescimento no número de pesquisas científicas realizadas. Entretanto, devido a esse aumento exorbitante, o acompa-nhamento de todos esses trabalhos de forma manual se tornou uma tarefa bastante difícil. Assim, neste trabalho foi desenvolvido um modelo de processamento de linguagem natural que, utilizando as técnicas de vetorização BERT e Word2Vec e calculando a similaridade entre palavras, se propõe a auxiliar a análise de produções científicas. Para isso, foi necessário definir o tamanho ideal para o dataset que foi usado neste trabalho, aplicar os modelos elaborados usando o BERT e o Word2Vec e comparar os resultados obtidos. Foram estudadas as áreas de pesquisa da to-xicologia, farmacologia e farmácia. Como resultados, foram verificadas possíveis novas relações entre a depressão e a celecoxibe, a diabetes e a anfetamina e entre a ansiedade e alguns antibióticos.
Abstract
Over the last few years, thanks mainly to the creation of the internet and the increase in globalization, there has been a huge growth in the number of scientific researches carried out. However, due to this exorbitant increase, monitoring all these jobs manually has become a very difficult task. Thus, in this work a natural language processing model was developed which, using the BERT and Word2Vec vectorization techniques and calculating the similarity between words, proposes to help the analysis of scientific productions. For this, it was necessary to define the ideal size for the dataset that was used in this work, apply the models developed using BERT and Word2Vec and compare the results obtained. The research areas of toxicology, pharmacology and pharmacy were studied. As a result, possible new rela-tionships were verified between depression and celecoxib, diabetes and amphetamine and between anxiety and some antibiotics.