Vincenzo De Roberto Junior

Título



Ferramenta Auxiliar para Identificação de Regiões Codificadoras em Organismos Eucariotos - ExonBR

Orientador(es)



Nelson Francisco Favilla Ebecken

Resumo



A conclusão de vários projetos de seqüenciamento proporciona um volume considerável de dados, que precisa ser processado adequadamente de forma a se obter informações genéticas úteis. Uma das regiões mais importantes para neste processo são conhecidas como genes. A identificação de genes em organismos eucariotos é um problema que ainda hoje não teve uma completa solução. Esta tese investiga a aplicação de técnicas de inteligência computacional para a solução deste problema. Os principais objetivos deste trabalho são melhorar a predição das regiões codificadoras e a criação de uma ferramenta auxiliar para detecção destas regiões em genes eucariotos, denominada ExonBR. As principais inovações propostas são a utilização da técnica de redes neurais com entradas baseadas nas probabilidades dos hexâmeros (matriz peso-posição modificada) para detecção de regiões codificadoras e a disponibilização, para o biólogo, de uma ferramenta adaptável a qualquer organismo. Os objetivos deste trabalho foram alcançados, criando uma ferramenta amigável e adaptável a qualquer organismo. De acordo com os resultados encontrados, este programa pode ser comparado aos melhores existentes atualmente, com taxas de acerto variando entre 80% e 95% para o organismo para o qual foi treinado e aqueles próximos, evolutivamente, dele.

Abstract



The conclusion of several sequencing projects provides a considerable amount of data that needs to be processed appropriately in order to obtain useful genetic information. Among these areas, the most important in that process are known as genes. The gene finding in eukaryotic organisms is an unsolved problem yet. The thesis analyses the use of computational intelligence techniques to solve that problem. The main objective of this work is improving the performance of the prediction of coding regions and creating an auxiliary tool for the identification of coding areas in eukaryotic genes, called ExonBR. The main innovation proposed in this work is the use of neural networks with inputs based on the probabilities of hexamers (modified weight-position matrix) for detection of coding areas and to make available to biologists a tool suitable to any organism. The target of this work was reached by creating a friendly and suitable tool for any organism. In accordance with the obtained results, this program can be compared to the best ones that exist nowadays. The program ExonBR shows prediction rates about 80% and 95% for the organism that was trained and those ones evolutionary near to it.

Imprimir