José Cláudio Garcia Damaso
Orientador(es)
Beatriz de Souza Leite Pires de Lima
Resumo
Esta tese apresenta uma abordagem para sequenciamento de novo (in silico) de peptídeos em espectros MS2 multiplex, adquiridos em espectrômetros de massa, que contêm fragmentos de mais de um peptídeo na mesma janela de fragmentação. Foi desenvolvido um método simples e expedito, denominado DNbuilder, para o sequenciamento de novo de peptídeos com uma pontuação que considera as intensidades dos fragmentos do tipo y. O problema foi modelado através de grafos e adotou-se o algoritmo de busca DFS (Depth-first search) para se obter as sequências candidatas dos peptídeos. Identificadas as massas sobre cargas (m/z) dos íons peptídeos monoisotópicos de carga +2 presentes na janela selecionada para fragmentação do primeiro espectro de massa, MS1. A metodologia multiplex fundamenta-se na alteração das intensidades dos picos fragmentos do segundo espectro, MS2, para cada novo peptídeo a ser sequenciado da janela, podendo incluir a retirada, ou atenuação, de picos do espectro correspondentes a fragmentos do tipo y ou b dos peptídeos já identificados. Os programas de sequenciamento de novo usados para validar programa DNbuilder e a metodologia multiplex foram o Peaks 8, pNovoPlus e Novor 1.3.489. Espectros de uma amostra de tireoide adquiridos em janelas de 20 m/z foram usados nos testes de avaliação da metodologia multiplex. Os resultados mostram que a metodologia, mesmo que simples, melhora o sequenciamento de novo dos peptídeos presentes nos espectros multiplex MS2, aumentando o número de resíduos de aminoácidos corretamente posicionados nas sequências encontradas, mostrando que há um caminho possível para o sequenciamento de novo de peptídeos em espectros multiplex para janelas amplas.
Abstract
This thesis presents an approach for de novo peptide sequencing (in silico) using multiplex MS2 mass spectra, acquired by a mass spectrometer, containing fragments of more than one peptide in the same MS2 spectrum. A program, named DNbuilder, was developed for de novo peptide sequencing, in which the cost function considers y-fragments intensity. The de novo peptide sequencing problem was modeled in graphs using Depth-first search, DFS, as the search algorithm for peptide sequencing over the graph. Within the predefined fragmentation window, monoisotopic charged +2 peptide ions were identified and selected as the MS2 targets. The multiplex methodology consists of the intensity changes of selected peaks from the MS2 multiplex spectrum, including the elimination or reduction of the y or b fragments of the previously identified peptides present in the MS2 multiplex window. The state-of-the-art programs used in the multiplex de novo peptide sequencing tests were Peaks 8, pNovoPlus e Novor 1.3.489, as well as, DNbuilder. A set of spectra from a thyroid sample acquired in 20 m/z window size was used to evaluate the multiplex methodology. The results show the methodology, even if simple, increased the number of correct identified peptide amino acids in multiplex spectra, an evidence that there are ways of de novo sequencing multiplex spectra.