You are on page 1of 7

Quim. Nova, Vol. 31, No.

3, 669-675, 2008

Marcelo Delmar Cant e Emanuel Carrilho* Instituto de Qumica de So Carlos, Universidade de So Paulo, CP 780, 13560-970 So Carlos SP, Brasil Nelson Arno Wulff Fundo de Defesa da Citricultura, Av. Adhemar Pereira de Barros, 201, 14807-040 Araraquara - SP, Brasil Mario Srgio Palma Departamento de Biologia, Instituto de Biocincias de Rio Claro, Universidade Estadual Paulista, Av. 24 A, 1515, 13506-900 Rio Claro - SP, Brasil Recebido em 6/10/06; aceito em 17/8/07; publicado na web em 19/3/08

PEPTIDE SEQUENCING USING MASS SPECTROMETRY: A PRACTICAL GUIDE. This paper introduces the basics of peptide mass spectra interpretation applied to proteomics and is directed to chemists, biochemists and biologists. The manuscript presents a well detailed protocol aiming to serve as a first choice guide for understanding peptide sequencing. The tutorial was elaborated based on both a thorough bibliographic revision and the authors experience. In order to prove the applicability of the proposed guide, spectra obtained on different instruments have been successfully interpreted by applying the presented rational. Keywords: proteomic analysis; mass spectrometry; peptide sequencing.

INTRODUO A anlise protemica, definida como sendo o conjunto de metodologias analticas empregadas para caracterizar (quali e quantitativamente) um proteoma, trata-se de uma rea interdisciplinar da cincia, a qual agrega principalmente qumica, biologia e informtica. O sinergismo oriundo de tamanha interdisciplinaridade faz-se necessrio num cenrio onde se pretende estudar a funo/comportamento dos genes com base nas identificaes das protenas por eles expressas. Neste contexto, muitas vezes necessrio no somente determinar o conjunto de protenas presentes em uma amostra, o que por si s algo bastante desafiador, mas tambm caracterizar as inmeras e comumente presentes isoformas das protenas, produtos de modificaes ps-traducionais sofridas pelas mesmas e, por fim, como essas protenas interagem entre si.1,2 Devidamente dimensionada a complexidade do assunto, a espectrometria de massas (MS) emerge como uma tecnologia indispensvel para a interpretao da informao codificada pelos genes, ou seja, o proteoma. Uma das foras que impulsiona a protemica a habilidade de usar dados de espectrometria de massas inerentes a peptdeos para identificar protenas em bancos de dados. Para tal fim, dois tipos de resultados so usados. O primeiro usa a informao relativa massa molecular dos peptdeos oriundos da digesto enzimtica (Peptide Mass Fingerprint PMF), enquanto o segundo faz uso de resultados obtidos pela fragmentao de peptdeos individuais previamente detectados.3 ESPECTROMETRIA DE MASSAS APLICADA ANLISE PROTEMICA Em linhas gerais, a MS uma tcnica capaz de determinar a relao entre massa e carga (m/z) de espcies ionizadas em fase gasosa.2 Um espectrmetro de massas um instrumento constitudo por uma fonte de ons, um analisador de massas, um detector e um
*e-mail: emanuel@iqsc.usp.br

sistema de aquisio de dados. As fontes de ionizao empregadas em MS aplicada anlise protemica so Electrospray (ESI)4 e MALDI (Matrix-Assisted Laser Desporption Ionization),5 tendo a funo de ionizar (de maneira suave, preservando assim a estrutura polipetdica) e transferir as espcies a serem analisadas para a fase gasosa. Os analisadores de massas, como o prprio nome indica, tm como funo bsica separar os ons formados de acordo com suas relaes m/z. Diversos analisadores de massas, tais como, quadrupolos, ion-traps (tridimensionais e lineares), time-of-flight (TOF), Fourier-transform ion cyclotron resonance (FT-ICR), orbitrap, entre outros, so comercialmente disponveis e cada um possui aspectos positivos e negativos, de acordo com o experimento planejado e o resultado experimental requerido. Estes analisadores podem ser usados sozinhos e de maneira independente ou acoplados entre si, dando origem a equipamentos classificados como hbridos, os quais fazem uso das vantagens inerentes a cada anali-sador. Tais equipamentos permitem que experimentos em seqncia (tandem) sejam realizados, isto , sendo possvel detectar um determinado on e posteriormente submet-lo a uma etapa de fragmentao. Uma vez separados, esses ons so detectados por eletromultiplicadoras que constituem os detectores mais largamente usados. Uma ilustrao dos processos mostrada na Figura 1S em material suplementar De maneira geral, possvel descrever um estudo protemico empregando MS em seis etapas, descritas a seguir: i) as protenas a serem analisadas devem ser primeiramente isoladas ou extradas de lisados celulares ou tecidos. Tal procedimento comumente emprega metodologias de extrao ou fracionamento, definindo o sub-proteoma a ser estudado. Como exemplo prtico pode-se citar uma rea que tem a cada dia recebido maior ateno, a busca de biomarcadores para doenas, fazendo uso da anlise protemica aplicada ao plasma sanguneo. A primeira e mais importante etapa consiste da eliminao nas protenas mais abundantes do plasma, uma vez que as 10 protenas mais abundantes no plasma humano correspondem a aproximadamente 90% do contedo total. Assim, quando biomarcadores para doenas so o alvo do estudo necessrio reduzir a quantidade das protenas altamente abun-

Nota Tcnica

SEQENCIAMENTO DE PEPTDEOS USANDO ESPECTROMETRIA DE MASSAS: UM GUIA PRTICO

670

Cant et al.

Quim. Nova

ii)

iii)

iv)

v)

vi)

dantes, que acabam interferindo na anlise.6 Aps a etapa de purificao, o prximo passo converter a(s) protena(s) isolada(s) em um conjunto de peptdeos. Isso feito com o uso de enzimas que promovem a clivagem das protenas em pontos especficos. Quando a anlise protemica realizada por meio da anlise de peptdeos oriundos da digesto enzimtica de protenas, esse arranjo experimental recebe o nome genrico de anlise protemica bottom-up.7,8 Mesmo considerando que os espectrmetros de massas podem determinar a massa molecular de protenas intactas, existem inmeras razes que justificam o uso de peptdeos e no protenas para a anlise protemica. Dentre essas razes esto: de forma geral, protenas so difceis de manusear e degradam-se com facilidade, podendo ainda apresentar problemas de solubilidade. Assim, em muitos casos faz-se necessria a adio de tensoativos que comprovadamente interferem com a anlise por MS, uma vez que muitos desses componentes ionizam muito bem e quase sempre esto presentes em excesso na amostra. A sensibilidade dos espectrmetros de massas para a anlise de protenas consideravelmente menor que para peptdeos. Alm disso, se o interesse da anlise a identificao das protenas, informao inerente seqncia necessria, e nesse sentido os espectrmetros de massas so mais eficientes para obter informao estrutural de peptdeos que possuem at 20 aminocidos em comparao a protenas intactas. Entretanto necessrio esclarecer que com o uso de espectrmetros de massas de ltima gerao, tal como o FT-ICR, possvel obter informaes parciais da seqncia primria de protenas intactas, que obviamente podem ser usada para fins de identificao ou anlise de modificaes ps-traducionais, num arranjo experimental referido como anlise protemica top down.8,9 Os peptdeos obtidos podem ser separados por meio das tcnicas de cromatografia lquida uni- ou multidimensional, ionizados e transferidos (ESI ou MALDI) para o analisador de massas. ESI aplicada anlise de peptdeos produz preferencialmente espcies duplamente carregadas, enquanto MALDI gera quase que exclusivamente ons monocarregados. Nesta etapa o espectro de massas dos peptdeos oriundos da digesto enzimtica adquirido. Este resultado indica a relao m/z e, por conseqncia, a massa molecular dos peptdeos. Para esse resultado d-se o nome de peptide mass fingerprint (PMF). Os peptdeos previamente detectados durante o PMF (chamados de ons precursores) so ento isolados e submetidos fragmentao por coliso com molculas de um gs inerte, tal como argnio, nitrognio ou hlio. O espectro obtido chamado espectro de fragmentao ou MS/MS. Ao final do processo, os resultados inerentes a massa molecular (MM) dos peptdeos, obtida a partir do PMF, bem como a informao relativa a seqncia de aminocidos dos peptdeos, contida nos espectros de fragmentao (MS/MS), so usados pelos softwares de busca para localizar as protenas nos bancos de dados. Os softwares mais conhecidos e comumente empregados so o Sequest10 e o Mascot11 (veja Figura 2S).

FERRAMENTAS PARA IDENTIFICAO DE PROTENAS EM BANCOS DE DADOS Como apontado no pargrafo anterior, os programas mais comumente empregados para a identificao de protenas em bancos de dados a partir de dados de MS so o Sequest e o Mascot. Ambos os programas correlacionam espectros de massas de fragmentao (no interpretados) de peptdeos com seqncias de aminocidos de protenas registradas em bancos de dados.12,13 Alm

disso, esses softwares tambm tm a capacidade de usar sequncias de nucleotdeos para fazer tal correlao. Para tal, eles primeiramente simulam as seqncias primria potenciais das protenas correspondentes quelas seqncias de nucleotdeos encontradas nos bancos de genes, utilizando-se do cdigo gentico universal; posteriormente, simulam a fragmentao destas seqncias primrias. De forma geral, estes programas tm como objetivo encontrar a seqncia de aminocidos, em um determinado banco de dados, que melhor descreve os ons fragmentos encontrados em um espectro. As seqncias candidatas so procuradas nos bancos de dados de acordo com a massa do peptdeo intacto (informao adquirida na etapa do PMF) e com o espectro de fragmentao obtido para cada peptdeo. No Sequest, uma tcnica de processamento do sinal chamada autocorrelao usada a fim de determinar matematicamente a sobreposio entre o espectro terico, derivado de cada seqncia obtida no banco de dados em questo, e o espectro experimentalmente obtido. O resultado de tal sobreposio expresso quantitativamente em termos de um score para cada peptdeo (Xcorr). O Xcorr um parmetro que depende de diversos fatores, tais como o estado de carga do peptdeo bem como do tamanho do banco de dados que est sendo usado para a busca. Assim, a avaliao de um segundo score, classificado como Cn faz-se necessria para que a confiabilidade do resultado obtido seja aumentada. Esse parmetro definido como sendo a diferena entre os valores de Xcorr obtidos para a seqncia de aminocidos que obteve o maior Xcorr e a seqncia subseqente. Na literatura, diferentes critrios so usados para classificar uma determinao como satisfatria ou no. De forma geral, estes valores so: Xcorr > 3,75 para peptdeos com carga +3; Xcorr > 2,2 para peptdeos com carga +2 e Xcorr > 1,9 para peptdeos com carga +1. Em todos os casos descritos, Cn>0,10 exigido para que a determinao seja considerada suficientemente confivel.3,14 O Sequest tem se mostrado uma ferramenta bastante robusta, inclusive quando espectros com baixa relao sinal rudo so submetidos anlise.3,10 O Mascot tambm envolve o clculo de fragmentos teoricamente preditos para todos os peptdeos de um banco de dados de acordo com a massa do on precursor, previamente determinada. Os valores de m/z dos fragmentos preditos so comparados com os fragmentos experimentais sendo que, neste caso, a comparao se inicia com base nos ons -b e -y mais intensos. A probabilidade de o valor de m/z de um fragmento teoricamente obtido coincidir, de maneira randmica, com o valor de m/z de um fragmento obtido experimentalmente calculada e expressa como sendo o negativo do logaritmo desse nmero (score). Assim, quanto maior for o valor obtido, menor a probabilidade de que este resultado seja fruto de uma coincidncia. Esse software fornece para cada busca submetida um valor limite (dependendo das condies usadas para a busca) a partir do qual o valor obtido indica que a determinao possui probabilidade inferior a 5% de ser um evento randmico.11 Uma vez entendida a sistemtica aplicada pelos softwares para a identificao de protenas em bancos de dados usando dados de espectrometria de massas, faz-se extremamente necessrio e de suma importncia o completo entendimento de como ocorre a fragmentao dos peptdeos. Alm disso, a interpretao manual de espectros de MS/MS recomendada em todos os casos e indispensvel em algumas situaes. Por fim, existem situaes nas quais o genoma de uma determinada espcie ainda no est completamente seqenciado ou disponvel e, neste cenrio, necessrio derivar a seqncia primria de aminocidos de um determinado peptdeo baseado nica e exclusivamente nos dados obtidos por espectrometria de massas, isto , sem recorrer a banco de dados (seqenciamento de novo).15

Vol. 31, No. 3

Seqenciamento de peptdeos usando espectrometria de massas: um guia prtico

671

FRAGMENTAO E SEQENCIAMENTO DE PEPTDEOS A fragmentao de peptdeos por espectrometria de massas para a posterior anlise de sua seqncia de aminocidos comumente realizada por meio do processo de dissociao induzida por coliso (collision induced dissociation CID),16 tambm referida por alguns autores como dissociao ativada por coliso (collision activation dissociation CAD). Apesar de outras metodologias para a fragmentao de peptdeos, tais como Electron Capture Dissociation (ECD); Electron Transfer Dissociation (ETD)17 terem sido desenvolvidas, CID sem dvida o mais largamente empregado, alm de ser o mtodo mais freqentemente aplicado nos espectrmetros de massas comercialmente disponveis. Neste processo, os peptdeos so inicialmente introduzidos em uma regio de vcuo do espectrmetro de massas por meio dos processos de electrospray ou MALDI. Usando uma descrio simplista e abrangente, cabvel para a maior parte dos equipamentos comercialmente disponveis, os peptdeos ionizados so acelerados para uma regio do espectrmetro preenchida com um gs inerte (hlio, argnio ou nitrognio) proporcionando, assim, a coliso entre os peptdeos ionizados e as molculas do gs inerte. Como resultado, a energia translacional transferida em cada coliso convertida em energia interna. O modelo da mobilidade do prton18 descreve como a energia interna adquirida induz a transferncia intramo-lecular dos prtons em cada peptdeo, culminando na desestabili-zao das ligaes do esqueleto polipeptdico e, por conseqncia, induzindo a formao de dois on-fragmentos,19 que so classificados como ons que retm a carga residual (prton) no lado N-terminal (gerando fragmentos -a, -b e -c, dependendo da ligao que fragmentada); ons que retm a carga residual (prton) na regio C-terminal (gerando os fragmentos -x, -y -z, dependendo da ligao que fragmentada), segundo a nomenclatura proposta por Roepstorff FohlmannBiemann.20 importante enfatizar que os pares de ons a/x, b/y e c/z sero sempre ons correspondentes aos fragmentos opostos e complementares entre si. Considerando-se que as ligaes peptdicas so aquelas menos energticas, espera-se que a formao do par de fragmentos -b/-y seja mais freqente que os demais pares de fragmentos, facilitando muito a interpretao dos espectros. Apesar de diversos estudos no sentido de definitivamente compreender o mecanismo de fragmentao de peptdeos usando CID terem sido realizados, o mecanismo ainda no completamente entendido.16,21,22 Como resultado da fragmentao das ligaes peptdicas mencionada acima, uma srie de ons -b e -y complementares obtida, de modo que a diferena de valores de m/z entre dois ons consecutivos do mesmo tipo pode revelar a identidade do resduo de aminocido em questo. Enquanto as sries -b e -y resultam diretamente da clivagem das ligaes peptdicas, os ons -a so formados pela perda neutra de monxido de carbono dos ons -b (diferena de 27.9949 u relativo ao on -b correspondente).16,18 Considerando todos os ons que teoricamente podem ser produzidos em condies de CID, os ons -b e -y correspondem a grande maioria dos ons observados, enquanto os ons -a so menos comuns. Vale ainda dizer que para as situaes mais comumente enfrentadas em um estudo protemico, ou seja, a anlise de peptdeos oriundos de digesto trptica (R ou K na posio C-terminal) a formao da srie de ons -y favorecida (em relao srie -b) devido elevada basicidade desses resduos de aminocidos. 16 A energia comumente usada para induzir a fragmentao dos peptdeos em CID geralmente insuficiente para romper as ligaes entre o carbono- e o carbono da carbonila, bem como entre o nitrognio e o

carbono- adjacente, de modo que os ons -c, -x e -z so tipicamente no observados no espectro.16 Quando a fragmentao ocorre simultaneamente nas posies amino e carboxi-terminal do mesmo resduo de aminocido, ons imnio so produzidos (Tabela 1). Esses ons servem como ons diagnstico, podendo indicar a presena ou ausncia de determinados aminocidos na seqncia em estudo. Em certos resduos de aminocidos, perdas neutras de molculas de H 2O e NH 3 so freqentemente verificadas. Por exemplo, S, T e E so aminocidos que quando presentes em peptdeos submetidos fragmentao por CID apresentaro perda neutra de H2O bastante pronunciada. Por outro lado, R, K, Q e N so exemplos de aminocidos que apresentam pronunciada perda neutra de NH3. Alm disso, determinadas modificaes ps-traducionais ocorridas nas cadeias laterais de certos aminocidos, tais como fosforilao de S e T ; glicosilao e/ou oxidao de M tornam tais grupos laterais lbeis, de modo que a perda neutra destes ons pode ser observada. Como exemplo, pode-se verificar se a S constituinte de um determinado peptdeo apresenta ou no uma fosforilao; para isso, deve-se verificar se h um pico com massa 98 u inferior ao on correspondente (-b ou -y) sendo que para esse on d-se o nome de on satlite15 (veja Figura 3S). No entanto, apesar da determinao da seqncia de aminocidos em um peptdeo ser possvel por meio do simples clculo da diferena de massa entre picos vizinhos em uma srie de ons, tal trabalho bastante difcil devido a uma sries de fatores, dentre os quais pode-se citar o conjunto de ons fragmento esperado pode no estar presente na ntegra, ou em outras palavras, pode haver a ausncia de alguns ons das sries -b e -y; alguns fragmentos podem sofrer rearranjos internos e subseqente fragmentao; os ons podem estar presente com diferentes estados de carga, dificultando a correta atribuio dos ons (tal dificuldade aplica-se na interpretao de espectros que no so de-convoludos); alguns fragmentos podem sofrer rearranjo neutro de hidrognios durante a fragmentao. Assim, o somatrio destes fatores pode induzir a atribuio errada das sries de ons, tornando a interpretao do espectro bastante desafiadora. Desta forma, uma srie de regras bsicas, compiladas a partir de informaes adquiridas na literatura15,23 bem como fazendo uso da experincia prpria adquirida durante o trabalho realizado nessa rea do conhecimento, foi elaborada apresentada a seguir, com o objetivo de estabelecer um guia geral para a interpretao/confirmao de seqncias de aminocidos obtidos pela fragmentao de peptdeos por espectrometria de massas. Tais informaes so apresentadas de maneira bastante abrangente, de modo que podem ser aplicadas para a interpretao de espectros obtidos por diferentes instrumentos, tais como Q-TOF, TOF-TOF, triplo quadrupolos e ion-traps. A Tabela 1 apresenta informaes inerentes massa molecular dos resduos de aminocidos e ons imnio enquanto a Tabela 2 traz a massa de dipeptdeos, uma informao bastante til para a atribuio de ons -b2. DETALHAMENTO DO PROCEDIMENTO SUGERIDO PARA O SEQENCIAMENTO DE NOVO DE PEPTDEOS Composio de aminocidos diagnstico dos aminocidos constituintes do peptdeo Verificar a presena dos ons imnio (Tabela 1) na regio de baixas massas do espectro. Tais ons podem fornecer informaes inerentes composio de aminocidos de um peptdeo. No entanto, importante ter em mente que se o on imnio para um determinado aminocido no estiver presente, isso no significa que o aminocido

672

Cant et al.

Quim. Nova

Tabela 1. Lista dos 20 resduos de aminocidos mais comuns26 Aminocido Glicina Alanina Serina Prolina Valina Treonina Cistena Leucina Isoleucina Asparagina cido asprtico Glutamina Lisina cido glutmico Metionina Histidina Fenilalanina Arginina Tirosina Triptofano Gly Ala Ser Pro Val Thr Cys Leu Ile Asn Asp Gln Lys Glu Met His Phe Arg Tyr Trp G A S P V T C L I N D Q K E M H F R Y W Massa mdia 57,052 71,079 87,078 97,117 99,133 101,105 103,145 113,160 113,160 114,104 115,089 128,131 128,174 129,116 131,199 137,141 147,177 156,188 163,176 186,213 Massa monoisotpica 57,02146 71,03711 87,03203 97,05276 99,06841 101,04768 103,00919 113,08406 113,08406 114,04293 115,02694 128,05858 128,09496 129,04259 131,04048 137,05891 147,06841 156,10111 163,06333 186,07931 on imnio 30 44 60 70 72 74 76 86 86 87 88 101 101 102 104 110 120 129 136 159 on relacionados

72 72 70 84, 129 70, 84, 112, 129 61 82, 121, 123, 138, 166 91 59, 70, 73, 87, 100, 112 91, 107 117, 130, 170, 171

Tabela 2. Lista das massas de dipeptdeos, teis para a determinao de ons -b2. Os valores correspondem soma das massas dos resduos dos aminocidos acrescidos de uma unidade23
G 57 G A S P V T C I/L N D Q/K E M H F/M* R C** Y W 57 71 87 97 99 101 103 113 114 115 128 129 131 137 147 156 161 163 186 114 129 145 155 157 159 161 171 172 173 186 187 189 195 205 214 219 221 244 A 71 143 159 169 171 173 175 185 186 187 200 201 203 209 219 228 233 235 258 S 87 P 97 V 99 T 101 C 103 I/L 113 N 114 D 115 Q/K 128 E 129 M 131 H F/M* R 137 147 156 C** 161 Y 163 W 186

175 185 187 189 191 201 202 203 216 217 219 225 235 244 249 251 274

195 197 199 201 211 212 213 226 227 229 235 245 254 259 261 284

199 201 203 213 214 215 228 229 231 237 247 256 261 263 286

203 205 215 216 217 230 231 233 239 249 258 263 265 288

207 217 218 219 232 233 235 241 251 260 265 267 290

227 228 229 242 243 245 251 261 270 275 277 300

229 230 243 244 246 252 262 271 276 278 301

231 244 245 247 253 263 272 277 279 302

257 258 260 266 276 285 290 292 315

259 261 267 277 286 291 293 316

263 269 279 288 293 295 318

275 285 294 299 301 324

295 304 309 311 334

313 318 320 343

323 325 348

327 350

361

* Oxidao; ** carbamidometilcistena

est ausente da seqncia. Seguindo a mesma linha de raciocnio, a presena de um on com massa concordante com algum on imnio no determina por certo a presena do aminocido, uma vez que tal on pode corresponder, por exemplo, ao um on-fragmento oriundo de rearranjo sofrido pelo peptdeo que por coincidncia possui valor de massa igual de um determinado on imnio. Obs.: Para instrumentos do tipo ion-traps, tal informao em muitos casos total ou parcialmente perdida devido limitao que estes equipamentos apresentam para a determinao de ons com valores de m/z inferiores a 1/3 da relao m/z do on precursor (regra do 1/3].24 No entanto, avanos recentes nessa rea esto sendo realizados de modo que tal limitao ser contornada num futuro bem prximo.

Determinao do aminocido presente na posio C-terminal aplicada a peptdeos obtidos por clivagem enzimtica Se os peptdeos a serem seqenciados so oriundos de digesto trptica, deve-se verificar a existncia dos ons diagnstico -y1: 147 para K ou 175 para R. Um vez verificada a presena de um destes ons (-y1), determinar o correspondente on bn-1 (na regio de alta massa) por meio da seguinte relao: bn-1 = (M+H)1+ - y1 + 1 Verificao/confirmao da presena do on -b2 Para tal, pode-se fazer uso da Tabela 2, a qual traz uma lista

Vol. 31, No. 3

Seqenciamento de peptdeos usando espectrometria de massas: um guia prtico

673

das massas de dipeptdeos ionizados. Geralmente esses ons podem ser identificados por meio da seguinte razo: on -b2/ on -a2 separados por 28 u (inerente perda neutra de CO por parte de um on b). Novamente, uma vez encontrada a razo m/z do on -b2, esta usada para calcular a m/z do correspondente on -ym-2 fazendo uso da relao: ym-2 = (M+H)1+ - b2 + 1 Em instrumentos do tipo ion-traps tal informao pode, em alguns casos, no ser medida. Extenso das seqncias de ons -b e y Tendo definido os aminocidos posicionados nas extremidades do peptdeo e usando a massa dos resduos dos aminocidos, iniciar o seqenciamento analisando a regio de altas massas do espectro. O menor nmero de picos nessa regio do espectro ir tornar o trabalho mais simples. No entanto, deve-se ter cuidado com a regio em torno de 60 u abaixo do on precursor, que pode ser confundida com picos referentes a mltiplas perdas de gua e amnia. Todavia, no se pode descartar a hiptese que G pode ser o primeiro resduo de aminocido da seqncia, de modo que o pico inerente a essa possibilidade pode estar presente. A partir desse ponto pode-se sistematicamente estender as seqncias de ons -b ou -y. Em outras palavras, a partir de um determinado on (seja ele -b ou -y) basta acrescer ou subtrair (dependendo da massa do on em questo) a massa dos resduos de aminocidos sucessivamente a partir da G at o W. Uma vez determinada a massa de um on -b ou -y, o correspondente on -y ou -b pode ser calculado usando as seguintes relaes gerais: ym-n = (M+H)1+ - bn + 1 e bn-m = (M+H)1+ - ym + 1. Sempre que um on determinado (por exemplo, um on -b) apresenta o on correspondente (on -y), a determinao ganha muito em confiabilidade. Considerando que o on -b1 raramente observado no espectro, a determinao da ordem dos dois primeiros aminocidos da regio N-terminal bastante difcil. Uma soluo para tal problema a determinao do aminocido N-terminal empregando-se a Qumica Degradativa de Edman, estratgia plausvel desde que a protena em questo no apresente o aminogrupo N-terminal bloqueado. INFORMAES PERTINENTES QUE CORROBORAM PARA A CORRETA DETERMINAO DA SEQNCIA DE AMINOCIDOS Perda neutra de amnia (NH3) e gua (H2O) As informaes apresentadas a seguir so bastante importantes no tocante confirmao de identificao de certos aminocidos: ons fragmento -y e -b contendo os resduos de aminocidos R, K, Q e N podem apresentar perda neutra de amnia (-17 u). O on inerente a essa perda neutra no raramente mais intenso que os prprios ons -b ou -y correspondentes e, ons-fragmento -y e -b contendo os resduos de aminocidos S, T e E podem apresentar perda neutra de gua (-18 u). No caso do cido glutmico, tal fato ser mais notrio caso esse aminocido esteja na posio do Nterminal do fragmento. Tais informaes corroboram para que a certeza inerente a uma determinao seja aumentada. Intensidades dos picos no espectro Nos peptdeos gerados a partir de digesto trptica, os ons da srie -y geralmente sero os de maior intensidade no espectro. Sempre que um peptdeo trptico contiver D em sua seqncia (no importando a posio) e o nmero de cargas for igual ou menor ao

nmero de resduos de R, haver uma fragmentao preferencial na posio C-terminal do D, de modo que o pico inerente a tal fragmentao ser o mais intenso do espectro. Quando a clivagem ocorrer em uma ligao peptdica de modo a posicionar um resduo de P na posio N-terminal do peptdeo, a intensidade do on b (o qual no conter a P) ser bastante reduzida em relao ao on -y correspondente (o qual ter a P na posio N-terminal). Tal evento tambm poder ser observado, ainda que em menor extenso, com os resduos de G, H, K e R. Clivagens internas podem ocorrer nos resduos P e H. Um fragmento de clivagem interna o fragmento que parece ser um peptdeo reduzido apresentando P e/ou H em sua posio N-terminal. Por exemplo, o peptdeo EFGLPGLQNK pode apresentar os ons -b referentes aos fragmentos de sequncia: PGLQNK, PGLQN , PGLQ, etc. Esses so resultados de uma dupla clivagem e so normalmente designados como fragmentos internos. Espcies isobricas L e I so isbaros e no podem ser diferenciados usando CID como mecanismo de dissociao. Quando essa diferena de massa for verificada no espectro, deve-se usar o smbolo X ou Lxx (L/I outra notao comumente usada), de acordo com a nomenclatura de Hunt.25 K e Q so aminocidos quase isobricos, uma vez que possuem massa 128,09496 e 128,05858, respectivamente. A diferena de massa 0,03638 u e pode ser usada para diferenciar K e Q se um espectrmetro for capaz de gerar resultados com alta exatido de massa e resoluo, tais como Q-TOF, Orbitrap e FT-ICR. Geralmente triplo quadrupolos e ion traps so incapazes de realizar tal feito. Existem situaes onde dois resduos de aminocidos iro apresentar massa molecular bastante prxima da de um terceiro aminocido (Tabela 3), ou mesmo de outros dois aminocidos especficos. Tabela 3. Combinao de resduos de aminocidos que possuem a mesma massa de um nico aminocido Aminocido (s) GG N AG Q K GV R AD EG W SV Massa (Da) 114,04293 114,04293 128,05858 128,05858 128,09496 156,08988 156,10111 186,06406 186,06406 186,07931 186,10044

EXEMPLOS PRTICOS DE INTERPRETAO DE ESPECTROS DE FRAGMENTAO DE PEPTDEOS Uma vez apresentadas uma srie de regras bsicas bem como informaes prticas que objetivam auxiliar na interpretao de espectros de fragmentao de peptdeos por MS em tandem, dois exemplos prticos sero apresentados a fim de melhor ilustrar os procedimentos descritos. Escolheram-se dois espectros inerentes ao mesmo peptdeo trptico, obtidos por dois instrumentos diferentes. No primeiro exemplo, o espectro foi adquirido num instrumento do tipo TOF-TOF (Proteomics 4700 Applied Biosystems), equipado com uma fonte de ionizao do tipo MALDI (que gera peptdeos

674

Cant et al.

Quim. Nova

majoritariamente monocarregados). No segundo, um ion-trap tridimensional (LCQ Deca XP Plus Thermo) foi empregado. Nesse instrumento uma fonte de ionizao do tipo electrospray foi utilizada. Assim, alm de apresentar a interpretao dos espectros, ser possvel verificar as diferenas entre os espectros obtidos por esses dois diferentes instrumentos. O espectro de fragmentao obtido para o peptdeo trptico em estudo (on precursor monocarregado na forma [M+H]+, m/z= 1623,7) usando o instrumento TOF-TOF ilustra bem o perfil dos espectros usualmente obtidos com esse tipo de instrumento. Em outras palavras, os espectros so pobres em relao ao nmero de picos principalmente nas regies de altas massas, sendo bastante difcil a verificao de picos inerentes aos ons -a, assim como perdas neutras de H2O e NH3. Por outro lado, os espectros obtidos nesse tipo de instrumento apresentam as vantagens de serem obtidos com alta resoluo (da ordem de 3000) e exatido de massa (melhor que 40 ppm). Tais caractersticas permitem que ambigidades em algumas situaes sejam eliminadas. Como exemplo, pode-se citar a distino entre os resduos de aminocidos Q e K, que possuem massas bastante prximas e no so distinguidos em equipamentos com baixa exatido de massa, tais como os ion-traps. Por fim, necessrio afirmar que o espectro de fragmentao obtido no instrumento TOF-TOF em uso submetido a uma etapa de ps-tratamento, onde sofre um processo de desconvoluo, que exclui possveis picos inerentes a espcies multicarregadas (se presentes), bem como elimina o padro isotpico. O mesmo espectro de fragmentao com um zoom na regio de baixas massas, seguindo o procedimento apresentado, identificou os ons imnio (Tabela 1) correspondentes aos seguintes resduos de aminocidos: S (60), P (70), I/L (86), N (87), R (112), Y (136) e W (159). Dessa forma, possvel ter uma idia acerca da composio de aminocidos do peptdeo. Alm disso, o pico com m/z 101, tambm presente, pode indicar a presena do resduo de aminocido Q ou K. Como prximo passo, sabendo que o peptdeo em estudo oriundo de digesto trptica, espera-se que o resduo de aminocido Cterminal seja R ou K. Nesse caso, o aminocido C-terminal facilmente identificado como sendo a R, visto que alm do on imnio referente a R ter sido verificado, o pico com m/z 175 (-y1) confirma tal fato. Com essa informao, automaticamente pode se retornar ao pargrafo anterior e inferir que o on com m/z 101 corresponde a Q e no a K, a menos que a tripsina tenha falhado em um ponto de clivagem, o que a priori pode ser descartado. De posse da informao inerente ao on -y1, pode-se calcular a relao m/z do on -bn-1 correspondente, que nesse caso se trata do on 1449,7, o qual no pode ser visualizado no espectro (Figura 4SD - Material Suplementar). tambm possvel verificar o on -b2. Tal on, neste caso o m/z 155, facilmente identificado devido presena do on a correspondente (m/ z 127). Fazendo uso da Tabela 2, pode-se concluir que o conjunto de dois resduos de aminocidos que apresentam m/z igual a 155 formado por PG, sendo obviamente a ordem desconhecida. Nesse aspecto, o espectro mostra-se bastante simples uma vez que somente uma combinao de resduos possui a relao m/z em questo. No entanto, em outros exemplos onde mais de um conjunto de aminocidos possui o valor de m/z correspondente ao on -b2, todas as combinaes devem ser levadas em considerao. Obviamente, dados inerentes composio de aminocidos do peptdeo (ons imnio) podem ajudar a indicar a seqncia que possui a maior probabilidade de ser a verdadeira. Isso significa que se duas seqncias apresentam a mesma massa relativa ao on -b2 e, no entanto, em uma delas os ons imnio correspondentes aos aminocidos constituintes no foram detectados, provvel que essa no seja a seqncia correta.

Conhecendo-se o on -b2, possvel calcular o on -yn-2 correspondente, que nesse caso se trata do on de m/z 1569, o qual tambm no foi observado no espectro. Alm disso, pode-se usar tal informao para tentar determinar a seqncia dos resduos de aminocidos da regio N-terminal. Com as informaes obtidas at esse ponto sabe-se que os dois primeiros resduos da regio N-terminal so P e G. Logo, para determinar a ordem correta basta fazer a suposio que a P seja o resduo N-terminal. Se isso for verdade, um on com m/z aproximadamente igual a 98,03 (155.047 57,021) deveria ser observado, o que no ocorre. Portanto, no h evidncia que a P seja o aminocido N-terminal. A outra possibilidade que G esteja na posio N-terminal e nesse caso o on com m/z em torno de 57,99 deveria ser verificado, o que tambm no ocorre. Assim, apesar de saber que os dois primeiros resduos de aminocidos da regio N-terminal do peptdeo so a P e a G, no possvel determin-los pela interpretao desse espectro de massas. Uma vez determinados os ons -y1 e -b2, foi possvel estender as seqncias de aminocidos. A srie -b foi estendida desde o on -b2 (m/z 155,05) at o on -b7 (m/z 782,42). Por outro lado, a srie -y pde ser estendida a partir do on -y1 (m/z 175,07) at o on -y7 / -b6 (m/z 1028,70). Assim sendo, o completo seqenciamento do peptdeo foi obtido, fazendo uso da srie -y e/ou da srie -b (Figuras 4SC e 4SD). Neste exemplo, ons complementares (os pares -y7 / -b6 e -y6 / -b7) puderam ser identificados, aumentando a confiabi-lidade da seqncia proposta (veja Figura 4S). A seqncia de aminocidos determinada para o peptdeo em estudo, bem como os ons que foram detectados no espectro, permitiu predizer a seqncia de aminocidos do peptdeo, com exceo dos dois primeiros aminocidos na regio N-terminal, que permanece desconhecida (veja Figura 5S). O espectro de fragmentao para o mesmo peptdeo em questo foi obtido usando-se o instrumento do tipo ion-trap tridimensional. Neste caso, o modo de ionizao foi o ESI e o on precursor era duplamente carregado ([M+2H]2+, m/z = 812,5). Ao contrrio do espectro obtido no TOF-TOF, esse espectro apresenta muitos picos, inclusive picos inerentes s perdas neutras de H2O e NH3, o que facilita o seqenciamento do peptdeo, porm ao mesmo tempo torna maior a chance de que erros sejam cometidos devido a equvocos na assinalao das sries. Tal possibilidade ainda aumentada devido ao fato do espectro oriundo desse tipo de instrumento no ser desconvoludo, o que significa que ons relativos a espcies multicarregadas podem estar presentes, dificultando a interpretao. Deve-se lembrar tambm que os espectros obtidos em ion-traps possuem baixa resoluo e exatido de massas, o que torna impossvel, por exemplo, fazer a correta distino entre os resduos Q ou K. A limitao inerente regra do 1/324 verificada e por esse motivo ons com relao m/z inferiores a 270 no so sequer detectados. Nesse caso, como no se tem acesso regio de baixas massas, fica impossvel verificar os ons imnio presentes, bem como os ons diagnstico -y1. Sabendo-se de antemo que o resduo de aminocido C-terminal se trata de R ou K, deve-se supor que se trata da K (por exemplo) e calcular o on -bn-1 correspondente, que nesse exemplo teria m/z igual a 1477,5. Avaliando a Figura 6SC pode-se concluir que esse on no est presente e, portanto, a suposio de K corresponde ao resduo de aminocido C-terminal no se mostrou consistente. Como prxima tentativa deve-se supor que R o resduo C-terminal, situao na qual o on -bn-1 deveria ter m/z igual a 1449,4. A anlise da Figura 6SC mostra que esse on est presente e, portanto, o aminocido C-terminal trata-se da R. Uma anlise criteriosa mostra que o on de m/z 268,11 se trata de um fragmento do tipo -b. Tal fato pde ser concludo uma vez que o on -a correspondente facilmente identificado (m/z 240,89).

Vol. 31, No. 3

Seqenciamento de peptdeos usando espectrometria de massas: um guia prtico

675

Alm dessa evidncia, o clculo do on -y correspondente fornece o on com m/z 1357,45, tambm presente no espectro. Assim, o on de m/z 268,11 trata-se do primeiro on da srie -b detectado nesse espectro. Dessa maneira possvel estender as sries -y e -b usando as massas dos resduos dos aminocidos. A srie -b estendida desde o on -bn-1 (m/z 1449,5) at o ltimo on b detectado (m/z 268,11). Por outro lado, a srie -y pode ser estendida a partir do on -y1, mesmo apesar do fato desse on no ter sido detectado no espectro. As sries -b e -y estendidas bem como alguns ons -a verificados (-a3 e -a7 ) mostram, alm de inmeros ons inerentes, as perdas neutras de H2O e NH3. Conforme descrito anteriormente, uma intensa perda neutra de H2O pode ser verificada em ons fragmento que contm os resduos de aminocidos S, neste caso so mostrados como exemplo as perdas neutras relativas aos on -b6 e y8. Alm disso, diversas perdas neutras de NH3 so observadas para os fragmentos que contm os aminocidos N, Q e R. Como exemplo, so mostradas as perdas neutras do ons -b8, -b10, -y10 entre outras (veja Figura 6S). A seqncia de aminocidos obtida para o peptdeo em estudo, bem como todos os ons detectados no espectro, permitiu predizer a seqncia de aminocidos do peptdeo de maneira inequvoca a menos da ordem dos dois primeiros aminocidos na regio N-terminal, a qual continuou desconhecida tambm nesse equipamento (veja Figura 7S). Conforme esperado, a interpretao dos espectros de fragmentao do peptdeo em estudo, obtidos pelos dois diferentes instrumentos, gerou resultados concordantes. Assim sendo, a seqncia de aminocidos obtida (GPXQXSWNYNYXR ou PGXQXSWNYNYXR) pode agora ser comparada com a seqncia real do peptdeo, que GPIQLSWNYNYLR. Deste modo, pode-se concluir que a interpretao dos espectros possibilitou a determinao fidedigna dos aminocidos constituintes desse peptdeo, a menos da seqncia dos dois primeiros resduos de aminocidos da regio N-terminal. CONSIDERAES FINAIS O presente artigo apresenta um guia prtico para a interpretao de espectros de fragmentao de peptdeos obtidos usando espectrometria de massas em tandem. O conjunto de regras e informaes relatadas foi compilada a partir de uma profunda reviso bibliogrfica sobre o assunto, bem como usando o conhecimento prtico adquirido pelos autores. A fim de melhor enfatizar a aplicabilidade do guia proposto, dois exemplos foram apresentados. Espectros de fragmentao para um mesmo peptdeo foram obtidos atravs de dois espectrmetros de massas diferentes, sendo eles um TOF-TOF e um ion-trap (tridimensional). Alm de exemplificar com exemplos prticos e reais o seqenciamento de

peptdeos, foi possvel verificar as diferenas espectrais inerentes aos instrumentos avaliados. Dessa forma, espera-se que esse artigo sirva como uma fonte de referncia para pesquisadores que fazem uso de espectrometria de massas para estudar/identificar protenas, peptdeos biologicamente ativos, etc. MATERIAL SUPLEMENTAR Est disponvel gratuitamente em http://quimicanova.sbq.org.br, em forma de arquivo PDF, apresentando as Figuras 1S a 7S. REFERNCIAS
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. Tyers, M.; Mann, M.; Nature 2003, 422, 193. Aebersold, R.; Mann, M.; Nature 2003, 422, 198. Sadygov, R. G.; Cociorva, D.; Yates, J. R.; Nature Methods 2004, 1, 195. Fenn, J. B.; Mann, M.; Meng, C. K.; Wong, S. F.; Whitehouse, C. M.; Science 1989, 246, 64. Karas, M.; Hillenkamp, F.; Anal. Chem. 1988, 60, 2299. Ramstrom, M.; Hagman, C.; Mitchell, J. K.; Derrick, P. J.; Hakansson, P.; Bergquist, J.; J. Proteome Res. 2005, 4, 410. Kelleher, N. L.; Lin, H. Y.; Valaskovic, G. A.; Aaserud, D. J.; Fridriksson, E. K.; McLafferty, F. W.; J. Am. Chem. Soc. 1999, 121, 806. Bogdanov, B.; Smith, R. D.; Mass Spectrom. Rev. 2005, 24, 168. Nemeth-Cawley, J. F.; Tangarone, B. S.; Rouse, J. C.; J. Proteome Res. 2003, 2, 495. Eng, J. K.; McCormack, A. L.; Yates, J. R.; J. Am. Soc. Mass. Spectrom. 1994, 5, 976. Perkins, D. N.; Pappin, D. J.; Creasy, D. M.; Cottrell, J. S.; Electrophoresis 1999, 20, 3551. Chamrad, D. C.; Korting, G.; Stuhler, K.; Meyer, H. E.; Klose, J.; Bluggel, M.; Proteomics 2004, 4, 619. Elias, J. E.; Haas, W.; Faherty, B. K.; Gygi, S. P.; Nature Methods 2005, 2, 667. Washburn, M. P.; Wolters, D.; Yates, J. R.; Nat. Biotechnol. 2001, 19, 242. Steen, H.; Mann, M.; Nature Reviews 2004, 5, 699. Tabb, D. L.; Smith, L. L.; Breci, L. A.; Vysocki, V. H.; Lin, D.; Yates, J. R.; Anal. Chem. 2003, 75, 1155. Syka, J. E. P.; Coon, J. J.; Schroeder M. J.; Shabanowitz, J.; Hunt, D. F.; PNAS 2004, 101, 9528. Dongre, A. R.; Jones, J. L.; Somogyi, A.; Wysocki, V. H.; J. Am. Chem. Soc. 1996, 118, 8365. Mann, M.; Meng, C. K.; Fenn, J. B.; Anal. Chem. 1989, 61, 1702. Roepstorff, P.; Fohlman, J.; J. Biomed. Mass Spectrom. 1984, 11, 601. OHair, R. A. J.; J. Mass Spectrom. 2000, 35, 1377. Wysocki, V. H.; Tsaprailis, G.; Smith, L. L.; Breci, L. A.; J. Mass Spectrom, 2000, 35, 1399. Kinter, K.; Sherman, N. E.; Protein Sequencing and Identification Using Tandem Mass Spectrometry, Wiley-Interscience: New York, 2000. March, R. E.; J. Mass Spectrom. 1997, 32, 351. Hunt, D. F.; Yates, J. R.; Shabanowitz, J.; Winston, S.; Hauer, C. R.; PNAS 1986, 17, 6233. Falick, A. M.; Hines, W. M.; Medzihradszky, K. F.; Baldwin, M. A.; Gibson, B. W.; J. Am. Soc. Mass Spectrom. 1993, 4, 882.

You might also like