You are on page 1of 91

Tcnicas de

Caracterizao de
Protenas
Aula 5
Prof. Rodrigo Volcan Almeida
DBq IQ UFRJ

BIOINFORMTICA

Introduo
Projetos Genoma e Proteoma
Grande nmero de seqncias
Nucleotdeos (DNA)
Aminocidos (Protenas)

RMN, Difrao - Estruturas

aaattagctagttacttaagg
aaattagctagttacttaagg
aaattagctagttacttaagg

MGCTEFHKJLMASGGATVRRE
HGCTSFHKJLMASGGATVRRE
QGCTEFHKJLYASGGATVRRE

DNA

Protena
Estruturas

~85 bilhes de
nucleotdeos

Crescimento
exponencial

explorar os bancos de dados

Como se organizam estas


informaes?

Bioinformtica
Como se confere a uma
seqncia uma funo
biolgica?

Bioinformtica
Qual a sua definio?
a unio/interseo da biotecnologia
com a cincia da computao
Stios

Ferramentas
computacionais

Ativos

Fosforilao

Funes
biolgicas

Domnios

Estruturas

Glicosilao

Bioinformtica
Bancos de Dados

Funes

Lipase Engineering Database

GenBank
Gerais

Bioinformtica
Formato FASTA
Sinal de Maior
(>)

Identificador
(nome)

>4TGL:_|PDBID|CHAIN|SEQUENCE
SINGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIY
DTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQN
ELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALDLYQREEGLSSSNLFLYTQGQPRVG
NPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGSEYWITDNSPETVQVCTSDLE
TSDCSNSIVPFTSVLDHLSYFGINTGLCT
Seqncia em
cdigos de uma letra

Bioinformtica
Coding Sequence (CDS)

bioinformtica aplicada a cidos nuclicos x protenas

Bioinformtica
Como atravs da bioinformtica pode ser atribuda
uma funo biolgica a uma seqncia?
Comparando seqncias
conhecidas com a que se
quer atribuir a funo

funo conhecida

desconhecido

funo hipottica

Bioinformtica
Alinhamento

o processo de se comparar duas ou mais


seqncias buscando o mximo de identidade
entre as mesmas...
...com o objetivo de verificar o grau de similaridade e
possvel homologia entre as mesmas.

Bioinformtica
Identidade

VEDQKLS--KCE
VEE-KLTRPKCD
**: **:

Similaridade

**:

VEDQKLS--KCE
VEE-KLTRPKCD
**: **:

Homologia

Identidade = (6/10)*100 = 60%

**:

Aminocidos com
caractersticas fsico-qumicas
semelhantes (Asp/Glu e Ser/Thr)

a similaridade atribuda a descendentes de um


ancestral comum.
No existe grau de homologia Histria
evolucionria

-cristalino

55%

3 hidrxi esteride/dihidrodiol

R. catesbeiana

identidade

desidrogenase (3-HSD)

Bioinformtica
Mas como se constri um alinhamento?

Matriz de Substituio
Serve para relacionar a importncia de um
determinado pareamento de aminocidos em
um alinhamento.

Bioinformtica
Mas como se constri um alinhamento?
(algortmo de Needleman-Wunsch)

10

-2

-2

-2

-1

-2

-2

-2

-2

-3

-5

-2

-3

-4

-2

-3

-5

-3

-4

-2

-3

-3

-3

-6

-3

-1

-2

-2

-2

-1

-1

-3

-4

-1

-1

-1

-1

-3

-3

-2

-3

-5

10

-2

-5

-5

-5

-5

-6

-5

12

-4

11

-2

-4

-5

Bioinformtica
Mas como se constri um alinhamento?
(algortmo de Needleman-Wunsch)

10

41
4

33
-2

31
2

29
-2

24
-2

22
2

18
-1

12
-2

0
-2

-2

31
-2

37
4

35
3

33
2

26
0

17
-3

19
0

14
0

-3
-5

29
-2

32
1

33
2

32
1

27
1

17
-3

20
1

15
1

-2
-4

24
-2

26
0

26
0

27
1

31
5

17
-3

19
0

19
5

-3
-5

25
2

20
-3

18
-4

21
-2

17
-3

26
6

16
-3

11
-3

-4
-6

-3

23
0

23
0

23
0

22
-1

19
0

18
-2

20
1

14
0

0
-2

-2
18

-1
19

-1
19

1
21

3
23

-3
17

0
19

3
17

-4
-2

18
-1

18
-1

18
-1

19
0

18
-1

16
-3

20
1

14
0

-1
-3

12
-2

14
0

14
0

15
1

19
5

11
-3

14
0

19
5

-3
-5

10

-2
2

-5
-1

-5
-3

-5
-3

-5
-3

-6
-4

02

-5
-3

12
14

-4

11

-2

-4

-5

2
(11;10)

Bioinformtica
V

41

33

31

31

37

35

29

32

33

24

O Score
do
ser
Q
K alinhamento
L
S

18

12

-2

19

14

-3

20

15

-2

-3

o mais alto score da matriz

29
33

24

22

transformada

26

17

Contudo o alinhamento

32

27

17

gerou inseres (gaps) que devem ser penalizadas.

26

26

27

31

17

19

19

25
20
21
17 negativos
26
16
11ao Score.
-4
-3
L
Penalidades
=18 Valores
T

23

23

23

22

19

18

20

14

18

19

19

21

23

17

19

17

-2

18

18

18

19

18

16

20

14

-1

12

14

14

15

19

11

14

19

-3

-1

Score
= 41-3 10-4 12
-3
-3
2

-3

14

-4

-2

-5

Score = 41 (8+2*1) (8+2*2)

SEQ 1
SEQ 2

-4

Score = 19

VEDQKLS--KCN
VEN-KLTPRKCD

Bioinformtica
Alinhamentos Mltiplos (mtodo hierrquico)
CLUSTAL mais utilizado

Seqncias (FASTA)

Vantagens:
-Torna mais robusta a anotao de uma
determinada funo;

Alinhamentos em pares

Par com maior Score


Adio de novas seqncias
em ordem decrescente
de Score

-Localizao de stios ativos, aminocidos


conservados...

Bioinformtica
Alinhamentos Mltiplos (mtodo hierrquico)

CLUSTAL

Bioinformtica
Alinhamentos Mltiplos (mtodo hierrquico)

CLUSTAL

Bioinformtica
Mas a informao em protenas no est contida apenas
em sua seqncia de aminocidos.
Suas estruturas so muito importantes
Predio de Estrutura Secundria
Predio de Regies Transmembranares
Predio de Peptdeos Sinais

Redes Neurais Treinadas com os Bancos de


Dados

fazer predio de estruturas secundrias

Bioinformtica
Muitas vezes somente a partir da
estrutura primria no possvel
atribuir uma funo...

Pois a estrutura terciria mais


conservada que a primria.

Bioinformtica
Modelagem comparativa

Permite determinar a estrutura de uma


protena, a partir da comparao da sua
seqncia de aminocidos com a
seqncia de outra protena similar, cuja
estrutura j esteja determinada
experimentalmente.

Bioinformtica
1NDO
CarAa

1
1

-MNYNNKILVSESGLSQKHLIHGDEELFQHEL-KTIFARNWLFLTHDSLIPAPGDYVTAK
MANVDEAILKRVKGWA------------PYVDAKLGFRNHWYPVMFSKEIDE-GEPKTLK
* :: **
.* :
:
* * .:* : ... *
*: * *

1NDO
CarAa

59
48

MGIDEVIVSRQNDGSIRAFLNVCRHRGKTL-VSVEAGNAKGFVCSYHGWGF----GSNGE
LLGENLLVNRI-DGKLYCLKDRCLHRGVQLSVKVECKTKSTITCWYHAWTYRWEDGVLCD
: ::::*.* **.: .: : * *** * *.**. . . :.* **.* :
*
:

1NDO
CarAa

114
107

LQSVPFEKDLYGESLNKKCLGLKEVARVESFHGFIYGCF-DQEAPPLMDYLGDAAWYLEP
ILTNPTSAQIGRQKL--------KTYPVQEAKGCVFIYLGDGDPPPLARD--------TP
: : * . :: :.*
:. *:. :* :: : * :.***
*

1NDO
CarAa

173
151

Modelagem comparativa

Seqncia

1NDO
CarAa
alvo

molde ... LPPEGAGLQMTSKYGSGMGVLWDGYS--GVHSADLVPELMAFGGAKQERLNKEIGDVRAR


...
233
alvo ... FAPGGDRKQQTRVVDDDVVGRKGVYDLIGEHGVPVFEGTIGGEVVREGAYGEKIVANDIS
...
204
:.* *
* *
...:
. *. * *.. :.
:.
.::
.::*

1NDO
CarAa

291
264

1NDO
CarAa

350
318

Estrutura molde
1NDO
CarAa

Modelo da protena
MFKHSGGLELVGPPGKVVIKANWKAPAENFVGDAYHVGWTHASSLRSGESIFSSLAGNAA
PNFLDDDMEILGK--NQIIKSNWRLAVENGF-DPSHI-YIHKDSILVKD---NDLALPLG
alvo por homologia
...:*::*
: :**:**: ..** . *. *: : * .*:
:
..**
.

410
370

Alinhamento
IYRSH-LNCTVFPNNSMLTCSGVFKVWNPIDANTTEVWTYAIVEKDMPEDLKRRLADSVQ
IWLPGVLKVNPFPNPDMMQ----FEWYVPIDENTH--YYFQTLGKPCANDEERKNYEQEF
*: . *: . *** .*:
*: : *** **
: : : * .:* :*: :.

Construo da cadeia principal


RTFGPAGFWESDDNDNMETASQNGKKYQSRDSDLLSNLGFGEDVYGDAVYPGVVGKSAIG
Modelagem das cadeias laterais
ESKWKPMALEGFNNDDI-WAREAMVDFYADDKGWVNEILFEVD-------EAIVAWRKLA
.:
.
*. :**:: * :
.: : *.. :.:: * *
.:*.
:.
ETSYRGFYRAYQAHVSSSNWAEFEHASSTWHTELTKTT
Modelo no satisfatrio
SEHNQGIQT--QAHVSG--------------------.
:*:
*****.

Avaliao do
modelo

Bioinformtica
Modelagem comparativa

Bioinformtica
Modelagem comparativa

Bioinformtica
Ser que todas estas caracterizaes
se verificam na prtica?
BIOINFORMTICA
uma ferramenta fundamental para a Qumica de
Protenas...

Mas, a comprovao experimental


imprescindvel.

TCNICAS DE
PURIFICAO

Tcnicas para purificao de protenas


Propriedade
Localizao celular
Solublidade
Carga
Polaridade
Tamanho
Ligao especfica

Localizao celular
NCLEO

CITOPLASMA

600 g por 10min ncleos e clulas


MEMBRANA PLASMTICA

15.000 g por 5min mitocondrias e lisossomos

Centrifugao a 150.000 g por 1 h.

Pellet: ribossomo, mitocndrias,


cloroplastos, lisossomos, retculo
endoplsmatico

Sobrenadante: enzimas, RNA, metablitos,


ons inorgnicos e subunidades monomricas

Centrifugao

Separao por solubilidade

Solubilidade de protenas
depende da concentrao
de sais, da polaridade do
solvente, do pH e da T

protein solubility

Separao por solubilidade

Solubilidade da -lactoglobina em
funo do pH para diferentes
concentraes de NaCl

protein solubility

Separao por solubilidade

Solubilidade de algumas protenas em


soluo de sulfato de amnia
(NH4)2SO4

protein solubility

Separao por solubilidade

Solvente

Constante Momento

Dieltrica Dipolar
78.5
1.85
3.96
Dimetilformamida 48.9
Metanol
32.6
1.66
Etanol
24.3
1.68
Acetona
20.7
2.72
Clorofrmio
4.8
1.15
Benzeno
2.3
0.00
gua

Solventes miscveis
com a gua diminuem
a constante dieltrica
do meio e
desorganizam a
camada de solvatao
das protenas.

A constante dieltrica de um meio a razo entre o trabalho necessrio para separar cargas
opostas a uma determinada distncia no vcuo pelo trabalho necessrio para separar as
mesmas cargas quando imersas no meio.

Cromatografia

Cromatografia:
Tipos de matrizes usadas para cromatografia

Cromatografia de Partio em Papel

distncia de migrao da substn

Rf = distncia de migrao do solven


Poo do solvente

Cuba de vidro

Amostra

Suporte

Para um dado sistema d


solvente e tipo de supo
cada substncia
apresenta um valor de
Rf caracterstico

Suporte
Papel
Frente do
Solvente

Amostra

Solvente
Solvente
ASCENDENTE

DESCENDENTE

Cromatografia de troca inica


Princpios Bsicos da Cromatografia de Troca
Inica
Adsoro

Eluio

+
+
+
+
+
+
++

+
+
+
+
+
+
++

Molculas
com a mesma
carga, ou sem
carga, no
interagem
com a resina

cido

PI

neutro

bsico

H+
-COOH
+
-NH3

+ Na+Cl-

-COO
-NH2
H+
Carga em

OVALBUMINA
PI = 4.6
Adio de sal ao
tampo resulta em
competio entre os
ons em soluo e as
molculas adsorvidas
na resina

HEMOGLOBINA
PI =7.1
CITOCROMO C
PI = 10.6

pH_ 7.0
+
+

Cromatografia de troca inica


Duas Modalidades de Cromatografia de Troca
Inica
Eluio NaCl
+

0. 10 M

(-)
(-)
(-)

+
+ +

0. 10 M

(+)
(+)

0. 20 M

_
=

(-)

0. 15 M

++

Eluio NaCl

0. 15 M

_
(+) =

0. 20 M

(+)
No retidas

+
+
+

No retidas

Carboximetil~celulose

Dietilaminoetil~celulose

(trocadora de ctions)

(trocadora de nions)

Cromatografia de troca inica

Cromatografia de Gel filtrao


Princpios Bsicos da Cromatografia de
Gel Filtrao
a)

Fluxo Contnuo de lquido


Molcula pequena
Molcula grande

Partculas
porosas

Coluna de vidro

Molculas percorrem a coluna


empurradas por tampo.

Perfil de Eluio

Molcula grande excluda dos poros

Concentrao

Beads (gros) da resina com


poros de tamanho controlado

b)

Molcula pequena

v0

vc
Volume (ml)

vt

Cromatografia de Gel filtrao

Cromatografia de Gel filtrao


Estimativa da massa molecular:

padronizao da coluna de gel-filtrao


com protenas de massa conhecida

Cromatografia por afinidade

Poro da membrana

Adsoro

Adsoro

Molcula de interesse

Eluio

Exemplo: Passo a passo da purificao de uma


protena por cromatografia

Dilise

Estabilidade das protenas


Agentes desnaturantes
pH
Temperatura
Enzimas degradativas
Adsoro s superfcies
Armazenamento por longo tempo

CARACTERIZAO

Eletroforese
+
+
t

+
+
SUPORTE X pH MEIO

Eletroforese

persulfate

poliacrilamide

7 a 15% [acrilamida] - protenas


cuba vertical para mini-gel (10 X 8 cm)

[ ] mais baixas gel muito mole


suporte com agarose
Gradiente de acrilamida aumenta
poder de resoluo

Eletroforese nativa
Ponto Isoeltrico

Protena
Pepsina

< 1.0

Ovalbumina
(galinha)

4.6

AlbuminaSrica(humana)

4.9

Tropomiosina

5.1

Insulina (bovina)

5.4

Fibrinognio (humano)
Globulina
Colgeno

5.8

155.000

6.6

330.000

6.6

Mioglobina
(cavalo)
Hemoglobina (humana)
RibonucleaseA (bovina)

18.000
64.000

7.0
7.1
7.8

Citocromoc(cavalo)

10.6

Histona (bovina)

10.8

Lisozima (galinha)

11.0

Salmina(salmon)

12.1

Separao na eletroforese
nativa influenciada pela
carga, massa e forma da
molcula

Eletroforese desnaturante
Efeitos do SDS
desnaturao
uniformiza a forma das
protenas;
mascara a carga natural
das protenas no pH da
corrida, fazendo com que
todas molculas migrem
para o ando;
facilita o efeito de
redutores

H3C-CH2-CH2-CH2-CH2-CH2-CH2-CH2-CH2-CH2-CH2-CH2-

Sdio dodecil sulfato

Eletroforese desnaturante
cistina

2 cistenas

Padres

2-mercaptoetanol

AB
A
B

s
2 - Mercaptoetanol

Sem

Com

2 - Mercaptoetanol

A
SH

SH

Determinao do nmero de cadeias e tipo de ligao entre


cadeias de protenas oligomricas

Eletroforese
distncia percorrida pela banda X
distncia percorrida pelo marcador da corrida

Log MW

Migrao relativa =

Eletroforese

ilustrao

Focalizao isoeltrica

focalizao isoeltrica, separa as protenas


de acordo com seu ponto isoeltrico (pI)

Eletroforese bidimensional
Primeiro passo:
Focalizao isoeltrica

Segundo passo: Eletroforese em gel


de poliacrilamida, as protenas juntas
por possurem mesmo pI, so agora
separadas em funo de suas massas
moleculares, gerando assim um mapa
de "spots" onde cada um deles
formado por uma protena isolada

Eletroforese bidimensional

pH

Mr, kDa
66
48

23
18
16

Mapa de bandas onde cada


uma delas formado por uma
protena isolada

Protenas com a
mesma massa

Eletroforese 2D de protenas
totais (proteoma) de clulas de
Escherichia coli
PROTEOMA:
anlise simultnea de at 5.000 protenas

Protenas com mesmo pI

permite comparao de todas as protenas expressas por uma clula


em dois momentos diferentes:
anlise do efeito de hormnios,
anlise do efeito de drogas;
estados fisiolgicos (desenvolvimento);
condies patolgicas diversas (vrus, bactrias,etc.)

Proteoma Comparativo

condio

condio

Identificao de Protenas por MS

Banco de
espectros

Banda
removida do
gel

Espectro de
massas dos
fragmentos
virtuais

Fragmentar
com tripsina

Obter
espectro de
massas dos
fragmentos

compara
o

Tripsiniza
o virtual

Banco de
seqncias
(i.e.
SwissProt)

Sequenciamento de
protenas
Degradao de Edman
Espectrometria de Massas

Degradao de Edman

Etapas
Etapa 1

Etapa 2

Etapa 3

Etapa 4

Clivagem das
ligaes
peptdicas

Identificao
dos
aminoterminais

Hidrlise da
protena em
peptdeos

Sequenciamento
dos peptdeos

(HCl, NaOH ou
enzimas)

(1 flor - 2,4
dinitro benzeno)

Separao,
identificao e
quantificao
dos
aminocidos

HCl 6M

Separao e
identificao
dos
aminocidos

Tripsina (Arg,
Lys)
CNBr (Met)
Quimiotripsina
(Tyr, Trp, Phe)

Degradao de
Edman

Fenilisotiocianato

Degradao de Edman

Degradao de Edman

PTC feniltiocarbamoil
PTH feniltioidantona

Espectrometria de Massas

Ionizao por Electrospray (ESI)

Desoro/Ionizao assistida por uma


matriz (MALDI).

Espectrometria de massas em srie


(MS/MS) e seqenciamento

Espectrometria de Massas (MS)


ilustrao

Fragmentao de peptdeos

Seqenciamento

H CH3

H CH3

H
H CH2-(CH2)3-NH2
+

H N C C N C C N C C N C C OH
H H +O H H +O H H +O H H O
Massa Molecular
dos aminocidos

Espectro
de massas

Glicina

Alanina

Alanina

Lisina

58.0

71.0

71.0

146.1

218.1
129.0
147.1

58.0

100

200.0

200

346.1
289.1

300

Espectrometria de Massas (MS)


ilustrao

Identificao de protena

hidrlise

Identificao
Protena A

Gel 2D
Protena B

Protena C

Identificao de protenas

You might also like