Professional Documents
Culture Documents
qxd
8/5/11
9:32 AM
Page 71
NDICE
4.1
4.2
4.3
4.4
4.5
4.6
4.7
Introduccin
Los genomas se pueden mapear en diversos
niveles de resolucin
Los genomas individuales muestran gran
variacin
Los RFLP y los SNP pueden utilizarse para el
mapeo gentico
Por qu algunos genomas son tan grandes?
Los genomas eucariontes contienen tanto
secuencias de DNA repetitivo como no repetitivo
Se pueden identificar genes eucariontes que
codifican protenas por la conservacin de
exones
4.8
4.9
4.10
4.11
4.12
4.13
92544-04.qxd
72
8/5/11
9:32 AM
CAPTULO 4
Page 72
4.1
Introduccin
Una pregunta clave acerca del genoma es cuntos genes contiene. Sin embargo, una
pregunta ms que fundamental es qu es un gen?. Claramente, los genes no se definen
solamente como una secuencia de DNA que codifica un polipptido, debido a que son muchos los genes que codifican mltiples polipptidos, y a que muchos genes codifican RNA
que sirven para otras funciones. Dadas la variedad de funciones del RNA y las complejidades de su expresin, parece prudente enfocarse en el concepto de gen como una unidad de transcripcin. Sin embargo, grandes zonas de los cromosomas, que anteriormente
se crea que carecan de genes, ahora parecen ser transcriptas ampliamente; por lo tanto,
en la actualidad, es difcil definir a un gen con precisin.
Se puede intentar caracterizar tanto la cantidad total de genes como el nmero de genes que codifican protenas en cuatro niveles, que corresponden a las etapas sucesivas de
la expresin gnica:
El genoma es el grupo completo de genes de un organismo. En ltima instancia,
se define por la secuencia de DNA completa, aunque de manera prctica no es posible identificar cada gen de manera inequvoca solamente sobre la base de la secuencia.
El transcriptoma es el grupo completo de genes expresados bajo condiciones particulares. Se define en trminos del grupo de molculas de RNA que estn presentes y pueden referirse a un tipo celular nico, o a cualquier organizacin compleja
de clulas, hasta constituir un organismo. Debido a que algunos genes generan
mltiples mRNA, es probable que el transcriptoma sea ms grande que el nmero
de genes definidos directamente en el genoma. El transcriptoma incluye los RNA
no codificantes (como tRNA, rRNA, y microRNA o miRNA, que se describen en
la Seccin 13.8, Los eucariontes contienen RNA reguladores) as como tambin mRNA.
El proteoma es el grupo de polipptidos codificados por el genoma entero o producidos en cualquier clula o tejido particular. Se corresponde con los mRNA en
el transcriptoma, aunque existen diferencias de detalles que reflejan cambios en la
abundancia relativa o en las estabilidades de los mRNA y de las protenas. Tambin
pueden existir modificaciones postraduccionales de las protenas que permiten
que se produzcan ms de una protena a partir de un nico transcripto (esto se denomina corte y empalme de protena; vase la Seccin 29.11, El corte y empalme de protenas es autocataltico).
Las protenas pueden funcionar de forma independiente o como parte de complejos multiproteicos o multimoleculares, como las holoenzimas y las vas metablicas donde se agrupan las enzimas. Dos ejemplos son la holoenzima RNA polimerasa (vase la Seccin 11.5, La RNA polimerasa bacteriana consiste en la enzima central
y el factor sigma) y el empalmosoma (vase la Seccin 28.8, Cinco snRNP forman el
empalmosoma). Si se pudieran identificar todas las interacciones protena-protena,
se podra definir el nmero total de complejos independientes de protenas. Esto
a menudo se denomina como el interactoma.
El nmero mximo de genes que codifican protenas en el genoma puede identificarse
directamente mediante la caracterizacin de marcos de lectura abiertos. El mapeo a gran
escala de esta naturaleza es complicado por el hecho de que los genes interrumpidos pueden consistir en muchos marcos de lectura abiertos separados. No necesariamente se tiene
informacin acerca de las funciones de estos productos proteicos o, en efecto, la prueba
de que son todos expresados; por lo tanto, este enfoque se restringe a definir el potencial
del genoma. Sin embargo, existe una suposicin fuerte de que cualquier marco de lectura
abierto conservado es probable que sea expresado.
Otro enfoque consiste en definir la cantidad de genes directamente en trminos del
transcriptoma (por identificacin directa de todos los RNA) o del proteoma (por identificacin directa de todos los polipptidos). Esto brinda una certidumbre de que se est tratando con genes bona fide que son expresados bajo circunstancias conocidas. Esto permite
preguntarse cuntos genes se expresan en un tejido o tipo celular particular, qu variaciones existen en los niveles relativos de expresin, y cuntos de los genes expresados en una
clula particular son nicos de esa clula o se expresan adems en otras. Adems, el transcriptoma puede revelar cuntos mRNA diferentes (p. ej., los mRNA que contienen diferentes combinaciones de exones) se generan a partir de un gen dado.
92544-04.qxd
8/5/11
9:32 AM
Page 73
4.2
73
En relacin con los tipos de genes, se puede preguntar si un gen particular es esencial:
qu le sucede a un mutante nulo? Si una mutacin nula es letal, o si el organismo tiene
un defecto visible, se puede concluir que el gen es esencial o, al menos, que porta una ventaja selectiva. Sin embargo, algunos genes pueden eliminarse sin efecto aparente en el fenotipo. Son estos genes realmente prescindibles, o se produce una desventaja selectiva a
partir de la ausencia del gen, tal vez en otras circunstancias, o durante perodos ms largos? En algunos casos, la ausencia de estos genes podra ser compensada por un mecanismo redundante, como una duplicacin gnica, que proporciona una copia de resguardo
para una funcin esencial.
REVISIN DE CONCEPTOS
Explicar por qu, en los animales el transcriptoma y el proteoma de una clula suelen ser ms
pequeos que su genoma; mientras que el transcriptoma y el proteoma del organismo entero,
en general, son ms grandes que su genoma.
4.2
92544-04.qxd
74
8/5/11
9:32 AM
CAPTULO 4
Page 74
para caracterizar una serie de fragmentos superpuestos de DNA que pueden conectarse
dentro de un mapa continuo. La caracterstica crucial es que, en el mapa, cada segmento
se relaciona con el segmento siguiente mediante el solapamiento entre ellos, de manera tal
de poder asegurar que no se pierdan segmentos. Este principio se aplica tanto en el ordenamiento de los fragmentos grandes en un mapa como en la conexin de las secuencias
que forman los fragmentos.
CONCEPTOS CLAVE
Si se toma una muestra del mismo cromosoma de poblaciones diferentes del mismo organismo,
el mapa fsico puede ser idntico; pero el mapa de ligamiento puede ser levemente diferente.
Por qu?
4.3
El punto de vista mendeliano del genoma clasificaba los alelos segn dos alternativas:
de tipo silvestre o mutante. Posteriormente, se reconoci la existencia de alelos mltiples,
cada uno con diferente efecto sobre el fenotipo. En algunos casos, puede incluso no ser
adecuado definir ningn alelo como de tipo silvestre.
La coexistencia de alelos mltiples en un locus se denomina polimorfismo gentico.
Cualquier sitio en el cual existan alelos mltiples como componentes estables de la poblacin es, por definicin, polimrfico. Un locus suele definirse como polimrfico si dos o ms
alelos estn presentes a una frecuencia > 1% en la poblacin.
Aunque no se evidencia a partir del fenotipo, el tipo silvestre puede, en s mismo, ser
polimrfico. Se pueden distinguir versiones mltiples del alelo de tipo silvestre por las diferencias en la secuencia que no afectan a su funcin y que, por lo tanto, no producen variantes en los fenotipos. Una poblacin puede ser ampliamente polimrfica desde el punto
de vista del genotipo. Muchas variantes de secuencias diferentes pueden existir en un locus dado; algunas de ellas son evidentes debido a que afectan al fenotipo, pero otras se
encuentran ocultas debido a que no tienen efecto visible.
Por lo tanto, puede haber un continuo de cambios en un locus, incluso aquellos que
cambian la secuencia de DNA pero que no cambian la secuencia de protena, en aquellos que cambian la secuencia de protena sin cambiar su funcin, en aquellos que crean
protenas con actividades diferentes, y en aquellos que crean protenas mutantes que son
no funcionales.
Un cambio en un nucletido cuando se comparan los alelos se denomina polimorfismo de un nucletido nico (SNPsingle nucleotide polymorphism). En promedio, se produce uno cada 1.330 bases en el genoma humano. Definido por sus SNP, cada ser humano es nico. Los SNP pueden detectarse a travs de diferentes maneras, que abarcan
desde la comparacin directa de secuencias hasta la espectroscopia de masa o los mtodos
bioqumicos que producen diferencias basadas en variaciones de la secuencia en una regin definida.
Una meta del mapa gentico consisti en obtener un catlogo de las variantes comunes. La frecuencia observada de los SNP por genoma pronostic que, en la poblacin humana en su totalidad (considerando la suma de todos los genomas humanos de todos los
individuos vivientes), debera haber > 10 millones de SNP que apareceran a una frecuencia > 1%. Ya se han identificado > 1 milln.
Algunos polimorfismos en el genoma pueden detectarse al comparar los mapas de
restriccin de diferentes individuos. El criterio es un cambio en el patrn de fragmentos
de DNA que se produce por una escisin con una enzima de restriccin. La FIGURA 4.1
muestra que, cuando un sitio diana est presente en el genoma de un individuo y ausente
92544-04.qxd
8/5/11
9:32 AM
Page 75
4.3
75
La escisin genera 2
fragmentos internos
La mutacin elimina
1 sitio blanco
La escisin genera
1 fragmento interno
fragmento A fragmento B
fragmento C
Electroforesis
C
A
Fragmentos combinados
A+B=C
F1
Padres
3 son heterocigotas,
1 es homocigota para C
C
D
A
B
C
C
B
C
A
D
F2 hereda
A o D de un progenitor, B
B o C del otro progenitor D
B
C
C
D
A
C
A
B
B
D
A
C
B
D
A
B
redan de acuerdo con las reglas mendelianas. Mediante la tcnica de transferencia de Southern y la hibridacin con sondas,
se visualizaron cuatro alelos para un marcador de restriccin en
todas las combinaciones de a pares posibles y segregaron de
manera independiente en cada generacin. Fotografa cortesa
de Ray White, Ernest Gallo Clinic and Research Center, University
of California, San Francisco.
Alelo A
Alelo B
Alelo C
Alelo D
El polimorfismo puede detectarse en distintos niveles: como fenotipo cuando una secuencia
afecta la funcin gnica; en el fragmento de restriccin, cuando afecta al sitio diana de la
enzima de restriccin; y en la secuencia, por anlisis directo del DNA.
Los alelos de un gen muestran gran polimorfismo en la secuencia, pero muchos cambios de
secuencia no afectan la funcin.
polimorfismo de longitud de
los fragmentos de restriccin
(RFLP) Diferencias heredadas
en los sitios para las enzimas
de restriccin por ejemplo, por
cambios de bases en el sitio
blanco, las cuales generan diferencias en las longitudes de
los fragmentos producidos por
el corte con una enzima determinada. Se utilizan para el
mapa gentico y para vincular
al genoma directamente con un
marcador gentico convencional.
92544-04.qxd
76
8/5/11
9:32 AM
CAPTULO 4
Page 76
4.4
Cruza gentica
35%
35%
Tipos parentales
15%
Recombinantes
15%
Deteccin de patrones
de DNA de personas
sanas como control
92544-04.qxd
8/5/11
9:32 AM
Page 77
4.5
77
CONCEPTOS CLAVE
Los RFLP y los SNP pueden ser la base para los mapas de ligamiento y son tiles para establecer las relaciones parentales.
REVISIN DE CONCEPTOS
Describir cmo la posicin de un alelo de enfermedad puede ser delimitada a una regin cromosmica especfica mediante el anlisis de ligamiento utilizando los RFLP de miembros de
una familia grande en la cual el alelo de la enfermedad est segregado.
4.5
La cantidad total de DNA en el genoma (haploide) es una caracterstica de cada especie viviente que se conoce como valor C. Existe una variacin enorme en el intervalo de
Lewin. Genes 2012. Editorial Mdica Panamericana
92544-04.qxd
8/5/11
78
9:32 AM
CAPTULO 4
Page 78
107
108
109
1010 1011
incrementa con la complejidad morfolgica de los eucariontes inferiores, pero vara en gran medida dentro de algunos grupos de eucariontes superiores. El intervalo de
valores de DNA dentro de cada grupo se indica mediante
el rea sombreada.
1010
109
108
107
G os
us
an
os
In
se
ct
os
Av
es
An
fi
M bio
am s
fe
ro
s
oh
M
ra
ia
du
er
ct
va
Le
Ba
M
ic
op
la
sm
a
106
Especie
Pyrenomas salina
M. pneumoniae
E. coli
S. cerevisiae
D. discoideum
C. Elegans
D. Melanogaster
G. Domesticus
X. Laevis
H. sapiens
Genoma (pb)
6,6 x 105
1,0 x 106
4,2 x 106
1,3 x 107
5,4 x 107
8,0 x 107
1,8 x 108
1,2 x 109
3,1 x 109
3,3 x 109
experimentales comunes.
los valores C, desde < 106 pb para un micoplasma hasta > 1011 pb para
algunas plantas y anfibios.
La FIGURA 4.5 resume el intervalo de los valores C que se encuentran
en diferentes taxones (grupos de organismos clasificados juntos). Existe
un incremento en el tamao de genoma mnimo que se encuentra en
cada grupo a medida que la complejidad se acrecienta. Aunque los valores C son superiores en los eucariontes multicelulares, se pueden observar variaciones amplias en los tamaos de genomas dentro de algunos taxones.
Como se observa en la FIGURA 4.6, graficar la cantidad mnima de
DNA requerida para un miembro de cada grupo sugiere que es necesario un incremento en el tamao del genoma para formar procariontes
ms complejos y eucariontes inferiores.
Los micoplasmas son los procariontes ms pequeos y tienen genomas de slo 3 veces el tamao de un bacterifago grande. Los tamaos
de genomas bacterianos ms tpicos comienzan a partir de 2 106 pb.
Los eucariontes unicelulares (cuyos estilos de vida pueden asemejarse al
de los procariontes) se las arreglan con genomas que tambin son pequeos, aunque son ms grandes que los de las bacterias. Ser eucarionte per
se, no implica un gran incremento en el tamao del genoma; una levadura puede tener un tamao de genoma de 1,3 107 pb, que slo es alrededor del doble de tamao de un genoma bacteriano promedio.
Una duplicacin adicional del tamao del genoma es adecuada para
sustentar al moho deslizante Dictyostelium discoideum, que es capaz de vivir de modo unicelular o multicelular. Se necesita otro incremento en la
complejidad para producir los primeros organismos completamente
multicelulares; el gusano nemtodo Caenorhabditis elegans tiene un contenido de DNA de 8 107 pb.
Tambin se puede observar un incremento estable en el tamao del
genoma con la complejidad en la lista de la FIGURA 4.7 de algunos organismos comnmente analizados. Es necesario incrementar el tamao del
genoma para formar insectos, aves o anfibios, y mamferos. Si bien, despus de este punto, no es clara la relacin entre el tamao del genoma y
la complejidad morfolgica del organismo.
Se sabe que los genes son mucho ms grandes que las secuencias necesarias para codificar los polipptidos, debido a que los exones pueden
abarcar slo una parte pequea de la longitud total de un gen. Esto explica por qu existe mucho ms DNA del que es necesario para proporcionar marcos de lectura para todas las protenas del organismo. Grandes
regiones de un gen interrumpido pueden no codificar un polipptido.
Adems, tambin puede haber longitudes significativas de DNA entre
los genes. De manera tal que no es posible deducir el nmero de genes
a partir del tamao global del genoma.
La paradoja del valor C se refiere a la falta de correlacin entre el
tamao del genoma y la complejidad gentica. Tambin existen casos curiosos acerca del tamao relativo del genoma; por ejemplo, el batracio
Xenopus y los seres humanos tienen genomas, esencialmente, del mismo
tamao. En algunos taxones, existen variaciones extremadamente grandes en el contenido de DNA entre los organismos que no varan mucho
en complejidad (vase la Figura 4.5). (Esto es especialmente notable en
los insectos, anfibios y plantas, pero no se produce en las aves, reptiles
ni mamferos, que tienen pequeas variaciones dentro del grupo, una variacin de 2 veces el rango del tamao del genoma.) El grillo tiene un
genoma de 11 veces, el tamao del genoma de la mosca de la fruta. En
los anfibios, los genomas ms pequeos son < 109 pb, mientras que los
ms grandes son 1011 pb. Es improbable que exista una diferencia grande
en la cantidad de genes necesarios para especificar estos anfibios. Todava
no se comprende del todo hasta qu punto esta variacin es selectivamente neutral o est sujeta a la seleccin natural.
92544-04.qxd
8/5/11
4.6
9:32 AM
Page 79
Los genomas eucariontes contienen tanto secuencias de DNA repetitivo como no repetitivo
79
paradoja del valor C Falta de
relacin entre el contenido de
DNA (valor C) de un organismo y su potencial de codificacin.
CONCEPTOS CLAVE
Cules son algunas de las ventajas y desventajas de un genoma grande? Y de un genoma pequeo?
4.6
um
ab
ac
.t
la
ev
is
X.
at
M
de os
la ca
fru
ta
E.
co
C.
li
el
eg
an
s
En general, la naturaleza del genoma eucarionte puede ser evaluada segn la cintica
de reasociacin y desnaturalizacin del DNA. Esta tcnica se utiliz ampliamente antes de
que fuera posible la secuenciacin del DNA a gran escala.
Las cinticas de reasociacin identifican dos tipos generales de secuencias genmicas:
El DNA no repetitivo consiste en secuencias que son nicas: slo existe una copia
en un genoma haploide.
El DNA repetitivo consiste en secuencias que estn presentes en ms de una copia en cada genoma.
A menudo el DNA repetitivo se divide en dos tipos generales:
El DNA moderadamente repetitivo consiste en secuencias relativamente cortas
que se repiten en general entre 10-1.000 veces en el genoma. Las secuencias estn
dispersadas a travs de todo el genoma y son responsables del alto grado de formacin de estructuras secundarias en el pre-mRNA, cuando las repeticiones invertidas en los intrones se aparean para formar regiones dplex.
El DNA altamente repetitivo consiste en secuencias muy cortas (en general < 100
pb) que estn presentes muchos cientos de veces en el genoma, suele estar organizado como largas regiones de repeticiones en tndem (vase
la Seccin 6.9, Los DNA satlites suelen encontrarse en la heterocromatina). Ninguna clase se encuentra en los exones.
1010
La proporcin del genoma ocupada por el DNA no repetitivo va65%
ra ampliamente entre los taxones. La FIGURA 4.8 resume la organiza58%
54%
41%
cin del genoma de algunos organismos representativos. Los proca109
33%
25%
riontes contienen principalmente DNA no repetitivo. Para los
10%
7%
eucariontes inferiores, la mayora del DNA es no repetitiva; < 20% se
5%
70%
108
encuentra en la categora de uno o ms componentes moderadamente
83%
repetitivos. En las clulas animales, hasta la mitad del DNA suele es17%
12%
14%
tar ocupado por componentes moderada y altamente repetitivos. En
7
10
las plantas y en los anfibios, los componentes moderada y altamente
100%
3%
repetitivos pueden representar hasta el 80% del genoma, de manera
6
tal que el DNA no repetitivo se reduce a un componente minoritario.
10
Una parte significativa del DNA moderadamente repetitivo son
los transposones (elementos transponibles): consisten en secuencias
cortas de DNA (1 kb) que tienen la capacidad de moverse a localizaciones nuevas en el genoma y/o de hacer copias adicionales de s mismos (vase el Captulo 21, Transposones, retrovirus, y retrotransposones).
En algunos genomas de eucariontes superiores, pueden incluso ocuNo repetitivo
Moderadamente
Altamente
par ms de la mitad del genoma (vase la Seccin 5.5, El genoma hurepetitivo
repetitivo
mano tiene menos genes de lo esperado originalmente).
Los transposones suelen ser vistos como DNA redundante, que
FIGURA 4.8 Las proporciones de los diferentes componentes
se define como secuencias que se propagan a s mismas dentro de un de secuencia varan en los genomas de eucariontes. El contegenoma sin contribuir al desarrollo ni al funcionamiento del orga- nido absoluto de DNA no repetitivo se incrementa con el tanismo. Los transposones pueden causar reordenamientos del genoma, mao del genoma, pero alcanza una meseta en 2 109 pb.
92544-04.qxd
80
8/5/11
9:32 AM
CAPTULO 4
Page 80
y podran conferir ventajas selectivas. Es justo decir, no obstante, que no se comprende realmente por qu las fuerzas selectivas no actan contra los transposones convirtindolos
en una porcin grande del genoma. Puede ser que stos sean selectivamente neutrales en
la medida en que no interrumpan o eliminen regiones codificantes o reguladoras. Sin embargo, muchos organismos suprimen activamente la transposicin, como en algunos casos
en los que se producen rupturas cromosmicas deletreas (vase la Figura 21.18). Otro trmino que se utiliza para describir el exceso aparente del DNA en algunos genomas es el
DNA basura, lo que implica secuencias genmicas sin funcin aparente. Por supuesto,
es probable que exista un equilibrio en el genoma entre la generacin de secuencias nuevas y la eliminacin de secuencias no deseadas, y alguna proporcin del DNA que aparentemente carece de funcin puede estar en proceso de ser eliminada.
La longitud del componente del DNA no repetitivo tiende a incrementarse con el tamao global del genoma a medida que se avanza hasta un tamao total de genoma de
3 109 (caracterstico de los mamferos). Incrementos posteriores en el tamao del genoma, sin embargo, suelen reflejar un aumento en la cantidad y proporcin de los componentes repetitivos, de manera que es poco comn que un organismo presente un componente de DNA no repetitivo > 2 109. Por lo tanto, el contenido de DNA no repetitivo de
los genomas concuerda de mejor manera con el sentido que se tiene de la complejidad relativa de los organismos. E. coli tiene 4,2 106 pb de DNA no repetitivo, C. elegans tiene un
orden ms de magnitud (6,6 107 pb), D. melanogaster tiene 108 pb, y los mamferos an
otro orden de magnitud ms, 2 109 pb.
Qu tipo de DNA corresponde a los genes que codifican polipptidos? Las cinticas
de reasociacin en general muestran que el mRNA deriva del DNA no repetitivo. Por lo
tanto, la cantidad de DNA no repetitivo es un mejor indicador del potencial codificante de
lo que es el valor C. (Sin embargo, un anlisis ms detallado sobre la base de las secuencias genmicas demostr que muchos exones tienen secuencias que estn relacionadas con
otros exones [vase la Seccin 3.4, Las secuencias de los exones se conservan, pero los intrones
varan]. Tales exones evolucionan a partir de una duplicacin para dar copias que, inicialmente, son idnticas, pero que luego divergieron en su secuencia durante la evolucin.)
CONCEPTOS CLAVE
Las cinticas de reasociacin del DNA, despus de que un genoma ha sido desnaturalizado,
distinguen secuencias por su frecuencia de repeticin en el genoma.
Los polipptidos estn generalmente codificados por secuencias en el DNA no repetitivo.
Los genomas ms grandes dentro de un taxn no contienen ms genes, sino que tienen cantidades grandes de DNA repetitivo.
Una gran parte del DNA moderadamente repetitivo puede estar constituida por transposones.
REVISIN DE CONCEPTOS
4.7
Algunos enfoques importantes para identificar genes eucariontes que codifican protenas se basan en el contraste entre la conservacin de exones y la variacin de intrones.
En una regin que contiene un gen cuya funcin ha sido conservada entre un espectro de
especies, la secuencia que representa al polipptido debera tener dos propiedades distintivas:
debe tener un marco de lectura abierto, y
es probable que posea una secuencia (ortloga) relacionada, en otras especies.
Estas caractersticas pueden utilizarse para aislar genes.
Suponiendo que se conozca por anlisis de ligamiento que un gen, que influye en un
rasgo particular, se localiza en una regin cromosmica dada; si se carece de conocimiento
acerca de la naturaleza del producto gnico, cmo se hace para identificar el gen en una
regin que puede ser de un tamao, por ejemplo, de > 1 Mb?
Lewin. Genes 2012. Editorial Mdica Panamericana
92544-04.qxd
4.7
8/5/11
9:32 AM
Page 81
Se pueden identificar genes eucariontes que codifican protenas por la conservacin de exones
81
Una tcnica exitosa realizada con algunos genes de importancia mdica consisti en
examinar fragmentos relativamente cortos de la regin para las dos propiedades esperadas de un gen conservado. Primero, se busc identificar fragmentos con hibridacin cruzada con los genomas de otras especies, y luego se analizaron esos fragmentos en busca
de marcos de lectura abiertos.
El primer criterio se aplica mediante una transferencia zoo (zoo blot). Se utilizan frag- transferencia zoo (zoo blot)
Uso de la transferencia
mentos cortos de la regin como sondas marcadas para evaluar los DNA homlogos de
Southern para evaluar la capauna variedad de especies mediante la hibridacin Southern (una tcnica para transferir
cidad de una sonda de DNA de
fragmentos de DNA separados por electroforesis en gel a una membrana filtro, seguida
una especie, para formar hbripor la hibridacin de una sonda para detectar la secuencia complementaria o casi compledos con el DNA de los genomentaria). Si se encuentran fragmentos que hibridan en diversas especies relacionadas con
mas de varias especies diferenla de la sonda (que por lo general se prepara a partir de DNA humano), la sonda se contes.
vierte en un candidato para un exn del gen.
Los candidatos son secuenciados; y, si contienen marcos de lectura abiertos, se los utiliza para aislar regiones genmicas de los alrededores. Si stas parecen ser parte de un
exn, pueden ser utilizadas para identificar al gen entero, para aislar el cDNA correspondiente (el DNA obtenido por transcripcin inversa a partir del mRNA) o el mRNA mismo
y, en ltima instancia, para identificar la protena.
Cuando una enfermedad humana es causada por un cambio en una protena conocida,
paseo cromosmico Tcnica
el gen responsable puede ser identificado debido a que codifica para la protena, y su respara ubicar un gen que utiliza
ponsabilidad sobre la enfermedad puede ser confirmada al demostrar que presenta mutalos marcadores ligados ms cerciones en el DNA de pacientes, pero no en el DNA de individuos no afectados. Sin embargo,
canos como sonda en una genoteca.
en muchos casos, no se conoce la causa de una enfermedad a nivel molecular, y es necesario identificar el gen sin informacin acerca de su producto proteico.
El criterio bsico para la identificacin de un gen que est involucrado
en una enfermedad humana es demostrar que, en cada paciente con la enferLas traslocaciones cromosmicas
medad, el gen tiene una mutacin que no est presente en el DNA normal.
identifican la banda Xp21 como
Sin embargo, el gran polimorfismo presente entre los genomas individuales
origen de la DMD
implica que se puedan encontrar muchos cambios cuando se compara el
DNA de un paciente con el DNA normal. Antes de la secuenciacin del genoma humano, el ligamiento gentico poda utilizarse para identificar una regin que contuviera un gen de enfermedad, pero la regin podra contener
muchos genes candidatos. En un gen muy grande, con intrones diseminados
en una distancia larga del genoma, era dificultoso identificar las mutaciones
El DNA clonado del cromosoma X humano
identifica las deleciones en esta regin
crticas en los pacientes. La disponibilidad de los mapas de SNP de alta resolucin y de la secuencia genmica facilit, en gran medida, la localizacin preMapa de restriccin construido mediante
paseo cromosmico a partir de la sonda
cisa de una regin ms pequea que contuviera el gen en la cual se pueda
comparar, directamente, las secuencias del DNA normal con el del paciente.
0
70 kb
+70 kb
Un ejemplo del proceso mediante el cual un gen de enfermedad puede
ser rastreado fue proporcionado por el gen responsable para la distrofia muscular de Duchenne (DMD), un desorden degenerativo del msculo que est
Los DNA de pacientes con DMD tienen
deleciones en la regin del paseo
ligado al cromosoma X y que afecta a 1 de cada 3.500 hombres. Los pasos
para identificar al gen se resumen en la FIGURA 4.9.
El anlisis de ligamiento localiz el locus de DMD en la banda cromosmica Xp21. Los pacientes con la enfermedad, a menudo, tienen reordenamienEl DNA hacia la derecha est
tos cromosmicos que involucran a esta banda. Mediante la comparacin de
delecionado
la capacidad de las sondas de DNA ligadas al X, de hibridar con el DNA de
O
pacientes y el DNA normal, se obtuvieron los fragmentos clonados que corresponden a la regin reordenada o eliminada en el DNA de los pacientes. El DNA hacia la izquierda
Una vez que se ha obtenido el DNA en la vecindad general del gen est delecionado
diana, fue posible realizar el paseo a lo largo del cromosoma hasta alcanO
zar el gen. Se utiliz un paseo cromosmico para construir un mapa de restriccin de la regin a cada lado de la sonda, que cubra una regin de > 100
Delecin interna
kb. El anlisis del DNA, a partir de una serie de pacientes, identific deleciones grandes en esta regin que se extendan en cualquier direccin. La delecin ms significativa es una que est contenida enteramente dentro de FIGURA 4.9 El gen involucrado en la distrofia muscular
de Duchenne fue rastreado mediante mapeo y paseo
esta regin, debido a que la delecin delinea un segmento que debe ser im- cromosmico en una regin en la que se pueden
portante en la funcin del gen y que indica que el gen o al menos una parte identificar deleciones relacionadas con la ocurrencia
de l se encuentra en esa regin.
de la enfermedad.
Lewin. Genes 2012. Editorial Mdica Panamericana
92544-04.qxd
8/5/11
82
9:32 AM
CAPTULO 4
Page 82
H
o
Va mb
M ca re
o
H no
R ms
a t
Po tn er
llo
Despus de identificar la regin del gen, fue necesario identificar sus exones e intrones. Mediante la trasferencia zoo (zoo blot), se identificaron los fragmentos que tienen hibridacin cruzada con el cromosoma X del ratn y con otros DNA de mamfero. Como se
resume en la FIGURA 4.10, stos fueron analizados para identificar los marcos de lectura
abiertos y las secuencias tpicas de las uniones exn-intrn. Los fragmentos que cumplan
con estos criterios se utilizaron como sondas para identificar secuencias homlogas en una
biblioteca de cDNA preparada a partir de mRNA de msculo.
El cDNA correspondiente al gen identifica un mRNA inusualmente largo (14 kb). La
hibridacin hacia atrs en el genoma demuestra que el mRNA est codificado por > 60 exones, que se encuentran diseminados en 2.000 kb de DNA. Esto hace que el gen DMD sea
el gen ms largo que se haya identificado.
El gen codifica una protena de 500 kD denominada distrofina, que es un componente
del msculo que est presente en cantidades bastante bajas. Todos los pacientes con distrofia muscular de Duchenne tienen deleciones en este locus y carecen de distrofina (o sta
es defectuosa).
El msculo tambin tiene la distincin de tener la protena ms grande, titina, con casi
atrapamiento de exones
27.000 aminocidos. El gen titina tiene la mayor cantidad de exones (178) y el exn ms
Insercin de un fragmento gelargo (17.000 pb) del genoma humano.
nmico en un vector, cuya funOtra tcnica que permite analizar rpidamente la presencia de exones en los fragmencin depende de la provisin
tos genmicos se denomina atrapamiento de exones. La FIGURA 4.11 muestra que esta tcde uniones de corte y empalme
por parte del fragmento.
nica comienza con un vector que contiene un promotor fuerte y tiene un nico intrn entre
dos exones. Cuando se transfecta este vector adentro de clulas, su transcripcin genera cantidades grandes de un RNA que contiene las secuencias de los dos exones. Dentro del intrn, se encuentra un sitio de restriccin, el cual es utilizado para insertar fragmentos genmicos de una regin
de inters. Si un fragmento no contiene un exn, no existir cambio en el
50 clones de la regin hibridaron con el DNA de otras
patrn de corte y empalme, y el RNA contendr las mismas secuencias que
especies; 2 clones hibridael vector parental. Sin embargo, si el fragmento genmico contiene un exn
ron con todos los mamferos
Humano
....GCCATAGCACGAGAA ....
Se utiliza el fragmento para identificar el cDNA de 14 kb se mapean
exones correspondientes al cDNA
Ratn
cDNA
0
10
12
kb
exn
exn
intrn
Transcripcin y corte y
empalme para eliminar
el intrn
Fragmento genmico
250
500
a b c d
200
100
50
25
750 1.000
1.500 kb en el genoma
se caracteriz mediante las tcnicas de zoo blot, hibridacin de cDNA, hibridacin genmica y por identificacin
de la protena.
intrn
exn
Insercin del fragmento genmico
en el intrn
exn
intrn
exn
intrn
exn
intrn
Transcripcin y corte y
empalme para eliminar
el intrn
FIGURA 4.11 Para el atrapamiento de exones, se utiliza un vector especial de
corte y empalme. Si est presente un exn en el fragmento genmico, su secuencia ser recuperada en el RNA citoplasmtico. Si el fragmento genmico
est compuesto solamente por secuencias del interior del intrn, no se producir, por lo tanto, el corte y empalme ni se exportar el mRNA al citoplasma.
92544-04.qxd
8/5/11
9:32 AM
4.8
Page 83
83
flanqueado por dos secuencias intrnicas parciales, los sitios de corte y empalme a ambos
lados de este exn sern reconocidos y la secuencia del exn se insertar dentro del RNA
entre los dos exones del vector. Esto puede detectarse fcilmente mediante la transcripcin
inversa del RNA citoplasmtico a cDNA y utilizando PCR (denominada RT-PCR, vase la
siguiente seccin) para amplificar las secuencias entre los dos exones del vector. De esta manera, se observar que la aparicin de las secuencias del fragmento genmico en la poblacin amplificada indican que un exn ha sido atrapado. En los genes de mamfero que
codifican protenas, los intrones suelen ser grandes y los exones pequeos; por lo tanto,
existe una alta probabilidad de que un fragmento aleatorio del DNA genmico contenga la
estructura requerida de un exn rodeado por intrones parciales. De hecho, el atrapamiento
de exones puede imitar los acontecimientos que ocurrieron naturalmente durante la evolucin de los genes (vase la Seccin 3.7, Cmo evolucionaron los genes interrumpidos?).
CONCEPTOS CLAVE
La conservacin de exones puede utilizarse como fundamento para identificar las regiones
codificantes mediante el reconocimiento de fragmentos cuyas secuencias estn presentes en
mltiples organismos.
Los genes de enfermedades humanas se identifican mediante el mapeo y la secuenciacin del
DNA de pacientes para encontrar diferencias respecto del DNA normal que estn genticamente ligadas a la enfermedad.
REVISIN DE CONCEPTOS
La sonda de un exn particular puede identificar mltiples sitios en el genoma. Por qu?
4.8
Una vez que se ha determinado la secuencia de un genoma, an se tiene que identificar los genes dentro de l. Las secuencias codificantes representan una fraccin muy pequea del genoma total. Los potenciales exones pueden identificarse como marcos de lectura abiertos sin interrupciones flanqueados por secuencias adecuadas. Qu criterio se
necesita cumplir para identificar un gen funcional (intacto) a partir de una serie de exones?
La FIGURA 4.12 muestra que un gen funcional debera consistir en una serie de exones
para los cuales el primer exn se encontrara inmediatamente a continuacin de un promotor; los exones internos, flanqueados por uniones de corte y empalme adecuados; el ltimo exn, seguido por seales de procesamiento 3; y se podra deducir un nico marco
de lectura abierto, el cual comienza con un codn de iniciacin y que finaliza con un codn de terminacin mediante la unin de todos los exones. En los casos ms simples, el
primer y el ltimo exn contienen el principio y el final de la regin codificante, respectivamente (as como las regiones 3 y 5 no traducidas). En los casos ms complejos, el primer o el ltimo exn pueden tener slo regiones no traducidas y, por lo tanto, pueden ser
ms dificultosos de identificar.
FIGURA 4.12 Los exones de genes que codifi-
Secuencia
promotora
unin de
corte y
empalme
GT
Primer exn
5 UTR + ORF
unin de
corte y
empalme
AG
unin de
corte y
empalme
GT
unin de
corte y
empalme
AG
Exones internos
ORF
seales de
procesamiento
3
ltimo exn
ORF + 3 UTR
AUG..........................................UGA
Los exones forman un marco abierto de lectura continuo
92544-04.qxd
84
8/5/11
9:32 AM
CAPTULO 4
Page 84
Los algoritmos que se utilizan para conectar los exones no son completamente eficientes
cuando el genoma es muy grande y los exones estn separados por distancias muy grandes.
Por ejemplo, en el anlisis inicial del mapa del genoma humano se contabilizaron
170.000 exones dentro de 32.000 genes. Esto probablemente sea incorrecto debido a que
dara un promedio de 5,3 exones por gen, mientras que el promedio de exones en los genes individuales que han sido completamente caracterizados es de 10,2. O se han omitido
exones, o ellos deberan estar conectados de manera diferente en una cantidad ms pequea de genes en la secuencia del genoma completo.
Incluso cuando la organizacin de un gen se identifica de manera correcta, existe el
problema de distinguir los genes funcionales de los pseudogenes. Muchos pseudogenes
pueden reconocerse por defectos obvios dado que presentan mutaciones mltiples, que
crean una secuencia codificante no funcional. Los pseudogenes que surgieron ms recientemente no han acumulado tantas mutaciones y, por lo tanto, puede ser ms difcil reconocerlos. En un ejemplo extremo, el ratn tiene slo un gen Gapdh funcional (que codifica para
la gliceraldehdo fosfato deshidrogenasa), pero tiene 400 pseudogenes. Aproximadamente
100 de stos inicialmente parecan ser funcionales en la secuencia del genoma del ratn, y
fue necesario un anlisis individual para excluirlos de la lista de genes funcionales.
Cmo se puede verificar un gen putativo que codifica una protena? Si se puede demostrar que una secuencia de DNA se transcribe y procesa a un mRNA traducible, se puede
asumir que es funcional. Una tcnica para realizar esta verificacin es la transcripcin in transcripcin inversa-reaccin
en cadena de la polimerasa
versa-reaccin en cadena de la polimerasa (RT-PCR), en la que el RNA aislado a partir de
(RT-PCR) Una tcnica para la
clulas es transcripto de forma inversa a DNA y, posteriormente, es amplificado a muchas
deteccin y cuantificacin de la
copias mediante la utilizacin de la reaccin en cadena de la polimerasa. Los productos amexpresin de un gen mediante
plificados del DNA despus pueden ser secuenciados o analizados de otra forma para comla transcripcin inversa y la
probar si tienen las caractersticas estructurales apropiadas de un transcripto maduro. La RTamplificacin del RNA de una
PCR tambin puede utilizarse como una prueba cuantitativa de la expresin gnica.
muestra celular.
La confianza de que un gen es funcional puede incrementarse al comparar las regiones de los genomas de diferentes especies. Ha existido una gran reorganizacin global de
las secuencias entre los genomas del humano y del ratn, como se puede ver en el simple
hecho de que existen 23 cromosomas en el genoma haploide humano y 20 cromosomas en
el genoma haploide del ratn. Sin embargo, a nivel local el orden de los genes en general
es el mismo: cuando se comparan los pares homlogos humano y ratn, los genes localizados en ambos lados tienden a ser homlogos. Esta relacin se denomina sintenia.
sintenia Relacin entre regiones
cromosmicas de distintas esLa FIGURA 4.13 muestra la relacin entre el cromosoma 1 de ratn y el conjunto de cropecies, en las que aparecen gemosomas humanos. Se pueden reconocer 21 segmentos en este cromosoma de ratn, que
nes homlogos en el mismo ortienen contrapartes sintnicas en los cromosomas humanos. El grado del barajado de exoden.
nes que ha ocurrido entre los genomas est demostrado por el hecho de que los segmentos
se encuentran diseminados entre seis cromosomas humanos diferentes. Los mismos tipos
de relaciones se encuentran en todos los cromosomas de ratn, excepto para el cromosoma
X, que es sintnico slo con el cromosoma X humano. Esto se explica por el hecho de que
el X es un caso especial, y sujeto a una compensacin de la dosis para que se ajuste la diferencia entre una copia de los machos y las dos copias de las hembras (vase la Seccin 27.5,
El cromosoma X experimenta cambios globales). Esta restriccin puede aplicar presin selectiva
contra la translocacin de los genes hacia el cromosoma X y desde l.
La comparacin de las secuencias del genoma humano y del ratn muestran que
> 90% de cada genoma se encuentra en bloques de sintenia que varan ampliamente de tamao, desde 300 kb hasta 65 Mb. Existe un total de 342 segmentos sintnicos,
con una longitud promedio de 7 Mb (0,3% del genoma). El 99% de los genes
del ratn tiene un homlogo en el genoma humano; para el 96% ese hom10 20 30 40 50 60 70 80 90 100 Mb
logo est en una regin de sintenia.
Cromosoma 1 ratn
La comparacin de los genomas proporciona informacin interesante
acerca de la evolucin de las especies. El nmero de familias de genes en el
genoma humano y en el del ratn es el mismo, y una diferencia importante
1
2 14 5
2
6 8
entre las especies es la expansin diferencial de las familias particulares en el
Cromosoma humano correspondiente
genoma del ratn. Esto es especialmente notable en los genes que afectan caractersticas fenotpicas que son nicas a las especies. De las 25 familias para
FIGURA 4.13 El cromosoma 1 de ratn tiene 21 seglas cuales el tamao se ha expandido en el ratn, 14 contienen genes especmentos de 1 a 25 Mb que son sintnicos con reficamente involucrados en la reproduccin del roedor, y 5 contienen genes esgiones que corresponden a las partes de seis cromopecficos para el sistema inmunitario.
somas humanos.
Lewin. Genes 2012. Editorial Mdica Panamericana
92544-04.qxd
8/5/11
9:32 AM
Page 85
4.9
85
CONCEPTOS CLAVE
Los mtodos para identificar los genes activos no son perfectos y se deben hacer muchas
correcciones hasta llegar a las estimaciones preliminares.
Se debe distinguir a los pseudogenes de los genes activos.
Existen relaciones sintnicas entre los genomas humano y del ratn, y la mayora de los genes activos se encuentran en una regin sintnica.
REVISIN DE CONCEPTOS
En ausencia de informacin definitiva acerca de la expresin de una secuencia, como la presencia de un producto gnico funcional, qu caractersticas de una secuencia eucarionte podran sugerir fuertemente qu es un gen activo que codifica un polipptido?
4.9
La primera evidencia de la presencia de genes fuera del ncleo la proporcion la herencia no mendeliana en las plantas (observada en los primeros aos del siglo XX, justo
despus del redescubrimiento de la herencia mendeliana). La herencia no mendeliana se
define por el fracaso de la progenie de un apareamiento para exhibir la segregacin mendeliana de los caracteres parentales y, por lo tanto, es tomada para indicar la presencia de
genes que residen fuera del ncleo y que no utilizan la segregacin en los husos mittico
y meitico para distribuir copias de los gametos o de las clulas hijas, respectivamente. La
FIGURA 4.14 muestra que esto sucede cuando las mitocondrias heredadas de progenitores
masculino y femenino tienen diferentes alelos y una clula hija recibe una distribucin desequilibrada de la mitocondria a partir de un solo progenitor (vase la Seccin 17.11, Cmo
se replica y segregan las mitocondrias?). Esto tambin es un hecho verdadero para los cloroplastos de las plantas, ya que tanto la mitocondria como el cloroplasto contienen genomas
con genes funcionales (vase a continuacin).
La forma extrema de una herencia no mendeliana es la herencia uniparental, que ocurre cuando se hereda el genotipo de un solo progenitor y el del otro progenitor no se trasLewin. Genes 2012. Editorial Mdica Panamericana
herencia no mendeliana Un
patrn de herencia que no sigue el esquema esperado segn
los principios de Medel (cada
progenitor contribuye con un
solo alelo a la descendencia).
Los genes extranucleares muestran un patrn de herencia no
mendeliana.
92544-04.qxd
86
8/5/11
9:32 AM
CAPTULO 4
Page 86
MTODOS Y TCNICAS
El uso del mtDNA para reconstruir filogenias humanas
Desde que a comienzos de la dcada de 1960 se descubri que las mitocondrias contienen DNA, este mtDNA ha
llamado mucho la atencin. En los animales, el mtDNA es
relativamente pequeo, slo alrededor de 16,6 kb, por lo
que lo convierte en un genoma simple e ideal para analizar.
Este genoma pequeo codifica diversos genes que son absolutamente esenciales para la funcin mitocondrial, pero
no contiene intrones y tiene muy poca secuencia intergnica. La nica regin que tiene variabilidad significativa es
el bucle D, o regin control. El bucle D est involucrado en
la regulacin de la transcripcin y la replicacin del DNA y
constituye cerca de 1.122 pb del genoma (con algunas variaciones en la longitud). La regin control no codifica genes,
es altamente variable y evoluciona rpidamente en relacin
con el resto del genoma mitocondrial. El mtDNA humano,
y el mtDNA animal en general, tiene una tasa de mutacin
mucho ms alta que la tasa promedio de los genes nucleares, mientras que la organizacin (el orden de los genes en
el genoma) es altamente conservada. El mtDNA es, por lo
tanto, un buen blanco para identificar diferencias individuales aun dentro de las poblaciones.
Dado el tamao pequeo y la naturaleza altamente conservada del mtDNA animal, es relativamente simple secuenciar ya sea la molcula entera o porciones de ella, y el
anlisis del mtDNA ha sido un elemento importante de los
estudios filogenticos humanos durante casi tres dcadas
[del siglo XX]. El mtDNA es un objetivo lgico que simplifica el anlisis gentico debido a la herencia uniparental y a
la falta relativa de recombinacin entre las variantes de este
genoma de orgnulo. En contraste, el anlisis de los genes
autosmicos carece de la claridad de los marcadores uniparentales (el genoma mitocondrial, a partir de la madre, y el
cromosoma Y, a partir del padre).
El primer anlisis de la variacin del mtDNA utiliz la
digestin con enzimas de restriccin y caracterizacin de la
molcula entera de mtDNA (publicado en 1981 por
Anderson y cols.). Este estudio inform la capacidad del
anlisis de restriccin para trazar la historia gentica humana a partir de un grupo de 21 personas de diversas etnias y regiones geogrficas, sobre la base de la observacin
del polimorfismo de longitud en los fragmentos de restriccin
(RFLP). Esto condujo a la estimacin de alrededor de 180.000
aos para la variacin global del mtDNA el lapso de tiempo
transcurrido para la aparicin de todas las variaciones a
partir de un punto inicial en comn, que es notablemente
consistente con respecto a los estudios ms recientes.
Hacia la dcada de los noventa [del siglo XX], el anlisis de los RFLP se complement con el anlisis de la secuencia de los segmentos hipervariables (SHV) de la regin control
del mtDNA para proporcionar informacin adicional para
92544-04.qxd
8/5/11
9:32 AM
Page 87
4.9
lcula entera de mtDNA, en lugar de slo segmentos pequeos. Esto ha permitido un anlisis ms completo y preciso,
que simplifica el anlisis gentico, del cual resulta un rbol
de mtDNA con una resolucin filogeogrfica mucho ms
alta, a la vez que proporciona un mayor refinamiento de los
orgenes geogrficos. Por ejemplo, el anlisis de la secuencia completa del mtDNA condujo a la conclusin de que los
agrupamientos de haplogrupos de Asia Central y de los nativos de Amrica sean subconjuntos de la variacin del
mtDNA de Asia del Este. Esta distincin no sera posible
slo a travs de la comparacin de las secuencias de SHV.
Sin embargo, el anlisis de la secuencia completa del
mtDNA genera cierto desafo cuando se compara la informacin de secuencia de tramos cortos de mtDNA que se
obtienen a partir de muestras de DNA ancestral de huesos,
dientes o de otras muestras, con la informacin del genoma
mitocondrial completo de muestras actuales. Las muestras
de DNA ancestral con frecuencia carecen de la suficiente integridad que permita el anlisis de una secuencia completa
del mtDNA.
Las interpretaciones hechas sobre la base de la informacin de la secuencia del mtDNA podran verse afectadas y
generar incertidumbre acerca de si el mtDNA sufre (o no)
recombinacin homloga. La recombinacin del mtDNA se
produce fcilmente en levaduras, hongos y plantas. Sin embargo, se cree que en los animales no se produce recombinacin del mtDNA al menos parcialmente, debido al tamao extremadamente pequeo del genoma y a la herencia
uniparental de la madre. La ausencia de recombinacin simplifica el anlisis al permitir la mxima resolucin molecular simplemente como una funcin de la longitud de secuencia examinada, en lugar de la necesidad de tomar en
cuenta la variacin de la estructura gnica como resultado
de la recombinacin, que es comn para los genes autosmicos nucleares. Muchos investigadores han informado que
se puede producir la recombinacin de mtDNA a niveles bajos y en algunos rganos especficos de seres humanos y de
otros animales. Sin embargo, esto de alguna manera es controvertido y requiere experimentos posteriores que determinen el grado de la recombinacin en el mtDNA animal. Si
se produce la recombinacin del mtDNA, entonces sta
debe ser considerada, y puede requerirse cierta alteracin
de los rboles filogenticos.
Adems del anlisis filogentico, la informacin de la
secuencia de mtDNA ha sido til para caracterizar las enfermedades mitocondriales espontneas y hereditarias.
Durante las ltimas dos dcadas [del siglo XX] se han caracterizado una cantidad de enfermedades del mtDNA, que incluyen las miopatas mitocondriales que conducen al deterioro muscular, y la neuropata ptica hereditaria, que
conduce a la ceguera. Estas enfermedades se deben a mutaciones en los genes codificados en el mtDNA. Puesto que el
genoma mitocondrial humano es tan compacto, y con muy
poca secuencia no codificante, casi cualquier mutacin
87
92544-04.qxd
88
8/5/11
9:32 AM
CAPTULO 4
Page 88
FIGURA 4.14 Cuando los alelos mitocondriales materno y paterno difieren, se debe a que una clula tiene
dos conjuntos de DNA mitocondrial.
La mitosis suele generar clulas hijas con ambos conjuntos. La variacin somtica puede surgir si la segregacin desigual genera clulas
hijas slo con un conjunto.
Mitocondrias
paternas
92544-04.qxd
8/5/11
4.10
9:32 AM
Page 89
Los genomas de los orgnulos son DNA circulares que codifican las protenas de los orgnulos
89
ncleo; como resultado, la tasa de error durante la replicacin puede ser diferente. En
los mamferos, el DNA mitocondrial acumula
mutaciones ms rpidamente que el DNA nuNcleo
clear; pero, en las plantas, la acumulacin de
del
oocito
Mitocondrias
mutaciones es ms lenta en la mitocondria
que en el ncleo: mientras que el DNA del
cloroplasto tiene una tasa de mutacin intermedia.
Espermatozoide
Una consecuencia de la herencia materna
es que la secuencia del DNA mitocondrial es
ms sensible que la del DNA nuclear a las reducciones en el tamao de la poblacin reproductiva. Las comparaciones de las secuencias
de DNA mitocondrial en un especto de poblaciones humanas permiten construir un rbol evolutivo. La divergencia entre los DNA
mitocondriales humanos abarca el 0,57%. Se
puede construir un rbol en el cual las variantes mitocondriales divergieron a partir de un
ancestro comn (africano). La tasa a la cual el
Proncleo
DNA mitocondrial de los mamferos acumula
masculino
mutaciones es del 2 a 4% por milln de aos,
que es > 10 veces ms rpido que la tasa para
la globina. Una tasa como sta podra generar la divergencia observada en un perodo evolutivo de 140.000 a 280.000 aos. Esto implica que el DNA mitocondrial humano desciende de una poblacin nica que vivi en
frica hace 200.000 aos. Sin embargo, esto no puede interpretarse como evidencia de
que existi una nica poblacin al mismo tiempo, ya que pudieron existir muchas poblaciones, y algunas de ellas, o todas, pudieron haber contribuido con la variacin gentica
nuclear humana moderna.
CONCEPTOS CLAVE
Las mitocondrias y los cloroplastos tienen genomas que exhiben herencia no mendeliana. En
general, son de herencia materna.
Los genomas de los orgnulos pueden sufrir segregacin somtica en las plantas.
Las comparaciones del DNA mitocondrial sugieren que desciende de una sola poblacin que
vivi hace 200.000 aos en frica.
REVISIN DE CONCEPTOS
Por qu la tasa de mutacin del DNA mitocondrial en los mamferos puede ser un orden de
magnitud mayor que la del DNA nuclear? (Indicio: qu compuestos se encuentran en las mitocondrias y no en el ncleo?)
92544-04.qxd
90
8/5/11
9:32 AM
CAPTULO 4
Page 90
del genoma de un bacterifago grande, como el del T4 de 165 kb. Existen mltiples copias del genoma por orgnulo en general, de 20 a 40 en una planta superior, y mltiples
copias del orgnulo por clula, entre 20 y 40.
Los genomas mitocondriales varan en el tamao total por ms de un orden de magnitud. Las clulas animales tienen genomas mitocondriales pequeos (aproximadamente
16,5 kb en los mamferos). Existen varios cientos de mitocondrias por clula, y cada mitocondria tiene mltiples copias del DNA. La cantidad total de DNA mitocondrial, en relacin con el DNA nuclear, es pequea; se estima que es < 1%.
En la levadura, el genoma mitocondrial es mucho ms grande. En Saccharomyces cerevisiae, el tamao exacto vara entre las diferentes cepas, pero tiene en promedio 80 kb.
Hay 22 mitocondrias por clula, que corresponden a 4 genomas por orgnulo. En las clula en crecimiento, la proporcin de DNA mitocondrial puede ser tan alta como el 18%.
Las plantas exhiben una variacin extremadamente amplia en el tamao del DNA mitocondrial, con un mnimo de 100 kb. El tamao del genoma torna dificultoso el aislamiento intacto, pero el mapeo de restriccin realizado en
Genes que Genes que
Tamao codifican
codifican
diversas plantas sugiere que el genoma mitocondrial suele ser una secuenEspecies
(kb)
RNA
protena
cia nica organizada como un crculo. Dentro de este crculo, existen secuencias homlogas cortas. La recombinacin entre estos elementos geHongo
19100
814
1028
nera molculas circulares subgenmicas ms cortas que coexisten con el
Protistas
6100
362
229
Plantas
186366
2734
2130
genoma maestro completo un buen ejemplo de la aparente complejiAnimales
1617
13
424
dad de los DNA mitocondriales de las plantas.
Con los genomas mitocondriales secuenciados a partir de muchos orFIGURA 4.16 Los genomas mitocondriales tienen genes
ganismos,
se pueden apreciar ahora algunos patrones generales en la reque codifican protenas (mayormente, complejos IIV),
presentacin
de las funciones en el DNA mitocondrial. La FIGURA 4.16 rerRNA y tRNA.
sume la distribucin de los genes en los genomas mitocondriales. El
nmero total de genes que codifican protenas es ms bien pequeo y no
se correlaciona con el tamao del genoma. Los 16 kb de los genomas miCyt b
Bucle D
tocondriales de mamfero codifican 13 protenas, mientras que los 60 a 80 kb de
los genomas mitocondriales de levadura codifican apenas 8 protenas. Los geND6
nomas mitocondriales de plantas mucho ms grandes codifican ms protenas.
12S
rRNA
ND5
En la mayora de los genomas mitocondriales se encuentran intrones, aunque
16S rRNA
estn ausentes en los genomas muy pequeos de mamfero.
Los dos rRNA principales siempre estn codificados por el genoma mito16.6 kb
condrial.
La cantidad de tRNA codificada en el genoma mitocondrial vara
ND4
ND1
desde ninguno hasta el complemento completo (25 a 26 en la mitocondria). Esto
ND4L
explica la variacin en la cantidad que se observa en la Figura 4.16.
ND3
La mayor parte de la actividad codificante de protena corresponde a los
ND2
CO3
componentes de la estructura de multisubunidades de los complejos I-IV de resATPasa 6
piracin. En los genomas mitocondriales de plantas y protistas, se encuentran
ATPasa 8
CO1
CO2
codificadas muchas protenas ribosmicas, pero existen unas pocas o ninguna
en los genomas de animales y hongos. En muchos genomas mitocondriales de
Genes de tRNA
protistas, existen genes que codifican protenas involucrados en la importacin
Regiones codificantes
mitocondrial.
Indica la direccin del gen, 5 a 3
El DNA mitocondrial animal es extremadamente compacto. Existen diferenCO: CO: citocromo oxidasa
cias de gran magnitud en la detallada organizacin gnica que se encuentran en
ND: NADH deshidrogenada
diferentes taxones animales, pero se mantiene el principio general de un genoma
pequeo que codifica para una cantidad restringida de funciones. En las mitoFIGURA 4.17 El DNA mitocondrial humano tiene 22
genes de tRNA, 2 genes de rRNA y 13 regiones co- condrias de mamferos, el genoma es extremadamente compacto. No existen indificantes de protenas. Catorce de las 15 regiones trones; en realidad, algunos genes se superponen, y casi cada par de bases puede
que codifican protena o rRNA se transcriben en la asignarse a un gen. A excepcin del bucle D una regin involucrada con la inimisma direccin. Catorce de los genes de tRNA se
ciacin de la replicacin del DNA: no ms de 87 de los 16.569 pb del genoma
expresan en la direccin del sentido de las agujas
mitocondrial humano se encuentran en regiones intercistrnicas.
de reloj; y 8, en sentido contrario.
Las secuencias nucleotdicas completas de los genomas mitocondriales de
los animales exhiben gran homologa en su organizacin. En la FIGURA 4.17, se
resume el mapa del genoma mitocondrial humano. Existen 13 regiones que codifican pro bucle D Regin del DNA mitotenas. Todas las protenas son componentes del sistema de transferencia de electrones de
condrial de los animales variala respiracin celular. stas incluyen el citocromo b, tres subunidades de la citocromo oxible en tamao y secuencia, que
dasa, una de las subunidades de la ATPasa y siete subunidades (o protenas asociadas) de
contiene el origen de replicacin.
la NADH deshidrogenasa.
Lewin. Genes 2012. Editorial Mdica Panamericana
92544-04.qxd
8/5/11
9:32 AM
Page 91
91
Citocromo b
4.11
CONCEPTOS CLAVE
Los genomas de los orgnulos, en general (pero no siempre), son molculas circulares de DNA.
Los genomas de orgnulos codifican algunas, pero no todas, las protenas que se encuentran
en los orgnulos.
El DNA mitocondrial de una clula animal es extremadamente compacto y suele codificar
para 13 protenas, 2 rRNA y 22 tRNA.
El DNA mitocondrial de levadura es 5 veces ms largo que el mtDNA de una clula animal
debido a la presencia de intrones largos.
REVISIN DE CONCEPTOS
92544-04.qxd
92
8/5/11
9:32 AM
CAPTULO 4
Page 92
FIGURA 4.19 El genoma de cloroplasto en las plantas terrestres codifica 4 rRNA, 30 tRNA y 60 protenas.
Genes
Tipos
CONCEPTOS CLAVE
Los genomas de cloroplasto varan en tamao, pero son los suficientemente grandes para codificar de 50 a 100 protenas, as como los rRNA y tRNA.
REVISIN DE CONCEPTOS
Qu ventajas existen en los genomas de cloroplasto que codifican la RNA polimerasa, los
tRNA, los rRNA y las protenas ribosmicas?
92544-04.qxd
8/5/11
9:32 AM
Page 93
4.12
93
FIGURA 4.20 La mitocondria se origin a partir de un acontecimiento
endosimbitico cuando una clula
eucarionte captur una bacteria.
92544-04.qxd
94
8/5/11
9:32 AM
CAPTULO 4
Page 94
ocurrieron en un perodo cuando los compartimentos estuvieron menos estrictamente definidos, de manera tal que fue ms fcil tanto para el DNA ser relocalizado como para las protenas ser incorporadas dentro del orgnulo independientemente del sitio de sntesis.
Los mapas filogenticos muestran que las transferencias gnicas ocurrieron independientemente en muchos linajes diferentes. Parece ser que las transferencias de genes mitocondriales al ncleo se produjeron slo al comienzo de la evolucin de la clula animal,
pero es posible que el proceso an contine en las clulas vegetales. El nmero de transferencias puede ser grande: existen 800 genes nucleares en Arabidopsis cuyas secuencias estn relacionadas con los genes en los cloroplastos de otras plantas. Estos genes son candidatos para la evolucin a partir de los genes que se originaron en el cloroplasto.
CONCEPTOS CLAVE
4.13 Resumen
Las secuencias de DNA que componen un genoma eucarionte pueden clasificarse en
tres grupos:
secuencias no repetitivas que son nicas;
secuencias moderadamente repetitivas que se encuentran dispersas y repetidas
una cantidad pequea de veces con algunas copias que no son idnticas; y
secuencias altamente repetitivas que son cortas y que suelen estar repetidas y organizadas en tndem.
Las proporciones de estos tipos de secuencias son caractersticas de cada genoma, aunque los genomas ms grandes tienden a tener una menor proporcin de DNA no repetitivo. Casi el 50% del genoma humano consiste en secuencias repetitivas la vasta mayora
corresponden a las secuencias de transposones. La mayora de los genes estructurales se
localiza en el DNA no repetitivo. La cantidad de DNA no repetitivo refleja mejor la complejidad del organismo que el tamao total del genoma; la mayor cantidad de DNA no repetitivo en los genomas es 2 109 pb.
La herencia no mendeliana se explica mediante la presencia de DNA en los orgnulos en el citoplasma. Las mitocondrias y los cloroplastos son sistemas rodeados por membranas en los cuales algunas protenas se sintetizan dentro del orgnulo mientras que otras
se importan. El genoma del orgnulo es, usualmente, un DNA circular que codifica todos
los RNA y algunas protenas requeridas por el orgnulo.
Los genomas mitocondriales varan mucho en tamao desde el genoma pequeo de
16 kb en mamferos hasta el genoma de 570 kb en las plantas superiores. Los genomas ms
grandes pueden codificar funciones adicionales. Los genomas de cloroplastos varan desde
120 a 217 kb. Aquellos que se han secuenciado tienen una organizacin similar y codifican funciones equivalentes. Tanto en las mitocondrias como en los cloroplastos, muchas
de las protenas ms importantes contienen algunas subunidades sintetizadas en el orgnulo y algunas subunidades importadas desde el citosol. Se han producido transferencias
de DNA entre los genomas de cloroplastos o de mitocondrias, y el nuclear.
92544-04.qxd
8/5/11
9:32 AM
Page 95
Preguntas
PREGUNTAS
1. Aproximadamente con qu frecuencia se producen polimorfismos de un nucletido
nico (SNP) en el genoma humano?
A. uno cada 560 bases
B. uno cada 950 bases
C. uno cada 1.330 bases
D. uno cada 2.040 bases
2. Si una cruza gentica entre dos moscas una con pigmento oscuro del ojo y un fragmento de DNA nico que hibridiza con una sonda y otra que carece de pigmento y
tiene dos fragmentos que hibridizan con la sonda produce una progenie con un 40%
de un tipo parental y un 40% del otro tipo parental, y un 10% de cada fenotipo recombinante, cul es la distancia en el mapa gentico entre el marcador de restriccin y el
marcador del color de ojo?
A. 10%
B. 20%
C. 40%
D. 80%
3. Cul de los siguientes grupos de organismos exhibe la menor complejidad del genoma?
A. insectos
B. moluscos
C. hongos
D. algas
4. Cul especie exhibe el mayor porcentaje de DNA repetitivo?
1. C. elegans
2. X. laevis
3. D. melanogaster
4. H. sapiens
5. Los genomas procariontes suelen contener:
A. casi el 100% de DNA no repetitivo
B. mayormente DNA no repetitivo con alrededor de un 20% de DNA moderadamente
repetitivo.
C. mayormente DNA moderada o altamente repetitivo con alrededor de un 20% de
DNA no repetitivo.
D. alrededor de cantidades iguales de DNA moderadamente repetitivo y no repetitivo.
6. Los genomas de plantas y anfibios contienen:
A. casi el 100% de DNA no repetitivo.
B. mayormente DNA no repetitivo con alrededor de un 20% de DNA moderadamente
repetitivo.
C. mayormente DNA moderada o altamente repetitivo con alrededor de un 20% de
DNA no repetitivo.
D. alrededor de cantidades iguales de DNA moderadamente repetitivo y no repetitivo.
7. La distrofia muscular de Duchenne (DMD) es causada por un(a)
en el
gen de la distrofina:
A. delecin grande
B. insercin grande
C. cambio de base nico
D. insercin pequea.
8. En la mayora de los animales, el DNA mitocondrial es heredado
A. de igual manera de ambos padres.
B. predominantemente del padre.
C. slo de la madre.
D. slo del padre.
95
92544-04.qxd
96
8/5/11
9:32 AM
CAPTULO 4
Page 96
9. Durante el curso de la evolucin, los genes de los genomas mitocondriales y de cloroplastos han:
A. sido transferidos a los cromosomas nucleares.
B. sido transferidos desde un orgnulo al otro.
C. sido eliminados de la clula.
D. evolucionado a otras funciones.
10. El pariente ms cercano conocido de la mitocondria entre las bacterias es:
A. cianobacteria.
B. Rickettsia.
C. Salmonella.
D. Bacillus.
PALABRAS CLAVE
ctDNA (cpDNA)
valor C
paradoja del valor C
paseo cromosmico
bucle D
huella gentica
atrapamiento de exones
etiqueta de secuencia
expresada (EST)
genes extranucleares
mapa gentico
genoma
haplotipo
interactoma
mapa de ligamiento
herencia materna
mtDNA
herencia no mendeliana
DNA no repetitivo
polimorfismo
proteoma
DNA repetitivo
polimorfismo de longitud en
los fragmentos de
restriccin (RFLP)
mapa de restriccin
transcripcin inversareaccin en cadena de la
polimerasa (RT-PCR)
DNA redundante
polimorfismo de un
nucletido nico (SNP)
sintenia
transcriptoma
transposn
transferencia zoo (zoo blot)
LECTURAS RECOMENDADAS
Altshuler, D., Brooks, L. D., Chakravarti, A., Collins, F. S., Daly, M. J., and Donnelly, P. (2005). A haplotype map of the human genome. Nature 437, 12991320.
Un informe sobre HapMap, la base de datos pblica de los SNP (polimorfismo de un nucletido
nico), que representa un intento a gran escala de documentar la variacin gentica humana.
Gregory, T. R. (2001). Coincidence, coevolution, or causation? DNA content, cell size, and the Cvalue enigma. Biol. Rev. Camb. Philos. Soc. 76, 65101.
Una revisin del enigma (paradoja) del valor C y de la hiptesis que la explica, y un anlisis de la
correlacin positiva entre el valor C y el tamao de la clula.
Hinds, D. A., Stuve, L. L., Nilsen, G. B., Halperin, E., Eskin E., Ballinger, D. G., Frazer, K. A., and Cox,
D. R. (2005). Wholegenome patterns of common DNA variation in three human populations.
Science 307, 10721079.
Un informe acerca de 1,5 millones de SNP de 71 individuos humanos que descendieron a partir de
tres poblaciones diferentes como una muestra de la variacin gentica humana.
Lang, B. F., Gray, M. W., and Burger, G. (1999). Mitochondrial genome evolution and the origin of eukaryotes. Annu. Rev. Genet. 33, 351397.
La evidencia sugiere que las mitocondrias evolucionaron a partir de una proteobacteria endosimbitica alrededor de la misma poca que evolucion el ncleo.
Sharp, A. J., Cheng, Z., and Eichler, E. E. (2006). Structural variation of the human genome. Annu.
Rev. Genom. Hum. G. 7, 407442.
Una revisin de los reordenamientos estructurales del genoma humano y sus efectos en la variacin
fenotpica.
Sugiura, M., Hirose, T., and Sugita, M. (1998). Evolution and mechanism of translation in chloroplasts.
Annu. Rev. Genom. Hum. G. 32, 437459.