Professional Documents
Culture Documents
ANTROPOLOGIA MOLECOLARE
Manuale di base
FIRENZE
UNIVERSITY
PRESS
manuali
scienze
pianeta redi
comitato scientifico
renato fani
david caramelli
alessio mengoni
titoli gi pubblicati
david caramelli
Antropologia molecolare
Manuale di base
Sommario
1
1
2
5
7
12
15
49
49
53
79
79
80
87
89
90
93
93
93
94
58
70
76
91
VI
sommario
113
117
117
117
124
127
133
133
135
149
149
164
171
185
185
186
188
189
191
208
210
213
213
215
217
147
179
210
212
218
219
225
225
antropologia molecolare
9.8 I primers
9.9 La prova inibitori
9.10 La PCR competitiva
9.11 Visualizzazione del risultato
9.12 La Real Time PCR: levoluzione della PCR
competitiva
9.13 Lamplificazione del DNA
9.14 Taglio della banda e purificazione
9.15 Clonaggio del DNA con il TopoTA Cloning
9.16 Conservazione dellamplicone e creazione
dellArchivio Biologico
9.17 Reazione di sequenza
9.18 Ricostruzione al PC della sequenza nucleotidica
VII
226
227
227
230
233
234
235
236
236
236
237
241
241
241
242
244
247
249
250
252
258
264
Bibliografia
295
321
244
266
279
Capitolo 1
Il genoma umano
1.1 Introduzione
Ogni organismo vivente, unicellulare o multicellulare, caratterizzato
dalla presenza di molecole di acido nucleico (DNA o RNA) in grado di produrre copie identiche a se stesse. Esclusi alcuni virus a RNA, linformazione
genetica degli organismi viventi contenuta nelle molecole di DNA. Con
il termine genoma si definisce il contenuto completo dellinformazione
genetica. Il contenuto totale di DNA negli eucarioti e quindi la dimensione
del genoma correlata alla complessit dellorganismo (ad es., il genoma
umano pi grande di quello degli insetti che a sua volta pi grande di
quello funghi). Esistono per diverse eccezioni: es. il genoma di X. laevis
grande quanto quello dei mammiferi; altri anfibi hanno un genoma circa
50 volte pi grande del genoma umano; tra le piante, il genoma di Zea
mais (5000 Mbp) pi grande di quello umano. In genere, per un dato
raggruppamento tassonomico, la dimensione minima del genoma approssimativamente proporzionale alla complessit dellorganismo. Come
per il contenuto di DNA, anche il numero e le dimensioni dei cromosomi
molto variabile tra gli eucarioti (Tab. 1.1). Il materiale genetico degli
eucarioti suddiviso in pi cromosomi lineari. Il numero cromosomico,
salvo poche eccezioni, caratteristico per ciascuna specie. Molti eucarioti
hanno due copie di ciascun tipo di cromosoma presente nel nucleo, e per
questo motivo, il loro assetto detto diploide, vale a dire 2N.
Nelluomo il cariotipo, ovvero linsieme completo di tutti i cromosomi metafasici di una cellula, costituito da 46 cromosomi. Di questi,
44 cromosomi, detti autosomi, sono 22 coppie di cromosomi omologhi,
identici nei due sessi. Per questo motivo i geni contenuti in ogni autosoma sono in duplice copia, una per omologo. Gli altri 2 cromosomi sono
quelli sessuali, rappresentati da due cromosomi X nella femmina e da
il genoma umano
Aves
Amphibia
Fish
Insecta
Nematoda
Protozoa
SPECIE
Homo sapiens
Pan troglodites
Bos taurus
Canis familiaris
Mus musculus
Rattus norvegicus
Gallus gallus
Xenopus laevis
Xenopus tropicalis
Danio rerio
Tetradon nigroviridis
Drosophila melanogaster
Anopheles gambiae
Apis mellifera
Caenorhabditis elegans
Leishmania major
Plasmodium falciparum
23
24
30
39
20
21
39
18
10
25
22
4
5
16
6
36
14
antropologia molecolare
il genoma umano
antropologia molecolare
il genoma umano
antropologia molecolare
1.4 I geni
Tradizionalmente, il gene definito come un segmento di DNA che
codifica per un polipeptide o per una specifica molecola di RNA. Signi-
il genoma umano
ficativi progressi in campo molecolare hanno tuttavia contribuito a rendere il concetto di gene pi ampio. In accordo con questi studi, il gene
una specifica regione di DNA, la cui trascrizione regolata da uno o pi
promotori e altri elementi di controllo trascrizionale che contiene linformazione per la sintesi di molecole di RNA tra loro correlate (con un tratto
di sequenza in comune) che possono svolgere varie attivit funzionali, ed
eventualmente dirigere la sintesi di catene polipeptidiche.
Oggi si riconoscono quattro classi di geni: (1) geni che codificano per le
proteine, che sono trascritti in RNA e successivamente tradotti in proteine,
(2) geni codificanti per proteine organizzati in famiglie geniche (3) geni
RNA-specifici (geni per rRNA, tRNA ed istoni), che sono esclusivamente
trascritti e organizzati per unit ripetute in tandem e (4) geni per ncRNA
(Cavalier-Smith 1985; Watson et al. 1987; Lewin 1994). Questultima
categoria di geni include solo sequenze non-trascritte, mentre i geni regolatori trascritti appartengono essenzialmente ad una delle prime due
categorie. I geni che codificano per le proteine e i geni RNA-specifici sono
anche noti come geni strutturali. I geni organizzati in famiglie geniche
sono tra loro omologhi, e derivano da un evento di duplicazione genica o
di retrotrasposizione mediata da RNA. I membri di una famiglia genica
allinterno di uno stesso genoma sono detti paraloghi, e normalmente si
specializzano acquisendo funzioni distinte. Nei batteri la trascrizione di
tali geni condotta da un solo tipo di RNA polimerasi e la sintesi avviene
nel citoplasma. Nel genoma nucleare degli eucarioti, sono coinvolti tre
tipi di RNA polimerasi (Watson et al. 1987; Lewin 1994). I geni RNA
ribosomici (rRNA) sono trascritti dalla RNA polimerasi I (Pol I), i geni
strutturali dalla RNA polimerasi II (Pol II), e i geni RNA citoplasmatici
(scRNA), come i geni codificanti gli RNA di trasporto, dalla RNA polimerasi III (Pol III).
antropologia molecolare
10
il genoma umano
antropologia molecolare
11
Affinch la traduzione dellmRNA avvenga a un ritmo efficiente allinterno di una cellula vivente, sono necessari svariati componenti cellulari.
Tra di essi vi sono i ribosomi, gli RNA di trasporto (tRNA), certi fattori
proteici e alcune piccole molecole. Specifiche sequenze dellmRNA sono
necessarie per garantire che sia sintetizzata la sequenza corretta di aminoacidi. Negli eucarioti il ribosoma esplora lmRNA in cerca di un codone di
inizio, che sar il punto iniziale della traduzione. Generalmente il codone di
inizio AUG, codone che specifica il primo aminoacido del polipeptide, la
metionina. La sintesi di un polipeptide comporta interazioni tra lmRNA, il
ribosoma e le molecole di tRNA. Il ribosoma scorre lungo lmRNA nella direzione 53. Mentre il ribosoma scorre su un codone dellmRNA, un tRNA
con un anticodone complementare si lega al codone; allestremit opposta
il tRNA porta un amino acido. Il tRNA ha quindi due funzioni importanti:
il suo anticodone si lega in modo specifico con un codone dellmRNA e,
inoltre, esso trasporta lamminoacido giusto alla sua estremit opposta. In
questo modo il tRNA funge da intermediario traduttore durante la sintesi
del polipeptide. Il codone di inizio dellmRNA generalmente seguito da
centinaia o anche da migliaia di codoni che specificano la sequenza amminoacidica del polipeptide che deve essere sintetizzato. Il ribosoma scorre i
codoni uno dopo laltro, in un processo a tappe, mentre le molecole di tRNA
si legano ai codoni tramite gli anticodoni, portando con s lamminoacido
corretto. Nel frattempo, gli amminoacidi vengono staccati dalle molecole
di tRNA e legati luno allaltro a formare una catena polipeptidica. Infine,
si raggiunge un codone di arresto che segnala la fine della traduzione. A
questo punto il ribosoma, lmRNa e il polipeptide si dissociano.
12
il genoma umano
antropologia molecolare
13
14
il genoma umano
FAMIGLIA
Alu
MIR
LINE
LINE-1
(kpn)
LINE-2
LTR
TRASPOSONI
A DNA
ERV
MER-1
(Charlie)
DIMENSIONI UNIT
RIPETUTA
0,3 kb lunghezza
completa
0,13 kb dimensione
media
0,8 kb dimensione
media
0,25 kb dimensione
media
1,3 kb dimensione
media
0,25 kb dimensione
media
N COPIE
GENOMA
1.200.000 ca 10,7 % ca
450.000 ca
2,5 % ca
2.600.000 ca
17,3 %
370.000 ca
3,3 %
240.000
4,7 %
213.000
1,4 %
antropologia molecolare
15
non abbia alcuna funzione. Unaltra ipotesi che alcune delle sequenze
ripetute, o dei loro trascritti, o entrambi, siano in qualche modo coinvolti
nei meccanismi di regolazione dellespressione genica.
1.6.1 Il cromosoma Y
Dove si trova e sua struttura. Negli animali ed in molte piante, le
cellule maschili e femminili che contengono il proprio corredo cromosomico allinterno del nucleo, si distinguono per i cromosomi sessuali,
cromosomi che, in molti organismi eucarioti, sono rappresentati diversamente nei due sessi. Nelluomo, le femmine possiedono due cromosomi
X, submetacentrici e di media lunghezza, mentre i maschi portano un
cromosoma X ed un cromosoma Y, acrocentrico di piccole dimensioni
(Fig. 1.6). Il cromosoma Y lungo circa un terzo del cromosoma X e per
questo motivo molti geni presenti sul cromosoma X non hanno una controparte sul cromosoma Y. Dal punto di vista strutturale il cromosoma Y
una molecola lineare di circa 50 Mb.
In un lavoro pubblicato su Nature nel 2003 i ricercatori del Whitehead
Institute e della Washington University, riportano la sequenza di 23 Mb
delle circa 50 Mb del cromosoma Y umano. La restante porzione del cro-
16
il genoma umano
antropologia molecolare
17
18
il genoma umano
di uno o pi geni che controllano la transizione verso la differenziazione sessuale maschile. Questo prodotto genico chiamato fattore di
determinazione del testicolo determina la differenziazione delle gonadi
primordiali in testicoli piuttosto che in ovari. Questo levento chiave
nella determinazione del sesso in molti mammiferi; tutte le altre differenze fra i sessi sono effetti secondari derivanti dallazione di ormoni o
di fattori prodotti dalle gonadi. In poche parole la determinazione del
sesso dipende dalla determinazione delle gonadi. A livello della regione
MSY, il cromosoma Y caratterizzato dalla presenza di diverse regioni
che non sono altro che copie del cromosoma X oppure regioni duplicate
del cromosoma Y stesso. Tre sono le classi di sequenze che sono state
tipizzate sul cromosoma: X-trasposte, X-degenerate ed ampliconic.
Due blocchi, posizionati sul braccio corto del cromosoma, con una
lunghezza complessiva di 3,4 Mb, formano le sequenze X-trasposte.
Queste ultime sono identiche al 99% rispetto a delle sequenze trovate sul
cromosoma X in posizione Xq21 che contengono due sequenze geniche
e che non partecipano al crossing over X-Y durante la meiosi maschile.
Le sequenze X-degenerate si trovano organizzate in otto blocchi su
braccio corto e su quello lungo del cromosoma, per una lunghezza di
8,6 Mb. Queste sequenze presentano unomologia del 96% con sequenze
presenti sul cromosoma X. I segmenti ampliconic sono costituiti da
sette ampi blocchi sparsi sia sul braccio corto che su quello lungo del
cromosoma, coprono una lunghezza di circa 10,2 Mb. Il 60% di queste
sequenze hanno unidentit intracromosomica pari al 99,9% o pi. In
altre parole, molto difficile distinguere queste sequenze luna dallaltra.
Unaltra caratteristica che queste sequenze sono palindromiche, presentano cio una sequenza identica ma invertita. Otto ampie palindromi
occupano 5,7 Mb del braccio lungo del cromosoma e per lo meno sei di
queste contengono geni coinvolti nella formazione del testicolo.
antropologia molecolare
19
20
il genoma umano
antropologia molecolare
21
22
il genoma umano
antropologia molecolare
23
donando per lanalisi del cromosoma Y il loro sangue. Per quanto riguarda
la famiglia Hemings lanalisi stata condotta sui discendenti del figlio
di Sally Hemings, Eston Hemings. Eston infatti ebbe due figli maschi
ed una figlia, il suo figlio pi giovane, Beverly, ebbe un figlio Carl-Smith
che a sua volta ebbe due figli, solo uno dei quali ebbe un figlio maschio di
nome John Weeks. Questultimo, nato nel 1946, stato utilizzato come
campione di confronto per la famiglia Hemings (Fig. 1.10).
Figura 1.10. Esempio di genealogia del cromosoma Y.
In questo studio diversi sono stati i campioni ulteriori che sono stati
raccolti per essere utilizzati come controlli e per cercare di risolvere la
controversa questione della paternit. Uno di questi campioni aggiuntivi
fu quello di un discendente di Thomas Woodson, primogenito di Sally
Hemings. Oggi i discendenti infatti di questo sono in un numero superiore
a 1400 e sono sparsi per tutti gli Stati Uniti. Secondo la tradizione orale
della famiglia Woodson, Thomas era il figlio pi grande di Sally e del
Presidente. Dal momento che non cerano documenti che supportassero
la pretesa della famiglia Woodson, si prelevarono anche campioni di sangue di cinque discendenti ancora in vita di Thomas Woodson in modo da
poter aiutare a confermare o confutare ci che la famiglia si tramandava
di generazione in generazione. Per lo studio furono utilizzati anche tre
campioni di discendenti della linea maschile dei nipoti di Thomas Jefferson, figli cio della sorella in quanto alcune testimonianze indicavano
i nipoti come possibili padri dei figli di Sally Hemings e di sua sorella.
Infine vennero prelevati anche cinque campioni di discendenti per linea
maschile da diverse vecchie famiglie della Virginia utili come campioni di
24
il genoma umano
confronto. Questi campioni sono stati inseriti nello studio per fornire il
segnale di background, con lidea che le potenziali similarit riscontrate
nellanalisi del cromosoma Y dovute alla vicinanza geografica dovessero
essere eliminate. I risultati ottenuti da questo studio sono riportati nella
tabella 1.3.
Come si evince dalla tabella, tutti le 19 regioni del cromosoma Y
analizzate dai discendenti della famiglia Jefferson sono perfettamente
compatibili con i profili ottenuti dai discendenti di Eston Hemings. Questo
risultato stato interpretato dai ricercatori come la prova che il Presidente
Tabella 1.3. Risultati dello studio sui discendenti di Jefferson.
Marcatori
studiati
Numero di
individui
tipizzati
Y-STR loci
DYS19
DYS388
DYS389A
DYS389B
DYS389C
DYS389D
DYS390
DYS391
DYS392
DYS393
DXYS156Y
Y-SNP loci
DYS287
(YAP)
SRYm8299
DYS271
(SY81)
LLY22g
Tat
92R7
SRYm1532
Minisatellite
MSY1
15
12
4
11
3
9
11
10
15
13
7
Linea maschile
nipoti
Presidente
Linea maschile
Thomas
Woodson
15
14
12
12
4
5
11
12
3
3
9
10
11
11
10
10
15
13
13
13
7
7
(0 = allele ancestrale; 1 = allele derivato)
14
12
5
11
3
10
11
13
13
13
7
0
0
0
1
0
0
0
1
0
0
1
1
0
0
1
1
(3)-5
(1)-14
(3)-32
(4)-16
(3)-5
(1)-14
(3)-32
(4)-16
(1)-17
(3)-36
(4)-21
(1)-16
(3)-27
(4)-21