You are on page 1of 8

Esercitazioni di Statistica

Analisi delle distribuzioni doppie:dipendenza

Prof. Livia De Giovanni ldegiovanni@luiss.it Dott. Flaminia Musella fmusella@uniroma3.it

Esercizio 1 La seguente tabella riporta il numero di impiegati, per settore (X) e genere (Y), in un certo comune. X/Y M F Agricoltura 1400 760 Industria 7300 1600 Servizi 5100 4700 Calcolare 1. Le distribuzioni marginali ni. , n.j ; 2. Le frequenze relative congiunte fij ; 3. Le distribuzioni di frequenza marginali relative fi. , f.j ;

Soluzione 1. Per ciascuna modalit xi del carattere X, la frequenza marginale ni. si ottiene sommando le frequenze congiunte che si trovano sulla riga corrispondente. Analogamente le frequenze marginali n.j per ciascuna modalit yi del carattere Y, si ottengono sommando le frequenze congiunte che si trovano sulla colonna corrispondente,

ni. =
j=1 3

nij

n.j =
i=1

nij

M F Totale Agricoltura 1400 760 1400+760=2160 Industria 7300 1600 8900 Servizi 5100 4700 9800 Totale 13800 7060 20860 Le frequenze marginali per i due caratteri sono riportate nellultima riga (n.j per il genere) e nellultima colonna (ni. per il settore di appartenenza) della tabella sopra. 2. Le frequenze relative congiunte si ottengono dividendo le frequenze assolute congiunte per la numerosit N = 20860 fij = nij /N, come da tabella sotto. M F Agricoltura 1400/20860=0.067 0.036 Industria 0.350 0.077 Servizi 0.244 0.225

3. Per ciascuna modalit, le frequenze marginali relative fi. , f.j si ottengono in modo analogo rispetto alle frequenze marginali (punto a)): M F Totale Agricoltura 0.067 0.036 0.103 Industria 0.350 0.077 0.427 Servizi 0.244 0.225 0.470 Totale 0.661 0.338 1

Esercizio 2 La seguente tabella riporta il numero di componenti X ed il numero di televisori posseduti Y per un collettivo di famiglie: X/ Y 0 1 2 1-2 0 0 10 3-4 5 20 10 5 o pi 0 5 5 Calcolare a) le distribuzioni marginali della X e della Y; b) la distribuzione condizionata secondo il numero di televisori posseduti associata alla modalit 3-4 del carattere numero di componenti; c) le distribuzioni condizionate del carattere Y espresse in percentuale; d) lindice relativo . Soluzione a) Per ciascuna modalit xi del carattere X, le frequenze marginali si trovano sommando le frequenze congiunte che si trovano sulla riga corrispondente. In modo analogo, per ciascuna modalit yi del carattere Y le frequenze marginali si trovano sommando le frequenze congiunte che si trovano nella colonna corrispondente. Le distribuzioni marginali della X e della Y si trovano rispettivamente nellultima colonna e lultima riga della tabella sotto. X/ Y 0 1 2 1-2 0 0 10 3-4 5 20 10 5 o pi 0 5 5 Totale 5 25 25

10 35 10 55

b) La distribuzione condizionata del numero di televisori associata alla modalit 3-4 del carattere numero dei componenti si ottiene considerando linsieme delle unit della distribuzione numero di televisori posseduti che presentano 3-4 componenti in famiglia. X/ Y 3-4 0 1 2 Totale 5 20 10 35

c) Le distribuzioni condizionate percentuali si ottengono sostituendo alle frequenze assolute quelle percentuali calcolate ponendo uguale a 100 il totale di riga.

X/ Y 1-2 X/ Y 3-4

0 1 2 Totale (0/10)*100=0 (0/10)*100=0 (10/10)*100=100 100

0 1 2 Totale (5/35)*100=14.3 (20/35)*100=57.1 (10/35)*100=28.6 100

X/ Y 0 1 2 Totale 5 o pi (0/5)*100=0 (5/10)*100=50.0 (10/35)*100=50.0 100 d) Lindice si calcola a partire da una tabella di contigenza ed interpretabile come la media quadratica delle contingenze con pesi pari a nij . Le contingenze sono quei valori cij ottenuti nel modo seguente: nij nij nij 1 N
s t

cij = =

i=1 j=1

(nij nij )2 nij

Le nij sono le frequenze congiunte che si avrebbero nel caso di indipendenza. Queste sono anche dette frequenze interne della tabella di indipendenza e si trovano nel modo seguente: ni0 n0j N

nij =

La tabella di indipendenza sar quindi la seguente: X/ Y 0 1 2 1-2 (5*10)/55=0.909 (25*10)/55=4.545 4.545 3-4 (5*35)/55=3.182 15.909 15.909 5 o pi 0.909 4.545 4.545 Lindice ora calcolabile:

= + +

1 (0 0.909)2 (0 4.545)2 (10 4.545)2 (5 3.182)2 + + + + 55 0.909 4.545 4.545 3.182 1 (20 15.909)2 (10 15.909)2 (0 0.909)2 (5 4.545)2 + + + + 55 15.909 15.909 0.909 4.545 1 (5 4.545)2 = 0, 56 55 4.545

Esercizio 3 Con riferimento alla seguente distribuzione di un collettivo di individui secondo il Sesso X e lOccupazione Y , calcolare lindice relativo e lindice 2 . X/ Y Femmine Maschi Totale Occupati 100 300 400 Disoccupati 50 400 450 Totale 150 700 850

Soluzione Si procede in modo del tutto analogo allesercizio precedente per il calcolo la tabella di indipendenza e dellindice X/ Y Femmine Maschi Occupati 70.588 329.412 Disoccupati 79.412 370.588

= 0.18 Un altro indice per misurare lindipendenza il 2 . Questo, come , uguale a 0 nel caso di indipendenza. Tale indice calcolabile nel seguente modo:

2 =
i=1 j=1

(nij nij )2 = N 2 nij

Per questo possibile ottenere 2 sfruttando la relazione con

2 = 850 0.182 = 28.11

Esercizio 4 Completare la seguente tabella doppia sapendo che i due caratteri X e Y sono indipendenti X/ Y A B C Totale M 10 1 52 26 F 20

Soluzione In una tabella di contingenza il carattere Y statisticamente indipendente dal carattere X se le distribuzioni condizionate percentuali sono uguali tra loro. Una tabella di questo tipo detta di indipendenza e le sue frequenze interne nij sono date dalla relazione; nij = ni0 n0j N

Poich nella tabella da completare i caratteri X e Y sono indipendenti le frequenze mancanti dovranno soddisfare la relazione precedente. Per prima cosa, quindi, occorre calcolare la distribuzione marginale della X. La frequenza marginale della X nella i-esima riga ni0 sar data da: nij N n0j

ni0 =

Ad esempio, la frequenza marginale di X nella prima riga della tabella, conoscendo la frequenza n12 = 20, sar data dalla seguente relazione: n12 N = n02 20 78 = 60 = 26

n10 =

La frequenza marginale della X nella seconda riga della tabella, conoscendo la frequenza n21 = 10, sar invece pari a: n21 N = n01 10 78 = = 15 52

n20 =

Stesso procedimento vale per il calcolo della frequenza marginale della X nella terza riga della tabella, conoscendo la frequenza n32 = 1. n30 = n32 N = n02 10 78 = =3 52 6

X/ Y A B C Totale

Totale 60 10 15 1 3 52 26 78

F 20

Ne segue che la tabella completa della distribuzione marginale della X sar: Una volta ottenute la distribuzione di frequenza marginale della X si pu procedere con il calcolo delle frequenze mancanti nella tabella. La tabella completa riportata a seguire. X/ Y A B C Totale M F Totale 40 20 60 10 5 15 2 1 3 52 26 78

Esercizio 5 Si consideri la seguente distribuzione di un collettivo di individui secondo la presenza di un disturbo psicologico X e let Y . X/ Y si no Totale a) Calcolare lindice chi quadrato; b) calcolare una misura normalizzata della dipendenza tra X e Y; c) ridistribuire le frequenze in modo da avere massima dipendenza tra le variabili. <40 40 Totale 12 2 14 4 12 16 16 14 30

Soluzione a) Lindice 2 calcolabile a partire dalla tabella di contingenza. Anche in questo caso necessario calcolare la tabella di indipendenza. X/ Y si no <40 40 7.5 6.5 8.5 7.5

=
i=1 j=1

(nij nij )2 = nij

(12 7.5)2 (2 6.5)2 (4 8.5)2 (12 7.5)2 = 11.06 + + + 7.5 6.5 8.5 7.5 7

b) Sfruttando la relazione 2 = N 2 possiamo ottenere come radice quadrata del rapporto tra 2 e N : = 2 = N 11.06 = 0.37 = 0.61 30

Una misura normalizzata di dipendenza data dal rapporto

Cy =

0.61 = = 0.61 1 t1

c) Si raggiunge la massima dipendenza nel caso in cui in una tabella di contingenza i valori delle celle sono tutti nulli tranne uno che uguale al totale di riga. Ne segue che si possono vericare due possibili scenari in cui esiste una dipendenza perfetta: X/ Y si no Totale Oppure X/ Y si no Totale <40 40 Totale 14 0 14 0 16 16 14 16 30 <40 40 Totale 0 14 14 16 0 16 14 16 30

You might also like