Professional Documents
Culture Documents
Aderncia e Independncia
1
1. Testes de Aderncia
Objetivo: Testar a adequabilidade de um modelo
probabilstico a um conjunto de dados observados.
Exemplo 1: Segundo Mendel (geneticista famoso), os resultados
dos cruzamentos de ervilhas amarelas redondas com ervilhas
verdes enrugadas ocorrem na proporo de 9:3:3:1, ou seja,
seguem uma distribuio de probabilidades dada por:
Resultado Amarela Amarela Verde Verde
redonda enrugada redonda enrugada
Probabilidades: AR AE VR VE
(de Mendel) 9/16 3/16 3/16 1/16
3
No experimento, 556 ervilhas foram classificadas segundo o
tipo de resultado, fornecendo a tabela a seguir:
Tipo de Frequncia
resultado observada
AR 315
AE 101
VR 108
VE 33
Total 556
4
Se o modelo probabilstico for adequado, a frequncia
esperada de ervilhas do tipo AR, dentre as 556 observadas,
pode ser calculada por:
556 x P(AR) = 556 x 9/16 = 312,75
6
Testes de Aderncia Metodologia
Considere uma tabela de frequncias, com k 2 categorias de
resultados:
Frequncia
Categorias
Observada
1 O1
2 O2
3 O3
k Ok
Total n
7
Seja pi a probabilidade associada categoria i, i = 1,..., k.
O objetivo do teste de aderncia testar as hipteses
Ei = n poi, i = 1, ...,k
8
Expandindo a tabela de frequncias original, temos
Frequncia Frequncia
Categorias
observada esperada, sob H
1 O1 E1
2 O2 E2
3 O3 E3
k Ok Ek
Total n n
i 1 Ei 9
k
( O E ) 2
2 i i Estatstica do
Ei teste de aderncia
i 1
Supondo H verdadeira,
k
(O E )2
2 i i
~ q2 , aproximadamente,
i 1 Ei
sendo que q = k - 1 representa o nmero de graus de
liberdade.
obs
2
12
Resultado Oi Ei
AR 315 312,75
AE 101 104,25
VR 108 104,25
VE 32 34,75
Total 556 556
Clculo do valor da estatstica do teste (k = 4):
(Oi Ei ) 2 (315 312,75) 2 (101 104,25) 2 (108 104,25) 2 (32 34,75) 2
4
2
obs
1 Ei 312,75 104,25 104,25 34,75
0,016 0,101 0,135 0,218 0,470.
Usando a distribuio de qui-quadrado com q = k-1 = 3 graus de
liberdade, o nvel descritivo calculado por P P ( 32 0,470) 0,925.
Concluso: Para a = 0,05, como P = 0,925 > 0,05, no h
evidncias para rejeitarmos a hiptese H0, isto , ao nvel de
significncia de 5%, conclumos o modelo de probabilidades de
Mendel se aplica aos resultados do experimento.
13
O clculo do nvel descritivo P pode ser feito no Rcmdr,
via menu, atravs do seguinte caminho:
14
Exemplo 2: Deseja-se verificar se o nmero de acidentes em
uma estrada muda conforme o dia da semana. O nmero de
acidentes observado para cada dia de uma semana
escolhida aleatoriamente foram:
Dia da No. de
semana acidentes
Seg 20
Ter 10
Qua 10 O que pode ser dito?
Qui 15
Sex 30
Sab 20
Dom 35
15
Hipteses a serem testadas:
18
2. Testes de Independncia
Objetivo: Verificar se existe independncia entre duas variveis
medidas nas mesmas unidades experimentais.
Tipo de Jornal
Grau de instruo Jornal A Jornal B Jornal C Outros Total
1o Grau 10 8 5 27 50
2o Grau 90 162 125 73 450
Universitrio 200 250 220 130 800
Total 300 420 350 230 1300
19
Vamos calcular propores segundo os totais das colunas
(poderiam tambm ser calculadas pelos totais das linhas). Temos
a seguinte tabela:
Tipo de Jornal
Grau de
Jornal A Jornal B Jornal C Outros Total
instruo
1o Grau 3,33% 1,90% 1,43% 11,74% 3,85%
o
2 Grau 30,00% 38,57% 35,71% 31,74% 34,62%
Universitrio 66,67% 59,52% 62,86% 56,52% 61,54%
Total 100,00% 100,00% 100,00% 100,00% 100,00%
A \ B B1 B2 ... Bs Total
A1 O11 O12 ... O1s O1.
A2 O21 O22 ... O2s O2.
... ... ... ... ... ...
Ar Or1 Or2 ... Ors Or.
Total O.1 O.2 ... O.s n
2
ij ij
i 1 j 1
Eij
Supondo H0 verdadeira,
r s (O E )2
2 ij ij
~ q2
i 1 j 1 Eij
aproximadamente, sendo q = (r 1)(s 1 ) o nmero de
graus de liberdade. 23
Regra de deciso:
Pode ser baseada no valor P (nvel descritivo), neste caso
P P( q2 obs
2
),
em que obs o valor calculado, a partir dos dados,
2
Graficamente:
obs
2
29
Exemplo 4: 1237 indivduos adultos classificados segundo a
presso sangunea (mm Hg) e o nvel de colesterol (mg/100cm3).
Presso
Colesterol Total
< 127 127 a 166 > 166
< 200 117 168 22 307
200 a 260 204 418 63 685
> 260 67 145 33 245
Total 388 731 118 1237
Hipteses:
H0 : Presso sangunea e nvel de colesterol so independentes;
H1 : Nvel de colesterol e presso sangunea so variveis dependentes
30
Rcmdr: Estatsticas Tabelas de Contingncia Digite e analise tabela
de dupla entrada
Sada do Rcmdr: data: .Table
X-squared = 13.5501, df = 4, p-value = 0.008878
32
Funcionrio Metodologia Conceito
Dados: 1
2
MA
MA
A
B
3 MB A
4 MB B
5 MA A
6 MA B
7 MA C
8 MB B
9 MB B
10 MA B
11 MB C
12 MB A
13 MB B
14 MB A
15 MB C
16 MA A
17 MA B
18 MB C
19 MA C
20 MB C
21 MB A
22 MA C
23 MB C
24 MA A
25 MA B
26 MB B
27 MA A
28 MB C
29 MA A
30 MA B
31 MA A
32 MA A
33 MB B
34 MB B
35 MA A
36 MA A
37 MA A
38 MB B
39 MB C 33
40 MB C
Rcmdr: Construo da tabela de contingncia (ou tabela de
frequencias conjuntas)
34
Sada do Rcmdr:
> .Table Metodologia
Conceito MA MB
A 11 4
B 6 8
C 3 8
> rowPercents(.Table) # Row Percentages
Metodologia
Conceito MA MB Total Count
A 73.3 26.7 100 15
B 42.9 57.1 100 14
C 27.3 72.7 100 11