Professional Documents
Culture Documents
Mtodos No-Paramtricos
Isabel Fraga Alves
Departamento de Estatstica e Investigao
Operacional
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
2
Programa
Introduo
Anlise de Dados Categorizados
Teste do Qui-Quadrado
Teste de Ajustamento
Tabelas de Contingncia
Teste de Independncia
Teste de Homogeneidade
Estatstica No-Paramtrica
Introduo: O problema geral da localizao relativo a 2 amostras
Amostras emparelhadas
Teste dos Sinais (pequenas e grandes amostras)
Teste de Wilcoxon (pequenas e grandes amostras)
Uso das Ordens para Comparar Populaes: Amostras Independentes
2 Populaes: O Teste de Mann-Whitney (pequenas e grandes amostras)
Mais de 2 Populaes:
O Teste de Kruskal-Wallis (pequenas e grandes amostras)
Teste de Friedman (pequenas e grandes amostras)
Uso das Ordens para Testar Independncia e Aleatoriedade
Teste de Spearman (pequenas e grandes amostras)
Teste dos Runs para Aleatoriedade (pequenas e grandes amostras)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
3
Bibliografia
CONOVER, W. J. (1999) - Practical Nonparametric Statistics, 3rd ed. Wiley.
DANIEL, W. W. (1990) - Applied Nonparametric Statistics, 2nd ed. PWS-Kent.
Graa Martins, M. E. (2005) Introduo Probabilidade e Estatstica Com
complementos de Excel, SPE.
DeGroot, Morris H. - Probability and statistics (1986 ) - 2nd ed Massachusetts Addison-
Wesley.
Pestana e Velosa (2006) - Introduo Probabilidade e Estatstica, I, Fundao
Gulbenkian. 2 ed.
SIEGEL, S. and Castellan, N. Y. (1988) - Nonparametric Statistics for the Behavioral
Sciences. McGraw-Hill.
* Wackerly, D., Mendenhall, W. and Scheaffer, L. (2007)
Mathematical Statistics with Applications. Duxbury Press; 7th ed.
* Manual Recomendado para consulta das Tabelas ao longo dos slides.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
4
Introduo
O que a Estatstica ?
Estudo da Incerteza
Como a quantificar? Que podemos fazer com ela?
As experincias repetidas
sob o que pensamos serem as condies
no resultam sempre da mesma forma!
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
5
Tipos de Experincias
Causais ou Determinsticas
Ex: Deixar cair uma pedra no rio
Aleatria ou Estocstica
Ex: O Tempo que vou Esperar pelo Autocarro
Como posso prever o resultado?
Com Estatstica quantificamos e medimos o imprevisvel!
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
6
Estatstica: produz afirmaes numricas relativamente a
situaes sujeitas a INCERTEZA.
Exemplos:
Quem ir ganhar as prximas eleies?
Estaro os clientes da PT satisfeitos com o servio
prestado?
Qual das duas pastas dentfricas mais eficiente que a
outra para prevenir as cries?
Qual a previso da quantidade de precipitao para o
prximo inverno?
Aps a monitorizao de pacientes com doenas
cardacas, como decidir acerca dos factores que
afectam a sua sade ?
2
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
7
Como e Que Respostas ?
Para responder a estas perguntas frequentemente usamos modelos
probabilsticos, que so modelos matemticos para lidar com incerteza.
So recolhidos Dados para explorar uma Populao, o objectivo
de nosso estudo.
Quando recolhida uma amostra grande necessrio produzir resumos
das informaes nela contidas. Existem ferramentas grficas e numricas
que so normalmente utilizadas pelos estatsticos
AMOSTRA
Estatstica Descritiva
Inferncia Estatstica - faz generalizaes vlidas para a Populao,
a partir de Amostras.
(enquanto na Previso - apresentada uma afirmao sobre o Futuro.)
Dados - observaes de determinadas quantidades de interesse.
Variveis - incerteza acerca dos seus verdadeiros valores.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
8
Tipos de Variveis
VARIVEL
QUALITATIVA QUANTITATIVA
DISCRETA
NOMINAL ORDINAL
CONTNUA
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
9
Tipos de Variveis (cont.)
QUANTITATIVA vs. QUALITATIVA : variveis com /
sem representao numrica e ordenao natural
nica (por exemplo, a presso arterial versus religio).
DISCRETA vs. CONTNUA: variveis quantitativas
com / sem lacunas conceptuais entre os seus valores
(por exemplo, nmero de crianas numa famlia versus
presso arterial).
ORDINAL vs. NOMINAL: variveis qualitativas com
/ sem ordenao (eventualmente no nica) dos seus
valores (a satisfao do cliente versus religio).
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
10
De modo geral,
as variveis qualitativas esto mais ligadas aos
modelos no-paramtricos
enquanto que
as variveis quantitativas aos modelos
paramtricos.
Tipos de Variveis (cont.)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
11
As variveis qualitativas podem ainda ser classificadas de acordo com:
VARIVEL CATEGORIZADA (Categrica, Nominal ou de Classe)
nomes das pessoas ou coisas; as letras do alfabeto; o sexo, masculino ou feminino,
macho ou fmea; o estado civil, solteiro, casado, divorciado, vivo; o curso, primrio,
secundrio, colegial, universitrio, ps-graduao, etc.
Representa o nvel mais simples e mais elementar de medio. Os indivduos de uma
populao ou amostra so medidos mediante uma certa caracterstica que pode ser
categoria, nome ou classe.
Caractersticas binrias ou dicotomizadas:
presente ou ausente, 1 ou 0, positivo ou negativo, vivo ou morto, sim ou no, benigno
ou maligno, etc.
Essas caractersticas so mutuamente exclusivas, isto , cada indivduo s pode se enquadrar
em um nico nome, categoria ou classe, e tambm so exaustivas, pois devem atingir todos os
indivduos da populao ou amostra em estudo, sem excepo.
A varivel categrica qualitativa e no se presta aos clculos aritmticos
comuns: soma, subtraco, multiplicao e diviso.
Apresenta as seguintes propriedades de equivalncia (=): reflexiva (x=x); simtrica
(x=y ento y=x); transitiva (x=y e y=z ento x=z).
Tipos de Variveis (cont.)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
12
VARIVEL ORDINAL
no alfabeto, A,B,C,D ou D,C,B,A; em nmeros de ordem, 1,2,3 ou 3,2,1; no
sexo, F,M ou M,F; no curso, primrio- secundrio-superior ou superior-
secundrio-primrio; em uma quantificao, leve-moderado-intenso ou intenso-
moderado-leve; em cruzes, +,++,+++,++++ ou ++++,+++,++,+; na ordenao
de dados numricos, 11,18,23,29,35 ou 35,29,23,18,11; etc.
Os indivduos de uma populao ou amostra so classificados de acordo
com as diversas categorias de uma determinada caracterstica e em
seguida so ordenados. Esta ordenao pode ser crescente ou
decrescente, ou igualmente, ascendente ou descendente.
A varivel ordinal tambm qualitativa.
Sabe-se que um indivduo ou coisa maior ou menor do que outro, porm no se
sabe o quanto maior nem o quanto menor. So comuns as expresses
comparativas: maior, menor; superior, inferior; primeiro, ltimo; mais intenso,
menos intenso; mais alto, mais baixo; prefervel; etc.
Na escala ordinal utilizam-se as comparaes maior do que (>) e menor do
que (<). As operaes aritmticas comuns (adio, subtraco,
multiplicao e diviso) no so aplicveis.
Na ordenao, a relao maior do que (>) apresenta a propriedade transitiva (se x>y e
y>z ento x>z).
Tipos de Variveis (cont.)
3
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
13
VARIVEL INTERVALAR
os valores de idade, altura, peso, presso arterial, frequncia cardaca, exames
laboratoriais, medidas diversas, etc.
A escala intervalar verdadeiramente quantitativa. A medio feita
directamente em nmeros reais, obtidos mediante a comparao com um
determinado valor fixo, denominado unidade. O nome intervalar est
ligado aos intervalos entre as categorias da varivel e aqui se sabe
exactamente o quanto uma categoria menor ou maior que outra,
ou ainda se h igualdade entre elas.
As operaes aritmticas comuns (soma, subtraco, multiplicao e
diviso) so aplicveis.
A varivel intervalar rene todas as propriedades dos dois tipos anteriores
de mensurao: as de equivalncia (=), reflexiva (x=x), simtrica (x=y
ento y=x) e transitiva (x=y e y=z ento x=z) e a de ordenao (>),
transitiva (x>y e y>z ento x>z).
Tipos de Variveis (cont.)
ESTATSTICA NO
PARAMTRICA
Extremamente interessante para
anlises de dados qualitativos.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
15
MEDIDAS DE TENDNCIA CENTRAL - Localizao
Mdia
Mediana
Moda
Mdia Amostral - a soma de
todos os valores de uma amostra
dividida pelo n de elementos da
amostra (dimenso).
aplicada em variveis quantitativas.
A mdia amostral a
contrapartida emprica do Valor
Mdio da Populao ou da
Varivel, .
1
1
n
i
i
X X
n
=
=
1 2
( . .) - , , ,
n
amostra aleatoria a a X X X
1 2
- , , ,
n
amostra observada x x x
1
1
n
i
i
x x
n
=
=
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
16
Mediana Amostral - o valor da
amostra que ocupa a posio central,
quando todos os valores esto
ordenados em ordem crescente ou
decrescente.
Se n for mpar, a mediana ( Med )
ser o valor que ocupa a posio
central na amostra ordenada. Esta
posio pode ser calculada por
(n+1)/2.
Se n for par, a Med ser calculada
pela mdia aritmtica dos dois valores
centrais na amostra ordenada da
amostra. A posio de cada um desses
dois valores centrais pode ser
calculada por n/2 e n/2+1.
A Mediana muito utilizada nos
clculos no-paramtricos.
MEDIDAS DE TENDNCIA CENTRAL - Localizao
1
:
2
: 1:
2 2
1
2
n
n
n n
n n
x n impar
Med
x x n par
+
+
=
+
`
)
1: 2: :
ordenada -
n n n n
amostra observada
x x x s s s
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
17
MEDIDAS DE TENDNCIA CENTRAL - Localizao
Moda - o valor da
varivel que
corresponde
frequncia mxima.
A moda pode ter um
ou mais valores,
unimodal, bimodal,...,
multimodal, conforme
existam uma, duas, ou
mais frequncias iguais,
dos valores da varivel.
Dados:
25, 22, 28, 32, 35, 55, 83, 83, 98, 99, 43, 46, 51
(n=13)
mdia
mediana
moda
53.9 x =
1 2
-
( , , , )
(25, 22, 28, 32, 35, 55, 83, 83, 98, 99, 43, 46, 51 )
n
amostra observada
x x x =
1: 2: :
ordenada -
(22, 25, 28, 32, 35, 43, 46, 51, 55, 83, 83, 98, 99)
n n n n
amostra observada
x x x s s s =
46 Med =
83 Mo =
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
18
Localizao: Mediana vs. Mdia
Razes para usar a mediana:
menos influenciada por valores extremos
Se as distribuies so simtricas, a mdia e a
mediana populacional coincidem
Mdia vs. Mediana
5 6 6 7 7 8 10
Mdia = 7 Med = 7
5 6 6 7 7 8 50
Mdia = 8.43 Med = 7
4
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
19
Distinguir
Metodologias Paramtricas
&
Metodologias No-Paramtricas
Explicar uma
Variedade de Testes No-Paramtricos
Resolver
Problemas de Testes de Hipteses usando Testes No-
Paramtricos
Objectivos do Curso
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
20
Quadro Geral
At este ponto, todos os testes que tm utilizado esto
sujeitos a suposies sobre a distribuio subjacente aos
dados. Especificamente, assumido que os dados so normais
para usar o teste-t, por exemplo.
Poder-se-ia usar a teoria de grandes amostras e o Teorema
do Limite Central, mas isso ainda apenas se verifica
Assintoticamente
O que que acontece se no estamos dispostos ou no sensato
fazer as suposies de normalidade sobre a distribuio subjacente
e temos uma amostra de dimenso pequena ?
n
TESTE DE HIPTESES
Trata-se de uma tcnica para se
fazer a inferncia estatstica sobre
uma populao a partir de uma
amostra
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
22
E muitos mais!
Testes de Hipteses - Metodologias
Teste de
Hipteses -
metodologias
No-Paramtricas Paramtricas
Teste - z
Teste
Kruskal-Wallis
Teste
Wilcoxon
Teste - t ANOVA
etc
etc
Amostra emparelhada
Teste-t
emparelhado
Testes de Hipteses - Metodologias
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
24
Estatstica No-Paramtrica
Muitos dos testes estatsticos no-paramtricos
respondem mesma srie de questes tal como os
testes paramtricos.
Com testes no-paramtricos as hipteses podem ser
flexibilizadas consideravelmente.
Por conseguinte, so utilizados mtodos no-paramtricos
para situaes que violem os pressupostos de procedimentos
paramtricos.
5
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
25
Testes Paramtricos
Testes Paramtricos
Incidem explicitamente sobre um ou mais parmetros de uma
ou mais populaes;
A distribuio de probabilidades da estatstica de teste pressupe
uma forma particular das distribuies populacionais;
As varincias so homogneas;
Os erros ou resduos so aleatrios e independentes e tm
distribuio normal com varincia finita e constante.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
26
Testes No-Paramtricos
Testes No Paramtricos
Requerem menos pressupostos em relao
populao;
No exigem normalidade;
No se baseiam em parmetros da distribuio (logo, no
necessitam varincias homogneas);
Ligeiramente menos eficientes que os testes
paramtricos;
Baseiam-se nas estatsticas ordinais (e no nos
valores das observaes);
Mais fceis de aplicar.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
27
Testes No-Paramtricos
Poucos Pressupostos Relativos Populao
Facilidade de implementao
Maior Perceptibilidade
Aplicvel em Situaes No Abrangidas Pela Normal
Mais Eficientes quando as Populaes no tm Distribuio Normal
Os resultados podem ser to exactos como nos procedimentos paramtricos
Vantagens
As hipteses testadas por testes no-paramtricos tendem a ser
menos especficas;
No tm Parmetros, Dificultando Comparaes Quantitativas
entre Populaes
Escasso Aproveitamento de Informao da Amostra
Pode ser de Difcil Clculo mo para Grandes Amostras
Tabelas no amplamente disponveis
Desvantagens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
28
No incorpora as suposies restritivas, caractersticas dos
testes paramtricos.
Os dados no precisam estar normalmente distribudos
(Distribution-Free). necessrio, apenas, que eles sejam
ordenveis.
Muitas vezes, so baseados nas ordens das observaes e no
nos seus valores, como no caso paramtrico.
Podem ser aplicados para variveis quantitativas e qualitativas.
Menos sensveis aos erros de medida e rpidos para pequenas
amostras.
Estatstica No-Paramtrica - Distribuio Livre
TESTE DE HIPTESES
Trata-se de uma tcnica para se
fazer a inferncia estatstica sobre
uma populao a partir de uma
amostra
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
30
PRINCIPAIS CONCEITOS
HIPTESE ESTATSTICA
Trata-se de uma suposio quanto ao valor de um parmetro
populacional, ou quanto natureza da distribuio de
probabilidade de uma varivel populacional.
TESTE DE HIPTESES
uma regra de deciso para rejeitar ou no rejeitar uma
hiptese estatstica com base nos elementos amostrais
6
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
31
TEORIA POPPERIANA - Falseabilidade (ou refutabilidade)
Science can't prove anything. It can only disprove things.
A cincia no pode provar nada. S pode refutar coisas.
Considere o exemplo do famoso Cisne Negro (black swan):
Um cientista gasta sua vida observando cisnes. Observa que todos
os cisnes que jamais viu so brancos. Com base nesta evidncia
emprica, ele postula uma teoria de que todos os cisnes so
brancos.
Um dia viaja para a Austrlia e v - UPS! - um Cisne Negro.
A sua teoria refutada. Mas isso no significa que no era
cincia quando a estabeleceu. Agora, pode estabelecer uma teoria
nova: Os cisnes podem ser brancos ou pretos.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
32
Karl Popper(1902- 1994) - UM FILSOFO INOVADOR
Sir Karl Raimund Popper foi filsofo da cincia austraco naturalizado
britnico e um professor da London School of Economics.
Formou-se em matemtica, fsica e filosofia da cincia britnica.
Uma das pessoas mais influentes da filosofia da Cincia durante o sculo
XX.
POPPER E A REFUTAO
Uma hiptese s cientfica se puder ser colocada em questo
(refutada).
Isto significa que deve ser sempre possvel realizar uma observao
que prove que a hiptese falsa
Uma teoria cientfica no poder em nenhuma circunstncia ser
declarada verdadeira
A teoria cientfica mais no do que uma hiptese; uma conjectura, que um dia ser
refutada e substituda por uma outra.
What really makes science grow is new ideas, including false ideas. Karl Popper
S APRENDEMOS QUANDO ERRAMOS.
OS ESTATSTICOS NO PERGUNTAM QUAL A PROBABILIDADE DE ESTAREM CERTOS,
MAS A PROBABILIDADE DE ESTAREM ERRADOS.
Para fazerem isso estabelecem uma hiptese nula.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
33
Data Analysis and Research for Sport and Exercise Science: A Student Guide
By Craig Williams, Chris Wragg, Routledge ed., 2003. pag 6
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
34
PRINCIPAIS CONCEITOS
TIPOS DE HIPTESES
H
0
, hiptese nula, a hiptese estatstica a ser testada
H
1
, hiptese alternativa
A HIPTESE NULA UMA AFIRMAO DE COMO O MUNDO
DEVERIA SER, SE NOSSA SUPOSIO ESTIVESSE ERRADA.
Ex: A hiptese nula expressa uma igualdade, enquanto a
hiptese alternativa dada por uma desigualdade.
0 1
: 1.5 . : 1.5 H m vs H m = =
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
35
Testes de Hipteses Erros
EXISTEM DOIS TIPOS DE ERRO:
Erro tipo 1 - rejeio de uma hiptese nula verdadeira
Erro tipo II no rejeio de uma hiptese nula falsa
no rejeiao no rejeio
A probabilidade o do erro tipo I denominada
nvel de significncia do teste.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
36
Realidade
Deciso
H
0
verdadeira H
0
falsa
No rejeitar
H
0
Deciso
correcta
Erro tipo II
Rejeitar
H
0
Erro tipo I
Deciso
correcta
o = P( erro tipo I ) = P(rejeitar H
0
| H
0
verdadeira) = P(ET e RR | H
0
verd.)
nvel de significncia ou tamanho do teste
| = P(erro tipo II)= P(no rejeitar H
0
| H
0
falsa) = P(ET e RA | H
0
falsa)
1-| = potncia do teste Probabilidade de no cometermos um erro do tipo II
Testes de Hipteses Erros
ET:= Estatstica de Teste
RR:= Regio de Rejeio
RA:= Regio de No Rejeio
REGRA de TESTE: ETe RR ento Rejeitar H
0
7
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
37
p -Value
O resultado foi significativo?
Quo pequeno tem de ser o p-value, para se rejeitar a
hiptese nula?
Se p-value < 5 % estatisticamente significativo.
Se p-value < 1 % altamente significativo.
Os investigadores devem
resumir os dados,
dizer qual o teste usado e
reportar o p-value (em vez de apenas o comparar com os valores de 1 % ou 5 % )
No caso de se estabelecer partida o nvel de significncia o e se o
TESTE indicar a aceitao de H
0
, diz-se que
Ao nvel de significncia o no se pode rejeitar H
0 .
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
38
TIPOS DE TESTE
Qui-Quadrado
Teste dos Sinais
Teste de Wilcoxon
Teste de Mann-Whitney
Teste de Kruskal-Wallis
Teste de Spearman
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
39
TESTE DO QUI-QUADRADO- Teste de Independncia
Testes no paramtricos que medem o grau de dependncia entre
duas variveis aleatrias.
No assumem nenhum tipo de distribuio.
Assume observaes de frequncia de variveis categricas. As
variveis da amostra esto divididas em categorias.
As observaes das duas variveis so agrupadas em classes
independentes (disjuntas).
Tipicamente, os dados do teste esto representados em tabelas de
contingncia 2 x 2. No entanto podemos ter mais do que 2
dimenses.
Testes a estudar
Teste do
2
(qui-quadrado)
Teste exacto de Fisher
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
40
TESTE DO QUI-QUADRADO- Teste de Independncia
Dados bivariados (X
i
, Y
i
), i=1, ...,n, tendo (X, Y) f.d. conjunta
F(x,y) com marginais F
1
(x) = F(x,+) e F
2
(y)=F(+,y).
Pretendemos testar
H
0
: F(x,y)=F
1
(x) F
2
(y) (x,y)eR
2
vs. H
1
: F(x,y)F
1
(x) F
2
(y) para
algum (x,y)eR
2
Isto , face a uma amostra aleatria (X
i
, Y
i
), i=1,...,n,
pretendemos testar a independncia do par (X,Y).
Para obter a estatstica de teste comeamos por dividir o
suporte da varivel aleatria X em L classes A
1
, A
2
, ..., A
L
,
disjuntas e o suporte da varivel aleatria Y em C classes B
1
, B
2
,
..., B
C
, disjuntas.
Representemos por
N
ij
= # { (X
k
, Y
k
): X
k
e A
i
; Y
k
e B
j
},i=1,,L; j=1,,C.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
41
TESTE DO QUI-QUADRADO- Teste de Independncia
X\Y
B
1
B
2
B
j
B
C
A
1
N
11
N
12
N
1j
N
1C N
1 .
A
2
N
21
N
22
N
22
N
2C
N
2 .
A
i
N
i1
N
i2 N
ij
N
iC N
i .
A
L
N
L1
N
L2
N
L2
N
LC
N
L .
N
.1
N
. 2
N
. j
N
.C
N
..
=n
[ ; ]
ij i j
p P X A Y B = e e
.
.
[ ]
[ ]
i i
j j
p X A
p Y B
= e
= e
0 . . 1 . .
: , ( , ) . : ( , ),
ij i j ij i j
H p p p i j vs H i j p p p = - =
1
L
j ij
i
N N
-
=
=
1
C
i ij
j
N N
-
=
=
[ ; ]
ij i j
p P X A Y B = e e
. .
[ ] [ ]
i i j j
p X A p Y B = e = e
. . ij ij i j
e np np p = =
. . . .
. .
j i j i
ij ij i j
N N N N
e np np p n
n n n
= = = =
2
2 2
0 ( 1)( 1)
1 1
( )
, tem uma distribuio assinttica de um .
L C
ij ij
L C
i j ij
N e
X sob H
e
_
= =
1
2
( 1)( 1) L C
o
_
8
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
43
TESTE DO QUI-QUADRADO- Teste de Independncia
Regra prtica:
Como a distribuio da estatstica de teste assinttica,
convm que as clulas no tenham valores esperados
muito pequenos.
Como regra prtica, utiliza-se a seguinte:
No mximo, 20% das clulas podem ter frequncia esperada <5
e nenhuma clula deve ter frequncia esperada <1.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
44
TESTE DO QUI-QUADRADO- Teste de Independncia
Exemplo 6: Dependncia entre bairro e escolha do
sabor de pasta de dentes
Dados: H0: a preferncia pelo sabor
independente do bairro;
H1: a preferncia pelo sabor depende do
bairro
o = 5%
_
2
(L-1)(C-1)= _
2
(4-1)(3-1) = _
2
(6)
Frequncia esperada = (soma da linha i) x (soma da coluna j)/(total de observaes)
. .
i j
ij
N N
e
n
=
Sabor
Bairros
A B C
Limo 70 44 86 200
Chocolate 50 30 45 125
Hortel 10 6 34 50
Menta 20 20 85 125
150 100 250 500
2
2 2
0 ( 1)( 1)
1 1
( )
, tem uma distribuio assinttica de um .
L C
ij ij
L C
i j ij
N e
X sob H
e
_
= =
2
= (3534 3434.6)
2
/ 3434.6 + (1319 1418.4)
2
/ 1418.4 + + (252 152.6)
2
/ 152.6 = 101.35
Para o=0.05 temos
2
0.95
(1)(1)=3.84. Rejeitamos H
0
se
2
> 3.84 o que o caso.
Concluso: H evidncia de uma associao entre tipo de TB e sexo.
Observao: p-value < 0.00001.
Exemplo com tabela de contingncia 2 x 2
Homens Mulheres Total
TB no SR 3534 1319 4853
Outras TB 270 252 522
Total 3804 1571 5375
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
47
Correco de Yates para tabelas 2x2
No caso especfico de tabelas 2 x 2 devemos usar a
Correco de Yates para continuidade.
Para o problema anterior, Yates
2
= 100.39.
2
2 2
2
1 1
( 0.5)
*
ij ij
i j ij
N e
X
e
= =
=
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
48
No R, temos:
x<-matrix(c(3534,1319,270,252),ncol=2,byrow=T)
et<-chisq.test(x)
names(et)
et
et$expected
#quantil
qchisq(0.05,1, ncp=0, lower.tail = F)
#p-valor
pchisq(100.3915,1, ncp=0, lower.tail = F)
#density
plot(density(rchisq(500,df=1)))
points(qchisq(0.05,1, ncp=0, lower.tail = F),0,pch=19,col=2)
TESTE DO QUI-QUADRADO - Teste de Independncia
9
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
49
Teste Exacto de Fisher
O teste ideal para aplicar com tabelas de contingncia
de dados pequenos esparsos e no balanceados.
Embora seja aplicvel noutras situaes, vamos sempre
usar em tabelas 2 x 2 .
um teste exacto, portanto um p-value exacto.
A ideia geral considerando a tabela de observaes,
gerar as tabelas com as mesmas margens, que so
mais extremas que a observada, na mesma direco da
nossa observao ie, que a proporo TB do tipo SR
nas mulheres menor que proporo TB tipo SR nos
homens.
Teste Exato de Fisher
Caracterstica
(sim)
Caracterstica
(no)
Total
Population 1 a A-a A
Population 2 b B-b B
a+b A+B-a-b
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
50
H0: a proporo com a caracterstica de interesse a mesma nas duas
populaes
Bilateral
H1: a proporo com a caracterstica de interesse no a mesma nas duas
populaes (no R: fisher.test(x))
Unilateral
H1: a proporo com a caracterstica de interesse na populao 1 menor que
na populao 2 (no R: fisher.test(x,alternative=less))
H1: a proporo com a caracterstica de interesse na populao 1 maior que
na populao 2 (no R: fisher.test(x,alternative=greater))
Teste Exacto de Fisher (cont.)
Para o exemplo anterior temos no R:
x<-matrix(c(3534,1319,270,252),ncol=2,byrow=T)
fisher.test(x)
Fisher's Exact Test for Count Data
data: x
p-value < 2.2e-16
alternative hypothesis: true odds ratio is not equal
to 1
95 percent confidence interval:
2.073019 3.014822
sample estimates:
odds ratio
2.500202
Teste dos Sinais
Contrapartida no-paramtrica para
Teste-t para amostras
emparelhadas
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
53
Amostras Emparelhadas - O Teste dos Sinais
Populao X Populao Y
1 1 2 2
( , ), ( , ), , ( , )
n n
X Y X Y X Y
0 1
: localizaao de localizaao de . : localizaao de localizaao de
( > ) ou ( < )
H X Y vs H X Y = =
| | | |
0
, 0 0 1/ 2; sobH P D P D > = < =
{ }
| |
0
: =# : 0 ; , ( , 1/ 2),
com :
i i
M D D sob H M Binomial n p
p P X Y
> =
= >
Diferenas: : ; : ;
i i i
D X Y D X Y = =
0 1
: ( ) 0 . : ( ) 0
( > ) ou ( < )
H Med D vs H Med D = =
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
54
Amostras Emparelhadas - O Teste dos Sinais
(pequenas amostras)
N
/ 2
(0,1)
1/ 2
M n
Z
n
~ N
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
65
Teste dos Sinais Grandes amostras
Hiptese nula e alternativa
bilateral:
p-value:
Regio de Rejeio, ao nvel
de significncia o :
0 1
: 1/ 2 . : 1/ 2 H p vs H p = =
| |
| |
/ 2 / 2 / 2
2 2 2{1 ( )},
1/ 2 1/ 2 1/ 2
/ 2 / 2
2 2 2 ( ).
1/ 2 1/ 2
M n n n
P P Z z z z
n n n
M n n
ou P
m m
p value
m
P Z z z
n n
(
= > ~ > = u =
(
(
= s ~ s = u
(
1
/2 /2 /2
, : (1 /2), quantil da Normal(0,1) Z z ou Z z z
o o o
o
> s =u
/ 2 o / 2 o
/ 2
z
o / 2
z
o
1
/ 2
, : (1 ), quantil da Normal(0,1), :
1/ 2
M n
Z z z Z
n
o o
o
> = u =
o
z
o
12
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
67
Teste dos Sinais Grandes amostras
Hiptese nula e alternativa unilateral :
p-value:
Regio de Rejeio, ao nvel de significncia o :
0 1
: 1/ 2 . : 1/ 2 H p vs H p = <
| |
/ 2 / 2 / 2
( ), .
1/ 2 1/ 2 1/ 2
m m
p
M n n n
P P Z z z z
n
value
n n
(
= s ~ s = u =
(
1
/ 2
, : (1 ), quantil da Normal(0,1), :
1/ 2
M n
Z z z Z
n
o o
o
s = u =
o
z
o
=
/ 2 35 55/ 2
2.02
1/ 2 1/ 2 55
n
z
m
n
= = =
Teste de Wilcoxon
Contrapartida no-paramtrica para
Teste-t para amostras
emparelhadas
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
70
Amostras Emparelhadas - O Teste de Wilcoxon
(pequenas amostras)
Populao X Populao Y
> = u Z
Teste Unilateral
H
o
: Med(D) = 0 (As distribuies de X e de Y so idnticas)
H
1
: Med(D)> 0
(localizao de X direita
da localizao de Y)
p-value:
Regio de Rejeio, ao nvel de significncia o :
| | 1 ( ). P z z > = u Z
H
1
: Med(D)< 0 (localizao
de X esquerda da
localizao de Y)
1
, : (1 ) z z
o o
o
s = u Z
| | ( ). P z z = u s Z p-value:
o
zo
o
zo
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
78
Exemplo - Cancro pancretico
Agora, podemos analisar o
grupo que teve interveno
cirrgica com Esplenectomia
Novamente, temos
observaes emparelhadas
sobre cada um dos
pacientes, e estamos
interessados na diferena
entre duas medies de
plaquetas.
Ser que h uma diferena
significativa?
Patient Pre Post
1 492 375
2 297 382
3 272 325
4 367 585
5 206 181
6 284 237
7 338 273
8 212 243
9 161 147
10 384 326
11 224 214
12 251 292
13 224 263
14
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
79
Exemplo - Cancro pancretico - Teste de Wilcoxon
A hiptese nula para a nossa
investigao que no h nenhuma
diferena na contagem de plaquetas, antes e
aps a cirurgia com Esplenectomia .
H
0
: Med(D) = 0
H
1
: Med(D) 0
Rejeitar Ho se T T
0
(Tabela 9),
com
T:=min(T- , T+)
Valor observado de T = 44
T
0
(Tabela 9): n=13
Two-sided p=0.10
T
0
=21
Ento: T >T
0,
no se rejeita H
0.
Concluso: No h nenhuma evidncia de
uma diferena entre o pr e ps contagem
plaquetas para os pacientes que tinham
uma Esplenectomia durante sua cirurgia.
Pacient
e
Pre Post Di |Di| Ordem T+ T-
1 492 375 117 117 12 12
2 297 382 -85 85 11 11
3 272 325 -53 53 8 8
4 367 585 -218 218 13 13
5 206 181 25 25 3 3
6 284 237 47 47 7 7
7 338 273 65 65 10 10
8 212 243 -31 31 4 4
9 161 147 14 14 2 2
10 384 326 58 58 9 9
11 224 214 10 10 1 1
12 251 292 -41 41 6 6
13 224 263 -39 39 5 5
44 47
No R:
x=c(492,297,272,367,206,284,338,212,161,384,224,251,224)
y=c(375,382,325,585,181,237,273,243,147,326,214,292,263)
wilcox.test(x, y ,alternative = c("two.sided"),paired =T)
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
80
Concluses
Os nossos testes de hipteses mostram que:
os doentes a partir do grupo de preservao bao tinham uma
mudana significativa na sua contagem de plaquetas aps cirurgia (rej H0)
e os pacientes do grupo Esplenectomia no tm uma mudana
significativa na sua contagem de plaquetas aps cirurgia (no rej H0).
Estes resultados podem mostrar que a cirurgia de
preservao bao difcil para o paciente e outras
medidas devem ser investigadas para garantir que esta
cirurgia no excessivamente agressiva para os de
pacientes.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
81
Comentrios
Quando ns temos dados emparelhados e os pressupostos
de um teste-t emparelhado no forem pressupostos, temos
duas maneiras para elaborar o teste de hipteses sobre a
localizao:
O Teste de Wilcoxon sempre preferido ao Teste dos
Sinais j que usa mais informao contida nos dados (j que usa as
ordens).
O Teste de Wilcoxon tem muito mais potncia do que o
Teste dos Sinais para detectar uma diferena significativa.
No h uma grande perda de potncia no Teste de Wilcoxon
comparado a um teste-t quando se mantm a suposio de
normalidade.
Por outro lado, o Teste de Wilcoxon muito mais potente do que
o teste-t quando no vlida a suposio de normalidade.
Teste Mann-Whitney
Contrapartida no-paramtrica para
Teste-t para amostras
independentes
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
83
Teste Mann-Whitney pequenas amostras independentes
1. Testes para Duas Populaes, X e Y, Independentes
2. Corresponde ao Teste-t para 2 valores mdios
3. Pressupostos
Amostras Aleatrias Independentes (dimenses n
1
e n
2
)
Populaes Contnuas
4. Aproximao Normal se n
i
> 10
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
84
Teste Mann-Whitney pequenas amostras independentes
H
0
: X e Y tm distribuio idntica
H
1
: As distribuies de X e Y diferem na Localizao
T
1
= Soma das Ordens das Observaes da amostra 1
na amostra conjunta de dimenso n=n
1
+ n
2
T
2
= Soma das Ordens das Observaes da amostra 2
na amostra conjunta de dimenso n=n
1
+ n
2
15
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
85
U
1
= n
1
n
2
+ - T
1
n
1
(n
1
+ 1)
2
U
2
= n
1
n
2
+ - T
2
n
2
(n
2
+ 1)
2
Teste Mann-Whitney pequenas amostras independentes
n
1
n
2
2
U
=
2
n
1
n
2
(n
1
+ n
2
+ 1)
12
o
U
=
2
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
90
Teste Mann-Whitney grandes amostras independentes
Rejeitar H
o
se | Z| > Z
o/2
H
1
: As distribuies de X e Y diferem na Localizao
Teste Bilateral
H
0
: X e Y tm distribuio idntica
Determine U
2
= n
1
n
2
+ - T
2
n
2
(n
2
+ 1)
2
Z
o/2
:= u
-1
(1- o/2), u(.) f.d. da N(0,1)
/ 2 o / 2 o
/ 2 zo / 2 zo
16
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
91
Teste Mann-Whitney grandes amostras independentes
H
0
: X e Y tm distribuio idntica
Determinar U
2
= n
1
n
2
+ - T
2
n
2
(n
2
+ 1)
2
Teste Unilateral
H
1
: A populao 1 (X) est
localizada direita da
populao 2 (Y)
Rejeitar H
0
se Z> z
o
Teste Unilateral
H
1
: A populao 1 (X) est
localizada esquerda
da populao 2 (Y)
Rejeitar H
0
se Z< -z
o
o
zo
o
zo
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
92
Teste Mann-Whitney Exemplo
Suponha que um gestor de produo e est interessado em investigar
se as taxas de produo de 2 fbricas so iguais. Para a fbrica 1, as
taxas (% de capacidade) so 71, 82, 77, 92, 88. Para a fbrica 2, as
taxas so 85, 82, 94, 97. Tero as taxas de produo das 2 fbricas a
mesma distribuo de probabilidade ao nvel de .10 ?
H0: Distribuio Idntica
Ha: Localizao Diferente
o = .10
n1 = 4 n2 = 5
Pontos crticos:
Estatstica de Teste :
Deciso:
Concluso:
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
93
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 85
82 82
77 94
92 97
88 ... ...
Soma
das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
94
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85
82 82
77 94
92 97
88 ... ...
Soma
das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
95
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85
82 82
77 2 94
92 97
88 ... ...
Soma
das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
96
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85
82 3 82 4
77 2 94
92 97
88 ... ...
Soma
das Ordens
17
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
97
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85
82 3 3.5 82 4 3.5
77 2 94
92 97
88 ... ...
Soma
Das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
98
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94
92 97
88 ... ...
Soma
Das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
99
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94
92 97
88 6 ... ...
Soma
Das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
100
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94
92 7 97
88 6 ... ...
Soma
Das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
101
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94 8
92 7 97
88 6 ... ...
Soma
das Ordens
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
102
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94 8
92 7 97 9
88 6 ... ...
Soma
Das Ordens
18
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
103
Teste Mann-Whitney Exemplo
Fbrica 1 Fbrica 2
Taxa Ordem Taxa Ordem
71 1 85 5
82 3 3.5 82 4 3.5
77 2 94 8
92 7 97 9
88 6 ... ...
Soma
Das Ordens
19.5 25.5
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
104
Teste Mann-Whitney Exemplo
Suponha que um gestor de produo e est interessado em investigar
se as taxas de produo de 2 fbricas so iguais. Para a fbrica 1, as taxas
(% de capacidade) so 71, 82, 77, 92, 88. Para a fbrica 2, as taxas so
85, 82, 94, 97. Tero as taxas de produo das 2 fbricas a mesma
distribuo de probabilidade ao nvel de .10 ?
H0: Distribuio Idntica
Ha: Localizao Diferente
o = .10
n1 = 4 n2 = 5
Estatstica de Teste :
T1 = 5 + 3.5 + 8+ 9 = 25.5
(Amostra de dimenso mais pequena)
p-value= 2P[ U1< 4.5 ] >2P[ U1< 4] =2x 0.0952
Deciso:
No Rejeitar ao nvel de o = 10%
Concluso:
No existe evidncia estatstica que nos permita duvidar que as 2
Fbricas tm Taxas de Produo Idnticas, ao nvel de 10%.
1 1
1 1 2 1
( 1) 4 5
4 5 25.5 4.5
2 2
n n
U n n T
+
= + = + =
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
105
Teste Mann-Whitney Exemplo
Suponha que um gestor de produo e est interessado em investigar
se as taxas de produo de 2 fbricas so iguais. Para a fbrica 1, as taxas
(% de capacidade) so 71, 82, 77, 92, 88. Para a fbrica 2, as taxas so
85, 82, 94, 97. Tero as taxas de produo das 2 fbricas a mesma
distribuo de probabilidade ao nvel de .10 ?
H0: Distribuio Idntica
Ha: Localizao Diferente
o = .10 n1 = 4 n2 = 5
No R:
x<-c(71, 82, 77, 92, 88)
y<-c(85, 82, 94, 97)
wilcox.test(x, y ,alternative = c("two.sided"),paired =F)
Wilcoxon rank sum test with continuity correction
data: x and y
W = 4.5, p-value = 0.2187
alternative hypothesis: true location shift is not equal to 0
Teste de Kruskal-Wallis
Contrapartida no-paramtrica para
ANOVA completely
randomized
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
107
Teste de Kruskal-Wallis
A anlise da varincia leva em considerao que
as variveis so independentes,
tem uma distribuio normal com uma varincia
comum (homogeneidade das varincias)
mdia constante em cada coluna.
O teste Kruskal-Wallis um mtodo no
paramtrico.
No leva em considerao formas especficas de
distribuio.
Contrapartida no-paramtrica para
ANOVA completely randomized
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
108
Teste Kruskal-Wallis
Trata-se de um teste para decidir se
k amostras de dimenses ni, i=1,,k, (k>2) independentes
provmde
Ho: k populaes com distribuies idnticas.
versus
H1: pelo menos duas das k populaes diferem
na localizao.
Considerar a amostra global das n = n
i
observaes e
atribua Ordens.
Calcular as Somas das Ordens R
i
, para cada amostra
i=1,,k.
19
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
109
Teste Kruskal-Wallis
Estatstica de Teste:
Semempates
Com empates( Siegel & Castellan 88, pg.210)
g := n de grupos de empates distintos
tj := n de valores empatados no grupo j de
empates, j=1,,g
2
* 2
1 1
12 12
3( 1) ( ) ,
( 1) ( 1)
/ e ( 1) / 2
k k
i
i i
i i i
i i i
R
H H n n R R
n n n n n
R R n R n
= =
= = + =
+ +
= = +
*
3
1
3
( )
1
g
j j
j
H
H
t t
n n
=
=
2
k-1, 1-
Deve-se usar apenas quando a mais pequena das
dimenses n
i
5.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
111
Teste Kruskal-Wallis Pequenas Amostras
Quando k= 3 e n
i
s 5, sem empates:
os Quantis w
c
, c =0.90, 0.95, 0.99 da
distribuio exacta da ET K-W esto
tabelados na
Tabela A8 (Conover 80)
Deciso: (ao nvel )
Rejeitar hiptese nula Ho se H > w
1-
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
112
Teste de Kruskal-Wallis
Primeiramente, os dados so convertidos em ordens.
Considere os 4 Tratamentos seguintes, A, B, C, D, cada
um com cinco rplicas.
Podemos dizer que esses valores so provenientes da
mesma distribuio?
Ou seja, no existe uma diferena significativa entre os
Tratamentos?
Tratamentos A B C D
27 48 11 44
14 18 0 72
8 32 3 81
18 51 15 55
7 22 8 39
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
113
Teste de Kruskal-Wallis
Ordenao
Nota:
As diferenas nos pontos mdios (Ri/ni) indicam diferenas nos grupos.
i
i
i
i
i
i
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
114
Teste de Kruskal-Wallis
A hiptese nula que todos os grupos vem da
mesma populao.
Seja n = 20, o tamanho da amostra total.
A Estatstica de Teste
Para nosso exemplo
2
*
1
12
3( 1)
( 1)
k
i
i i
R
H n
n n n
=
= +
+
| |
*
12
259.2 884.45 92.45 1479.2 3 (21) 14.6
20 21
H
(
= + + + =
(
20
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
115
Teste de Kruskal-Wallis
Factor de Correco:
Com g = 2 (valores 8 e 18), t1 = t2 = 2 (dois valores 8 e dois valores 18),
A Estatstica de Teste corrigida
Para nosso exemplo
14.6
14.622
0.9985
H = =
*
2
3
1
3
( )
1
j j
j
H
H
t t
n n
=
=
2
3
3
1
3 3
( )
2(2 2) 12
1 1 1 0.9985
20 20 7980
j j
j
t t
n n
=
= = =
2
3
7.81 14.5
2
3, 0.95
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
117
Teste de Kruskal-Wallis
No R:
aa <- c(27,14,8,18,7) # tratamento A
bb <- c(48,18,32,51,22) # tratamento B
cc <- c(11,0,3,15,8) # tratamento C
dd <- c(44,72,81,55,39) #tratamento D
grupo <- factor(rep(1:4, each=5),labels = c("A","B","C","D"))
grupo
r<-rank(c(aa,bb,cc,dd))
R<-tapply(r,grupo,sum)
R
n=20
hstar= (12/(n*(n+1))) * sum(R^2/5) - 3*(n+1)
hstar
#Fator de correo
t=c(2,2)
correction=1-sum(t^3-t)/(n^3-n)
correction
h=hstar/correction
h
#h sob ho segue qui-quadrado com k-1 graus de liberdade=3
p.valor<-pchisq(h,df=3,lower.tail=F)
p.valor
quantil<-qchisq(p=0.95, df=3, lower.tail = TRUE)
quantil
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
118
Teste de Kruskal-Wallis
No R:
kruskal.test(list(aa,bb,cc,dd))
Outro exemplo
## Mucociliary efficiency from the rate of removal of
## dust in normal subjects, subjects with obstructive
## airway disease, and subjects with asbestosis.
x <-c(2.9, 3.0, 2.5, 2.6, 3.2) # normal subjects
y <-c(3.8,2.7,4.0,2.4)# with obstructive airway disease
z <-c(2.8, 3.4, 3.7, 2.2, 2.0) # with asbestosis
Teste do Coeficiente de
correlao ordinal de
Spearman
contrapartida no-paramtrica do
coeficiente de correlao
amostral de Pearson
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
120
Populao X Populao Y (contnuas)
1 1 2 2
( , ), ( , ), , ( , )
n n
X Y X Y X Y
0
: relao ( ) entre e , ie,
e
No existe associaao
independente s o s
H X Y
X Y
Teste do Coef de correlao ordinal de Spearman
1
. : entre exi e ste associaao (Teste Bilateral) vs H X Y
1
. : entre exist e e associaao directa (Teste Unilateral) vs H X Y
1
. : entre existe associaao inversa (Teste Unilateral) e vs H X Y
21
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
121
Teste do Coef de correlao ordinal de Spearman
O coeficiente de correlao ordinal de
Spearman Rs a contrapartida no-paramtrica do
coeficiente de correlao amostral de Pearson, em que
os Xis e os Yis sao substitudos pelas suas ordens.
Para obter r(Xi)=ordem de Xi e r(Yi)= ordem de Yi,
ordenam-se as amostras dos Xis e os Yis separadamente.
Observao:
Num modelo paramtrico e Normal, X e Y so independentes sse o
coeficiente de correlo =corr(X,Y)=0, ie,
testar Ho equivalente a testar Ho: =0, pelo que e natural usar o coeficiente
de correlacao amostral.
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
122
Teste do Coef de correlao ordinal de Spearman
Coeficiente de correlao ordinal de Spearman Rs:
Observao: Se o n de empates for pequeno relativamente ao
n de pares (Xi,Yi) o erro resultante desta ltima expresso
pequeno.
=
=
2
1
2
na Se houver ,
6
1 ,
( 1)
com ( )
o
( ).
n
i
i
i i i
S
d
n n
d r x r
empat
y
es
R
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
123
Teste do Coef de correlao ordinal de Spearman
Regio de Rejeio (Pequenas Amostras):
p-value= 2 min[P(R
S
r
S
), P(R
S
r
S
)] (Teste Bilateral)
= P(R
S
r
S
)
= P(R
S
r
S
) (Testes Unilaterais)
Observao: Se o n de empates for pequeno relativamente ao n
de pares (Xi,Yi) o erro resultante desta ltima expresso pequeno.
Grandes Amostras: para um n de pares (Xi,Yi) elevado,
pode ser aproximada pela N(0,1). n-1
S
R
> s >
> s
0
0 0 0 0
0 0
Tabela 11,
Teste Bilateral
Com escolhido criteriosamente na
Rejeitar H , se { } | |
} { Testes Unilater { } a s i
S S S
S S
r
r ou r r
r ou r
R R R
R R
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
124
Teste de Spearman - Exemplo
Cinco professores de Cincias do
ensino bsico foram classificados
por um jri de acordo com sua
capacidade pedaggica.
Esses mesmos professores
realizaram um "exame nacional
para professores".
Existe acordo entre a classificao
do jri e a classificao no exame?
Se a Ordenao do Jri baixa
(melhor professor), seria de
esperar a Classificao elevada
no exame para professores;
pelo que colocamos na hiptese
alternativa uma associao inversa
entre as variveis Ordenao do
Jri e Classificao no Exame.
Professor 1 2 3 4 5
Ordenao
do Jri
4 2 3 1 5
Classificao
no Exame
72 69 82 93 80
0
1
: ) entre e
.
: entre e
No existe associaao
e
xiste as
sociaao inversa
(Teste Unilateral)
H X Y
vs
H X Y
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
125
Professor
1 2 3 4 5
Ordenao do Jri 4 2 3 1 5
Classificao no Exame 72 69 82 93 80
R(xi) 4 2 3 1 5
R(yi) 2 1 4 5 3
di 2 1 -1 -4 2
Teste de Spearman - Exemplo
Ordenar os Resultados dos Exames (a 1 variavel j est na
forma ordenada). No h empates.
0
1
) entre e
.
entre e
No exis
te associaao
existe asso
ci
aao inversa
(Teste Unilateral)
:
:
H
H
X Y
vs
X Y
Isabel Fraga Alves
FCUL/ DEIO - Estatstica Aplicada: Mtodos No-Paramtricos 1Ano/2Sem (2009/2010)
126
Teste de Spearman - Exemplo
Com nvel de significncia=0.05, n=5
Rejeita-se H0 se Rs <=0
2
2
1
2 2
6
6 6(26)
1 1 1 0.3.
( 1) ( 1) 5(25 1)
S
n
i
i i
d
d
n n n n
r
=
= = =
22
Teste de Spearman - Exemplo
No R:
a <- c(4,2,3,1,5)
b <- c(72, 69,82,93,80)
cor.test(a, b, method="spearman",alternative="less")
Spearman's rank correlation rho
data: a and b
S = 26, p-value = 0.3417
alternative hypothesis: true rho is less than 0
sample estimates:
rho
-0.3
> ?cor.test
Teste de Spearman - Exemplo
Deciso: No Rejeitar Ho.
No existe evidncia suficiente que indique uma
associao negativa entre Ordenao do Jri e
Classificao no Exame, ao nvel de significncia de
5%.