You are on page 1of 204

Inferência estatística

Especialização em estatística aplicada


Turma: 02
Profª : Ana Clara Campos

Agosto/setembro de 2017
2

EMENTA
• Estimação pontual e propriedades básicas de um estimador
• Estimação intervalar para a média populacional (para
pequenas e grandes amostras)
• Estimação intervalar para proporção populacional (para
grandes amostras)
• Estimação intervalar para a variância populacional
• Intervalos de confiança para diferença entre duas médias
populacionais
• Intervalos de confiança para diferença entre duas
proporções populacionais
EMENTA
3

 Teste de hipóteses: Hipóteses estatísticas


 Tipo de erros
 Nível de significância e poder do teste
 p-valor
 Teste de uma média populacional (pequenas e grandes
amostras)
 Teste de uma proporção populacional
 Teste para a diferença de duas médias populacionais
 Teste para a diferença de duas proporções populacionais
 Teste de uma variância populacional
 Teste de Homogeneidade
 Testes não paramétricos.
4

O QUE É INFERÊNCIA?

• Conjunto de técnicas que objetiva estudar a


população através de evidências fornecidas por
uma amostra.

• Conhecer característica de uma população via


informação amostral.

• Essa característica na população pode ser


representada por uma variável aleatória.
5

CONCEITOS BÁSICOS
 População: conjunto de indivíduos, objetos ou
informações que apresentam pelo menos uma
característica comum, cujo comportamento temos
interesse analisar;
 Amostra é qualquer subconjunto da população;
 Parâmetro é uma medida usada para descrever uma
característica da população;
Ex: O diretor de uma empresa gostaria de saber se os
funcionários estão satisfeitos com os benefícios.

População? Característica? Parâmetro?


6

• Amostra aleatória: conjunto de n variáveis


aleatórias independentes (X1,X2,...,Xn), cada uma
com a mesma distribuição de X.
• Estatística: qualquer função de uma amostra
aleatória.
• Estimador: combinação de elementos da amostra,
construída com a finalidade de estimar um
parâmetro .
• Estimativa : valores numéricos assumidos pelos
estimadores .
7

Exemplo de Estatísticas
2
X 1  X 2  ...  X n X i  X 
n
1
X s2  
n  1 i 1
n

Notação
8

Problemas da Inferência
 Estimação e Testes de Hipóteses
Exemplo:1: Qual a distribuição da altura de
homens brasileiros?

Exemplo II: Deseja-se saber se a média da altura


dos homens brasileiros é maior que a dos
chilenos.

Qual modelo probabilístico mais razoável pensar? Quais


os parâmetros a serem identificados? Qual abordagem
utilizar em cada caso?
9

Estimação Testes de hipóteses

Qual é a proporção de
O candidato A vencerá as
votos que o candidato A
próximas eleições para
terá nas próximas eleições
prefeito de SP?
para prefeito de SP?

 Qual é a proporção de  Pelo menos 2% dos


motoristas baianos que motoristas habilitados da
tiveram sua carteira BA tiveram suas carteiras
apreendida após a apreendidas após a lei
vigência da lei Seca? Seca.
10
11

Estimação Pontual
12

• Estima-se (calcula-se) o parâmetro desconhecido


usando o valor de um estimador, o qual chamamos
de estimativa pontual.

• Fornece como estimativa um único valor numérico


para o parâmetro.
• Não permite julgar a magnitude do erro.
13

USOS DA ESTIMAÇÃO PONTUAL


• Estimar a proporção (p) de habitantes de
Salvador do sexo feminino que tomaram a vacina
da febre amarela na ultima campanha.

• Suponha que foi selecionada aleatoriamente uma


amostra de 30 funcionários da área
administrativa de uma empresa. Deseja-se saber
a idade em que eles conseguiram o seu primeiro
estágio em Administração, sabendo-se que a
população tem um comportamento normal.
14

EXERCÍCIO
Suponha que estamos interessados na média (μ) e
variância (σ2) das alturas de jovens com idade entre 15 e
18 anos de certa cidade do Brasil. Escolhemos ao acaso
10 jovens.

A amostra:

Qual o melhor estimador para μ? E para σ2 ?


15

PROPRIEDADES BÁSICAS DE UM ESTIMADOR

P1. Não Tendenciosidade


Um estimador é dito não viciado (não viesado) se sua
média é igual ao parâmetro.
P2. Consistência
Um estimador é consistente se: é não viesado e tende a se
aproximar do parâmetro a que se refere quando o tamanho
da amostra aumenta.
P3. Eficiência
Quando um estimador tem uma dispersão pequena
comparado a outros estimadores.
ILUSTRANDO
• Considere 4 jogadores, cada um com 8 dardos em que os
dardos representam as amostras e os jogadores os 4 tipos de
estimadores .
Comentários?
Mais
Não Eficiente,
viciado e viciado
Eficiente

Viciado e
Não viciado Não
e Não Eficiente
eficiente
17

Estimadores para a média, proporção e


variância
18

Estimação Pontual e Distribuição Amostral

Os estimadores pontuais são variáveis aleatórias e,


portanto, possuem uma distribuição de probabilidade,
em geral, denominada distribuição amostral.

Distribuição amostral: distribuição de probabilidade


de uma estatística quando consideramos todas as
amostras possíveis de tamanho n.
19

DISTRIBUIÇÃO AMOSTRAL DA MÉDIA

• Distribuição de probabilidade de todos os valores


possíveis de médias retiradas de amostras de
mesmo tamanho.

• Utiliza-se um resultado fundamental na teoria da


Inferência Estatística: Teorema do Limite Central
(TLC).
20

TEOREMA DO LIMITE CENTRAL


1. Para amostras aleatórias selecionadas de uma população
normal com média μ e variância σ2 finita, a distribuição
amostral de pode ser aproximada, pela distribuição
normal com média μ e variância σ2/n.

2. A distribuição da média amostral, devidamente


padronizada, se comporta segundo um modelo Normal
padronizado (Z).

3. Se a população de origem é não-normal, a distribuição de


médias amostrais será aproximadamente normal para
grandes amostras.
21

EFEITO DO TAMANHO AMOSTRAL SOBRE A


DISTRIBUIÇÃO DE X

Comentários?
22

O CASO DA PROPORÇÃO AMOSTRAL ( )


• Coletamos uma a.a. de X~Bernoulli(p) com o
objetivo de estimar a proporção (p) de elementos
numa população com determinada característica.

• Pode-se definir X da seguinte maneira:


1, se o i - ésimo elemento apresentaa característica;
Xi  
0, se o i - ésimo elemento não apresentaa característica.

Temos que com:


E(Xi )  p e Var(X i )  p(1  p)
23

• Ao somarmos todos os Xi’s saberemos quantos da


população possuem o atributo de interesse.

• Definindo p̂ como sendo a proporção de temos


que: 1 n
ˆ p
n
 X
i 1
i X

• Pelo TLC, podemos dizer que a distribuição


amostral de p̂, caso o tamanho da amostra extraída
seja suficientemente grande è:

 p(1-p) 
p̂ ~ N p, 
 n 
ESTIMAÇÃO PONTUAL X INTERVALAR

Pontual – fornece um único valor do


parâmetro de interesse e não permite
julgar a magnitude do erro.

Intervalar – fornece uma faixa valores


dentro da qual o parâmetro
provavelmente está incorporando uma
margem de erro associada a estimativa
pontual.
25

Estimação Intervalar
26

IDEIA
• Construir intervalos de confiança que incorporem
à estimativa pontual, informações a respeito de
sua variabilidade (erro amostral).
Limite Limite
inferior superior

[Estimativa – erro; Estimativa + erro]

• Baseados na amostra, gostaríamos de construir


um intervalo que com alta probabilidade
contivesse o verdadeiro valor do parâmetro.
27

 Seja  o parâmetro (média, proporção ou variância)


de interesse.

 Desejamos obter um intervalo cuja expressão, IC(,


1-), envolve uma estimativa do parâmetro  e um
coeficiente de confiança (1-α) ;

 Intervalos de confiança são obtidos por meio da


distribuição amostral do estimador pontual;
28

• Os limites do intervalo dependerão da amostra


selecionada. Logo são aleatórios.

• O valor 1- ꭤ é o nível de confiança e representa a


probabilidade de obter um intervalo que contenha
o verdadeiro valor do parâmetro.

• A precisão depende da amplitude do intervalo (LS –


LI)

• Valores usuais
Interpretando o IC
29

Interpretação : se pudéssemos repetir o estudo um


grande número de vezes, 1-α% dos intervalos de
confiança obtidos conteriam o verdadeiro valor do
parâmetro de interesse.

AMOS
TRA
1 ( )
2 ( )
3 ( )
4 ( )
5 ( )
6 ( )
7 ( )
...


30
Lembrar:

• Na prática, tem-se apenas uma estimativa do


estudo e não sabemos o verdadeiro valor do
parâmetro.

• Intervalos de confiança são calculados para se ter


uma noção da precisão da estimativa.

• Intervalos de confiança estreito indica boa


precisão, mas não necessariamente que a
estimativa é próxima do parâmetro porque podem
haver vieses.
31

E como evitar viés?

Garantir que os instrumentos usados na coleta de


dados estejam sendo usados corretamente e sejam
apropriados para o que se deseja avaliar.

 Procedimento amostral correto (amostragem


probabilística).
32

Importante saber que:

Aumentar o tamanho da amostra aumenta a precisão:

 mas não garante ausência de viés;

 e viés pode produzir resultados bastante incorretos.


33

EXEMPLOS NA LITERATURA

**Avaliação comparativa de sistemas de saúde com a


utilização de fronteiras estocásticas: Brasil e OCDE*

Rev. Bras. Econ. vol.66 no.1 Rio de Janeiro Jan./Mar. 2012


34

O QUE NÃO FAZER


Métodos gráficos
35

Análise do perfil de crescimento de 566 crianças com idade entre 3 meses e 3 anos
matriculadas nas 14 creches municipais de Paulínia (SP).

J pediatr (Rio J) 1996;72(4):245-250


36

INTERVALOS DE CONFIANÇA
NECESSÁRIO SABER

• Se a amostra foi obtida de forma independente ou


pareada;
• Se a variável resposta tem natureza quantitativa ou
qualitativa;
• Se as amostras são pequenas ou grandes;

• A distribuição amostral do estimador.


37

Caso 1: Estimação intervalar para


média de 1 população com variância
conhecida e grandes amostras
38

• O intervalo de confiança para a média µ com


variância conhecida é construído com base na
distribuição amostral de .

• Vimos que, pelo TLC,


39

• Fixando um valor entre 0 e 1 para o coeficiente de


confiança 1-α (100)% podemos encontrar um
valor zα/2, e posteriormente encontrar um IC para a
média μ como:

   
IC( ,1   )   X  z  ; X  z 
 2 n 2 n 

Nível de confiança
40

USO DA TABELA NORMAL


TABELA – Distribuição Normal padrão para valores de P(0 < Z < z0).
41

EXEMPLO1

Sem embasamento estatístico nenhum, o prefeito de certo


município deseja estimar a média de gastos dos turistas
que visitam a cidade. Com este propósito, uma amostra
aleatória de 121 turistas foi selecionada para a
investigação e encontrou-se que a média foi igual a R$
500,00 e desvio padrão de R$ 250,00.

a) Qual o intervalo de confiança, a 99% para a média dos


gastos de turistas com a cidade?

Qual o parâmetro de interesse? Como calcular o


intervalo de confiança ?
42

EXEMPLO 2
O maior tempo dedicado às atividades de baixa
intensidade, como assistir televisão, tem
contribuído para o ganho de peso dos
adolescentes.

Questão de investigação: usualmente quantas


horas os adolescentes gastam assistindo tv?

Terminologia estatística: conhecer o tempo médio


(μ) em frente à tv.
43

Resultados da análise de dados

• Como o erro padrão (SE Mean) foi obtido?


• Qual o impacto do tamanho da amostra no IC?
• Qual a interpretação do IC calculado pelo software?
44

Praticando no software
45

Caso 2: Estimação intervalar para a


média de 1 população em pequenas
amostras
46

Situações a serem avaliadas com cuidado

• A amostra é muito pequena e


• a distribuição é extremamente assimétrica.

Quando a amostra é pequena e a distribuição é


aproximadamente simétrica:

 uso da distribuição t-Student no lugar da


distribuição Normal.
47

DISTRIBUIÇÃO T-STUDENT

Variabilidade maior
que a da Normal

Utilizada para fazer inferência a respeito da média


populacional em amostras pequenas.
 Não é recomendada em casos extremos de
assimetria da distribuição (não paramétrica)
48

O Intervalo de Confiança de (1-ꭤ) para a média


populacional μ é dado por:

 S S 
IC1 (  )   X  t / 2,n 1 ; X  t / 2,n 1 
 n n 

 Os valores t / 2,n 1 encontram-se tabelados.

 A distribuição t-Student depende dos graus de


liberdade (gl). Neste procedimento gl=n-1.
49

Tabela T- Student
50

EXEMPLO DIDÁTICO
• Um pesquisador está estudando a resistência de
um certo material sob determinadas condições.
Ele sabe que essa variável é Normalmente
distribuída com variância igual a 4 unidades2.
• Foi extraída uma amostra aleatória de tamanho
10.
7,9 6,8 5,4 7,5 7,9 6,4 8,0 6,3 4,4 5,9

• Obtenha um. IC de 90% para a resistência média


51

BOM SABER

• A maioria dos softwares estatísticos usam a


distribuição t-Student para obter IC´s para as
médias, não importando o n.

• Para amostras grandes , o uso da distribuição t-


Student ou da Normal resultam em IC´s idênticos.
52

Caso 3 : Estimação intervalar para 1


proporção populacional
(grandes amostras)
53

• Respostas dicotômicas em uma única amostra.

X
• Considere a proporção amostral pˆ  .
n

• Pelo TCL, a distribuição amostral de p̂ é


aproximadamente normal. Assim , o Intervalo de
Confiança de (1-ꭤ) x 100% para a proporção
populacional p é dado por:

 pˆ (1  pˆ ) pˆ (1  pˆ ) 
IC1 ( p)   pˆ  z ; pˆ  z 
 2 n 2 n 
54

• A fórmula do IC para a proporção só deve ser


aplicada para amostras aleatórias grandes.

• Uma vez que a distribuição amostral de só é
aproximadamente normal nessas condições.

• Na prática recomenda-se ter amostras com pelo


menos 15 observações em cada categoria da
variável binária .
55

Intervalo de confiança conservador

• Considerar a proporção máxima -> p=50%

• Fornece intervalos de confiança excessivamente


grandes quando p se distancia de ½ ( p≈ 0 ou p ≈1)
(Bussab & Moretin, 2002).

• Importante ter algum conhecimento sobre p,


garantindo que seu valor esteja próximo de ½.
56

EXEMPLO
• Um produtor deseja estimar a proporção de itens
de certo artigo na linha de produção de sua
empresa que apresentam defeito de fabricação.
Para esta finalidade, retirou uma amostra aleatória
de 200 itens da linha de produção, constatando que
184 destes não apresentaram defeito de fabricação.

• Construa um intervalo de confiança de 95% para a


proporção de itens na linha de produção com
defeito de fabricação.
E se o IC fosse
conservador?
EXEMPLOS NA LITERATURA 57

Disability related to chronic low back pain: prevalence and associated factors

Rev. esc. enferm. USP vol.46 no.spe São Paulo Oct. 2012.
58

Prevalence of Autism Spectrum Disorders — Autism and Developmental Disabilities Monitoring


Network, 14 Sites, United States, 2008.

Morbidity and Mortality Weekly Report (MMWR)


59

Caso 4 : Estimação intervalar para a


variância populacional
60

REQUISITOS
• Amostra aleatória simples
• População deve se comportar segundo uma
distribuição Normal, mesmo que amostra seja grande.

** Afastamento da distribuição normal pode levar a


erros grosseiros.

** Uso da distribuição qui-quadrado para construir o IC.


DISTRIBUIÇÃO
61

QUI-QUADRADO
Suponha que :
• População seja normalmente distribuída.
• Tenha variância populacional (σ2 ).
• Amostras aleatórias independentes de tamanho
n.
• Calculadas as variâncias amostrais (s2).
• Esta estatística amostral tem distribuição qui-
quadrado.
62

PROPRIEDADES IMPORTANTES
• A distribuição (ꭓ2) é determinada pelos graus de
liberdade (gl=n – 1).
• Simétrica e valores positivos.
• À medida que os graus de liberdade aumentam,
distribuição qui-quadrado se aproxima de distribuição
normal.
63

A TABELA ꭓ2
64

Um intervalo de 100(1-α)% de confiança para σ2 é


dado por:

Para uma nível de confiança fixado pode-se


determinar os quantis e
da distribuição qui-quadrado.
65

• A distribuição qui-quadrado possui numerosas


aplicações importantes em inferência estatística.

• Devido a sua importância está tabulada para


diferentes valores do parâmetro n.

• Bastante utilizada em aplicações reais, como na


análise de Controle de processos
66

Caso 5: Intervalos de confiança para


diferença entre duas médias
populacionais
67

Considere duas populações A e B cujas médias são μA


e μB e variâncias σA2 e σA2, respectivamente.

Um estimador não viciado para μA - μB é dado pela


estatística e sua distribuição amostral é obtida
conforme três diferentes situações:

a) Populações independentes com variâncias


conhecidas;
b) Populações independentes com variâncias
desconhecidas, porém, iguais;
c) Populações independentes com variâncias
diferentes e desconhecidas.
68

INTERVALO DE CONFIANÇA PARA A DIFERENÇA


ENTRE AS MÉDIAS DE DUAS POPULAÇÕES
INDEPENDENTES COM VARIÂNCIAS CONHECIDAS

• Seja uma a.a de tamanho nA , retirada de uma


população A e uma a.a de tamanho nB retirada de
uma população B, independentes. Considerando
que as variâncias sejam ambas conhecidas, temos
que:

~ N (0,1)
69

Logo, para o caso em que as variâncias são


conhecidas, temos que:

Então, um IC (1-ꭤ)x100% para (μA - μB ) é dado por:


70

EXEMPLO DIDÁTICO
Num estudo comparativo do tempo médio de adaptação,
uma amostra aleatória de 50 homens e 50 mulheres de
um grande complexo industrial, produziu os seguintes
resultados:
Homens Mulheres
Média 3,2 anos 3,7 anos

Sabe-se que os desvios padrão populacionais são,


respectivamente, 0.8 anos e 0.9 anos. Construa um IC
para a diferença dos tempos médios de adaptação
considerando um nível de confiança de 90%. Qual a sua
conclusão?
71

INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE


AS MÉDIAS DE DUAS POPULAÇÕES INDEPENDENTES
COM VARIÂNCIAS DESCONHECIDAS E IGUAIS

• Nesse caso, σA2 = σB2 = σ2 e podemos estimar uma


variância comum, e então utilizar as informações de
ambas as amostras para ter uma estimativa da
variância populacional.

• A variância combinada Sp2, nada mais é do que uma


variância ponderada pelos graus de liberdade das
duas amostras:
72

• Como temos um estimador comum para a variância


populacional, pode-se obter uma distribuição de
probabilidade para e concluímos que:

• Logo, um IC (1-ꭤ)x100% para (μA - μB ) pode ser


escrito como :
73

EXEMPLO DIDÁTICO
Um mesmo tipo de material pode ser adquirido por
2 fabricantes. As variáveis de interesse são a
resistência mecânica do material (em unidades
convenientes) para cada fabricante. Para comparar
os seus valores médios obteve-se uma amostra
aleatória de cada:
74

Para o quadro!

• Admita populações aproximadamente normais e


um nível de confiança de 95%, o que se pode
afirmar a respeito das resistências médias do
material produzido pelos dois fabricantes? Qual a
sua decisão?
75

INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE


AS MÉDIAS DE DUAS POPULAÇÕES INDEPENDENTES
COM VARIÂNCIAS DESCONHECIDAS E DIFERENTES

• Considere duas populações A e B com médias μA e


μB e variâncias diferentes e desconhecidas (σA2 ≠σB2)

• Utilizar as estimativas SA2 e SB2 para construir os


IC´s.
• A estatística utilizada terá distribuição t-Student,
com v graus de liberdade.
76

• Logo, um I.C (1-ꭤ)x100% para (μA - μB ) quando as


variâncias são diferentes e desconhecidas, é dado
por:
77

EXEMPLO DIDÁTICO
• Para ajudar os lojistas em seu planejamento, a
cada ano se realiza um estudo para se determinar
quanto as pessoas pretendem gastar com
presentes nos dia dos namorados. Uma pesquisa
de novembro de 2008, obteve-se uma amostra de
compradores e lhes foi perguntado a quantia (em
dólar) que pretendiam gastar com presentes.
78

PARA REFLETIR EM CASA

• Com base nos dados, construa um IC a diferença


do gasto médio entre homens e mulheres. Você
diria que a quantidade média que os homens
pretendem gastar é maior do que a quantidade
média que as mulheres pretendem gastar? Use 1-
α = 0, 10, e admita que as populações sejam
normais e que as variâncias sejam desconhecidas
e diferentes.
79

Bom saber
• Na prática nunca sabemos o valor verdadeiro da
variância populacional;

• Deve-se verificar a plausibilidade da afirmação de


que as variâncias são ou não iguais antes de
construir IC´s para diferença de médias
(disponível em softwares) .
80

Caso 6: Intervalos de confiança para


diferença entre duas proporções
populacionais
81

• Interesse em estimar a diferença entre duas


proporções p1 e p2 , associadas a duas populações
independentes.

• estimador não viesado para p1 - p2. Então,


para amostras grandes:
82

Desta forma, um I.C (1-ꭤ)x100% para (p1 – p2 )


dado por:
83

EXEMPLO DIDÁTICO

Com o objetivo de identificar fatores de risco para


doença coronária analisaram-se duas amostras de
215 homens e de 1140 mulheres, tendo-se
registrado que 58 dos homens e 217 das mulheres
tinham diabetes.

• Estime um intervalo de confiança a 90% para a


diferença das proporções de diabéticos nas duas
populações . Qual a sua conclusão?
Pratica
84

Outras medidas conhecidas


na área de saúde
85

Para pensar
86

Testes de Hipóteses
87

OBJETIVO
• Testar se uma conjectura sobre determinada
característica de uma ou mais populações é, ou
não, apoiada por evidências obtidas de dados
amostrais.

hipótese
Conjectura
estatística

Regra de teste de
decisão hipóteses
88

 Hipóteses estatísticas

• Podem ser expressas em termos de parâmetros de


interesse.
• Afirmação sobre uma população, geralmente de
forma que o parâmetro assume determinado valor.

Parâmetros de interesse:
• Médias, prevalências(proporções), diferença de
médias, diferença de proporções, Odds ratio, Risco
relativo, etc
89

 Testes de hipóteses ou testes de significância


estatística:

• Usam os dados amostrais para sumarizar evidências


sobre determinada hipótese.

•Definição baseada na distribuição de probabilidade


da variável que se quer estudar .
90

• O teste estatístico depende do tipo de variável


envolvida e do tipo de planejamento;

 variável é quantitativa ou qualitativa?


dados foram obtidos de forma independente ou
pareada?
 qual o objetivo da análise?
Rev. Psicol. Saúde vol.5 no.2 Campo Grande dez. 2013

Cuidado com91

interpretações

?
PROCEDIMENTO ESTATÍSTICO
92

1- Estabelecer as hipóteses:
Objetivo?
H0: hipótese nula
H1: hipótese alternativa
Tipo de
variável?

Inexistência de Existência de Desenho


efeito efeito de estudo?
93

2- DEFINIÇÃO DAS
HIPÓTESES:
• O valor do parâmetro em H0 usualmente é onde
fica a igualdade e representa a ausência de efeito;

• O valor em H1 usualmente representa então


algum tipo de efeito;

• Assume-se que H0 é verdadeira até que os dados


provem o contrário.
94

3 – Estabelecer um critério de decisão para que H0


seja julgada :

• O critério de decisão é fundamentado pela Teoria


das Probabilidades e definido por meio da
Estatística de Teste:
 mede a discrepância do que foi observado nos
dados e o que seria esperado caso H0 fosse
verdade;
 discrepância evidências contra H0

 Resumo: H0 é rejeitada se o valor da estatística


de teste for “grande”.
95

Cad. Saúde Pública, Rio de Janeiro, 29(7):1301-1310, jul, 2013


96

Como poderíamos escrever as


hipóteses testadas no artigo?

• Hipóteses testadas

• Critério estatístico: estatística definida pelo teste t-


Student para comparação de 2 médias de
populações independentes :

 precisa definir matematicamente a medida de


discrepância;

Requer distribuição de probabilidade para a avaliar


qual das hipóteses é suportada pelos dados.
97

TIPOS DE ERROS
 Erro tipo I e erro tipo II

α =P(erro tipo I) e β= P(erro tipo II)


α =nível de significância do teste
98

• α -> nível de significância do teste


Valores usuais: 5%, 1%, 0,1%

1-β= Poder - > capacidade de detectar que a hipótese


nula é falsa

Lembrar: ambos
fixados no
planejamento do
estudo
99

P- valor ou nível descritivo

• Probabilidade de ocorrer o resultado observado ou


um mais extremo, supondo a hipótese nula
verdadeira.
• Quanto maior o p-valor maior evidência para
rejeitar H0.
• Nas mais diversas áreas do conhecimento
considera-se um valor de p menor ou igual a 0.05
como indicativo de rejeição de H0

Regra de decisão
100

• O p valor não fornece informações sobre a magnitude


do efeito

• A magnitude de um efeito estatisticamente


significativo pode ser tão pequena que o efeito prático
não é importante.

• Se o tamanho da amostra é grande o suficiente, quase


qualquer hipótese nula pode ser rejeitada.

• Mais informativo olhar o intervalo de confiança.


101

Exemplo da literatura : Birth month and


height
Título: Spring Birthday Confers Height Advantage

Estudo austríaco de alturas de 507,125 recrutas militares. Teste


para diferença de médias , amostras independentes.
-Resultado: Homens nascidos na primavera foram, em média ,
cerca de 0,6 cm mais alts do que os homens nascidos no outono.
-Os resultados foram altamente significativos (minúsculo p
valor).
(Weber et al ., Nature, 198 , 391 : 754-755 ).

O tamanho da amostra tão grande que mesmo uma


pequena diferença foi estatisticamente significativa .
102

Cuidado com
o p valor!

The basic problem with the null hypothesis Sugiro ler este
significance test in political science is that it artigo. Ano 2013
often does not tell political scientists what
they think it is telling them. (J. Gill)

Statistical significance testing has


involved more fantasy than fact. (R.
Carver)

The research methodology literature in


recent years has included a full frontal
assault on statistical significance testing.
(J. E. McLean and J. M. Ernest)
103

Tamanho da amostra e a significância estatística

• Um pequeno a moderado efeito na população é difícil


de detectar.
• Com uma pequena amostra , o resultado tem pouca
chance de ser estatisticamente significativo.

• Com uma grande amostra, mesmo um efeito pequeno


e sem importância na população pode ser
estatisticamente significativo.
2/3 dos dentistas
recomendam.....

2/3 dos 500 dentistas


recomendam
104

Caso 1: Teste de hipóteses para


1 média populacional
105

Grandes amostras
• Considere uma amostra aleatória de tamanho n
de uma população normal com média μ
(desconhecida) e variância σ2(conhecida).
Suponha o interesse em verificar as seguintes
hipóteses:
H0 : μ= μ0 vs H1: μ≠ μ0

A estatística de teste é definida por:

Sob H0:
106

• Outras hipóteses alternativas podem ser


formuladas (unilateral)

Região Crítica para um α fixado

c = ponto crítico da tabela da normal (z)


107

EXEMPLO DIDÁTICO

Os registros dos últimos anos de um colégio atestam


que calouros tem nota média (teste vocacional)de
115. Para testar a hipóteses de que a média de uma
nova turma é a mesma das turmas anteriores,
retirou-se, ao acaso, uma amostra de 36 notas,
obtendo-se média 118. Considere população normal
e desvio padrão populacional igual a 20. Qual a sua
conclusão ao nível de significância de 5%?

Defina os passos
PEQUENAS AMOSTRAS
108

• Na maioria das vezes não temos informação sobre a


variância da variável aleatória de interesse. E além
disso, alguns casos não temos amostra grande o
suficiente .
• Supondo que a variável aleatória de interesse tem
distribuição normal com média µ desconhecida e
variância σ2 também desconhecida. Nesse caso, a
estatística de teste é definida como:

Sob H0 :
109

EXEMPLO DIDÁTICO Software

• Uma certa cervejaria vende cervejas em


embalagens cujos rótulos indicam um conteúdo de
600 ml. O Instituto Nacional de Pesos e Medidas
(INPM) seleciona aleatoriamente 25 garrafas de
cerveja produzidas pela companhia, mede seu
conteúdo e obtém uma média amostral igual a
596,25 ml com desvio padrão de 14,06 ml. A um
nível de significância de 1%, você diria que a
empresa está enganando seus consumidores?
Quais as hipóteses de interesse? O teste é uni ou bilateral?
Conclusão?
110

Observação

• Se o desvio padrão populacional é desconhecido, mas


a amostra é relativamente grande, o TCL diz que a
distribuição amostral das médias é aproximadamente
normal.
Usa a estatística Z com desvio padrão
amostral no lugar do σ

• Em populações não muito assimétricas a


convergência é ainda mais rápida.
111

Teste de hipóteses para 1


variância
112

• Suponha o interesse em estar a hipótese de que a


variância (σ2)de uma população normal seja igual a
um valor específico, σ02. Considere uma amostra
aleatória de n observações proveniente dessa
população. Para testar

H0 : σ2= σ02 vs H1: σ2 ≠ σ02 (ou unilaterais)

Usaremos a estatística de teste

Sob H0 :
113

REGIÃO CRÍTICA
114

EXEMPLO DIDÁTICO Software

• Uma máquina de enchimento automático é usada para


encher garrafas com detergente líquido. Uma amostra
aleatória de 50 garrafas resulta em uma variância
amostral de volume de enchimento de s2 = 0,015 (onça
fluida)2. Se a variância do volume de enchimento exceder
0,01 (onça fluida)2, existirá proporção inaceitável de
garrafas cujo enchimento não foi completo e cujo
enchimento foi em demasia.
• Ao nível α=5%, há evidências que o fabricante tem um
problema com garrafas cheias com falta e excesso de
detergente? Considere que o volume de enchimento tem
uma distribuição normal.
Hipóteses?
115

SOLUÇÃO
• Parâmetro de interesse: σ2
• Hipóteses: H0 : σ2= 0.01 vs H1: σ2 ≠ 0.01
• α =5% ; ꭕ20.05;49 = 33.93
• H0 será rejeitada se : ꭕ20 > 33.93

Cálculos:

Conclusão?
116

Caso 2: Teste de hipóteses para


diferença de médias
117

Grandes amostras
 Comparar dois grupos de indivíduos em relação à
uma variável resposta de natureza continua. Por
exemplo, nível de colesterol segundo faixa etária.

• Hipóteses estatísticas:
H0 : μ1 =μ2 versus H1 : μ1 ≠μ2 (bilateral)

Opções de alternativas unilaterais


•H0 : μ1 =μ2 versus H0 : μ1 >μ2 (direita)
•H0 : μ1 =μ2 versus H0 : μ1 <μ2 (esquerda)
118

•Supondo uma amostra aleatória de tamanho n1 de


uma população com característica X1, que tem
distribuição normal com média μ1 e variância σ12.

• Considere outra amostra aleatória de tamanho n2 ,


de uma população com característica X2, que tem
distribuição normal com média μ2 e variância σ22.

• X1 e X2 são independentes.
119

• Assumindo que as variabilidades dos grupos são


conhecidas , a estatística de teste para diferença
de médias é dada por:

Sob H0 :
EXEMPLO NA LITERATURA 120

Rev. CEFAC vol.8 no.4 São Paulo Oct./Dec. 2006


121

Pequenas amostras – caso 1


Assumindo que as variabilidades dos grupos são
desconhecidas e supostas iguais, a estatística de
teste para a diferença de médias é dada por:

H0 : μ1 =μ2 versus H1 : μ1 ≠μ2

Sob H0 :
122

Pequenas amostras – caso 2


Assumindo que as variabilidades dos grupos são
desconhecidas e diferentes, a estatística de teste para a
diferença de médias é dada por:
H0 : μ1 =μ2 versus H1 : μ1 ≠μ2

Sob H0 :
123

EXEMPLO EM ARTIGOS

Avaliação da eficácia do aconselhamento nutricional dentro da estratégia


do AIDPI (OMS/UNICEF)
Rev. Bras. Epidemiol. Vol. 5, Nº 1, 2002
124

CONFRONTANDO RESULTADOS

Comparando-se dois grupos


Variável de interesse: ferro
 Hipóteses : H0 : μ1 =μ2 vs H1 : μ1 ≠μ2
Estatística de teste:

= 0,52

Valor crítico da distribuição t ->


Conclusão?
125

TESTE PARA VERIFICAÇÃO DA SUPOSIÇÃO DE


IGUALDADE DAS VARIÂNCIAS
Hipóteses:

• H0: As variâncias das duas populações são iguais

• H1: As variâncias populacionais são diferentes

A maioria dos softwares realiza este


procedimento conjuntamente com o
teste da diferença de médias
126

SPSS
127

STATA

Comando
adicional

Teste de Levene
128

Aplicação de Testes de hipóteses


para dados categorizados
129

VARIÁVEL RESPOSTA EM ESCALA QUALITATIVA

• Em medicina: diagnóstico de câncer de mama


baseado na mamografia pode usar categorias como:
normal, benigno , provável suspeito, suspeito e
benigno.

• Em ciências do comportamento: transtorno mental


comum (depressão, ansiedade) .

• Em educação: resposta de estudantes à questão de


uma prova (correta e incorreta)
130

• Aparecimento dos métodos para dados categóricos


por volta de 1900 -> Karl Pearson

• Maior desenvolvimento nos anos 60 e ainda é uma


área de crescente interesse.

• Grande variedade de métodos:

Medidas de associação (prevalência, risco relativo, OR)


com IC´s; métodos qui-quadrado para grandes amostras;
métodos exatos para amostras pequenas ou dados
esparsos; Estatística de Mantel Haenszel; Teste de
McNemar; Regressão logística.
131

• Muitas questões na análise de dados categóricos


podem ser respondidas através do uso de testes de
hipóteses .

• Entretanto uma forte suposição para o uso destes


testes é a alocação aleatória dos indivíduos.

• A tabela de contingência 2x 2 é uma das formas


mais comuns de apresentar os dados categóricos
132

Teste de hipóteses para uma


proporção
133

• Procedimento similar ao teste para uma média


populacional.

• Considere o problema de testar a hipótese que a


proporção de sucessos de um ensaio de Bernoulli é
igual a um valor especifico, p0. Isto é, testar as
seguintes hipóteses:
H0 : p =p0 versus H1 : p ≠ p0
H0 : p =p0 versus H1 : p < p0
H0 : p =p0 versus H1 : p >p0
134

• Para grandes amostras, a estatística de teste pode


ser definida como:
135

EXEMPLO DIDÁTICO Software

Um fabricante de semicondutores produz


controladores usados em aplicações no motor de
automóveis. O consumidor requer que a fração de
defeitos em uma etapa crítica da fabricação não
exceda 0,05 e que o fabricante demonstre uma
capacidade de processo desse nível de qualidade,
usando α = 5%. O fabricante retira uma amostra
aleatória de 200 aparelhos e encontra que quatro
deles são defeituosos. O fabricante pode
demonstrar uma capacidade de processo para o
consumidor?

Hipóteses?
136

SOLUÇÃO
• Parâmetro de interesse: p
• Hipóteses: H0 : p = 0.05 vs H1 : p < 0.05
• α =5% ; zα = 1.645 ;
• H0 será rejeitada se : Zcalc > 1.645

Cálculos:

Conclusão?
137

Teste de hipóteses para duas


proporções populacionais
138

• Considere o interesse em comparar as respostas de


2 grupos provenientes de amostras aleatórias
independentes com respeito a uma resposta binária.

• Seja p1 a probabilidade de resposta favorável na


população 1 e p2 a probabilidade de resposta
favorável na população 12.

• A hipótese de interesse é: H0 : p1 = p2

Alternativas
139

Para n grande, a estatística de teste pode ser


definida como:

Estatística de Wald

Zw é aproximadamente normal quando p1 = p2

Região de rejeição
140

EXEMPLO DIDÁTICO software

Acredita-se que um paciente submetido a um


procedimento cirúrgico X apresenta menos
complicações após do que pacientes submetidos a um
procedimento Y. Deseja-se saber, com base em uma
amostra de 152 pacientes em cada grupo, se é razoável
sugerir que o segundo procedimento apresenta mais
complicações do que o primeiro. Considere que nas
amostras retiradas obteve-se 5% de complicação no
procedimento X e 15% após o tipo de cirurgia Y. Qual a
sua conclusão ao nível de significância de 1%?

Hipóteses?
141

USANDO O SOFTWARE
• No STATA este teste pode ser feito usando a sintaxe:
prtesti 152 8 152 23, count
142

Testes não paramétricos


143

Motivação
• As técnicas não-paramétricas são métodos
alternativos extremamente interessantes para
análises de dados qualitativos.

• Independem dos parâmetros populacionais e de


suas respectivas estimativas.

• Uso em situações onde a variável analisada não


segue uma distribuição normal e/ou as amostras
são pequenas.
144

Vantagens Desvantagens

Não exigem Perda de informação,


populações distribuídas uma vez que os dados são
normalmente; reduzidos a uma forma
qualitativa.
Podem ser aplicados a
dados não numéricos;  Não muito eficientes ;
Requerem amostras
Em geral envolvem maiores para detectar se
cálculos mais simples. as diferenças realmente
existem.
145

PRINCIPAIS TESTES

Amostras Amostras
independentes dependentes

- Teste do sinal para 1 -Wilcoxon signed


amostra ranks
-Wilcoxon-Mann -McNemar
Whitney
-Kruskal Wallis
146

Parte I: Testes não paramétricos


para amostras independentes
147

TESTE DOS SINAIS PARA MEDIANA DE


UMA AMOSTRA
• Contrapartida não-paramétrica para o Teste-t
quando temos 1 amostra.

• Um dos testes mais fáceis.

• Os dados convertidos para sinais de mais (+) ou de


menos (-).
• A ideia: analisar a frequência dos sinais de mais ou
de menos.

• Suposição importante: amostra aleatória


148

• Hipóteses testadas
H0: m = m0
H1: m ≠ m0 (ou m > m0 , m < m0)

Funcionamento do teste
• Calcula-se a mediana da amostra (m0)
• As observações maiores que m0 recebem o sinal
“+” e as observações que forem menores recebem
o sinal “−”.
149

• Seja K o nº de observações que receberam sinal


“+”.
• K ~ binomial (n, θ).
• Se Ho for verdadeira, isto é, no caso de m0 ser a
mediana, então θ = 0.5 -> K ∼ bin(n; 0, 5).
• Rejeita-se Ho, ao nível de significância α, se K for
um valor muito extremo (o quão extremo
depender de H1)
O que acontece com a estatística
de teste quando temos grandes
amostras? A região critica muda?
150

EXERCÍCIO DIDÁTICO
Uma máquina deve produzir arames com diâmetro
de 1 mm. Para verificar se a máquina está ajustada
de maneira adequada, 13 pecas por ela produzidas
foram selecionadas e medidas obtendo-se os
seguintes resultados:

1,017 1,001 1,008 0,995 1,006 1,011 1,009 1,009 1,003


0,998 0,990 1,007 1,002
Com base nessa amostra, você diria que essa
máquina precisa ser reajustada?
Considere α =0.10
151

RESOLUÇÃO
• Definir as hipóteses
H0: m = 1 vs H1: m ≠ 1 -> H0: θ = 0.5 vs H1: θ ≠ 0.5

• Região crítica: com base na dist. Binomial


• Para α = 0, 10, a região crítica é {K ≤ 3} ou {K ≥ 10}
(tabela da binomial).
• Na amostra tem-se que Ko = 10.
Conclusão?
152

WILCOXON MANN-WHITNEY
(TESTE U)
• Metodologia alternativa ao Teste –t para 2
amostras
• Envolve 2 populações independentes sem
informações a respeito de suas distribuições.

• Variáveis envolvidas em escala pelo menos


ordinal.

• Objetivo: saber se uma população tende a ter


valores maiores do que a outra, ou se elas têm a
mesma mediana.
153

• Baseado nos postos dos valores obtidos


combinando-se as duas amostras.

• Ordenação dos valores, do menor para o maior,


independentemente de qual população cada valor
provém.
• Postos mais baixos são atribuídos aos maiores
números negativos (se houver).

• O valor da estatística U é o nº de vezes que um


escore no grupo com n2 casos precede um escore
no grupo com n1 casos no grupo ordenado
crescentemente.
154

Por exemplo, suponha-se um grupo experimental com


3 casos e um grupo de controle com 4 casos.
n1
n2

-Conta-se o número de escores E que precedem cada


escore deste grupo. Nenhum escore E precede o escore
C igual a 6. Isto também é verdade para o escore C = 8.
O próximo escore C é 10 e é precedido por um escore
E. O último escore C, o 13, é antecedido por dois
escores E. Assim, U = 0 + 0 + 1 + 2 = 3.
155

• A distribuição amostral de U, sob H0, é conhecida e


pode-se então determinar-se a probabilidade
associada à ocorrência, sob H0, de qualquer valor
de U tão extremo quanto o valor observado.

• Em amostras muito pequenas (n1 <8 e n2 <8),


pode-se utilizar a tabela J (Siegel, pg. 302-04) para
determinar a probabilidade mencionada acima.

• Em amostras médias (9 ≤ maior grupo≤ 20), pode-


se aplicar a prova de Mann-Whitney utilizando a
tabela K (Siegel, pg. 305-08)
156
157

Exemplo STATA

• Grande amostras (n > 20): Mann e Whitney


mostraram (1947), que à medida que n1 e n2
aumentam, a distribuição amostral de U tende
rapidamente para a distribuição normal.

• Quando ocorrem empatem entre as observações


atribui-se a cada um dos valores empatados a
média dos postos que lhes seriam atribuídas se
não houvesse empate.

• Softwares disponibilizam métodos com correção


para empates.
APLICAÇÕES NA LITERATURA
158
159

KRUSKAL WALLIS
• Útil para decidir se k amostras independentes
provêm de populações diferentes.
• Procedimento alternativo à ANOVA paramétrica
• Suposição importante: variável mensurada em
escala no mínimo ordinal.
• Procedimento: as n observações (das k amostras)
são substituídas por um posto. Ao menor escore
atribuí-se o posto 1, ao seguinte o posto 2 e assim
sucessivamente até o maior posto que é n,
160

• Determina-se a soma dos postos em cada amostra


(coluna).
• O método irá testar se estas somas são tão diferentes
entre si que não seja provável que tenham sido todas
retiradas de uma mesma população.

• Quando n grande (mais de 5 elementos em cada


amostra)
-> Sob H0 a estatística H~ꭓ2 com gl= k-1
• Se n pequeno (k = 3 e o número de casos em cada
uma das 3 amostras <= 5), utiliza-se a tabela O (Siegel,
pg. 313- 14).
161

• O teste de Kruskal –Wallis é abrangente e não


informa que grupos específicos de sua variável
independente são estatisticamente diferentes uns
dos outros;
• A hipótese alternativa é que pelo menos dois
grupos diferem.
• Para determinar quais desses grupos diferem
pode-se fazer testes post hoc .
162

• O teste de Kruskal é muito menos sensível a


outliers .
• Metodologia não é livre de pressupostos, uma vez
que conclusões você pode fazer vai depender da
distribuição dos dados.
• Para interpretar os resultados de um teste de
Kruskal- Wallis precisa conhecer se as distribuições
em cada grupo têm a mesma forma.

Se semelhantes -> mediana


Se não são-> ranks médios
APLICAÇÕES NA LITERATURA
163

Um estudo comparativo da eficácia do Grupo de terapia cognitiva e exercício aeróbio no Tratamento da Depressão entre os
alunos.
164

EXEMPLO DIDÁTICO software

Dados referentes a 50 estados americanos


contendo a idade média da população e a região
do país. O interesse é testar a igualdade da
distribuição da idade em todas as quatro regiões.

Hipóteses?
165

Parte II: Testes não


paramétricos para amostras
dependentes
166

WILCOXON SIGNED RANKS TEST

• Contrapartida não-paramétrica para o Teste-t


quando temos amostras dependentes.
Pop.X Pop.Y

(x1, y1,),(x2, y2),... ,(xn, y1n )

H0 : distribuição de X=distribuiçao de Y.
vs que é diferente
167

Funcionamento

• Obter as diferenças : D = Xi - Yi
• Sob H0 : Med(D) =0 vs Med(D) ≠0 (ou > ou <)
• Obter |Di |
• Ignore os empates (D=0)
• Passos seguintes são iguais as do teste para 1 mediana já
visto.
• Empates podem ocorrer e softwares dispõem de
procedimentos para tratar.
• Sob H0 é de esperar que a soma das ordens positivas (T+ )
não difira grandemente da soma das ordens negativas (T- ).
168

Exemplo no software

• Em pequenas amostras a tabela G (Siegel, pg. 285)


fornece vários valores de T (estatística do teste –
soma dos postos) com os respectivos níveis de
significância.

• Tobs< valor tabela G sob, dado α e n, rejeita-se a


hipótese de nulidade àquele nível.

• Em grandes amostras (n> 25) T ~ normal,


169

EXEMPLO NA LITERATURA

Facebook como um ambiente de aprendizagem para o ensino de


emergências médicas na prática odontológica .
Estudantes sirios de odontologia sírios foram convidados a participar de um grupo no Facebook
“emergências médicas na prática odontológica " durante o segundo semestre do ano lectivo de
2013-2014 . Administradores do grupo publicou 61 mensagens durante o período do curso , que
se estendeu por um mês. o progresso de aprendizagem dos alunos foi avaliado por meio de
questionários de auto-avaliação administrados aos alunos antes e depois do curso. Estatísticas
qualitativas , Wilcoxon sgined rank test e Mann-Whitney U foram utilizados para analisar os
dados.
170

Parte III: Testes usando a


distribuição Qui-Quadrado
171

TESTE QUI-QUADRADO DE
INDEPENDÊNCIA
• Procedimento estatístico mais utilizado para testar a
hipótese nula de independência (não associação)
entre duas variáveis categóricas.

Hipóteses:
H0 : Não existe associação entre as variáveis
H1 : Existe associação entre as variáveis

• Quando a tabela é 2x2 se equivale ao procedimento


da comparação de 2 proporções.
172

Estatística de Pearson
• Uso em tabelas de contingência Ilinhas x Jcolunas.
Oij=freq. observada linha i,
coluna j
Eij= total linha i x total coluna j
total

• Para n grande esta estatística segue distribuição qui-


quadrado com (I -1)x (J-1).

• Critério de decisão: comparar o valor calculado para


com o valor teórico da distribuição qui-quadrado ou
calcular o p valor.
173

EXEMPLO LITERATURA
• Considere os dados de um estudo randomizado
cujo objetivo foi avaliar o efeito da vacinação
contra influenza em adultos.

Pergunta-se: Ao nível α = 5%, existe associação entre


vacinação e a presença da gripe influenza?
174

As hipóteses:
H0: Não existe associação entre vacinação e
ocorrência de influenza
H1 : Existe associação entre vacinação e ocorrência de
influenza

• Passo 1: descrever a proporção de pessoas com a


gripe de acordo com status de vacinação

20/240
175

• Se não houver efeito da vacina espera-se que a


proporção de pessoas com influenza seja igual nos
2 grupos.

• O teste compara frequências observadas com


aquelas esperadas se não houvesse associação
entre as variáveis.

• Observou-se 21.7% dos indivíduos com a gripe.


Assim, espera-se essa mesma proporção de
indivíduos doentes nos 2 grupos caso não haja
associação.
176

• Usando os dados da tabela acima podemos calcular


a estatística de Pearson definida anteriormente.

Qui-quadrado tabelado: gl = 1, α=5% =3.84 Conclusão?


177

• Este procedimento é equivalente ao teste para 2


proporções definido anteriormente (H0 : p1 = p2) .

• As estimativas de p1 e p2 são, respectivamente,


e

• A estatística de teste é dada por:

Sob H0:

Ztab bilateral= 1,96


178

Algumas observações
• A vantagem do teste de hipótese para proporções é que
ao utilizar a distribuição normal ele também permite a
obtenção de intervalos de confiança.

• Já o teste qui-quadrado permite a comparação de


proporções para um número maior de grupos.

• A validade do teste qui-quadrado depende de grandes


amostras.

• Cuidado com as conclusões tiradas sobre o método:


não informa a direção e nem a magnitude da associação
179

TESTES EXATOS
• Inferência usando aproximação qui-quadrado
exige grandes amostras.
• Situações em que métodos aproximados podem
fornecer resultados errôneos:
 amostras pequenas
 dados esparsos (entre diferentes categorias)

• Métodos exatos são geralmente baseados em


técnicas permutacionais.
180

• Muitos softwares estatísticos já possuem estes


procedimentos disponíveis .

• Dados com caselas com frequência pequena ou


nulas usualmente necessitam de métodos exatos
para testar associações.

• Uso recomendado: n< 20 ou quando há valores


esperados na tabela menores que 5.
181

EXEMPLO DIDÁTICO

• Considere um exemplo com dados de um estudos que


avaliou fatores associados ao envolvimento de
gestantes com drogas (Porto et al, 2015).

• Desfecho de interesse: uso de álcool e outras drogas


em algum momento na vida.
• Fator associado: faixa etária
• Amostra não aleatória: gestantes atendidas em uma
maternidade pública (n=268).
• α =5%
182

O uso do teste exato fez-se necessário neste


exemplo, pois existem caselas com frequências
esperadas <5.
183

USANDO O SOFTWARE

• No STATA o comando para execução do teste exato de


Fisher é :
tabi 3 28\ 29 126\ 16 66, chi2 exact

qui-
quadrado
184

Teste de homogeneidade
• Consiste em verificar se uma variável aleatória se
comporta de maneira semelhante, ou homogênea,
em várias subpopulações.

• Realização similar ao do teste de independência,


distinguindo na forma como as amostras são
coletadas.

• No teste de homogeneidade, fixamos o tamanho da


amostra em cada uma das subpopulações e, então,
selecionamos uma amostra de cada uma delas.
185

• Considere o exemplo com dados de contagem de


produtos defeituosos e não defeituosos das marcas
A e B. Poderíamos organizar essa informação na
seguinte tabela:

• Se o objetivo é verificar se a proporção de produtos


defeituosos é a mesma para as marcas (H0), então
podemos aplicar o teste de qui-quadrado para
homogeneidade.
186

• Sob esta hipótese, esperaríamos a seguinte tabela:

• A estatística de teste é a mesma usada para o teste


qui-quadrado de independência.
187

• Para estes dados o valor do qui-quadrado calculado


é = 25, 96.

• Comparamos com o valor tabelado de acordo com o


número de graus de liberdade (gl) e com o nível de
significância (α = 1%, 5% ou 10%).

• Gl = (r – 1)×(c – 1) = (2 – 1)×(2 – 1) = 1.
• Considerando α = 5%, temos

• Rejeitamos H0 se: >


188

TESTE DE MCNEMAR –
AMOSTRAS PAREADAS
• Em muitas situações as tabelas 2x2 fornecem
informações de amostras dependentes (pareadas).

• Exemplos: medidas feitas nos olhos direito e esquerdo


de uma mesma pessoa, medidas antropométricas
medidas em 2 pontos do tempo, peso antes e após uma
dieta.

Dados de amostras
pareadas
189

• Pergunta de investigação: a proporção dos que


responderam sim na ocasião 1 é a mesma
proporção dos que responderam sim na ocasião 2?

• Seja
• Hipótese de interesse: H0 : p1 = p2

• Em 1947, o psicólogo e estatístico americano Quinn


Michael McNemar desenvolveu um teste qui-
quadrado para responder a este tipo de questão.
190

• Ele mostrou que apenas os elementos fora da


diagonal são importantes para determinar se existe
diferença entre estas proporções .

• Sua estatística de teste é:


191

EXEMPLO DIDÁTICO

Um investigador tenta determinar se uma droga


tem um efeito sobre uma determinada doença.
Contagens de indivíduos são dados na tabela , com
o diagnóstico (doença : presente ou ausente ) antes
do tratamento dado nas linhas, e o diagnóstico
após o tratamento nas colunas .
• Dados com mesmos indivíduos antes e após.
• α = 5%
192

a b
c d

• A hipótese nula é de que não há efeito do


tratamento , e então, H0 : pdoenteAntes = pdoenteDepois

• Utilizando o teste de Mcnemar, temos:


P valor <0.01

Conclusão?
193

• Estes testes não informam sobre a direção da


associação.

• Não mensuram associação entre categorias de


variáveis e sim entre 2 variáveis qualitativas.
194

Aplicação dos testes de


hipóteses para dados
categorizados
exemplos na literatura
195

COMPARAÇÃO DE DUAS PROPORÇÕES

Características das mães e


das crianças, comparando
aquelas acompanhadas até o
fim do estudo com as não
acompanhadas. As crianças
que foram acompanhadas
até o final não eram
diferentes das que foram
perdidas.

Avaliação do impacto de centros de lactação sobre padrões de amamentação...


Rev. bras. epidemiol. vol.5 no.1 São Paulo Apr. 2002
TESTES DE ASSOCIAÇÃO
196

grupo respirador bucal (RB) e grupo respirador nasal (RN).

Associação entre as alterações posturais e a respiração bucal em crianças.


Fisioter. Mov., Curitiba, v. 25, n. 2, p. 379-388, abr./jun. 2012
TESTE DE MCNEMAR
197

Funcionalidade e estado geral de saúde em idosos com dor lombar


agudizada: um estudo longitudinal – Tese (Ribeiro, J. P.V – 2014)
198

Concluindo
199

RELAÇÃO ENTRE IC´S E TESTES DE


HIPÓTESES

• IC´s: fornecem intervalos de valores para o


parâmetro de interesse baseado nos dados
amostrais

• Testes de hipóteses: avaliam se os dados são


consistentes com um valor hipotético específico.

• Desta forma, se H0 for rejeitada, o IC


correspondente não incluirá o valor hipotetizado.
200

• IC´s podem ser usados para avaliar significância


estatística, assim como o teste de hipóteses

 Se o intervalo de confiança contém o valor que


reflete “não efeito” , então implica em “não
significância estatística”

Se o intervalo de confiança não contém o valor


que reflete “não efeito” , então implica em “
significância estatística”
201

• IC tem vantagem adicional por informar através


dos limites o quão pequeno ou grande o efeito pode
ser.

• Se o intervalo é estreito, então a estimação é mais


precisa, indicando que o estudo tem poder para
detecção de tal efeito.

• Em contrapartida, se o intervalo é muito amplo,


indica baixa precisão dos resultados, ou seja, o
estudo tem “baixo poder’’ para estimar o efeito de
interesse.
202

OUTROS COMENTÁRIOS

• A publicação apenas de resultados


estatisticamente significantes pode levar os
pesquisadores a conclusões errôneas a respeito
de suas questões.
• Também chamado de viés de publicação.
• P valor <0.001 não implica em achado importante
do ponto de vista prático e teórico.
203

RECENTES DISCUSSÕES

“O p value nunca foi destinado a ser um substituto para o


raciocínio científico. Argumentos estatísticos bem fundamentados
contêm muito mais do que o valor de um número único e se esse
número exceder um limite arbitrário. A declaração da American
Statistical Association (ASA) destina-se a orientar investigações
na era do “p<0,05 " “(Ron Wasserstein , diretor executivo da ASA)
204

Sucesso e
obrigada!
“O conhecimento torna a alma jovem e
diminui a amargura da velhice. Colhe, pois,
a sabedoria. Armazena suavidade para o
amanhã”.
Leonardo da Vinci

You might also like