Inferência estatística: estimação e testes de hipóteses

Inferência estatística
Especialização em estatística aplicada

Turma: 02
Profª : Ana Clara Campos
Agosto/setembro de 2017
2
EMENTA
• Estimação pontual e propriedades básicas de um estimador
• Estimação intervalar para a média populacional (para
pequenas e grandes amostras)
• Estimação intervalar para proporção populacional (para
grandes amostras)
• Estimação intervalar para a variância populacional
• Intervalos de confiança para diferença entre duas médias
populacionais
• Intervalos de confiança para diferença entre duas
proporções populacionais
EMENTA
3
 Teste de hipóteses: Hipóteses estatísticas

 Tipo de erros
 Nível de significância e poder do teste
 p-valor
 Teste de uma média populacional (pequenas e grandes
amostras)
 Teste de uma proporção populacional
 Teste para a diferença de duas médias populacionais
 Teste para a diferença de duas proporções populacionais
 Teste de uma variância populacional
 Teste de Homogeneidade
 Testes não paramétricos.
4
O QUE É INFERÊNCIA?
• Conjunto de técnicas que objetiva estudar a

população através de evidências fornecidas por
uma amostra.
• Conhecer característica de uma população via

informação amostral.
• Essa característica na população pode ser

representada por uma variável aleatória.
5
CONCEITOS BÁSICOS
 População: conjunto de indivíduos, objetos ou
informações que apresentam pelo menos uma
característica comum, cujo comportamento temos
interesse analisar;
 Amostra é qualquer subconjunto da população;
 Parâmetro é uma medida usada para descrever uma
característica da população;
Ex: O diretor de uma empresa gostaria de saber se os
funcionários estão satisfeitos com os benefícios.
População? Característica? Parâmetro?

6
• Amostra aleatória: conjunto de n variáveis

aleatórias independentes (X1,X2,...,Xn), cada uma
com a mesma distribuição de X.
• Estatística: qualquer função de uma amostra
aleatória.
• Estimador: combinação de elementos da amostra,
construída com a finalidade de estimar um
parâmetro .
• Estimativa : valores numéricos assumidos pelos
estimadores .
7
Exemplo de Estatísticas
2
X 1  X 2  ...  X n X i  X 
n
1
X s2  
n  1 i 1
n
Notação
8
Problemas da Inferência
 Estimação e Testes de Hipóteses
Exemplo:1: Qual a distribuição da altura de
homens brasileiros?
Exemplo II: Deseja-se saber se a média da altura

dos homens brasileiros é maior que a dos
chilenos.
Qual modelo probabilístico mais razoável pensar? Quais

os parâmetros a serem identificados? Qual abordagem
utilizar em cada caso?
9
Estimação Testes de hipóteses
Qual é a proporção de
O candidato A vencerá as
votos que o candidato A
próximas eleições para
terá nas próximas eleições
prefeito de SP?
para prefeito de SP?
 Qual é a proporção de  Pelo menos 2% dos

motoristas baianos que motoristas habilitados da
tiveram sua carteira BA tiveram suas carteiras
apreendida após a apreendidas após a lei
vigência da lei Seca? Seca.
10
11
Estimação Pontual
12
• Estima-se (calcula-se) o parâmetro desconhecido

usando o valor de um estimador, o qual chamamos
de estimativa pontual.
• Fornece como estimativa um único valor numérico

para o parâmetro.
• Não permite julgar a magnitude do erro.
13
USOS DA ESTIMAÇÃO PONTUAL

• Estimar a proporção (p) de habitantes de
Salvador do sexo feminino que tomaram a vacina
da febre amarela na ultima campanha.
• Suponha que foi selecionada aleatoriamente uma

amostra de 30 funcionários da área
administrativa de uma empresa. Deseja-se saber
a idade em que eles conseguiram o seu primeiro
estágio em Administração, sabendo-se que a
população tem um comportamento normal.
14
EXERCÍCIO
Suponha que estamos interessados na média (μ) e
variância (σ2) das alturas de jovens com idade entre 15 e
18 anos de certa cidade do Brasil. Escolhemos ao acaso
10 jovens.
A amostra:
Qual o melhor estimador para μ? E para σ2 ?

15
PROPRIEDADES BÁSICAS DE UM ESTIMADOR
P1. Não Tendenciosidade

Um estimador é dito não viciado (não viesado) se sua
média é igual ao parâmetro.
P2. Consistência
Um estimador é consistente se: é não viesado e tende a se
aproximar do parâmetro a que se refere quando o tamanho
da amostra aumenta.
P3. Eficiência
Quando um estimador tem uma dispersão pequena
comparado a outros estimadores.
ILUSTRANDO
• Considere 4 jogadores, cada um com 8 dardos em que os
dardos representam as amostras e os jogadores os 4 tipos de
estimadores .
Comentários?
Mais
Não Eficiente,
viciado e viciado
Eficiente
Viciado e
Não viciado Não
e Não Eficiente
eficiente
17
Estimadores para a média, proporção e

variância
18
Estimação Pontual e Distribuição Amostral
Os estimadores pontuais são variáveis aleatórias e,

portanto, possuem uma distribuição de probabilidade,
em geral, denominada distribuição amostral.
Distribuição amostral: distribuição de probabilidade

de uma estatística quando consideramos todas as
amostras possíveis de tamanho n.
19
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA
• Distribuição de probabilidade de todos os valores

possíveis de médias retiradas de amostras de
mesmo tamanho.
• Utiliza-se um resultado fundamental na teoria da

Inferência Estatística: Teorema do Limite Central
(TLC).
20
TEOREMA DO LIMITE CENTRAL

1. Para amostras aleatórias selecionadas de uma população
normal com média μ e variância σ2 finita, a distribuição
amostral de pode ser aproximada, pela distribuição
normal com média μ e variância σ2/n.
2. A distribuição da média amostral, devidamente

padronizada, se comporta segundo um modelo Normal
padronizado (Z).
3. Se a população de origem é não-normal, a distribuição de

médias amostrais será aproximadamente normal para
grandes amostras.
21
EFEITO DO TAMANHO AMOSTRAL SOBRE A

DISTRIBUIÇÃO DE X
Comentários?
22
O CASO DA PROPORÇÃO AMOSTRAL ( )

• Coletamos uma a.a. de X~Bernoulli(p) com o
objetivo de estimar a proporção (p) de elementos
numa população com determinada característica.
• Pode-se definir X da seguinte maneira:

1, se o i - ésimo elemento apresentaa característica;
Xi  
0, se o i - ésimo elemento não apresentaa característica.
Temos que com:

E(Xi )  p e Var(X i )  p(1  p)
23
• Ao somarmos todos os Xi’s saberemos quantos da

população possuem o atributo de interesse.
• Definindo p̂ como sendo a proporção de temos

que: 1 n
ˆ p
n
 X
i 1
i X
• Pelo TLC, podemos dizer que a distribuição

amostral de p̂, caso o tamanho da amostra extraída
seja suficientemente grande è:
 p(1-p) 
p̂ ~ N p, 
 n 
ESTIMAÇÃO PONTUAL X INTERVALAR
Pontual – fornece um único valor do

parâmetro de interesse e não permite
julgar a magnitude do erro.
Intervalar – fornece uma faixa valores

dentro da qual o parâmetro
provavelmente está incorporando uma
margem de erro associada a estimativa
pontual.
25
Estimação Intervalar
26
IDEIA
• Construir intervalos de confiança que incorporem
à estimativa pontual, informações a respeito de
sua variabilidade (erro amostral).
Limite Limite
inferior superior
[Estimativa – erro; Estimativa + erro]
• Baseados na amostra, gostaríamos de construir

um intervalo que com alta probabilidade
contivesse o verdadeiro valor do parâmetro.
27
 Seja  o parâmetro (média, proporção ou variância)

de interesse.
 Desejamos obter um intervalo cuja expressão, IC(,

1-), envolve uma estimativa do parâmetro  e um
coeficiente de confiança (1-α) ;
 Intervalos de confiança são obtidos por meio da

distribuição amostral do estimador pontual;
28
• Os limites do intervalo dependerão da amostra

selecionada. Logo são aleatórios.
• O valor 1- ꭤ é o nível de confiança e representa a

probabilidade de obter um intervalo que contenha
o verdadeiro valor do parâmetro.
• A precisão depende da amplitude do intervalo (LS –

LI)
• Valores usuais
Interpretando o IC
29
Interpretação : se pudéssemos repetir o estudo um

grande número de vezes, 1-α% dos intervalos de
confiança obtidos conteriam o verdadeiro valor do
parâmetro de interesse.
AMOS
TRA
1 ( )
2 ( )
3 ( )
4 ( )
5 ( )
6 ( )
7 ( )
...

30
Lembrar:
• Na prática, tem-se apenas uma estimativa do

estudo e não sabemos o verdadeiro valor do
parâmetro.
• Intervalos de confiança são calculados para se ter

uma noção da precisão da estimativa.
• Intervalos de confiança estreito indica boa

precisão, mas não necessariamente que a
estimativa é próxima do parâmetro porque podem
haver vieses.
31
E como evitar viés?
Garantir que os instrumentos usados na coleta de

dados estejam sendo usados corretamente e sejam
apropriados para o que se deseja avaliar.
 Procedimento amostral correto (amostragem

probabilística).
32
Importante saber que:
Aumentar o tamanho da amostra aumenta a precisão:
 mas não garante ausência de viés;
 e viés pode produzir resultados bastante incorretos.

33
EXEMPLOS NA LITERATURA
**Avaliação comparativa de sistemas de saúde com a

utilização de fronteiras estocásticas: Brasil e OCDE*
Rev. Bras. Econ. vol.66 no.1 Rio de Janeiro Jan./Mar. 2012

34
O QUE NÃO FAZER

Métodos gráficos
35
Análise do perfil de crescimento de 566 crianças com idade entre 3 meses e 3 anos
matriculadas nas 14 creches municipais de Paulínia (SP).
J pediatr (Rio J) 1996;72(4):245-250

36
INTERVALOS DE CONFIANÇA
NECESSÁRIO SABER
• Se a amostra foi obtida de forma independente ou

pareada;
• Se a variável resposta tem natureza quantitativa ou
qualitativa;
• Se as amostras são pequenas ou grandes;
• A distribuição amostral do estimador.

37
Caso 1: Estimação intervalar para

média de 1 população com variância
conhecida e grandes amostras
38
• O intervalo de confiança para a média µ com

variância conhecida é construído com base na
distribuição amostral de .
• Vimos que, pelo TLC,

39
• Fixando um valor entre 0 e 1 para o coeficiente de

confiança 1-α (100)% podemos encontrar um
valor zα/2, e posteriormente encontrar um IC para a
média μ como:
   
IC( ,1   )   X  z  ; X  z 
 2 n 2 n 
Nível de confiança
40
USO DA TABELA NORMAL

TABELA – Distribuição Normal padrão para valores de P(0 < Z < z0).
41
EXEMPLO1
Sem embasamento estatístico nenhum, o prefeito de certo

município deseja estimar a média de gastos dos turistas
que visitam a cidade. Com este propósito, uma amostra
aleatória de 121 turistas foi selecionada para a
investigação e encontrou-se que a média foi igual a R$
500,00 e desvio padrão de R$ 250,00.
a) Qual o intervalo de confiança, a 99% para a média dos

gastos de turistas com a cidade?
Qual o parâmetro de interesse? Como calcular o

intervalo de confiança ?
42
EXEMPLO 2
O maior tempo dedicado às atividades de baixa
intensidade, como assistir televisão, tem
contribuído para o ganho de peso dos
adolescentes.
Questão de investigação: usualmente quantas

horas os adolescentes gastam assistindo tv?
Terminologia estatística: conhecer o tempo médio

(μ) em frente à tv.
43
Resultados da análise de dados
• Como o erro padrão (SE Mean) foi obtido?

• Qual o impacto do tamanho da amostra no IC?
• Qual a interpretação do IC calculado pelo software?
44
Praticando no software
45
Caso 2: Estimação intervalar para a

média de 1 população em pequenas
amostras
46
Situações a serem avaliadas com cuidado
• A amostra é muito pequena e

• a distribuição é extremamente assimétrica.
Quando a amostra é pequena e a distribuição é

aproximadamente simétrica:
 uso da distribuição t-Student no lugar da

distribuição Normal.
47
DISTRIBUIÇÃO T-STUDENT
Variabilidade maior
que a da Normal
Utilizada para fazer inferência a respeito da média

populacional em amostras pequenas.
 Não é recomendada em casos extremos de
assimetria da distribuição (não paramétrica)
48
O Intervalo de Confiança de (1-ꭤ) para a média

populacional μ é dado por:
 S S 
IC1 (  )   X  t / 2,n 1 ; X  t / 2,n 1 
 n n 
 Os valores t / 2,n 1 encontram-se tabelados.
 A distribuição t-Student depende dos graus de

liberdade (gl). Neste procedimento gl=n-1.
49
Tabela T- Student
50
EXEMPLO DIDÁTICO
• Um pesquisador está estudando a resistência de
um certo material sob determinadas condições.
Ele sabe que essa variável é Normalmente
distribuída com variância igual a 4 unidades2.
• Foi extraída uma amostra aleatória de tamanho
10.
7,9 6,8 5,4 7,5 7,9 6,4 8,0 6,3 4,4 5,9
• Obtenha um. IC de 90% para a resistência média

51
BOM SABER
• A maioria dos softwares estatísticos usam a

distribuição t-Student para obter IC´s para as
médias, não importando o n.
• Para amostras grandes , o uso da distribuição t-

Student ou da Normal resultam em IC´s idênticos.
52
Caso 3 : Estimação intervalar para 1

proporção populacional
(grandes amostras)
53
• Respostas dicotômicas em uma única amostra.
X
• Considere a proporção amostral pˆ  .
n
• Pelo TCL, a distribuição amostral de p̂ é

aproximadamente normal. Assim , o Intervalo de
Confiança de (1-ꭤ) x 100% para a proporção
populacional p é dado por:
 pˆ (1  pˆ ) pˆ (1  pˆ ) 
IC1 ( p)   pˆ  z ; pˆ  z 
 2 n 2 n 
54
• A fórmula do IC para a proporção só deve ser

aplicada para amostras aleatórias grandes.
p̂
• Uma vez que a distribuição amostral de só é
aproximadamente normal nessas condições.
• Na prática recomenda-se ter amostras com pelo

menos 15 observações em cada categoria da
variável binária .
55
Intervalo de confiança conservador
• Considerar a proporção máxima -> p=50%
• Fornece intervalos de confiança excessivamente

grandes quando p se distancia de ½ ( p≈ 0 ou p ≈1)
(Bussab & Moretin, 2002).
• Importante ter algum conhecimento sobre p,

garantindo que seu valor esteja próximo de ½.
56
EXEMPLO
• Um produtor deseja estimar a proporção de itens
de certo artigo na linha de produção de sua
empresa que apresentam defeito de fabricação.
Para esta finalidade, retirou uma amostra aleatória
de 200 itens da linha de produção, constatando que
184 destes não apresentaram defeito de fabricação.
• Construa um intervalo de confiança de 95% para a

proporção de itens na linha de produção com
defeito de fabricação.
E se o IC fosse
conservador?
EXEMPLOS NA LITERATURA 57
Disability related to chronic low back pain: prevalence and associated factors
Rev. esc. enferm. USP vol.46 no.spe São Paulo Oct. 2012.
58
Prevalence of Autism Spectrum Disorders — Autism and Developmental Disabilities Monitoring

Network, 14 Sites, United States, 2008.
Morbidity and Mortality Weekly Report (MMWR)

59
Caso 4 : Estimação intervalar para a

variância populacional
60
REQUISITOS
• Amostra aleatória simples
• População deve se comportar segundo uma
distribuição Normal, mesmo que amostra seja grande.
** Afastamento da distribuição normal pode levar a

erros grosseiros.
** Uso da distribuição qui-quadrado para construir o IC.

DISTRIBUIÇÃO
61
QUI-QUADRADO
Suponha que :
• População seja normalmente distribuída.
• Tenha variância populacional (σ2 ).
• Amostras aleatórias independentes de tamanho
n.
• Calculadas as variâncias amostrais (s2).
• Esta estatística amostral tem distribuição qui-
quadrado.
62
PROPRIEDADES IMPORTANTES
• A distribuição (ꭓ2) é determinada pelos graus de
liberdade (gl=n – 1).
• Simétrica e valores positivos.
• À medida que os graus de liberdade aumentam,
distribuição qui-quadrado se aproxima de distribuição
normal.
63
A TABELA ꭓ2
64
Um intervalo de 100(1-α)% de confiança para σ2 é

dado por:
Para uma nível de confiança fixado pode-se

determinar os quantis e
da distribuição qui-quadrado.
65
• A distribuição qui-quadrado possui numerosas

aplicações importantes em inferência estatística.
• Devido a sua importância está tabulada para

diferentes valores do parâmetro n.
• Bastante utilizada em aplicações reais, como na

análise de Controle de processos
66
Caso 5: Intervalos de confiança para

diferença entre duas médias
populacionais
67
Considere duas populações A e B cujas médias são μA

e μB e variâncias σA2 e σA2, respectivamente.
Um estimador não viciado para μA - μB é dado pela

estatística e sua distribuição amostral é obtida
conforme três diferentes situações:
a) Populações independentes com variâncias

conhecidas;
b) Populações independentes com variâncias
desconhecidas, porém, iguais;
c) Populações independentes com variâncias
diferentes e desconhecidas.
68
INTERVALO DE CONFIANÇA PARA A DIFERENÇA

ENTRE AS MÉDIAS DE DUAS POPULAÇÕES
INDEPENDENTES COM VARIÂNCIAS CONHECIDAS
• Seja uma a.a de tamanho nA , retirada de uma

população A e uma a.a de tamanho nB retirada de
uma população B, independentes. Considerando
que as variâncias sejam ambas conhecidas, temos
que:
~ N (0,1)
69
Logo, para o caso em que as variâncias são

conhecidas, temos que:
Então, um IC (1-ꭤ)x100% para (μA - μB ) é dado por:

70
EXEMPLO DIDÁTICO
Num estudo comparativo do tempo médio de adaptação,
uma amostra aleatória de 50 homens e 50 mulheres de
um grande complexo industrial, produziu os seguintes
resultados:
Homens Mulheres
Média 3,2 anos 3,7 anos
Sabe-se que os desvios padrão populacionais são,

respectivamente, 0.8 anos e 0.9 anos. Construa um IC
para a diferença dos tempos médios de adaptação
considerando um nível de confiança de 90%. Qual a sua
conclusão?
71
INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE

AS MÉDIAS DE DUAS POPULAÇÕES INDEPENDENTES
COM VARIÂNCIAS DESCONHECIDAS E IGUAIS
• Nesse caso, σA2 = σB2 = σ2 e podemos estimar uma

variância comum, e então utilizar as informações de
ambas as amostras para ter uma estimativa da
variância populacional.
• A variância combinada Sp2, nada mais é do que uma

variância ponderada pelos graus de liberdade das
duas amostras:
72
• Como temos um estimador comum para a variância

populacional, pode-se obter uma distribuição de
probabilidade para e concluímos que:
• Logo, um IC (1-ꭤ)x100% para (μA - μB ) pode ser

escrito como :
73
EXEMPLO DIDÁTICO
Um mesmo tipo de material pode ser adquirido por
2 fabricantes. As variáveis de interesse são a
resistência mecânica do material (em unidades
convenientes) para cada fabricante. Para comparar
os seus valores médios obteve-se uma amostra
aleatória de cada:
74
Para o quadro!
• Admita populações aproximadamente normais e

um nível de confiança de 95%, o que se pode
afirmar a respeito das resistências médias do
material produzido pelos dois fabricantes? Qual a
sua decisão?
75
INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE

AS MÉDIAS DE DUAS POPULAÇÕES INDEPENDENTES
COM VARIÂNCIAS DESCONHECIDAS E DIFERENTES
• Considere duas populações A e B com médias μA e

μB e variâncias diferentes e desconhecidas (σA2 ≠σB2)
• Utilizar as estimativas SA2 e SB2 para construir os

IC´s.
• A estatística utilizada terá distribuição t-Student,
com v graus de liberdade.
76
• Logo, um I.C (1-ꭤ)x100% para (μA - μB ) quando as

variâncias são diferentes e desconhecidas, é dado
por:
77
EXEMPLO DIDÁTICO
• Para ajudar os lojistas em seu planejamento, a
cada ano se realiza um estudo para se determinar
quanto as pessoas pretendem gastar com
presentes nos dia dos namorados. Uma pesquisa
de novembro de 2008, obteve-se uma amostra de
compradores e lhes foi perguntado a quantia (em
dólar) que pretendiam gastar com presentes.
78
PARA REFLETIR EM CASA
• Com base nos dados, construa um IC a diferença

do gasto médio entre homens e mulheres. Você
diria que a quantidade média que os homens
pretendem gastar é maior do que a quantidade
média que as mulheres pretendem gastar? Use 1-
α = 0, 10, e admita que as populações sejam
normais e que as variâncias sejam desconhecidas
e diferentes.
79
Bom saber
• Na prática nunca sabemos o valor verdadeiro da
variância populacional;
• Deve-se verificar a plausibilidade da afirmação de

que as variâncias são ou não iguais antes de
construir IC´s para diferença de médias
(disponível em softwares) .
80
Caso 6: Intervalos de confiança para

diferença entre duas proporções
populacionais
81
• Interesse em estimar a diferença entre duas

proporções p1 e p2 , associadas a duas populações
independentes.
• estimador não viesado para p1 - p2. Então,

para amostras grandes:
82
Desta forma, um I.C (1-ꭤ)x100% para (p1 – p2 )

dado por:
83
EXEMPLO DIDÁTICO
Com o objetivo de identificar fatores de risco para

doença coronária analisaram-se duas amostras de
215 homens e de 1140 mulheres, tendo-se
registrado que 58 dos homens e 217 das mulheres
tinham diabetes.
• Estime um intervalo de confiança a 90% para a

diferença das proporções de diabéticos nas duas
populações . Qual a sua conclusão?
Pratica
84
Outras medidas conhecidas

na área de saúde
85
Para pensar
86
Testes de Hipóteses
87
OBJETIVO
• Testar se uma conjectura sobre determinada
característica de uma ou mais populações é, ou
não, apoiada por evidências obtidas de dados
amostrais.
hipótese
Conjectura
estatística
Regra de teste de
decisão hipóteses
88
 Hipóteses estatísticas
• Podem ser expressas em termos de parâmetros de

interesse.
• Afirmação sobre uma população, geralmente de
forma que o parâmetro assume determinado valor.
Parâmetros de interesse:
• Médias, prevalências(proporções), diferença de
médias, diferença de proporções, Odds ratio, Risco
relativo, etc
89
 Testes de hipóteses ou testes de significância

estatística:
• Usam os dados amostrais para sumarizar evidências

sobre determinada hipótese.
•Definição baseada na distribuição de probabilidade

da variável que se quer estudar .
90
• O teste estatístico depende do tipo de variável

envolvida e do tipo de planejamento;
 variável é quantitativa ou qualitativa?

dados foram obtidos de forma independente ou
pareada?
 qual o objetivo da análise?
Rev. Psicol. Saúde vol.5 no.2 Campo Grande dez. 2013
Cuidado com91
interpretações
?
PROCEDIMENTO ESTATÍSTICO
92
1- Estabelecer as hipóteses:
Objetivo?
H0: hipótese nula
H1: hipótese alternativa
Tipo de
variável?
Inexistência de Existência de Desenho

efeito efeito de estudo?
93
2- DEFINIÇÃO DAS
HIPÓTESES:
• O valor do parâmetro em H0 usualmente é onde
fica a igualdade e representa a ausência de efeito;
• O valor em H1 usualmente representa então

algum tipo de efeito;
• Assume-se que H0 é verdadeira até que os dados

provem o contrário.
94
3 – Estabelecer um critério de decisão para que H0

seja julgada :
• O critério de decisão é fundamentado pela Teoria

das Probabilidades e definido por meio da
Estatística de Teste:
 mede a discrepância do que foi observado nos
dados e o que seria esperado caso H0 fosse
verdade;
 discrepância evidências contra H0
 Resumo: H0 é rejeitada se o valor da estatística

de teste for “grande”.
95
Cad. Saúde Pública, Rio de Janeiro, 29(7):1301-1310, jul, 2013

96
Como poderíamos escrever as

hipóteses testadas no artigo?
• Hipóteses testadas
• Critério estatístico: estatística definida pelo teste t-

Student para comparação de 2 médias de
populações independentes :
 precisa definir matematicamente a medida de

discrepância;
Requer distribuição de probabilidade para a avaliar

qual das hipóteses é suportada pelos dados.
97
TIPOS DE ERROS
 Erro tipo I e erro tipo II
α =P(erro tipo I) e β= P(erro tipo II)

α =nível de significância do teste
98
• α -> nível de significância do teste

Valores usuais: 5%, 1%, 0,1%
1-β= Poder - > capacidade de detectar que a hipótese

nula é falsa
Lembrar: ambos
fixados no
planejamento do
estudo
99
P- valor ou nível descritivo
• Probabilidade de ocorrer o resultado observado ou

um mais extremo, supondo a hipótese nula
verdadeira.
• Quanto maior o p-valor maior evidência para
rejeitar H0.
• Nas mais diversas áreas do conhecimento
considera-se um valor de p menor ou igual a 0.05
como indicativo de rejeição de H0
Regra de decisão
100
• O p valor não fornece informações sobre a magnitude

do efeito
• A magnitude de um efeito estatisticamente

significativo pode ser tão pequena que o efeito prático
não é importante.
• Se o tamanho da amostra é grande o suficiente, quase

qualquer hipótese nula pode ser rejeitada.
• Mais informativo olhar o intervalo de confiança.

101
Exemplo da literatura : Birth month and

height
Título: Spring Birthday Confers Height Advantage
Estudo austríaco de alturas de 507,125 recrutas militares. Teste

para diferença de médias , amostras independentes.
-Resultado: Homens nascidos na primavera foram, em média ,
cerca de 0,6 cm mais alts do que os homens nascidos no outono.
-Os resultados foram altamente significativos (minúsculo p
valor).
(Weber et al ., Nature, 198 , 391 : 754-755 ).
O tamanho da amostra tão grande que mesmo uma

pequena diferença foi estatisticamente significativa .
102
Cuidado com
o p valor!
The basic problem with the null hypothesis Sugiro ler este
significance test in political science is that it artigo. Ano 2013
often does not tell political scientists what
they think it is telling them. (J. Gill)
Statistical significance testing has

involved more fantasy than fact. (R.
Carver)
The research methodology literature in

recent years has included a full frontal
assault on statistical significance testing.
(J. E. McLean and J. M. Ernest)
103
Tamanho da amostra e a significância estatística
• Um pequeno a moderado efeito na população é difícil

de detectar.
• Com uma pequena amostra , o resultado tem pouca
chance de ser estatisticamente significativo.
• Com uma grande amostra, mesmo um efeito pequeno

e sem importância na população pode ser
estatisticamente significativo.
2/3 dos dentistas
recomendam.....
2/3 dos 500 dentistas

recomendam
104
Caso 1: Teste de hipóteses para

1 média populacional
105
Grandes amostras
• Considere uma amostra aleatória de tamanho n
de uma população normal com média μ
(desconhecida) e variância σ2(conhecida).
Suponha o interesse em verificar as seguintes
hipóteses:
H0 : μ= μ0 vs H1: μ≠ μ0
A estatística de teste é definida por:
Sob H0:
106
• Outras hipóteses alternativas podem ser

formuladas (unilateral)
Região Crítica para um α fixado
c = ponto crítico da tabela da normal (z)

107
EXEMPLO DIDÁTICO
Os registros dos últimos anos de um colégio atestam

que calouros tem nota média (teste vocacional)de
115. Para testar a hipóteses de que a média de uma
nova turma é a mesma das turmas anteriores,
retirou-se, ao acaso, uma amostra de 36 notas,
obtendo-se média 118. Considere população normal
e desvio padrão populacional igual a 20. Qual a sua
conclusão ao nível de significância de 5%?
Defina os passos
PEQUENAS AMOSTRAS
108
• Na maioria das vezes não temos informação sobre a

variância da variável aleatória de interesse. E além
disso, alguns casos não temos amostra grande o
suficiente .
• Supondo que a variável aleatória de interesse tem
distribuição normal com média µ desconhecida e
variância σ2 também desconhecida. Nesse caso, a
estatística de teste é definida como:
Sob H0 :
109
EXEMPLO DIDÁTICO Software
• Uma certa cervejaria vende cervejas em

embalagens cujos rótulos indicam um conteúdo de
600 ml. O Instituto Nacional de Pesos e Medidas
(INPM) seleciona aleatoriamente 25 garrafas de
cerveja produzidas pela companhia, mede seu
conteúdo e obtém uma média amostral igual a
596,25 ml com desvio padrão de 14,06 ml. A um
nível de significância de 1%, você diria que a
empresa está enganando seus consumidores?
Quais as hipóteses de interesse? O teste é uni ou bilateral?
Conclusão?
110
Observação
• Se o desvio padrão populacional é desconhecido, mas

a amostra é relativamente grande, o TCL diz que a
distribuição amostral das médias é aproximadamente
normal.
Usa a estatística Z com desvio padrão
amostral no lugar do σ
• Em populações não muito assimétricas a

convergência é ainda mais rápida.
111
Teste de hipóteses para 1

variância
112
• Suponha o interesse em estar a hipótese de que a

variância (σ2)de uma população normal seja igual a
um valor específico, σ02. Considere uma amostra
aleatória de n observações proveniente dessa
população. Para testar
H0 : σ2= σ02 vs H1: σ2 ≠ σ02 (ou unilaterais)
Usaremos a estatística de teste
Sob H0 :
113
REGIÃO CRÍTICA
114
• Uma máquina de enchimento automático é usada para

encher garrafas com detergente líquido. Uma amostra
aleatória de 50 garrafas resulta em uma variância
amostral de volume de enchimento de s2 = 0,015 (onça
fluida)2. Se a variância do volume de enchimento exceder
0,01 (onça fluida)2, existirá proporção inaceitável de
garrafas cujo enchimento não foi completo e cujo
enchimento foi em demasia.
• Ao nível α=5%, há evidências que o fabricante tem um
problema com garrafas cheias com falta e excesso de
detergente? Considere que o volume de enchimento tem
uma distribuição normal.
Hipóteses?
115
SOLUÇÃO
• Parâmetro de interesse: σ2
• Hipóteses: H0 : σ2= 0.01 vs H1: σ2 ≠ 0.01
• α =5% ; ꭕ20.05;49 = 33.93
• H0 será rejeitada se : ꭕ20 > 33.93
Cálculos:
Conclusão?
116
Caso 2: Teste de hipóteses para

diferença de médias
117
Grandes amostras
 Comparar dois grupos de indivíduos em relação à
uma variável resposta de natureza continua. Por
exemplo, nível de colesterol segundo faixa etária.
• Hipóteses estatísticas:
H0 : μ1 =μ2 versus H1 : μ1 ≠μ2 (bilateral)
Opções de alternativas unilaterais

•H0 : μ1 =μ2 versus H0 : μ1 >μ2 (direita)
•H0 : μ1 =μ2 versus H0 : μ1 <μ2 (esquerda)
118
•Supondo uma amostra aleatória de tamanho n1 de

uma população com característica X1, que tem
distribuição normal com média μ1 e variância σ12.
• Considere outra amostra aleatória de tamanho n2 ,

de uma população com característica X2, que tem
distribuição normal com média μ2 e variância σ22.
• X1 e X2 são independentes.
119
• Assumindo que as variabilidades dos grupos são

conhecidas , a estatística de teste para diferença
de médias é dada por:
Sob H0 :
EXEMPLO NA LITERATURA 120
Rev. CEFAC vol.8 no.4 São Paulo Oct./Dec. 2006

121
Pequenas amostras – caso 1

Assumindo que as variabilidades dos grupos são
desconhecidas e supostas iguais, a estatística de
teste para a diferença de médias é dada por:
H0 : μ1 =μ2 versus H1 : μ1 ≠μ2
Sob H0 :
122
Pequenas amostras – caso 2

Assumindo que as variabilidades dos grupos são
desconhecidas e diferentes, a estatística de teste para a
diferença de médias é dada por:
H0 : μ1 =μ2 versus H1 : μ1 ≠μ2
Sob H0 :
123
EXEMPLO EM ARTIGOS
Avaliação da eficácia do aconselhamento nutricional dentro da estratégia

do AIDPI (OMS/UNICEF)
Rev. Bras. Epidemiol. Vol. 5, Nº 1, 2002
124
CONFRONTANDO RESULTADOS
Comparando-se dois grupos

Variável de interesse: ferro
 Hipóteses : H0 : μ1 =μ2 vs H1 : μ1 ≠μ2
Estatística de teste:
= 0,52
Valor crítico da distribuição t ->

Conclusão?
125
TESTE PARA VERIFICAÇÃO DA SUPOSIÇÃO DE

IGUALDADE DAS VARIÂNCIAS
Hipóteses:
• H0: As variâncias das duas populações são iguais
• H1: As variâncias populacionais são diferentes
A maioria dos softwares realiza este

procedimento conjuntamente com o
teste da diferença de médias
126
SPSS
127
STATA
Comando
adicional
Teste de Levene
128
Aplicação de Testes de hipóteses

para dados categorizados
129
VARIÁVEL RESPOSTA EM ESCALA QUALITATIVA
• Em medicina: diagnóstico de câncer de mama

baseado na mamografia pode usar categorias como:
normal, benigno , provável suspeito, suspeito e
benigno.
• Em ciências do comportamento: transtorno mental

comum (depressão, ansiedade) .
• Em educação: resposta de estudantes à questão de

uma prova (correta e incorreta)
130
• Aparecimento dos métodos para dados categóricos

por volta de 1900 -> Karl Pearson
• Maior desenvolvimento nos anos 60 e ainda é uma

área de crescente interesse.
• Grande variedade de métodos:
Medidas de associação (prevalência, risco relativo, OR)

com IC´s; métodos qui-quadrado para grandes amostras;
métodos exatos para amostras pequenas ou dados
esparsos; Estatística de Mantel Haenszel; Teste de
McNemar; Regressão logística.
131
• Muitas questões na análise de dados categóricos

podem ser respondidas através do uso de testes de
hipóteses .
• Entretanto uma forte suposição para o uso destes

testes é a alocação aleatória dos indivíduos.
• A tabela de contingência 2x 2 é uma das formas

mais comuns de apresentar os dados categóricos
132
Teste de hipóteses para uma

proporção
133
• Procedimento similar ao teste para uma média

populacional.
• Considere o problema de testar a hipótese que a

proporção de sucessos de um ensaio de Bernoulli é
igual a um valor especifico, p0. Isto é, testar as
seguintes hipóteses:
H0 : p =p0 versus H1 : p ≠ p0
H0 : p =p0 versus H1 : p < p0
H0 : p =p0 versus H1 : p >p0
134
• Para grandes amostras, a estatística de teste pode

ser definida como:
135
Um fabricante de semicondutores produz

controladores usados em aplicações no motor de
automóveis. O consumidor requer que a fração de
defeitos em uma etapa crítica da fabricação não
exceda 0,05 e que o fabricante demonstre uma
capacidade de processo desse nível de qualidade,
usando α = 5%. O fabricante retira uma amostra
aleatória de 200 aparelhos e encontra que quatro
deles são defeituosos. O fabricante pode
demonstrar uma capacidade de processo para o
consumidor?
Hipóteses?
136
SOLUÇÃO
• Parâmetro de interesse: p
• Hipóteses: H0 : p = 0.05 vs H1 : p < 0.05
• α =5% ; zα = 1.645 ;
• H0 será rejeitada se : Zcalc > 1.645
Cálculos:
Conclusão?
137
Teste de hipóteses para duas

proporções populacionais
138
• Considere o interesse em comparar as respostas de

2 grupos provenientes de amostras aleatórias
independentes com respeito a uma resposta binária.
• Seja p1 a probabilidade de resposta favorável na

população 1 e p2 a probabilidade de resposta
favorável na população 12.
• A hipótese de interesse é: H0 : p1 = p2
Alternativas
139
Para n grande, a estatística de teste pode ser

definida como:
Estatística de Wald
Zw é aproximadamente normal quando p1 = p2
Região de rejeição
140
EXEMPLO DIDÁTICO software
Acredita-se que um paciente submetido a um

procedimento cirúrgico X apresenta menos
complicações após do que pacientes submetidos a um
procedimento Y. Deseja-se saber, com base em uma
amostra de 152 pacientes em cada grupo, se é razoável
sugerir que o segundo procedimento apresenta mais
complicações do que o primeiro. Considere que nas
amostras retiradas obteve-se 5% de complicação no
procedimento X e 15% após o tipo de cirurgia Y. Qual a
sua conclusão ao nível de significância de 1%?
Hipóteses?
141
USANDO O SOFTWARE
• No STATA este teste pode ser feito usando a sintaxe:
prtesti 152 8 152 23, count
142
Testes não paramétricos

143
Motivação
• As técnicas não-paramétricas são métodos
alternativos extremamente interessantes para
análises de dados qualitativos.
• Independem dos parâmetros populacionais e de

suas respectivas estimativas.
• Uso em situações onde a variável analisada não

segue uma distribuição normal e/ou as amostras
são pequenas.
144
Vantagens Desvantagens
Não exigem Perda de informação,

populações distribuídas uma vez que os dados são
normalmente; reduzidos a uma forma
qualitativa.
Podem ser aplicados a
dados não numéricos;  Não muito eficientes ;
Requerem amostras
Em geral envolvem maiores para detectar se
cálculos mais simples. as diferenças realmente
existem.
145
PRINCIPAIS TESTES
Amostras Amostras
independentes dependentes
- Teste do sinal para 1 -Wilcoxon signed

amostra ranks
-Wilcoxon-Mann -McNemar
Whitney
-Kruskal Wallis
146
Parte I: Testes não paramétricos

para amostras independentes
147
TESTE DOS SINAIS PARA MEDIANA DE

UMA AMOSTRA
• Contrapartida não-paramétrica para o Teste-t
quando temos 1 amostra.
• Um dos testes mais fáceis.
• Os dados convertidos para sinais de mais (+) ou de

menos (-).
• A ideia: analisar a frequência dos sinais de mais ou
de menos.
• Suposição importante: amostra aleatória

148
• Hipóteses testadas
H0: m = m0
H1: m ≠ m0 (ou m > m0 , m < m0)
Funcionamento do teste
• Calcula-se a mediana da amostra (m0)
• As observações maiores que m0 recebem o sinal
“+” e as observações que forem menores recebem
o sinal “−”.
149
• Seja K o nº de observações que receberam sinal

“+”.
• K ~ binomial (n, θ).
• Se Ho for verdadeira, isto é, no caso de m0 ser a
mediana, então θ = 0.5 -> K ∼ bin(n; 0, 5).
• Rejeita-se Ho, ao nível de significância α, se K for
um valor muito extremo (o quão extremo
depender de H1)
O que acontece com a estatística
de teste quando temos grandes
amostras? A região critica muda?
150
EXERCÍCIO DIDÁTICO
Uma máquina deve produzir arames com diâmetro
de 1 mm. Para verificar se a máquina está ajustada
de maneira adequada, 13 pecas por ela produzidas
foram selecionadas e medidas obtendo-se os
seguintes resultados:
1,017 1,001 1,008 0,995 1,006 1,011 1,009 1,009 1,003

0,998 0,990 1,007 1,002
Com base nessa amostra, você diria que essa
máquina precisa ser reajustada?
Considere α =0.10
151
RESOLUÇÃO
• Definir as hipóteses
H0: m = 1 vs H1: m ≠ 1 -> H0: θ = 0.5 vs H1: θ ≠ 0.5
• Região crítica: com base na dist. Binomial

• Para α = 0, 10, a região crítica é {K ≤ 3} ou {K ≥ 10}
(tabela da binomial).
• Na amostra tem-se que Ko = 10.
Conclusão?
152
WILCOXON MANN-WHITNEY
(TESTE U)
• Metodologia alternativa ao Teste –t para 2
amostras
• Envolve 2 populações independentes sem
informações a respeito de suas distribuições.
• Variáveis envolvidas em escala pelo menos

ordinal.
• Objetivo: saber se uma população tende a ter

valores maiores do que a outra, ou se elas têm a
mesma mediana.
153
• Baseado nos postos dos valores obtidos

combinando-se as duas amostras.
• Ordenação dos valores, do menor para o maior,

independentemente de qual população cada valor
provém.
• Postos mais baixos são atribuídos aos maiores
números negativos (se houver).
• O valor da estatística U é o nº de vezes que um

escore no grupo com n2 casos precede um escore
no grupo com n1 casos no grupo ordenado
crescentemente.
154
Por exemplo, suponha-se um grupo experimental com

3 casos e um grupo de controle com 4 casos.
n1
n2
-Conta-se o número de escores E que precedem cada

escore deste grupo. Nenhum escore E precede o escore
C igual a 6. Isto também é verdade para o escore C = 8.
O próximo escore C é 10 e é precedido por um escore
E. O último escore C, o 13, é antecedido por dois
escores E. Assim, U = 0 + 0 + 1 + 2 = 3.
155
• A distribuição amostral de U, sob H0, é conhecida e

pode-se então determinar-se a probabilidade
associada à ocorrência, sob H0, de qualquer valor
de U tão extremo quanto o valor observado.
• Em amostras muito pequenas (n1 <8 e n2 <8),

pode-se utilizar a tabela J (Siegel, pg. 302-04) para
determinar a probabilidade mencionada acima.
• Em amostras médias (9 ≤ maior grupo≤ 20), pode-

se aplicar a prova de Mann-Whitney utilizando a
tabela K (Siegel, pg. 305-08)
156
157
Exemplo STATA
• Grande amostras (n > 20): Mann e Whitney

mostraram (1947), que à medida que n1 e n2
aumentam, a distribuição amostral de U tende
rapidamente para a distribuição normal.
• Quando ocorrem empatem entre as observações

atribui-se a cada um dos valores empatados a
média dos postos que lhes seriam atribuídas se
não houvesse empate.
• Softwares disponibilizam métodos com correção

para empates.
APLICAÇÕES NA LITERATURA
158
159
KRUSKAL WALLIS
• Útil para decidir se k amostras independentes
provêm de populações diferentes.
• Procedimento alternativo à ANOVA paramétrica
• Suposição importante: variável mensurada em
escala no mínimo ordinal.
• Procedimento: as n observações (das k amostras)
são substituídas por um posto. Ao menor escore
atribuí-se o posto 1, ao seguinte o posto 2 e assim
sucessivamente até o maior posto que é n,
160
• Determina-se a soma dos postos em cada amostra

(coluna).
• O método irá testar se estas somas são tão diferentes
entre si que não seja provável que tenham sido todas
retiradas de uma mesma população.
• Quando n grande (mais de 5 elementos em cada

amostra)
-> Sob H0 a estatística H~ꭓ2 com gl= k-1
• Se n pequeno (k = 3 e o número de casos em cada
uma das 3 amostras <= 5), utiliza-se a tabela O (Siegel,
pg. 313- 14).
161
• O teste de Kruskal –Wallis é abrangente e não

informa que grupos específicos de sua variável
independente são estatisticamente diferentes uns
dos outros;
• A hipótese alternativa é que pelo menos dois
grupos diferem.
• Para determinar quais desses grupos diferem
pode-se fazer testes post hoc .
162
• O teste de Kruskal é muito menos sensível a

outliers .
• Metodologia não é livre de pressupostos, uma vez
que conclusões você pode fazer vai depender da
distribuição dos dados.
• Para interpretar os resultados de um teste de
Kruskal- Wallis precisa conhecer se as distribuições
em cada grupo têm a mesma forma.
Se semelhantes -> mediana

Se não são-> ranks médios
APLICAÇÕES NA LITERATURA
163
Um estudo comparativo da eficácia do Grupo de terapia cognitiva e exercício aeróbio no Tratamento da Depressão entre os
alunos.
164
EXEMPLO DIDÁTICO software
Dados referentes a 50 estados americanos

contendo a idade média da população e a região
do país. O interesse é testar a igualdade da
distribuição da idade em todas as quatro regiões.
Hipóteses?
165
Parte II: Testes não

paramétricos para amostras
dependentes
166
WILCOXON SIGNED RANKS TEST
• Contrapartida não-paramétrica para o Teste-t

quando temos amostras dependentes.
Pop.X Pop.Y
(x1, y1,),(x2, y2),... ,(xn, y1n )
H0 : distribuição de X=distribuiçao de Y.
vs que é diferente
167
Funcionamento
• Obter as diferenças : D = Xi - Yi
• Sob H0 : Med(D) =0 vs Med(D) ≠0 (ou > ou <)
• Obter |Di |
• Ignore os empates (D=0)
• Passos seguintes são iguais as do teste para 1 mediana já
visto.
• Empates podem ocorrer e softwares dispõem de
procedimentos para tratar.
• Sob H0 é de esperar que a soma das ordens positivas (T+ )
não difira grandemente da soma das ordens negativas (T- ).
168
Exemplo no software
• Em pequenas amostras a tabela G (Siegel, pg. 285)

fornece vários valores de T (estatística do teste –
soma dos postos) com os respectivos níveis de
significância.
• Tobs< valor tabela G sob, dado α e n, rejeita-se a

hipótese de nulidade àquele nível.
• Em grandes amostras (n> 25) T ~ normal,

169
EXEMPLO NA LITERATURA
Facebook como um ambiente de aprendizagem para o ensino de

emergências médicas na prática odontológica .
Estudantes sirios de odontologia sírios foram convidados a participar de um grupo no Facebook
“emergências médicas na prática odontológica " durante o segundo semestre do ano lectivo de
2013-2014 . Administradores do grupo publicou 61 mensagens durante o período do curso , que
se estendeu por um mês. o progresso de aprendizagem dos alunos foi avaliado por meio de
questionários de auto-avaliação administrados aos alunos antes e depois do curso. Estatísticas
qualitativas , Wilcoxon sgined rank test e Mann-Whitney U foram utilizados para analisar os
dados.
170
Parte III: Testes usando a

distribuição Qui-Quadrado
171
TESTE QUI-QUADRADO DE
INDEPENDÊNCIA
• Procedimento estatístico mais utilizado para testar a
hipótese nula de independência (não associação)
entre duas variáveis categóricas.
Hipóteses:
H0 : Não existe associação entre as variáveis
H1 : Existe associação entre as variáveis
• Quando a tabela é 2x2 se equivale ao procedimento

da comparação de 2 proporções.
172
Estatística de Pearson
• Uso em tabelas de contingência Ilinhas x Jcolunas.
Oij=freq. observada linha i,
coluna j
Eij= total linha i x total coluna j
total
• Para n grande esta estatística segue distribuição qui-

quadrado com (I -1)x (J-1).
• Critério de decisão: comparar o valor calculado para

com o valor teórico da distribuição qui-quadrado ou
calcular o p valor.
173
EXEMPLO LITERATURA
• Considere os dados de um estudo randomizado
cujo objetivo foi avaliar o efeito da vacinação
contra influenza em adultos.
Pergunta-se: Ao nível α = 5%, existe associação entre

vacinação e a presença da gripe influenza?
174
As hipóteses:
H0: Não existe associação entre vacinação e
ocorrência de influenza
H1 : Existe associação entre vacinação e ocorrência de
influenza
• Passo 1: descrever a proporção de pessoas com a

gripe de acordo com status de vacinação
20/240
175
• Se não houver efeito da vacina espera-se que a

proporção de pessoas com influenza seja igual nos
2 grupos.
• O teste compara frequências observadas com

aquelas esperadas se não houvesse associação
entre as variáveis.
• Observou-se 21.7% dos indivíduos com a gripe.

Assim, espera-se essa mesma proporção de
indivíduos doentes nos 2 grupos caso não haja
associação.
176
• Usando os dados da tabela acima podemos calcular

a estatística de Pearson definida anteriormente.
Qui-quadrado tabelado: gl = 1, α=5% =3.84 Conclusão?

177
• Este procedimento é equivalente ao teste para 2

proporções definido anteriormente (H0 : p1 = p2) .
• As estimativas de p1 e p2 são, respectivamente,

e
• A estatística de teste é dada por:
Sob H0:
Ztab bilateral= 1,96

178
Algumas observações
• A vantagem do teste de hipótese para proporções é que
ao utilizar a distribuição normal ele também permite a
obtenção de intervalos de confiança.
• Já o teste qui-quadrado permite a comparação de

proporções para um número maior de grupos.
• A validade do teste qui-quadrado depende de grandes

amostras.
• Cuidado com as conclusões tiradas sobre o método:

não informa a direção e nem a magnitude da associação
179
TESTES EXATOS
• Inferência usando aproximação qui-quadrado
exige grandes amostras.
• Situações em que métodos aproximados podem
fornecer resultados errôneos:
 amostras pequenas
 dados esparsos (entre diferentes categorias)
• Métodos exatos são geralmente baseados em

técnicas permutacionais.
180
• Muitos softwares estatísticos já possuem estes

procedimentos disponíveis .
• Dados com caselas com frequência pequena ou

nulas usualmente necessitam de métodos exatos
para testar associações.
• Uso recomendado: n< 20 ou quando há valores

esperados na tabela menores que 5.
181
EXEMPLO DIDÁTICO
• Considere um exemplo com dados de um estudos que

avaliou fatores associados ao envolvimento de
gestantes com drogas (Porto et al, 2015).
• Desfecho de interesse: uso de álcool e outras drogas

em algum momento na vida.
• Fator associado: faixa etária
• Amostra não aleatória: gestantes atendidas em uma
maternidade pública (n=268).
• α =5%
182
O uso do teste exato fez-se necessário neste

exemplo, pois existem caselas com frequências
esperadas <5.
183
USANDO O SOFTWARE
• No STATA o comando para execução do teste exato de

Fisher é :
tabi 3 28\ 29 126\ 16 66, chi2 exact
qui-
quadrado
184
Teste de homogeneidade
• Consiste em verificar se uma variável aleatória se
comporta de maneira semelhante, ou homogênea,
em várias subpopulações.
• Realização similar ao do teste de independência,

distinguindo na forma como as amostras são
coletadas.
• No teste de homogeneidade, fixamos o tamanho da

amostra em cada uma das subpopulações e, então,
selecionamos uma amostra de cada uma delas.
185
• Considere o exemplo com dados de contagem de

produtos defeituosos e não defeituosos das marcas
A e B. Poderíamos organizar essa informação na
seguinte tabela:
• Se o objetivo é verificar se a proporção de produtos

defeituosos é a mesma para as marcas (H0), então
podemos aplicar o teste de qui-quadrado para
homogeneidade.
186
• Sob esta hipótese, esperaríamos a seguinte tabela:
• A estatística de teste é a mesma usada para o teste

qui-quadrado de independência.
187
• Para estes dados o valor do qui-quadrado calculado

é = 25, 96.
• Comparamos com o valor tabelado de acordo com o

número de graus de liberdade (gl) e com o nível de
significância (α = 1%, 5% ou 10%).
• Gl = (r – 1)×(c – 1) = (2 – 1)×(2 – 1) = 1.
• Considerando α = 5%, temos
• Rejeitamos H0 se: >

188
TESTE DE MCNEMAR –
AMOSTRAS PAREADAS
• Em muitas situações as tabelas 2x2 fornecem
informações de amostras dependentes (pareadas).
• Exemplos: medidas feitas nos olhos direito e esquerdo

de uma mesma pessoa, medidas antropométricas
medidas em 2 pontos do tempo, peso antes e após uma
dieta.
Dados de amostras
pareadas
189
• Pergunta de investigação: a proporção dos que

responderam sim na ocasião 1 é a mesma
proporção dos que responderam sim na ocasião 2?
• Seja
• Hipótese de interesse: H0 : p1 = p2
• Em 1947, o psicólogo e estatístico americano Quinn

Michael McNemar desenvolveu um teste qui-
quadrado para responder a este tipo de questão.
190
• Ele mostrou que apenas os elementos fora da

diagonal são importantes para determinar se existe
diferença entre estas proporções .
• Sua estatística de teste é:

191
EXEMPLO DIDÁTICO
Um investigador tenta determinar se uma droga

tem um efeito sobre uma determinada doença.
Contagens de indivíduos são dados na tabela , com
o diagnóstico (doença : presente ou ausente ) antes
do tratamento dado nas linhas, e o diagnóstico
após o tratamento nas colunas .
• Dados com mesmos indivíduos antes e após.
• α = 5%
192
a b
c d
• A hipótese nula é de que não há efeito do

tratamento , e então, H0 : pdoenteAntes = pdoenteDepois
• Utilizando o teste de Mcnemar, temos:

P valor <0.01
Conclusão?
193
• Estes testes não informam sobre a direção da

associação.
• Não mensuram associação entre categorias de

variáveis e sim entre 2 variáveis qualitativas.
194
Aplicação dos testes de

hipóteses para dados
categorizados
exemplos na literatura
195
COMPARAÇÃO DE DUAS PROPORÇÕES
Características das mães e

das crianças, comparando
aquelas acompanhadas até o
fim do estudo com as não
acompanhadas. As crianças
que foram acompanhadas
até o final não eram
diferentes das que foram
perdidas.
Avaliação do impacto de centros de lactação sobre padrões de amamentação...

Rev. bras. epidemiol. vol.5 no.1 São Paulo Apr. 2002
TESTES DE ASSOCIAÇÃO
196
grupo respirador bucal (RB) e grupo respirador nasal (RN).
Associação entre as alterações posturais e a respiração bucal em crianças.

Fisioter. Mov., Curitiba, v. 25, n. 2, p. 379-388, abr./jun. 2012
TESTE DE MCNEMAR
197
Funcionalidade e estado geral de saúde em idosos com dor lombar

agudizada: um estudo longitudinal – Tese (Ribeiro, J. P.V – 2014)
198
Concluindo
199
RELAÇÃO ENTRE IC´S E TESTES DE

HIPÓTESES
• IC´s: fornecem intervalos de valores para o

parâmetro de interesse baseado nos dados
amostrais
• Testes de hipóteses: avaliam se os dados são

consistentes com um valor hipotético específico.
• Desta forma, se H0 for rejeitada, o IC

correspondente não incluirá o valor hipotetizado.
200
• IC´s podem ser usados para avaliar significância

estatística, assim como o teste de hipóteses
 Se o intervalo de confiança contém o valor que

reflete “não efeito” , então implica em “não
significância estatística”
Se o intervalo de confiança não contém o valor

que reflete “não efeito” , então implica em “
significância estatística”
201
• IC tem vantagem adicional por informar através

dos limites o quão pequeno ou grande o efeito pode
ser.
• Se o intervalo é estreito, então a estimação é mais

precisa, indicando que o estudo tem poder para
detecção de tal efeito.
• Em contrapartida, se o intervalo é muito amplo,

indica baixa precisão dos resultados, ou seja, o
estudo tem “baixo poder’’ para estimar o efeito de
interesse.
202
OUTROS COMENTÁRIOS
• A publicação apenas de resultados

estatisticamente significantes pode levar os
pesquisadores a conclusões errôneas a respeito
de suas questões.
• Também chamado de viés de publicação.
• P valor <0.001 não implica em achado importante
do ponto de vista prático e teórico.
203
RECENTES DISCUSSÕES
“O p value nunca foi destinado a ser um substituto para o

raciocínio científico. Argumentos estatísticos bem fundamentados
contêm muito mais do que o valor de um número único e se esse
número exceder um limite arbitrário. A declaração da American
Statistical Association (ASA) destina-se a orientar investigações
na era do “p<0,05 " “(Ron Wasserstein , diretor executivo da ASA)
204
Sucesso e
obrigada!
“O conhecimento torna a alma jovem e
diminui a amargura da velhice. Colhe, pois,
a sabedoria. Armazena suavidade para o
amanhã”.
Leonardo da Vinci

Inferência estatística: estimação e testes de hipóteses

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Inferência estatística: estimação e testes de hipóteses

Uploaded by

Copyright:

Available Formats

Inferência estatística

Especialização em estatística aplicada

 Teste de hipóteses: Hipóteses estatísticas

• Conjunto de técnicas que objetiva estudar a

• Conhecer característica de uma população via

• Essa característica na população pode ser

População? Característica? Parâmetro?

• Amostra aleatória: conjunto de n variáveis

Exemplo II: Deseja-se saber se a média da altura

Qual modelo probabilístico mais razoável pensar? Quais

Estimação Testes de hipóteses

 Qual é a proporção de  Pelo menos 2% dos

• Estima-se (calcula-se) o parâmetro desconhecido

• Fornece como estimativa um único valor numérico

USOS DA ESTIMAÇÃO PONTUAL

• Suponha que foi selecionada aleatoriamente uma

Qual o melhor estimador para μ? E para σ2 ?

PROPRIEDADES BÁSICAS DE UM ESTIMADOR

P1. Não Tendenciosidade

Estimadores para a média, proporção e

Estimação Pontual e Distribuição Amostral

Os estimadores pontuais são variáveis aleatórias e,

Distribuição amostral: distribuição de probabilidade

DISTRIBUIÇÃO AMOSTRAL DA MÉDIA

• Distribuição de probabilidade de todos os valores

• Utiliza-se um resultado fundamental na teoria da

TEOREMA DO LIMITE CENTRAL

2. A distribuição da média amostral, devidamente

3. Se a população de origem é não-normal, a distribuição de

EFEITO DO TAMANHO AMOSTRAL SOBRE A

O CASO DA PROPORÇÃO AMOSTRAL ( )

• Pode-se definir X da seguinte maneira:

Temos que com:

• Ao somarmos todos os Xi’s saberemos quantos da

• Definindo p̂ como sendo a proporção de temos

• Pelo TLC, podemos dizer que a distribuição

Pontual – fornece um único valor do

Intervalar – fornece uma faixa valores

[Estimativa – erro; Estimativa + erro]

• Baseados na amostra, gostaríamos de construir

 Seja  o parâmetro (média, proporção ou variância)

 Desejamos obter um intervalo cuja expressão, IC(,

 Intervalos de confiança são obtidos por meio da

• Os limites do intervalo dependerão da amostra

• O valor 1- ꭤ é o nível de confiança e representa a

• A precisão depende da amplitude do intervalo (LS –

Interpretação : se pudéssemos repetir o estudo um

• Na prática, tem-se apenas uma estimativa do

• Intervalos de confiança são calculados para se ter

• Intervalos de confiança estreito indica boa

E como evitar viés?

Garantir que os instrumentos usados na coleta de

 Procedimento amostral correto (amostragem

Importante saber que:

Aumentar o tamanho da amostra aumenta a precisão:

 mas não garante ausência de viés;

 e viés pode produzir resultados bastante incorretos.

**Avaliação comparativa de sistemas de saúde com a

Rev. Bras. Econ. vol.66 no.1 Rio de Janeiro Jan./Mar. 2012

O QUE NÃO FAZER

J pediatr (Rio J) 1996;72(4):245-250

• Se a amostra foi obtida de forma independente ou