Professional Documents
Culture Documents
Agosto/setembro de 2017
2
EMENTA
• Estimação pontual e propriedades básicas de um estimador
• Estimação intervalar para a média populacional (para
pequenas e grandes amostras)
• Estimação intervalar para proporção populacional (para
grandes amostras)
• Estimação intervalar para a variância populacional
• Intervalos de confiança para diferença entre duas médias
populacionais
• Intervalos de confiança para diferença entre duas
proporções populacionais
EMENTA
3
O QUE É INFERÊNCIA?
CONCEITOS BÁSICOS
População: conjunto de indivíduos, objetos ou
informações que apresentam pelo menos uma
característica comum, cujo comportamento temos
interesse analisar;
Amostra é qualquer subconjunto da população;
Parâmetro é uma medida usada para descrever uma
característica da população;
Ex: O diretor de uma empresa gostaria de saber se os
funcionários estão satisfeitos com os benefícios.
Exemplo de Estatísticas
2
X 1 X 2 ... X n X i X
n
1
X s2
n 1 i 1
n
Notação
8
Problemas da Inferência
Estimação e Testes de Hipóteses
Exemplo:1: Qual a distribuição da altura de
homens brasileiros?
Qual é a proporção de
O candidato A vencerá as
votos que o candidato A
próximas eleições para
terá nas próximas eleições
prefeito de SP?
para prefeito de SP?
Estimação Pontual
12
EXERCÍCIO
Suponha que estamos interessados na média (μ) e
variância (σ2) das alturas de jovens com idade entre 15 e
18 anos de certa cidade do Brasil. Escolhemos ao acaso
10 jovens.
A amostra:
Viciado e
Não viciado Não
e Não Eficiente
eficiente
17
Comentários?
22
p(1-p)
p̂ ~ N p,
n
ESTIMAÇÃO PONTUAL X INTERVALAR
Estimação Intervalar
26
IDEIA
• Construir intervalos de confiança que incorporem
à estimativa pontual, informações a respeito de
sua variabilidade (erro amostral).
Limite Limite
inferior superior
• Valores usuais
Interpretando o IC
29
AMOS
TRA
1 ( )
2 ( )
3 ( )
4 ( )
5 ( )
6 ( )
7 ( )
...
30
Lembrar:
EXEMPLOS NA LITERATURA
Análise do perfil de crescimento de 566 crianças com idade entre 3 meses e 3 anos
matriculadas nas 14 creches municipais de Paulínia (SP).
INTERVALOS DE CONFIANÇA
NECESSÁRIO SABER
IC( ,1 ) X z ; X z
2 n 2 n
Nível de confiança
40
EXEMPLO1
EXEMPLO 2
O maior tempo dedicado às atividades de baixa
intensidade, como assistir televisão, tem
contribuído para o ganho de peso dos
adolescentes.
Praticando no software
45
DISTRIBUIÇÃO T-STUDENT
Variabilidade maior
que a da Normal
S S
IC1 ( ) X t / 2,n 1 ; X t / 2,n 1
n n
Tabela T- Student
50
EXEMPLO DIDÁTICO
• Um pesquisador está estudando a resistência de
um certo material sob determinadas condições.
Ele sabe que essa variável é Normalmente
distribuída com variância igual a 4 unidades2.
• Foi extraída uma amostra aleatória de tamanho
10.
7,9 6,8 5,4 7,5 7,9 6,4 8,0 6,3 4,4 5,9
BOM SABER
X
• Considere a proporção amostral pˆ .
n
pˆ (1 pˆ ) pˆ (1 pˆ )
IC1 ( p) pˆ z ; pˆ z
2 n 2 n
54
EXEMPLO
• Um produtor deseja estimar a proporção de itens
de certo artigo na linha de produção de sua
empresa que apresentam defeito de fabricação.
Para esta finalidade, retirou uma amostra aleatória
de 200 itens da linha de produção, constatando que
184 destes não apresentaram defeito de fabricação.
Disability related to chronic low back pain: prevalence and associated factors
Rev. esc. enferm. USP vol.46 no.spe São Paulo Oct. 2012.
58
REQUISITOS
• Amostra aleatória simples
• População deve se comportar segundo uma
distribuição Normal, mesmo que amostra seja grande.
QUI-QUADRADO
Suponha que :
• População seja normalmente distribuída.
• Tenha variância populacional (σ2 ).
• Amostras aleatórias independentes de tamanho
n.
• Calculadas as variâncias amostrais (s2).
• Esta estatística amostral tem distribuição qui-
quadrado.
62
PROPRIEDADES IMPORTANTES
• A distribuição (ꭓ2) é determinada pelos graus de
liberdade (gl=n – 1).
• Simétrica e valores positivos.
• À medida que os graus de liberdade aumentam,
distribuição qui-quadrado se aproxima de distribuição
normal.
63
A TABELA ꭓ2
64
~ N (0,1)
69
EXEMPLO DIDÁTICO
Num estudo comparativo do tempo médio de adaptação,
uma amostra aleatória de 50 homens e 50 mulheres de
um grande complexo industrial, produziu os seguintes
resultados:
Homens Mulheres
Média 3,2 anos 3,7 anos
EXEMPLO DIDÁTICO
Um mesmo tipo de material pode ser adquirido por
2 fabricantes. As variáveis de interesse são a
resistência mecânica do material (em unidades
convenientes) para cada fabricante. Para comparar
os seus valores médios obteve-se uma amostra
aleatória de cada:
74
Para o quadro!
EXEMPLO DIDÁTICO
• Para ajudar os lojistas em seu planejamento, a
cada ano se realiza um estudo para se determinar
quanto as pessoas pretendem gastar com
presentes nos dia dos namorados. Uma pesquisa
de novembro de 2008, obteve-se uma amostra de
compradores e lhes foi perguntado a quantia (em
dólar) que pretendiam gastar com presentes.
78
Bom saber
• Na prática nunca sabemos o valor verdadeiro da
variância populacional;
EXEMPLO DIDÁTICO
Para pensar
86
Testes de Hipóteses
87
OBJETIVO
• Testar se uma conjectura sobre determinada
característica de uma ou mais populações é, ou
não, apoiada por evidências obtidas de dados
amostrais.
hipótese
Conjectura
estatística
Regra de teste de
decisão hipóteses
88
Hipóteses estatísticas
Parâmetros de interesse:
• Médias, prevalências(proporções), diferença de
médias, diferença de proporções, Odds ratio, Risco
relativo, etc
89
Cuidado com91
interpretações
?
PROCEDIMENTO ESTATÍSTICO
92
1- Estabelecer as hipóteses:
Objetivo?
H0: hipótese nula
H1: hipótese alternativa
Tipo de
variável?
2- DEFINIÇÃO DAS
HIPÓTESES:
• O valor do parâmetro em H0 usualmente é onde
fica a igualdade e representa a ausência de efeito;
• Hipóteses testadas
TIPOS DE ERROS
Erro tipo I e erro tipo II
Lembrar: ambos
fixados no
planejamento do
estudo
99
Regra de decisão
100
Cuidado com
o p valor!
The basic problem with the null hypothesis Sugiro ler este
significance test in political science is that it artigo. Ano 2013
often does not tell political scientists what
they think it is telling them. (J. Gill)
Grandes amostras
• Considere uma amostra aleatória de tamanho n
de uma população normal com média μ
(desconhecida) e variância σ2(conhecida).
Suponha o interesse em verificar as seguintes
hipóteses:
H0 : μ= μ0 vs H1: μ≠ μ0
Sob H0:
106
EXEMPLO DIDÁTICO
Defina os passos
PEQUENAS AMOSTRAS
108
Sob H0 :
109
Observação
Sob H0 :
113
REGIÃO CRÍTICA
114
SOLUÇÃO
• Parâmetro de interesse: σ2
• Hipóteses: H0 : σ2= 0.01 vs H1: σ2 ≠ 0.01
• α =5% ; ꭕ20.05;49 = 33.93
• H0 será rejeitada se : ꭕ20 > 33.93
Cálculos:
Conclusão?
116
Grandes amostras
Comparar dois grupos de indivíduos em relação à
uma variável resposta de natureza continua. Por
exemplo, nível de colesterol segundo faixa etária.
• Hipóteses estatísticas:
H0 : μ1 =μ2 versus H1 : μ1 ≠μ2 (bilateral)
• X1 e X2 são independentes.
119
Sob H0 :
EXEMPLO NA LITERATURA 120
Sob H0 :
122
Sob H0 :
123
EXEMPLO EM ARTIGOS
CONFRONTANDO RESULTADOS
= 0,52
SPSS
127
STATA
Comando
adicional
Teste de Levene
128
Hipóteses?
136
SOLUÇÃO
• Parâmetro de interesse: p
• Hipóteses: H0 : p = 0.05 vs H1 : p < 0.05
• α =5% ; zα = 1.645 ;
• H0 será rejeitada se : Zcalc > 1.645
Cálculos:
Conclusão?
137
• A hipótese de interesse é: H0 : p1 = p2
Alternativas
139
Estatística de Wald
Região de rejeição
140
Hipóteses?
141
USANDO O SOFTWARE
• No STATA este teste pode ser feito usando a sintaxe:
prtesti 152 8 152 23, count
142
Motivação
• As técnicas não-paramétricas são métodos
alternativos extremamente interessantes para
análises de dados qualitativos.
Vantagens Desvantagens
PRINCIPAIS TESTES
Amostras Amostras
independentes dependentes
• Hipóteses testadas
H0: m = m0
H1: m ≠ m0 (ou m > m0 , m < m0)
Funcionamento do teste
• Calcula-se a mediana da amostra (m0)
• As observações maiores que m0 recebem o sinal
“+” e as observações que forem menores recebem
o sinal “−”.
149
EXERCÍCIO DIDÁTICO
Uma máquina deve produzir arames com diâmetro
de 1 mm. Para verificar se a máquina está ajustada
de maneira adequada, 13 pecas por ela produzidas
foram selecionadas e medidas obtendo-se os
seguintes resultados:
RESOLUÇÃO
• Definir as hipóteses
H0: m = 1 vs H1: m ≠ 1 -> H0: θ = 0.5 vs H1: θ ≠ 0.5
WILCOXON MANN-WHITNEY
(TESTE U)
• Metodologia alternativa ao Teste –t para 2
amostras
• Envolve 2 populações independentes sem
informações a respeito de suas distribuições.
Exemplo STATA
KRUSKAL WALLIS
• Útil para decidir se k amostras independentes
provêm de populações diferentes.
• Procedimento alternativo à ANOVA paramétrica
• Suposição importante: variável mensurada em
escala no mínimo ordinal.
• Procedimento: as n observações (das k amostras)
são substituídas por um posto. Ao menor escore
atribuí-se o posto 1, ao seguinte o posto 2 e assim
sucessivamente até o maior posto que é n,
160
Um estudo comparativo da eficácia do Grupo de terapia cognitiva e exercício aeróbio no Tratamento da Depressão entre os
alunos.
164
Hipóteses?
165
H0 : distribuição de X=distribuiçao de Y.
vs que é diferente
167
Funcionamento
• Obter as diferenças : D = Xi - Yi
• Sob H0 : Med(D) =0 vs Med(D) ≠0 (ou > ou <)
• Obter |Di |
• Ignore os empates (D=0)
• Passos seguintes são iguais as do teste para 1 mediana já
visto.
• Empates podem ocorrer e softwares dispõem de
procedimentos para tratar.
• Sob H0 é de esperar que a soma das ordens positivas (T+ )
não difira grandemente da soma das ordens negativas (T- ).
168
Exemplo no software
EXEMPLO NA LITERATURA
TESTE QUI-QUADRADO DE
INDEPENDÊNCIA
• Procedimento estatístico mais utilizado para testar a
hipótese nula de independência (não associação)
entre duas variáveis categóricas.
Hipóteses:
H0 : Não existe associação entre as variáveis
H1 : Existe associação entre as variáveis
Estatística de Pearson
• Uso em tabelas de contingência Ilinhas x Jcolunas.
Oij=freq. observada linha i,
coluna j
Eij= total linha i x total coluna j
total
EXEMPLO LITERATURA
• Considere os dados de um estudo randomizado
cujo objetivo foi avaliar o efeito da vacinação
contra influenza em adultos.
As hipóteses:
H0: Não existe associação entre vacinação e
ocorrência de influenza
H1 : Existe associação entre vacinação e ocorrência de
influenza
20/240
175
Sob H0:
Algumas observações
• A vantagem do teste de hipótese para proporções é que
ao utilizar a distribuição normal ele também permite a
obtenção de intervalos de confiança.
TESTES EXATOS
• Inferência usando aproximação qui-quadrado
exige grandes amostras.
• Situações em que métodos aproximados podem
fornecer resultados errôneos:
amostras pequenas
dados esparsos (entre diferentes categorias)
EXEMPLO DIDÁTICO
USANDO O SOFTWARE
qui-
quadrado
184
Teste de homogeneidade
• Consiste em verificar se uma variável aleatória se
comporta de maneira semelhante, ou homogênea,
em várias subpopulações.
• Gl = (r – 1)×(c – 1) = (2 – 1)×(2 – 1) = 1.
• Considerando α = 5%, temos
TESTE DE MCNEMAR –
AMOSTRAS PAREADAS
• Em muitas situações as tabelas 2x2 fornecem
informações de amostras dependentes (pareadas).
Dados de amostras
pareadas
189
• Seja
• Hipótese de interesse: H0 : p1 = p2
EXEMPLO DIDÁTICO
a b
c d
Conclusão?
193
Concluindo
199
OUTROS COMENTÁRIOS
RECENTES DISCUSSÕES
Sucesso e
obrigada!
“O conhecimento torna a alma jovem e
diminui a amargura da velhice. Colhe, pois,
a sabedoria. Armazena suavidade para o
amanhã”.
Leonardo da Vinci