You are on page 1of 21

Estatstica Bsica

Unidade V:
Amostragem e estimativa

Professores
Fabrina Bolzan Martins/Marcelo de Paula Corra
IRN/UNIFEI

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

Estimao

Estimao de uma proporo populacional


Uma agncia de pesquisa fez entrevistas com 700 adultos para saber qual a
opinio dos brasileiros sobre o casamento homossexual. Os resultados
mostraram que 47% so favorveis, 51% so contra e 2% no opinaram.
Ser que a estatstica amostral de 47% a favor pode ser representativa como
proporo amostral ? Como estimar a proporo populacional ?
Hipteses a considerar:
 A amostra uma amostra aleatria simples (AAS) ?
 As condies para uma Distribuio Binomial so satisfeitas? (n fixo de tentativas
independentes, 2 categorias de resultados, probabilidade constante p/cada tentativa)
 np 5 e nq 5? Caso sim, a Distribuio Normal pode ser usada para aproximar a
Distribuio Binomial. Como p e q so? possvel usar a amostra para estim-los?
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

INTRODUO: Em pesquisas cientficas, quando se deseja conhecer as


caractersticas de uma populao, comum se observar apenas a
amostra de seus elementos, e a partir dos resultados dessa amostra,
obter valores aproximados (ou estimativas) para as caractersticas
populacionais de interesse  levantamento por amostragem!
Amostragem  representatividade e metodologia adequada.
CONCEITO: A amostragem definida de acordo com o processo de
seleo, podendo ser:
Probabilstica: amostras selecionadas de forma aleatria. Cada elemento da
populao tem uma probabilidade conhecida de participar da amostra.
No probabilstica: h escolha deliberada dos elementos da amostra  pode
prejudicar a representatividade da amostra.

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

TIPOS DE AMOSTRAGEM:
Amostragem aleatria simples (AAS): para a seleo necessrio ter o
conjunto de todos os elementos da populao e enumer-los.
Ocorre atravs de sorteio, sem restrio.
Cada elemento da populao tem a mesma probabilidade de pertencer a
amostra .

Amostragem sistemtica (AS): quando possvel obter caractersticas


parecidas com a AAS de maneira + fcil e rpida.
Amostragem estratificada (AE): consiste em dividir a populao em k
subgrupos denominados estratos  + homogneos. Sobre os estratos
so feitas as selees das amostras.

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

Estimao

Estimao de uma proporo populacional (observaes importantes)


Uma AAS de n valores possvel se toda amostra de tamanho n tiver a mesma
chance de ser escolhida (mesma probabilidade).
 Portanto, a coleta de dados deve ser criteriosa! Quaisquer outros tipos de amostragem
podem invalidar o trabalho!

Diferentes amostras geram diferentes resultados. Diferenas amostrais so


flutuaes do acaso e no significa o uso de um mtodo de amostragem
infundado.
 Obs: No caso do exemplo, o que no poderia ser feito era fazer o estudo na parada
gay, ou ento, no clube dos maches! Os resultados seriam tendenciosos.

Se desejamos estimar a proporo populacional a partir de um nico valor, a


melhor estimativa a proporo amostral estimativa pontual, j que:
 ela no viesada, j que a proporo amostral tende a se centralizar em torno da
proporo populacional (no subestima, ou superestima, p)
 a mais consistente: o desvio padro das propores amostrais tende a ser menor do
que qualquer outro estimador no-viesado.

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

Estimao

Estimao de uma proporo populacional (notao)


p proporo populacional

p =

x
n

proporo amostral de x sucessos em uma amostra de tamanho n

q = 1 p proporo amostral de x fracassos em uma amostra de tamanho n


Ex: Na pesquisa com 200 estudantes verificou-se que 80 deles fumam 
proporo amostral p
= 80/200 = 0,40
q = 0,60

Porm, no sabemos o quo boa uma estimativa pontual. E, portanto, devemos


determinar o intervalo de valores usado para estimar o verdadeiro valor de p.
Isto , para qual intervalo de confiana o verdadeiro valor de p se encontra.

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

Estimao

 Estimador: Um estimador uma caracterstica da amostra


Os principais estimadores so:

(I) A mdia da amostra


um estimador da mdia da populao ;
(ii) A varincia amostral, s2 um estimador da varincia populacional 2;
(iii) A proporo amostral
p um estimador amostral da proporo
populacional P ou .

 Estimativa: Uma estimativa um valor particular de um estimador


Assim

x =2

uma estimativa. O estimador a expresso (frmula)

enquanto que a estimativa o valor particular que ele assume (nmero).

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

Estimao

Intervalo de confiana (ou estimativa intervalar)


No sabemos o quo boa uma estimativa pontual. Assim, o Intervalo de
Confiana serve para determinar o intervalo de valores usado para estimar o
verdadeiro valor de p (pontual).
 uma faixa de valores usados para estimar o verdadeiro valor de um
parmetro populacional
Esse intervalo est associado a um Nvel de Confiana, que a taxa de
sucesso do procedimento usado para se determinar o Intervalo de Confiana.
O Nvel de Confiana a proporo de vezes que o Intervalo de Confiana
realmente contm o parmetro populacional, supondo que o processo de
estimao seja repetido um grande n de vezes.
O Nvel de Confiana dado como uma probabilidade ou rea (1 ). Os
valores comuns para Nvel de Confiana so 90%, 95% e 99% ( = 0,10; 0,05
e 0,01, respectivamente)
+ comum: bom equilbrio entre
preciso (largura do Intervalo de Confiana)
e confiabilidade (Nvel de Confiana)
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

Estimao

Mais detalhes sobre o Nvel de Confiana


O Nvel de Confiana ser refere taxa de sucesso do procedimento usado para
estimar a propores populacionais (p). no se refere prpria p.
 a probabilidade de que o intervalo estimado contenha o parmetro
populacional
Assim, devemos dizer: x% confivel de que o Intervalo de Confiana, de
tanto a tanto, contm realmente o verdadeiro valor de p.
NO devemos dizer: h x% de chance de que o verdadeiro valor de p est
entre tanto e tanto.
p uma constante fixa, embora desconhecida, e no uma VA. Portanto, no
existe probabilidade associada a p.
 Por exemplo, para um beb que j nasceu, no existe probabilidade de que ele seja
homem ou mulher. Isto , o beb ou no mulher (ou homem, tanto faz).

Por exemplo, um Nvel de Confiana = 95% diz que o procedimento usado


resultar, a longo prazo, em limites de Intervalo de Confiana que contenham p
95% das vezes!
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

Estimao

Valores Crticos (z/2)


Escore z (ou varivel aleatria padronizada, VAP) que est na fronteira vertical
que separa uma rea /2 na cauda direita da Distribuio Normal padro.
Assim como o valor Crtico z/2 est associado a uma rea /2 na cauda
esquerda da Distribuio Normal.
rea com chance

z/2 corresponde a rea de (1 /2)

rea sem chance


/2

/2
z/2

z/2

Para que usamos isso ?


A distribuio amostral das propores amostrais podem, em certos casos, ser aproximada por uma
Distribuio Normal. Tais propores tm uma chance pequena (isto , ) de cair em uma das caudas (
/2).
Portanto, h uma probabilidade de (1 ) de que a proporo amostral caia na rea restante.
Assim, o Valor Crtico o valor que separa estatsticas amostrais que tm chance de ocorrer daquelas
que no tm.
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

10

Estimao

Valores Crticos (exemplo)


Determinar o Valor Crtico correspondente ao Nvel de Confiana de 95%.
= 0,05 /2 = 0,025
rea = 1 0,0025 = 0,975 Pela tabela: z/2 = 1,96
CUIDADO!!! PROCURAR POR 0,975 NA TABELA! (E NO POR 0,950)

Ver tabela

Nvel de Confiana = 95%

NC

z/2

90% 0,10 1,645


95% 0,05 1,960
/2 = 0,025

/2 = 0,025

z/2 = 1,96

99% 0,01 2,575

z/2 = 1,96
97,5% chance de ocorrer
est entre -1,96<Z <1,96

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

11

Estimao

Margem de Erro para propores (E) e determinao do Intervalo de


Confiana
A margem de Erro a diferena mxima provvel (com probabilidade = 1 )
entre a proporo amostral (p) e proporo populacional (p  verdade).

E = z

p q
n

Margem de erro
para propores

Portanto, o Intervalo de Confiana para proporo populacional (p) dado


por:

p q

p E < p < p + E
ou

Intervalo de
confiana para
proporo
populacional (p)

so propores
amostrais de sucesso e
fracasso

p E
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

12

Estimao

Margem de Erro para propores (E) e determinao do Intervalo de


Confiana
Exemplo: Determine o Intervalo de Confiana para aquele estudo sobre a opinio dos
brasileiros sobre o casamento homossexual, considerando um Nvel de Confiana de
95%.

E = z 2

pq
0, 47.0,53
= 1,96
= 0,036973
n
700

Com base nos resultados, h 95%


de confiana que os limites 43,3% e
IC 0,47 0,036973 < p < 0,47 + 0,036973
50,7% contm a verdadeira
porcentagem de pessoas que so
favorveis ao casrio homossexual.

IC 0, 433 < p < 0,507

Com esses valores no d para


afirmar que a populao a favor
ou contra o casamento
homossexual.

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

13

Estimao

Mdia e desvio padro de propores amostrais


Quando np 5 e nq 5 a distribuio amostral das propores
aproximadamente normal. Assim,

= np

= npq

Ambos so relativos n tentativas e, portanto, podemos, tambm, determinar


e por tentativa.

np
n
npq
n

=p

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

mdia das propores amostrais

pq
n

desvio padro das propores amostrais

14

Estimao

Tamanho amostral (n)


Quantos devemos entrevistar ? Qual o tamanho da amostra?
Caso conheamos uma estimativa de p:

E = z 2

Caso no conheamos uma estimativa de p:

n=

z 2 2 pq

pq
n=
2
n
E

[z 2 ]2 0,25
E2

 Quando no conhecemos p, substitumos o produto (p. q) por 0,25  p = 0,5 e q = 0,5


 N irrelevante: no depende do tamanho da populao (exceto para populaes
pequenas, sem reposio)
 n deve ser sempre arredondado para o inteiro maior e mais prximo

No exemplo dado, quantas pessoas devemos entrevistar para que tenhamos 95%
de confiana em que p no tenha erro maior que 4% ?

n=

z 2 2 pq
E2

n=

1,962.0, 47.0,53
= 598,09 = 599 pessoas
0,042

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

15

Estimao
E se no conhecssemos p ?

n=

z 2 2 pq
E2

n=

1,962.0, 25
= 600, 25 = 601 pessoas
0,042

Se no conhecemos as propores amostrais


a partir de um estudo anterior, devemos entrevistar mais pessoas!

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

16

Estimao
Exemplo: Um estudo quer determinar a porcentagem de famlias que usam email. Quantas famlias devem ser entrevistadas para que tenhamos 90% de
confiana em que a porcentagem amostral no ter erro maior do que quatro
pontos percentuais?
= 0,10 /2 = 0,05
rea = 1 0,05 = 0,95 Pela tabela: z/2 = 1,645

[z 2 ]2 0,25
n=
E

n=

[1,645]2 0,25 0,6765 = 422,81


0,042

423 entrevistas

0,0016

Se no conhecemos as propores amostrais


a partir de um estudo anterior, devemos entrevistar mais pessoas!
Exemplo: Se assumisse que 16,9% das famlias usassem e-mail, qual seria o
nmero de entrevistas a serem realizadas?
n=

[z 2 ]2 p q

n=

E2

[1,645]2 0,169 0,831 0,380031 = 237,51


0,042

0,0016

238 entrevistas

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

17

Estimao

Apenas para finalizar nosso estudo sobre as propores, vamos


determinar a estimativas da proporo amostral e do erro a partir de um
Intervalo de Confiana
p =

limite superior de confiana + limite inferior de confiana


2

E=

limite superior de confiana limite inferior de confiana


2

Muitas vezes tem apenas o valor de um IC  pode calcular a


proporo amostral e o E amostral
Exemplo (Triola pg 240): De um artigo sabe-se dos 71 sujeitos, 70% estavam em
abstinncia de fumo havia 8 semanas IC95% = 58% 81% . Use a afirmativa para
calcular E e p
p =

0,58 + 0,81
0,695
2

p =

0,81 - 0,58
0,115
2

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

18

Estimao

Estimao da mdia populacional

Estimativa pontual, IC, tamanho


da amostra para

Vamos abordar o assunto a partir de duas situaes distintas:


a) conhecido (geralmente irreal, conhecer sem saber )
Como se observa em populaes com Distribuio Normal: No existem outliers e os
histogramas no se afastam muito de uma normal (distribuio das mdias
amostrais)
s vezes n = 30 no suficiente para determinar uma Distribuio Normal e o
tamanho amostral deve ser maior.
Se p a melhor estimativa pontual de p, ento a mdia amostral x a melhor
estimativa pontual de .
x a estatstica mais consistente para (< desvio padro), alm de ser um
estimador no-viesado (tende a se centralizar em torno de )
Intervalo de Confiana: x a melhor estimativa . Mas, quo boa ? A diferena
entre x e pode ser definida como um ERRO (desvio).
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

19

Estimao da mdia populacional


Vamos abordar o assunto a partir de duas situaes distintas
a) conhecido (geralmente irreal, conhecer sem saber )

o desvio-padro das mdias amostrais (x).


n

Ento, E = z / 2
n

Como

x =

Sempre que a populao tiver uma Distribuio Normal com mdia e desvio padro ,
a distribuio amostral das x exatamente uma Distribuio Normal com mdia e
desvio padro /n.
Se a populao no tiver Distribuio Normal, amostras grandes tero distribuies
aproximadamente normais.

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

20

10

Estimao

Estimao da mdia populacional


Interpretao: H uma probabilidade (1 ) de que a mdia amostral seja
diferente de (ou seja, esteja em erro) no superior a E
Assim, o Intervalo de Confiana para uma pop de mdia e conhecido :
x E < < x + E = 1-

ou

x E

ou

(x E : x + E)

Arrendondamento:
 Se o conjunto original de dados conhecido: Arredondar os limites para uma casa
decimal a mais.
 Se o conjunto original de dados desconhecido: Arredondar os limites para mesmo
nmero de casas de x.

Interpretao do Intervalo de Confiana:


 Correta: Estamos x % confiantes que o intervalo x E, x + E realmente contenha o
verdadeiro valor de x.
 Errada: H x % de chance de que esteja entre x E; x + E.
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

21

Estimao

Estimao da mdia populacional


Tamanho amostral para estimar

z
n = /2
E

arredondar para o inteiro maior mais prximo

caso a pop seja finita, multiplicar n pelo fator de correo:

Nn
N 1

Exemplo: Desejamos estimar o nvel mdio de coliformes fecais num lago. Quantas
amostras devem ser coletadas aleatoriamente se desejamos estar 95% confiantes em que a
mdia amostral estar a menos de duas unidades da mdia de todo o lago? Suponha que o
desvio padro esperado para tais estudos seja de 20 unidades.

= 0,05 z / 2 = 1,96
2

z 1,96.20
n = /2 =
= 384,16 = 385 amostras
E 2
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

22

11

Estimao

Estimao da mdia populacional (exemplo)


Um estudo de NPS possui um arquivo com 128 amostragens realizadas em um
dia. A mdia dessa amostragem de 79,0 dB. Suponha que a amostra seja uma
AAS e que = 7,3 dB. Usando um Nvel de Confiana = 95%, determine:
b) O Intervalo de Confiana para

a) A margem de erro

= 7,3 dB (conhecido); n = 128 > 30; vamos supor que outliers


= 0,05 z/2= 1,96

7,3
=1,96
= 1, 26466
n
128
b) x E < < x + E

a) E = z / 2

79,0 1, 26466 < < 79,0 + 1, 26466


77,7 < < 80,3
ou 79,0 1,3 ou (77,7:80,3)

Se selecionarmos muitas amostras de


n=128 e construssemos o Intervalo de
Confiana, 95% destas amostras conteriam
o valor de .

Obs: Se um estudo indica que a mdia local


seja, p.ex., 85 dB muito provvel que esse
valor no seja o valor correto de

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

23

Estimao

Estimao da mdia populacional (exemplo)


Para a amostra da temperatura corporal selecionou-se 106 indivduos (n=106),
com mdia de 98,20F. Suponha que a amostra seja aleatria simples e que
seja 0,62F. Usando um nvel de confiana de 90%, encontre:
b) O Intervalo de Confiana para

a) A margem de erro

= 0,62 F (conhecido); n = 106 > 30; vamos supor que outliers


= 0,10 z/2= 1,645

a) E = z

b)

= 1,645

0,62

= 0,09911

106

Se selecionarmos muitas amostras de


n=106 e construssemos o Intervalo de
Confiana, 90% destas amostras conteriam
o valor de .

xE< <x+E
98,20 0,09911 < < 98,20 + 0,09911
98,10 < < 98,30

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

24

12

Estimao

Estimao da mdia populacional


b) desconhecido
 Novamente.... AAS, populao normalmente distribuda ou n > 30
 Se a populao normal, a distribuio das x exatamente uma Distribuio Normal
com e .
 Se a populao no normalmente distribuda, grandes amostras resultam numa
distribuio aproximadamente normal, com mdia e desvio padro /n.
 Ao invs da Distribuio Normal, usaremos, neste caso, a distribuio de Student

Willian Gosset (1876-1937): Funcionrio da Guiness que precisava de uma


distribuio para amostras pequenas. Como a empresa no permitia publicaes,
ele usou o pseudnimo Student.

t=

Estimativa de a partir de s: maior incerteza

x
(s / n )

Usa valores Crticos maiores que z/2: t/2


(isto , Intervalo de Confiana mais largo)

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

25

Estimao

Estimao da mdia populacional


b) desconhecido

t=

x
(s / n )

,
onde t / 2 tem n 1 graus de liberdade
E = t / 2
Alm disso:
n
E o IC dado por: x E < < x + E

Mas o que so graus de liberdade ?


o nmero de valores amostrais que podem variar aps restries impostas aos dados amostrais.
Geralmente dado por n 1.
Ex: 10 medidas tm mdia 50. Pode-se atribuir os 9 primeiros valores e, assim, o 10 est determinado. Se a
soma das 10 medidas , p.ex., 500 ento x10 = 500 (x1 + ... + x9). Como esses 9 valores podem ser
determinados livremente, dizemos que h 9 graus de liberdade.
Graus de liberdade = tamanho amostral -1  liberdade que se perde ao trabalhar com amostra ao
invs da populao!
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

26

13

Estimao

Tabela de distribuio t (clique aqui)


Exemplo do uso da tabela:
Se n = 20 (AAS, selecionada de uma populao com Distribuio Normal).
Determine t/2 p/ Nvel de Confiana de 95%.
GL = n 1 = 19

tabela t/2 = 2,093 (duas caudas)

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

27

Estimao

Estimao da mdia populacional desconhecido (exemplo)


Voltemos ao estudo de NPS que possui um arquivo com 128 amostragens
(AAS) realizadas em um dia. A mdia dessa amostragem de 79,0 dB e o
desvio padro s = 7,3 dB. Usando um Nvel de Confiana = 95%, determine:
a) A margem de erro

b) O Intervalo de Confiana para

s = 7,3 dB ( desconhecido); n = 128 > 30; vamos supor que outliers


= 0,05 t/2 devemos fazer n 1 = 127 t/2 = 1,979 (statdisk)
Abrir Statdisk

s
7,3
a) E = t / 2
=1,979
= 1, 27692
n
128
b) x E < < x + E
79,0 1, 27692 < < 79,0 + 1, 27692
77,7 < < 80,3
ou 79,0 1,3 ou (77,7:80,3)
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

Estamos 95% confiantes de que os


limites 77,7 e 80,3 dB contm .
A tabela apresenta t/2 para n = 100 e n
= 200. Veja que para n=100, t/2 =
1,984 (pouca diferena)

28

14

Estimao

Propriedades da distribuio t de Student


 diferente para tamanhos amostrais (n) diferentes
 tem forma de sino, semelhante a distribuio normal padro, mas tem maior variabilidade
(com distribuies maiores) quando as amostras so pequenas
 tem mdia em t = 0 (Distribuio Normal Padro z = 0)
 tem desvio padro > 1 e varivel com o tamanho amostral (Distribuio Normal = 1)
 A medida que o tamanho amostral se torna maior (com n grande), a distribuio de
Student se aproxima da Distribuio Normal Padro

Podemos determinar a estimativas da mdia amostral (pontual) e do erro


a partir de um Intervalo de Confiana

estimativa
pontual de

x=

limite superior de confiana + limite inferior de confiana


2

E=

limite superior de confiana limite inferior de confiana


2

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

29

Estimao

Distribuio t de Student

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

K=n=1
K= n =10

30

15

Estimao

Como escolher a distribuio apropriada ?


SIM

SIM

Pop tem
Distribuio Normal ?

SIM

NO

conhecido ?

NO

n > 30 ?

SIM

SIM

NO

Usar mtodos
no-paramtricos

Usar Distribuio Normal (z)

Pop tem
Distribuio Normal ?

NO

n > 30 ?

Usar
Student (t)

NO

Usar mtodos
no-paramtricos

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

31

Estimao

Estimando a varincia e o desvio padro da populao


(Distribuio qui-quadrado): de uma populao normalmente distribuda com
varincia , selecionamos aleatoriamente amostras independentes de tamanho n e
calculamos a varincia amostral s para cada amostra. A estatstica amostral tem
uma distribuio qui-quadrado.
Hipteses: AAS e Populao normalmente distribuda (muito importante!)
Lembrando que se temos uma populao de Distribuio Normal, com varincia
2 e selecionamos amostras independentes de tamanho n, a varincia amostral
de cada amostra dada por:
n = tamanho amostral
2
2
s varincia amostral
n
(x
)

(
x)
=varincia
s2 =
n(n 1)
populacional

A relao 2 dada por:


Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

2 =

(n 1) s 2

2
32

16

Estimao

Caractersticas da distribuio qui-quadrado


Tem n 1 graus de liberdade (porm, pode ter mais)
No simtrica (diferentemente da Distribuio Normal Padro e t)
2 0 (nunca negativos)
Quanto > n GL, mais a distribuio qui-quadrado se aproxima de uma
Distribuio Normal
No simtrica

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

33

Estimao

Varincia e o desvio padro da populao (distribuio qui-quadrado)


Exemplo
Valores Crticos de 2 que determina regies que contm uma rea de 0,025
em cada cauda para uma amostra de n = 10.

Tabela rea direita


GL = 9; A = 0,025
D2 = 19,023

0,025
0,025
2E

GL = 9; A = 1 0,025 = 0,975
E2 = 2,700

2D

Tabela distribuio qui-quadrado


Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

34

17

Estimao

Intervalo de Confiana para 2 na distribuio qui-quadrado

(n 1)s 2
(n 1)s 2
2
< <
2D
E2
(n 1)s 2
(n 1)s 2
<

<
2D
E2
Obs : 2D = 2
s2

E2 = 12

a melhor estimativa de
estimador no-viesado
s comumente usado como a melhor estimativa de (principalmente para n grande,
vis pequeno)
Aproximao:
Se usar o conjunto original de dados: Uma casa a mais do que o conjunto
Se usar s ou s2: Mesmo nmero de casas decimais
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

35

Estimao

Exemplo: Intervalo de Confiana para 2


 Construa uma estimativa de Intervalo de Confiana de 95% de confiana para o desvio
padro de um conjunto de dados de 105 temperaturas mximas dirias medidas em
Itajub. Sabe-se que as temperaturas so normalmente distribudas e essa amostra tem
mdia de 26,50C e desvio padro de 4,50C. Obs: Nenhum outlier foi detectado e as
temperaturas so medidas com preciso de uma casa decimal.

Temos 95% de confiana que os limites 3,96 e


5,21C contm o verdadeiro valor de .
Estamos 95% confiantes que o desvio padro
das temperaturas mximas de Itajub est entre
3,96 e 5,21C.
Ateno! NO se expressa desvio padro como
s E. Somente 3,96 < < 5,21C ou (3,96 :
5,21)C
Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

36

18

Estimao

Exemplo: Intervalo de Confiana para 2


 Foram levantados dados de 106 temperaturas corporais. Use as caractersticas abaixo
para determinar o intervalo de confiana a 95% para o .
 A) A populao parece ter uma distribuio normal; B) mdia amostral 98,20F; c) s =
0,62F; d) n=106; e) no h outliers.

0,025

129,561

74,22

0,025
2E

2D

Opsm. Ia quase me esquecendo!

Lista de exerccios #12

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

37

Estimao

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

38

19

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

39

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

40

20

Marcelo
de PaulaBolzan
Corra (2011)
UniversidadeP.
Federal
de Itajub
Fabrina
Martins/Marcelo
Crrea

41

21

You might also like