You are on page 1of 9

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

Nota: o I. C. l u chamado bilateral. Em

Captulo 7 - Estimao por intervalos

alguns casos pode ser mais importante um intervalo

7.1 Intervalos de confiana


Para alm duma estimativa pontual de um

unilateral (superior ou inferior) do tipo


l , intervalo inferior
u intervalo superior

parmetro , em muitas situaes, importante


dispr de alguma forma de intervalo que indique a

7.2 Intervalo de confiana para a mdia,

confiana que se pode depositar na estimativa

varincia conhecida

pontual.

X populao tal que:

Um intervalo de confiana (I.C.) para um


parmetro desconhecido do tipo
l u,


onde l e u dependem do valor observado


(estimativa pontual), e da distribuio por
, usada para estimar .
amostragem da estatstica

( X1 ,

E( X ) =

(desconhecido)

V(X) = 2

(conhecido)

, Xn ) a. a. de dimenso n

= X (estimador pontual de )

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

Sabemos j que

Para minimizar a b deve ter-se b = a.

Z=

X
n

N (0,1) se X ~ N ( , 2 )
~ N (0,1) se X qq e n grande
a
~

X
P a
a =
n

= P a
X a
=

n
n

onde o caso X qq justificado pelo T. L. C.

X + a
= P X a
=

n
n

Distribuio de Z:

= P X a
X +a
=

n
n
1

/2
b

;X + a
= P X a
=1

n
n

/2
a

com a: P( Z > a) =
Podemos determinar pontos, a e b, tais que
Nota: a Z =

X
P b
a = 1 =
n

.
2

X
chama-se varivel aleatria
n

fulcral (deve ter distribuio conhecida e depender

onde 0 e 1 .

apenas do parmetro desconhecido).


3

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

Interpretao:

X a n ; X + a n um intervalo aleatrio,
quando substitumos X por x (valor observado da
mdia duma amostra aleatria) passamos a ter um
intervalo concreto chamado intervalo de confiana.
Definio (Intervalo de confiana para a mdia
com varincia conhecida): Se x for a mdia

No podemos dizer que pertence ao


intervalo de confiana com probabilidade
1 ;

o que podemos dizer que se fizermos um


grande nmero de intervalos nestas condies,
aproximadamente 100 (1 )% desses

duma populao normal (ou duma populao

intervalos contero de facto o verdadeiro valor


de (que permanece desconhecido), esta

qualquer desde que n grande, mas nesse caso o

ideia que traduzida por "confiana".

observada duma amostra aleatria de dimenso n

intervalo apenas aproximado) com varincia


conhecida 2 , um intervalo de confiana a
100 (1 )% para dado por
xa

Notas:
1) O comprimento do intervalo de confiana est
associado preciso, quanto menor for o

x+a
com a: P( Z > a) =
n
n
2

comprimento mais precisa a mdia.

(ou a = z 2 , na notao do Montgomery).


5

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

2) Se diminumos , isto , aumentarmos 1

Exemplo: X ~ N ( , 2 ) com = 1 .

(grau de confiana), mantendo n fixo, a vai


aumentar e consequentemente o comprimento
do intervalo. No possvel fazer = 0 pois
nesse caso a = + .
3) Quando aumentamos n, mantendo fixo,

a) uma amostra aleatria de dimenso 10 conduziu


a x = 10.1. Calcular um intervalo de confiana a
95% para :

= 0.05 P( Z > a) = 0.025


P( Z < a) = 0.975 a = 1 (0.975) = 1.96

diminui o comprimento do intervalo.


Logo o intervalo pedido
4) Qual deve ser a dimenso da amostra para que
se tenha um dado erro mximo (com confiana
fixa)?
Para termos uma confiana de 100 (1 )%
em que x E deve ter-se
a
a
n = , (visto que
= E) .
E
n
2

1
1

= [9.48;10.72]
10.1

1.96

;10.1
+
1.96

10
10
b) Qual deve ser n para que se possa garantir com
95% de confiana que x 0.25?
1.96 1
n=
= 61.47
0.25
2

Resposta: n = 62 .

(quando n no der inteiro arredonda-se por


excesso).
7

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

7.3 Intervalo de confiana para a diferena de

(X

X1 , populao 1, com E( X1 ) = 1 e V ( X1 ) =
(conhecida)
2
1

21

, X22 , , X2n2 )


Nota: um intervalo deste tipo til para comparar


duas experincias ou dois mtodos.

( X1 e X2 independentes)

O estimador pontual de 1 2 X1 X2 .

a. a. da populao 1 X11 , X12 , , X1n1 com mdia




n1

X2 ~ N ( 2 , 22 ) ento

i =1

n1

se

2
X1 ~ N 1 , 1 e X2 ~ N 2 , 2 pelo que
n1
n2

n2

X1 ~ N (1 , 12 )

J sabemos que se

1i

a. a. da populao 2 X21 , X22 , , X2n2 com mdia

X2 =

Como construir um I.C. a 100 (1 )% para


1 2 ?

X2 , populao 2, com E( X2 ) = 2 e V ( X2 ) = 22
(conhecida)

X1 =

(e a a.a. X11 , X12 , , X1n1 independente da a.a.

duas mdias, varincias conhecidas

2 2
X1 X2 ~ N 1 2 , 1 + 2
n1 n2

2i

i =1

n2
9

10

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

logo a v.a. fulcral :

Notas: Mantm-se as notas 1) 2) e 3) da seco

(X
Z=

X2 ) ( 1 2 )

12 22
+
n1 n2

7.2, relativas interpretao e variao do


~ N (0,1)

comprimento do intervalo.
4) Dimenso da amostra tal que

(X

X2 ) (1 2 ) E com 100 (1 )%

Notas: a distribuio anterior tambm vlida,


aproximadamente, para X1 e X2 com outra

de confiana ?

qualquer distribuio, no necessariamente normal,


desde que n1 e n2 sejam elevados (pelo T.L.C.)

No tem soluo nica para n1 e n2 gerais, mas

Fazendo, do mesmo modo que na seco anterior,


P( a Z a) = 1 , com P( Z > a) =

se quisermos n1 = n2 = n obtm-se
2

a
n = (12 + 22 )
E

obtm-se um I.C. a 100 (1 )% para 1 2 :

12 22
2 2
+
; x1 x2 + a 1 + 2
x1 x2 a
n1 n2
n1 n2

11

12

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

Mas qual ser o efeito de fazer isto? No a


7.4 Intervalo de confiana para a mdia de

mesma v. a.! Qual a sua distribuio?

uma populao normal, varincia


Se n for grande ( n > 30 , em geral) pode mostrar-se

desconhecida

que o efeito pequeno e tem-se


X populao tal que:

( X1 ,

E( X ) =

(desconhecido)

V(X) = 2

(desconhecida)

Z=

X
~ N (0,1),
S n a

quer para X ~ N ( , 2 ) , quer para X qualquer

(com E( X ) = e V ( X ) = 2 ). Ou seja, o I.C.

, Xn ) a. a. de dimenso n

calcula-se exactamente como na Seco 7.2


substituindo por s (desvio padro amostral

= X (estimador pontual de )
X
porque
No se pode usar Z =
n

desconhecido. Um procedimento lgico consiste


em substituir por S (desvio padro amostral), ou
X
.
seja, em considerar a v. a. fulcral
S n

observado).
Se n 30 o problema no solvel no caso geral
(isto , desconhecendo o tipo de distribuio da
populao). Se X ~ N ( , 2 ) o teorema seguinte
fornece o resultado que se pretende.

13

Ana Pires, IST, Outubro de 2000

14

Ana Pires, IST, Outubro de 2000

Teorema: Seja ( X1 , , Xn ) uma a.a. duma




2) Funo Gama

populao X ~ N ( , 2 ) . A varivel aleatria


T=

(r ) =

X
S n

r 1 x

e dx , r > 0

se r inteiro (r ) = (r 1)!. Esta funo pode

tem distribuio t com n 1 graus de liberdade


( T ~ tn 1 ).
Notas:

ser vista como uma generalizao do factorial


(definido s para inteiros) aos reais positivos.
3) Representao grfica

1) Uma v.a. com distribuio t tem funo de

f(x)

densidade de probabilidade
f ( x) =

[( k + 1) 2]

k ( k 2)

k =
k=3
k=1

x
1 +

k
2

k +1
2

onde k > 0 o nmero de graus de liberdade.


Pode mostrar-se que se T ~ tk ento
E(T ) = 0 ( k > 1) e V (T ) = k ( k 2) ( k > 2)
15

4) fcil ver que quando k +


x2

1 2
f ( x)
e
2

(f.d.p. de N (0,1) )
16

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

5) Os percentis da distribuio tk encontram-se


tabelados
Tabelas da disciplina:

S
S

P X a
;X + a
=1

n
n

com a: P(T > a) =

No livro:

.
2

Obtm-se ento o I.C. para a mdia de uma


populao normal com varincia desconhecida

t k,q

P T < tk,q = q

tk,1 q = tk,q

xa

t,k

P(T > t ,k ) =

t1 ,k = t ,k

s
s
x+a
n
n

Observaes:
1) A interpretao semelhante que foi feita em

___________

7.2.

Voltando construo do I.C. e procedendo da


forma habitual:

2) Se diminuir, com n fixo, aumenta o


comprimento do intervalo.

X
P a
a = 1
S n

17

18

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

3) Se n aumentar, com fixo, espera-se que


diminua o comprimento do intervalo, mas no

Exemplo: Considere-se uma v.a. X ~ N ( , 2 ) .

h certeza, pois s varia de amostra para amostra.


4) Determinao de n para um dado erro (com
fixo):
as
x E n=
E

Uma amostra aleatria de dimenso 10 conduziu a


x = 10.1 e s = 1.2. Calcular um intervalo de
confiana a 95% para .
T=

X
~ tn 1= 9
S n

= 0.05 P(T > a) = 0.025


P(T < a) = 0.975 a = t9,0.975 = 2.262

Dificuldades:
i) a tambm depende de n; Soluo: resoluo
por tentativa-erro.
ii) s desconhecido antes de se ter a amostra;
Soluo: obter uma amostra preliminar para ter
uma ideia do valor que s pode vir a ter.

19

s
s

I.C.95% ( ) = x a
;x + a
n
n

Logo o intervalo pedido


1.2
1.2

=
I.C.95% ( ) = 10.1 2.262
;10.1 + 2.262
10
10

= [9.48;10.72]

20

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

7.5 Intervalo de confiana para a diferena


entre as mdias de duas populaes normais,
varincias desconhecidas

(e a a.a. X11 , X12 , , X1n1 independente da a.a.

(X

21

, X22 , , X2n2 )


X1 , populao 1, com E( X1 ) = 1 e V ( X1 ) = 12
(desconhecida)

Como construir um I.C. a 100 (1 )% para

X2 , populao 2, com E( X2 ) = 2 e V ( X2 ) = 22
(desconhecida)

Quando 12 e 22 eram conhecidas usava-se a v.a.

( X1 e X2 independentes)

1 2 ?

fulcral
Z=

(X

X2 ) ( 1 2 )

12 22
+
n1 n2

a. a. da populao 1 X11 , X12 , , X1n1 com mdia




n1

X1 =

n1

1i

i =1

n1

e varincia

S12 =

(X

1i

i =1

X1 )

Se n1 > 30 e n2 > 30 pode-se substituir 12 por S12

n1 1

e 22 por S22 obtendo-se

a. a. da populao 2 X21 , X22 , , X2n2 com mdia




n2

X2 =

X2i
i =1

n2

n2

e varincia S22 =

(X
i =1

2i

X2 )

~ N (0,1)

Z=

(X

X2 ) ( 1 2 )
S12 S22
+
n1 n2

n2 1

~ N (0,1)
a

21

22

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

quer para X1 ~ N (1 , 12 ) e X2 ~ N ( 2 , 22 ) quer

e tem-se ainda que

para X1 e X2 com outra qualquer distribuio.

1 1
12 22
V ( X1 X2 ) =
+
= 2 +
n1 n2
n1 n2

Ento um I.C. calcula-se exactamente como na


Seco 7.4, apenas substituindo 12 por s12 e 22
por s22 .

Vai ser necessrio estimar 2 . Um estimador

Quando n1 30 ou n2 30 o problema s tem

amostrais

soluo no caso em que X1 ~ N (1 , 12 ) e

X2 ~ N ( 2 , 22 ) e mesmo assim para se obter uma

v.a. fulcral com distribuio exacta necessrio


supor que (embora desconhecidas) 12 = 22 = 2

natural obtm-se combinando as duas varincias

= S
2

n1 1)S12 + (n2 1)S22


(
=
n1 + n2 2

Note-se que quando n1 = n2 resulta 2 =

(esta suposio razovel em muitas situaes


reais, e alm disso pode ser testada).

2
p

S12 + S22
.
2

Sabemos que

X1 X2 continua a ser o estimador pontual de


1 2

23

Z=

(X

X2 ) ( 1 2 )
~ N (0,1)
1 1

+
n1 n2

24

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

substituindo por Sp obtm-se

Observaes:

T=

(X

X2 ) ( 1 2 )
~ tn1 + n2 2
1 1
Sp
+
n1 n2

1) A determinao da dimenso da amostra mais


complicada (ver 7.3 e 7.4).

(sob as suposies, ou hipteses de trabalho,

2) E se no for razovel admitir que


12 = 22 = 2 ? Este problema (conhecido por
problema de Behrens-Fisher) no tem soluo

consideradas). Ento de
P( a T a) = 1

exacta. H solues aproximadas, o

com a: P(T > a) =


2

Montgomery (pg. 397) apresenta uma (no


faz parte do programa).

obtm-se um I.C. a 100 (1 )% para 1 2 :


1 1
1 1
+ ; x1 x2 + as p
+
x1 x2 as p
n1 n2
n1 n2

onde s p =

(n1 1)s12 + (n2 1)s22 .

Exemplo: Um mesmo tipo de material pode ser


adquirido a dois fabricantes. As variveis de
interesse so a resistncia mecnica do material (em
unidades convenientes) para cada fabricante. Para

n1 + n2 2

comparar os seus valores mdios obteve-se (por


amostragem aleatria) uma amostra de cada:
25

Ana Pires, IST, Outubro de 2000

26

Ana Pires, IST, Outubro de 2000

Admitimos que (hipteses de trabalho):


Fabricante 1

Fabricante 2

x1 = 8.73
s12 = 0.35
n1 = 15

x2 = 8.68
s22 = 0.40
n2 = 18

Com o objectivo de ajudar a decidir qual dos dois


melhor pretende-se calcular um intervalo de
confiana a 95% para a diferena dos valores
mdios.
Sejam:

X1 ~ N (1 , 12 ) e X2 ~ N ( 2 , 22 )

X1 e X2 so independentes;

12 = 22 = 2 (parece razovel porque s12 e s22


so da mesma ordem de grandeza).

A estimativa de
14 0.35 + 17 0.40
sp =
= 0.614
15 + 18 2
para grau de confiana = 95% vem = 0.05 e

X1 - v.a. que representa a resistncia do material


produzido pelo fabricante 1
X2 - v.a. que representa a resistncia do material
produzido pelo fabricante 2

27

a = t31;0.975 = 2.04 ( n1 + n2 2 = 31)


I.C.95% (1 2 ) =

1 1
1 1
= x1 x2 as p
+ ; x1 x2 + as p
+ =
n
n2
n
n
1
2
1

= [ 0.388;0.488]
28

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

Podemos ento afirmar (com 95% de confiana)

Notas:

que no existe grande diferena entre a resistncia

1) Uma v.a. com distribuio do chi-quadrado tem

mdia do material produzido pelos dois fabricantes.


7.6 Intervalo de confiana para a varincia de

funo de densidade de probabilidade


f ( x) =

uma populao normal


X ~ N ( , 2 )

( X1 ,

, Xn ) a.a.

1
x ( k 2 ) 1e x 2 , x > 0
2 (k 2)
k2

onde k > 0 o nmero de graus de liberdade.


Pode mostrar-se que se Q ~ k2 ento
E(Q) = k e V (Q) = 2k.

Queremos um I.C. a 100 (1 )% para 2 .


O estimador pontual de 2 S 2 . A v.a. fulcral
obtm-se do teorema seguinte.

2) Representao grfica
f(x)

Teorema: Seja ( X1 , , Xn ) uma a.a. duma

k=2

populao X ~ N ( , ) . A v.a.
2

Q=

k=4
k =6

(n 1)S 2

2
tem distribuio do chi-quadrado com n 1 graus
de liberdade ( Q ~ n21 ).
29

30

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

3) Os percentis da distribuio k2 encontram-se

Dado que a distribuio de Q no simtrica


preciso determinar a e b. Faz-se ento

tabelados
Tabelas da disciplina:

a: P(Q < a) =

No livro:

b: P(Q > b) =

.
2

(n 1)S 2
P a
b = 1

,k

k,q

P Q<

2
k,q

)=q

2 (n 1)S 2 (n 1)S 2
;
P
= 1
b
a

P( Q >

2
,k

)=

Um I.C. a 100 (1 )% para 2 ento


(n 1)s 2 (n 1)s 2
;

b
a

Para construir um I.C. a 100 (1 )% para 2


parte-se de
P( a Q b ) = 1
31

32

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

Exemplo: Considere-se uma v.a. X ~ N ( , 2 ) .

7.7 Intervalo de confiana para uma proporo

Uma amostra aleatria de dimenso 10 conduziu a


10
10
i =1 xi = 101 e i =1 xi2 = 1040 . Calcular um

( X1 ,

intervalo de confiana a 99% para .

muito grande ou infinita.

s2 =
=

interesse.
Seja p a proporo de indivduos na populao que

2
a = 9;0.005
= 1.735

pertencem a essa categoria de interesse.

2
b = 9;0.995
= 23.59

Exemplos:

19.9 19.9
I.C.99% ( 2 ) =
;
= 0.844;11.47]
23.59 1.735 [
e

o nmero de observaes desta

amostra que pertencem a uma dada categoria de

2
1
101 = 19.9
1040

10

10
9
9

I.C.99% ( ) =

, Xn ) amostra aleatria de uma populao

Seja Y ( n)

1 n
1 n 2
2
2
x

x
=
(
)
xi nx =

i
n 1 i =1
n 1 i =1

Da tabela:

0.844; 11.47 = [0.918;3.39]

Populao

Categoria

Peas

ser defeituosa

Eleitores

vota no partido X

Y
O estimador pontual de p P = .
n

33

Ana Pires, IST, Outubro de 2000

Ana Pires, IST, Outubro de 2000

Sabemos que Y ~ Bin(n, p) e que se n for grande


Y ~ N (np,np(1 p))
a

ou ainda

Y
p(1 p)
P = ~ N p,

na
n

pois

Y
Y
E (Y )
V (Y )
E P = E =
e V P = V = 2
n
n
n
n

()

()

Ento tem-se Z =

P a

34

P p
~ N (0,1)
p(1 p) a
n

P a

P p
a 1

P 1 P

n
O I.C. (aproximado) a 100 (1 )% para p :

p (1 p )
p (1 p )
; p + a

p a
n
n

Exemplo: Populao de eleitores portugueses.

Sondagem (aleatria) a 1200 eleitores revelou que


683 tencionam votar no partido ABC. Determinar a

P p
a 1 , a: P( Z > a) =
2
p(1 p)

Resolver em ordem a p? Aproximao que d


resultados satisfatrios
35

e.m.v. de p (proporo de eleitores na populao


que tencionam votar no partido ABC) e um I.C.
aproximado a 95% para p.
p = 683 1200 = 0.569

a = 1.96

I.C.95% ( p) = [0.541;0.597]
36

You might also like