You are on page 1of 15

Universidade Estadual do Oeste do Paran UNIOESTE

Centro de Engenharias e Cincias Exatas - CECE


Curso de Engenharia Qumica









Apostila sobre Inferncias Estatsticas (Reviso)





Prof. Marcos Moreira






Toledo PR
2011

SUMRIO


3. INFERNCIAS ESTATSTICAS 1
3.1 Inferncia Estatstica para uma Amostra 2
3.1.1 Inferncia para a mdia de uma populao, varincia conhecida 2
3.1.2 O valor P 3
3.1.3 Inferncia para a mdia de uma distribuio normal, varincia desconhecida 4
3.1.4 Inferncia para a varincia de uma distribuio normal 4
3.1.5 Inferncia para uma proporo populacional 5
3.1.6 A probabilidade do Erro Tipo II 6
3.2 Inferncia Estatstica para duas Amostras 6
3.2.1 Inferncia para a diferena de mdias, varincias conhecidas 6
3.2.2 Inferncia para a diferena de mdias de duas populaes normais,
varincias desconhecidas
7
3.2.3 Inferncia para as varincias de duas distribuies normais 9
3.2.4 Inferncia para duas propores populacionais (grandes amostras
aproximao normal da binomial)
10
3.3 Anlise de Varincia 11
BIBLIOGRAFIA 13

Inferncias Estatsticas Prof. Marcos Moreira

1
3. INFERNCIAS ESTATSTICAS


Uma varivel aleatria caracterizada ou descrita pela sua distribuio de
probabilidade. Esta distribuio descrita pelos seus parmetros. No controle estatstico de
qualidade, a distribuio de probabilidade usada para descrever ou modelar alguma
caracterstica da qualidade, tal como a dimenso crtica de um produto ou a frao de defeitos
em um processo de produo. Sendo assim, nosso interesse recai em fazer inferncia sobre
parmetros de distribuies de probabilidade. Como os parmetros em geral so
desconhecidos, necessitamos de procedimentos para estim-los a partir dos dados de uma
amostra.
Se queremos, por exemplo, obter estimativas pontuais da mdia e da varincia do
dimetro interno dos mancais produzidos em um processo podemos tomar uma amostra
aleatria de n=20 mancais, calcular a mdia ( x ) e a varincia (S
2
). Esta ser uma boa
estimativa, pois
= ) (x E e
2 2
) ( = S E
O desvio padro amostral S no um estimador no-tendencioso, pois:

.
] 2 / ) 1 [(
) 2 / (
1
2
) (
4
c
n
n
n
S E =

=

Uma boa estimativa para o desvio padro amostral seria:

4

c
S
=

Em muitas aplicaes da estatstica nos problemas de engenharia de qualidade,
conveniente estimar o desvio padro pelo mtodo da amplitude. Seja x
1
, x
2
, ..., x
n
uma
amostra aleatria de n observaes de uma distribuio normal com mdia e varincia
2
.
A amplitude da amostra :
mn mx
x x R =

A varivel W=R/ chamada de amplitude relativa. A distribuio de W j foi bem
estudada. A mdia de W uma constante d
2
que depende do tamanho da amostra, isto ,
E(W)=d
2
. Assim, um estimador no-tendencioso do desvio padro de uma distribuio
normal :
2

d
R
=
O mtodo da amplitude eficiente para amostras com n6. Para amostras com n=2 o
mtodo 100% eficiente.

Tamanho da amostra, n Eficincia relativa
2 100%
3 99,2%
4 97,5%
5 95,5%
6 93,0%
10 85,0%
Inferncias Estatsticas Prof. Marcos Moreira

2
3.1 Inferncia Estatstica para uma Amostra

Se pensamos que a massa (em gramas) do contedo lquido de um produto de 1500g
podemos expressar essa afirmativa formalmente como:

H
0
: 1500 = (hiptese nula)
H
1
: 1500 (hiptese alternativa)

Este tipo de hiptese chamada de hiptese alternativa bilateral.

No controle estatstico de qualidade, usamos a informao passada para especificar
valores para o parmetro correspondente ao estado sob controle, e periodicamente testamos a
hiptese de que esse valor no mudou.
Os valores podem resultar de alguma teoria ou modelo do processo, ou ainda, podem
resultar de especificaes contratuais ou de projeto.
Para um teste estatstico toma-se uma amostra aleatria da populao em estudo,
calcula-se uma estatstica de teste apropriada e, ento, rejeita-se ou no a hiptese nula.
Dois tipos de erros podem ser cometidos quando testamos hipteses. O primeiro o
erro do tipo I, quando descartamos a hiptese nula quando ela verdadeira. O segundo o
erro do tipo II, quando no rejeitamos a hiptese nula sendo ela falsa. A probabilidade de
cometermos o erro do tipo I dada por e a probabilidade de cometermos o erro do tipo II
dada por .
O valor de geralmente arbitrado e o valor de determinado pelo tamanho da
amostra. Quanto maior o tamanho da amostra, menor o valor de .


3.1.1 Inferncia para a mdia de uma populao, varincia conhecida

Alguns teoremas:
Teorema 1 Se a populao infinita, ou se a amostragem com reposio, ento a
varincia da distribuio amostral de mdias, denotada por
2
X
, dada por
n
X E
X
2
2 2
] ) [(

= =

Teorema 2 Se a populao tem tamanho N, se a amostragem sem reposio, e se o
tamanho da amostra e nN, ento:

= =
1
] ) [(
2
2 2
N
n N
n
X E
X



Teorema 3 Se a populao da qual se extraem as amostras N(;
2
) ento a amostra
N(;
2
/n)

Teorema 4 Suponhamos que a populao da qual se extraem amostras tenha uma
distribuio de probabilidade no necessariamente normal com mdia e varincia
2
.
Ento, a varivel padronizada associada a X , dada por:

n
X
Z
/

=

Inferncias Estatsticas Prof. Marcos Moreira

3
assintoticamente normal para n, o que uma conseqncia do teorema do limite
central.

Teste Regio de rejeio de H
0
H
0
: a =
H
1
: a
) ; (
2 /
Z e ) ; (
2 /

Z
H
0
: a =
H
1
: a >

Z Z
O
>
H
0
: a =
H
1
: a <

Z Z
O
<

Valores crticos de Z para testes unilaterais e bilaterais


Teste 10% 5% 1% 0,5% 0,2%
Unilateral Z=-1,28
Z=1,28
Z=-1,645
Z=1,645
Z=-2,33
Z=2,33
Z=-2,58
Z=2,58
Z=-2,88
Z=2,88
Bilateral Z=-1,645
Z=1,645
Z=-1,96
Z=1,96
Z=-2,58
Z=2,58
Z=-2,81
Z=2,81
Z=-3,08
Z=3,08


Intervalo de Confiana para a mdia com varincia conhecida

Bilateral
n
Z X
n
Z X

2 / 2 /
+


Unilateral
n
Z X


+


Unilateral


n
Z X


Os intervalos de confiana so aproximados para distribuies no normais, de acordo
com o Teorema do Limite Central, e exatos para distribuies normais.

3.1.2 O valor P

O valor P o menor nvel de significncia que levaria rejeio da hiptese nula H
O
.

Teste Valor de P
H
0
: a =
H
1
: a
)] ( 1 [ 2
O
Z P =
H
0
: a =
H
1
: a >
)] ( 1 [
O
Z P =
H
0
: a =
H
1
: a <
) (
O
Z P =
Inferncias Estatsticas Prof. Marcos Moreira

4
3.1.3 Inferncia para a mdia de uma distribuio normal, varincia desconhecida

Como a varincia desconhecida, torna-se necessria a hiptese adicional da varivel
aleatria ser normalmente distribuda. Com isso podemos trabalhar com a seguinte varivel:

) 1 /(
) 1 ; 0 (
~
/
/
/
2
1

n
N
S
n
x
n S
x
n



que a estatstica t de Student, ou seja,

) 1 /(
) 1 ; 0 (
~
/
/
/
2
1

n
N
S
n
x
n S
x
n




Teste Regio de rejeio de H
0
H
0
: a =
H
1
: a
) ; (
1 , 2 /

n
t

e ) ; (
1 , 2 /

n
t

H
0
: a =
H
1
: a >
1 ,
>
n O
t t


H
0
: a =
H
1
: a <
1 ,
<
n O
t t





Intervalo de Confiana para a mdia da distribuio normal com varincia desconhecida

Bilateral
n
S
t X
n
S
t X
n n 1 , 2 / 1 , 2 /
+




Unilateral
n
S
t X
n 1 ,
+



Unilateral



n
S
t X
n 1 ,


3.1.4 Inferncia para a varincia de uma distribuio normal

A estatstica de teste para esse caso :

2
2
2
) 1 (
o
O
S n


=

Inferncias Estatsticas Prof. Marcos Moreira

5
Teste Regio de rejeio de H
0
H
0
:
2 2
o
=
H
1
:
2 2
o

) ; ( 1 , 2 / 1
2
n e ) ; ( 1 , 2 /
2
n
H
0
:
2 2
o
=
H
1
:
2 2
o
>
1 ,
2 2
> n
O

H
0
:
2 2
o
=
H
1
:
2 2
o
<
1 , 1
2 2
< n
O


Intervalo de Confiana para a varincia de uma distribuio normal

Bilateral
2
1 , 2 / 1
2
2
2
1 , 2 /
2
) 1 ( ) 1 (

n n
S n S n



Unilateral
2
1 , 1
2
2
) 1 (

n
S n



Unilateral
2
2
1 ,
2
) 1 (

n
S n



3.1.5 Inferncia para uma proporo populacional


Teste Regio de rejeio de H
0
H
0
:
O
p p =
H
1
:
O
p p
) ; (
2 /
Z e ) ; (
2 /

Z
H
0
:
O
p p =
H
1
:
O
p p >

Z Z
O
>
H
0
:
O
p p =
H
1
:
O
p p <

Z Z
O
<

Onde
n
p p
p n X
p np
np X
Z
o o
o
o o
o
) 1 (
/
) 1 (

=


H vrias abordagens para a construo do intervalo de confiana para p. Se n
grande e p0,1, ento a aproximao normal da binomial pode ser usada, resultando nos
seguintes intervalos de confiana:

Bilateral
n
p p
Z p p
n
p p
Z p
) 1 (

) 1 (

2 / 2 /

+



Inferncias Estatsticas Prof. Marcos Moreira

6

Unilateral
n
p p
Z p p
) 1 (


+



Unilateral
p
n
p p
Z p

) 1 (




Se n pequeno, ento a distribuio binomial deve ser usada para estabelecer o
nvel de significncia de p. Se n grande, mas p pequeno, ento a aproximao
Poisson para a binomial til na construo de intervalos de confiana para p.

3.1.6 A probabilidade do Erro Tipo II


n
Z
n
Z
2 / 2 /

onde =
1
-
o
O poder do teste dado por 1-.


Teste Estatstica
H
0
:
O
=
H
1
:
O

n
X
Z
/

=


3.2 Inferncia Estatstica para duas Amostras

3.2.1 Inferncia para a diferena de mdias, varincias conhecidas

A estatstica de teste dada por:

2
2
2
1
2
1
2 1 2 1
) (
n n
X X
Z
o


+

=

e tem distribuio N(0;1). As populaes 1 e 2 devem ser independentes, normais ou, pelo
menos, o Teorema do Limite Central deve ser vlido.

Teste Regio de rejeio de H
0
H
0
:
0 2 1
=
H
1
:
0 2 1
=
) ; (
2 /
Z e ) ; (
2 /

Z
H
0
:
0 2 1
=
H
1
:
0 2 1
>

Z Z
O
>
H
0
:
0 2 1
=
H
1
:
0 2 1
<

Z Z
O
<
Inferncias Estatsticas Prof. Marcos Moreira

7

Intervalo de Confiana para a diferena de mdias com varincias conhecidas

Bilateral
2
2
2
1
2
1
2 / 2 1 2 1
2
2
2
1
2
1
2 / 2 1
n n
Z X X
n n
Z X X




+ + +


Unilateral
2
2
2
1
2
1
2 1 2 1
n n
Z X X



+ +


Unilateral
2 1
2
2
2
1
2
1
2 1

+
n n
Z X X



3.2.2 Inferncia para a diferena de mdias de duas populaes normais, varincias
desconhecidas

Caso 1:
2 2
2
2
1
= =

O estimador combinado de
2
, denotado por S
P
2
definido como:
2
) 1 ( ) 1 (
2 1
2
1 1
2
1 1 2
+
+
=
n n
S n S n
S
P

Sabemos que

2 1
2 1 2 1
1 1
) (
n n
X X
Z
+

=



tem distribuio N(0;1). Substituindo por S
P
, obtm-se a estatstica de teste:

2 1
2 1 2 1
1 1
) (
n n
S
X X
t
P
+

=



que tem distribuio t com n
1
+n
2
-2 graus de liberdade.

Teste Regio de rejeio de H
0
H
0
:
0 2 1
=
H
1
:
0 2 1
=
) ; (
2 2 1 , 2 / +

n n
t

e ) ; (
2 2 1 , 2 /

+n n
t

H
0
:
0 2 1
=
H
1
:
0 2 1
>
2 2 1 , +
>
n n
t t


H
0
:
0 2 1
=
H
1
:
0 2 1
<
2 2 1 , +
<
n n
t t


Inferncias Estatsticas Prof. Marcos Moreira

8
Intervalo de Confiana para a diferena de mdias com varincias conhecidas

Bilateral
2 1
2 2 1 , 2 / 2 1 2 1
2 1
2 2 1 , 2 / 2 1
1 1 1 1
n n
S t X X
n n
S t X X
p n n p n n
+ + +
+ +



Caso 2:
2
2
2
1


Em algumas situaes no razovel supor que as varincias desconhecidas
1
2
e
2
2

sejam iguais. No h uma estatstica t exata para testar H
o
:
1
-
2
=
o
nesse caso. No entanto,
se H
o
:
1
-
2
=
o
verdadeira, a estatstica:

2
2
2
1
2
1
2 1 2 1 *
) (
n
S
n
S
X X
t
o
+

=


aproximadamente distribuda como uma t com nmero de graus de liberdade dado por:

2
1
) / (
1
) / (
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1

+
+
+

+
=
n
n S
n
n S
n
S
n
S



Assim, se , hipteses sobre a diferena de mdias de duas distribuies normais so
testadas da mesma forma como no caso de varincias iguais, exceto pelo fato de se usar t
2
2
2
1

o
*

como estatstica de teste e de se substituir n
1
+n
2
-2 por para o nmero de graus de liberdade
do teste.

Intervalo de Confiana para a diferena de mdias com varincias conhecidas

Bilateral
2
2
2
1
2
1
, 2 / 2 1 2 1
2
2
2
1
2
1
, 2 / 2 1
n
S
n
S
t X X
n
S
n
S
t X X + + +















Inferncias Estatsticas Prof. Marcos Moreira

9

3.2.3 Inferncia para as varincias de duas distribuies normais


A estatstica utilizada para este teste dada por:

2
2
2
1
S
S
F
O
=

Teste Estatstica de teste Regio de rejeio de H
0
H
0
:
2
2
2
1
=
H
1
:
2
2
2
1

2
2
2
1
S
S
F
O
=
) ; (
1 2 , 1 1 , 2 / 1

n n
F

e
) ; (
1 2 , 1 1 , 2 /

n n
F

H
0
:
2
2
2
1
=
H
1
:
2
2
2
1
<
2
1
2
2
S
S
F
O
=
1 1 , 1 2 ,
>
n n O
F F


H
0
:
2
2
2
1
=
H
1
:
2
2
2
1
>
2
2
2
1
S
S
F
O
=
1 2 , 1 1 ,
<
n n O
F F



Intervalo de Confiana para a diferena de mdias com varincias conhecidas

Bilateral
1 1 , 1 2 , 2 /
2
2
2
1
2
2
2
1
1 1 , 1 2 , 2 / 1
2
2
2
1


n n n n
F
S
S
F
S
S



Unilateral
1 1 , 1 2 ,
2
2
2
1
2
2
2
1

n n
F
S
S



Unilateral
2
2
2
1
1 1 , 1 2 , 1
2
2
2
1


n n
F
S
S



Uma relao importante :



, ,
, , 1
1
u
u
F
F =












Inferncias Estatsticas Prof. Marcos Moreira

10
3.2.4 Inferncia para duas propores populacionais (grandes amostras aproximao
normal da binomial)


A estatstica utilizada para este teste dada por:

=
2 1
2 1
1 1
) 1 (

n n
p p
p p
Z
O


onde:
2 1
2 1

n n
x x
p
+
+
=

Teste Regio de rejeio de H
0
H
0
:
2 1
p p =
H
1
:
2 1
p p
) ; (
2 /
Z e ) ; (
2 /

Z
H
0
:
2 1
p p =
H
1
:
2 1
p p >

Z Z
O
>
H
0
:
2 1
p p =
H
1
:
2 1
p p <

Z Z
O
<

Intervalo de Confiana para a diferena de mdias com varincias conhecidas

Bilateral

2
2 2
1
1 1
2 / 2 1 2 1
2
2 2
1
1 1
2 / 2 1
) 1 ( ) 1 (

) 1 ( ) 1 (

n
p p
n
p p
Z p p p p
n
p p
n
p p
Z p p

+





















Inferncias Estatsticas Prof. Marcos Moreira

11
3.3 Anlise de Varincia



Supondo que um engenheiro deseja saber se existe ou no influncia de dois fatores
(por exemplo, temperatura e concentrao) de um processo de produo de um determinado
lquido sobre um caracterstico de qualidade desse produto lquido, por exemplo, a sua
viscosidade. Ele planeja os seguintes experimentos:


T
1
=30
o
C T
2
=40
o
C T
3
=50
o
C
A
11
A
12
A
13
C
1
=5%
A
11r
A
12r
A
13r
A
21
A
22
A
23
C
2
=10%
A
21r
A
22r
A
23r

E obtm os seguintes resultados:

Viscosidades do produto final (cP) em funo da temperatura e da concentrao utilizadas.
T
1
=30
o
C T
2
=40
o
C T
3
=50
o
C
1,16 0,91 0,88 C
1
=5%
1,09 0,84 0,83
0,98 0,78 0,69 C
2
=10%
0,99 0,71 0,60

Depois o engenheiro calcula a soma dos quadrados da seguinte maneira:

ijr ij ij
A A B + =

nC nT nR
B
nC nR
B
SQ
nT
j
nC
i
ij
nT
j
nC
i
ij
T
. .
) (
.
) (
2
1 1
1
2
1

=


= =
= =


nC nT nR
B
nT nR
B
SQ
nT
j
nC
i
ij
nC
i
nT
j
ij
C
. .
) (
.
) (
2
1 1 1
2
1

=

= = = =



C T Tratl TxC
SQ SQ SQ SQ =

nC nT nR
B
nR
B
SQ
nT
j
nC
i
ij
nC
i
nT
j
ij
Trat
. .
) (
) (
2
1 1
1 1
2

= =
= =


Trat Total sduo
SQ SQ SQ =
Re

Inferncias Estatsticas Prof. Marcos Moreira

12

nC nT nR
B
A A SQ
nT
j
nC
i
ij
nT
j
nC
i
ijr ij Total
. .
) (
) (
2
1 1
1 1
2 2

+ =

= =
= =



Sabendo que:

- o nmero de rplicas utilizadas (nR) igual a 2
- o nmero de nveis de temperatura testados (nT) igual a 3
- o nmero de nveis de concentrao testados (nC) igual a 2
- os graus de liberdade para a temperatura so iguais a nT-1
- os graus de liberdade para a concentrao so iguais a nC-1
- os graus de liberdade para a interao temperatura-concentrao so iguais a nT x nC
- os graus de liberdade para o tratamento so iguais a (nT-1) +(nC-1) +(nT-1) x (nC-1)
- os graus de liberdade totais so iguais a nT x nC x nR
- os graus de liberdade do resduo so iguais diferena entre os graus de liberdade total e os
graus de liberdade do tratamento
- o quadrado mdio (QM) igual a SQ/g.l., e que
- F igual a QM/QM
resduo


O engenheiro monta a seguinte tabela (Quadro de Anova)


g.l. SQ QM F
Temperatura 2 0,2088 0,1044 49,34
Concentrao 1 0,0768 0,0768 36,28
T x C 2 0,0038 0,0019 0,89
Tratamento 5 0,2895 0,0579
Resduo 6 0,0127 0,0021
Total 11 0,3022 0,0275

A fim de saber se a temperatura, a concentrao e a interao temperatura-
concentrao influenciam ou no a viscosidade do lquido, o engenheiro vai a uma tabela
com os valores da estatstica F de Fisher e com os graus de liberdade do tratamento, do
resduo e com o nvel de significncia adotado, ele obtm o valor de F tabelado.
Supondo que o engenheiro seja rigoroso e adote um nvel de significncia muito
baixo, por exemplo, 1%, o valor de F
1%, 5, 6
de 8,75. Comparando esse valor com os valores
da tabela imediatamente acima, verificamos que so influentes a temperatura e a
concentrao sobre a viscosidade do lquido a um nvel de significncia de 1%, pois seus
valores de F so maiores que o tabelado. J a interao temperatura-concentrao no se
mostra influente sobre a viscosidade do produto a um nvel de significncia de 1%.







Inferncias Estatsticas Prof. Marcos Moreira

13
BIBLIOGRAFIA


Campos, V. F. TQC Controle da Qualidade Total (no estilo japons), Belo Horizonte,
Editora de Desenvolvimento Geral (EDG), 230p., 1999.


Costa, A.F.B.; Epprecht, E.K.; Carpinetti, L.C.R. Controle Estatstico de Qualidade, So
Paulo, Editora Atlas, 334p., 2004.


Montgomery, D.C. Introduo ao Controle Estatstico de Qualidade, Rio de J aneiro, LTC
Editora, 513p., 2004.

You might also like