Professional Documents
Culture Documents
Inferncia Estatstica
Definida a v.a. X, representativa do resultado de uma experincia aleatria, qual se associa um modelo terico de distribuio de probabilidades e cujos valores dos parmetros que o caracterizam so conhecidos, calculamse as probabilidades de ocorrncia de acontecimentos definidos sobre a v.a..
A partir do estudo de observaes concretas de um dado fenmeno aleatrio, conclui-se (infere-se) que este poder ser descrito por um dado modelo de distribuio de probabilidades. Os valores dos parmetros que caracterizam este so desconhecidos e so inferidos (i.e., deduzidos) atravs das observaes feitas, possibilitando a estimao de probabilidades de ocorrncia de acontecimentos definidos sobre o fenmeno aleatrio em estudo.
Exemplo. Suponha que, num lote numeroso de bales, existe uma dada proporo de bales estampados com a cara do Pateta. Recolhem-se, ao acaso e com reposio, n bales. Se for conhecido, por exemplo = 0.35 , pode calcular-se a probabilidade de, no grupo de n bales, encontraremse x bales com a cara do Pateta: n C x 0.35 x 0.65 n x Neste pressuposto, est-se perante um problema de Teoria da Probabilidade.
nota: v.a. X n de bales com a cara do Pateta, em n bales, x = 0, ..., n
X ~ B( n ; 0.35) , em que
Se for desconhecido (o que, na prtica, comum), interessar usar a informao contida na amostra recolhida para retirar concluses sobre a populao, ou seja, neste caso, a proporo de bales, na amostra, com a cara do Pateta, x , n (em que x = n de bales com a cara do Pateta na amostra de dimenso n, i.e, em n bales) ser utilizada para tirar concluses sobre a proporo de bales com a cara do Pateta, , no lote de bales de onde foi extrada a amostra, supondo que a populao (n de bales com a cara do Pateta no lote de bales) seguir uma distribuio de probabilidades binomial. Neste pressuposto, est-se perante um problema de Inferncia Estatstica.
Principal objectivo da Inferncia Estatstica: Ao analisar e reduzir toda a informao contida na amostra (conjunto de dados concretos), estender (utilizando tcnicas estatsticas convenientes) populao de onde aquela foi extrada, as concluses obtidas, formulando proposies gerais que levem especificao de um modelo (ou famlia de modelos) que descreva o fenmeno aleatrio em estudo (a Populao).
POPULAO
ESTATSTICA DESCRITIVA:
Anlise do conjunto de dados e sua reduo de forma a evidenciar as caractersticas mais importantes do seu comportamento
Formulao de suposies acerca da populao, a partir das concluses obtidas no estudo da amostra INFERNCIA ESTATSTICA:
Relativamente ao Exemplo anterior, poderia ter-se interesse em: (1) estimar, a partir da amostra observada, o verdadeiro valor do parmetro Estimao pontual, i.e., adivinhar o verdadeiro valor da proporo, , de bales com a cara do Pateta no lote de bales; (2) construir, a partir da amostra observada, um intervalo de nos reais que contenha o verdadeiro valor (desconhecido) do parmetro com uma confiana aceitvel construo de um Intervalo de Confiana para , i.e., um intervalo real que, com um dado grau de confiana, contm o verdadeiro valor da proporo, , de bales com a cara do Pateta no lote de bales; (3) propor uma hiptese para o valor do parmetro e verificar se a amostra observada sustenta essa suposio Teste de Hiptese para , i.e., supor, por exemplo, que a proporo de bales com a cara do Pateta no lote de bales, , inferior a 0.35 ( < 0.35).
Para realizar inferncias necessrio no esquecer que a amostra observada , apenas, um dos muitos conjuntos de dados possveis de se obter quando se efectua, em condies semelhantes, a experincia aleatria. Sejam k amostras de dimenso n, recolhidas da populao X :
POPULAO X
x11
x21
.........
as amostras observadas, (x11 , x12 , x13 , .... , x1n ) , (x21 , x22 , x23 , .... , x2n ) , ... , (xk1 , xk2 , xk3 , .... , xkn ) so realizaes da varivel aleatria (X1 , X2 , X3 , .... , Xn ) , designada Amostra Aleatria de dimenso n, onde cada uma das vsas representa o valor que possvel observar na posio respectiva nas amostras recolhidas, i.e., v.a. X1 valor observado do 1 elemento recolhido nas diversas amostras v.a. X2 valor observado do 2 elemento recolhido nas diversas amostras ......... v.a. Xi valor observado do i-simo elemento recolhido nas diversas amostras, i = 1, 2, 3, ..., n , denominada i-sima varivel aleatria observada. nota: cada uma das vsas observadas assume os mesmos valores que a v.a. X (populao) pode tomar.
Exemplo. Estudo da proporo de bales com a cara do Pateta existente num saco de 20 bales. Um lote numeroso de bales diversos foi transformado em sacos de 20 bales cada. Recolheram-se, aleatoriamente, 4 sacos do lote (n = 4) , tendo este procedimento sido repetido trs vezes (k = 3), com reposio dos sacos retirados de cada vez. Obtiveram-se os resultados seguintes quanto ao n de bales com a cara do Pateta em cada saco:
POPULAO X : n de bales com a cara do Pateta num saco de 20 bales, x = 0, 1, ..., 20
v.a. Xi n de bales com a cara do Pateta no i-simo saco de 20 bales recolhido, nas diferentes amostras , xi = 0, 1, ..., 20 i = 1, 2, 3, 4 Amostra Aleatria de dimenso n = 4 : (X1 , X2 , X3 , X4 ) Os valores assumidos pela v.a. (X1 , X2 , X3 , X4 ) so todas as amostras concretas de tamanho 4 possveis de recolher da populao, i.e., a quantidade de bales com a cara do Pateta que existe em cada um dos 4 sacos de 20 bales recolhidos, aleatoriamente e com reposio, do lote de sacos de bales e que constituem cada uma das amostras: (5 , 8 , 7 , 8) , (7 , 7 , 4 , 8) , (8 , 9 , 5 , 6) , ......
Dos vrios processos de amostragem (mtodos de selecco de amostras aleatrias), estudar-se-, apenas, a Amostragem Casual. Definio. Amostragem Casual Quando as n variveis aleatrias observadas, Xi (i = 1, 2, ..., n), componentes da varivel aleatria (X1, X2, X3, ..., Xn), so independentes e identicamente distribudas (i.i.d.) diz-se que se trata de amostragem casual, sendo a v.a. (X1, X2, X3, ..., Xn) designada por amostra casual. notas: (1) vsas Xi (i = 1, 2, ..., n) identicamente distribudas pretende-se que as vsas observadas sejam rplicas da v.a. X que representa a populao em estudo; (2) vsas Xi (i = 1, 2, ..., n) independentes os valores que cada v.a. observada assume no esto dependentes dos valores assumidos por qualquer outra v.a. observada.
Muitos problemas de inferncia estatstica consistem em adivinhar os valores dos parmetros da distribuio de probabilidades associada populao (inferncia paramtrica), ou seja, a forma da funo de distribuio, F(x|1, 2, ... , m), subjacente populao X , ou supe-se, conhecida e, apenas, so desconhecidos os verdadeiros valores dos parmetros, 1, 2, ... , m, que caracterizam a distribuio de probabilidades, aos quais se tenta chegar aplicando mtodos de estimao paramtrica. As inferncias que se pretendem realizar sobre os parmetros desconhecidos, 1, 2, ... , m, i.e, os procedimentos utilizados para chegar aos verdadeiros valores dos parmetros, podero ter como base determinadas caractersticas numricas (mdia, varincia, quantis, ....) que so possveis de calcular a partir da amostra aleatria (X1 , X2 , X3 , .... , Xn ).
Definio. Estatstica Uma Estatstica uma varivel aleatria T = T(X1, X2, ..., Xn), funo da amostra aleatria (X1, X2, ..., Xn), que no envolve parmetros desconhecidos. notas: (1) T = T(X1, X2, ..., Xn) envolve, apenas, as vsas observadas ou as vsas observadas e parmetros conhecidos; (2) em muitas situaes, no necessrio, ao analisar uma amostra, considerar pormenorizadamente as observaes, podendo procederse a uma reduo destas atravs do clculo de medidas descritivas (mdia, mediana, varincia, ....) que so funes das observaes. As Estatsticas operam essa reduo, passando de uma v.a. multidimensional, (X1, ..., Xn), a uma v.a. unidimensional, T = T(X1, ..., Xn), cujo tratamento estatstico mais simples.
Exemplos. 1. Seja a amostra casual (X1, X2, ..., Xn) de uma populao de Bernoulli. v.a. Xi n de sucessos observado no i-simo elemento recolhido nas diferentes amostras , xi = 0, 1 Xi ~ B(1; ) , i = 1, 2, 3, ..., n ; 0 < < 1
( = proporo desconhecida de sucessos na populao)
Xi
T2 =
i =1
Xi
n
2. Seja (X1, X2, ..., Xn) uma amostra casual de uma populao de Poisson. v.a. Xi n de acontecimentos observado, por unidade de medida, no isimo elemento das diferentes amostras recolhidas , xi = 0,1,2, ...
(Exemplo: v.a. Xi n de chamadas que caem, por hora, no i-simo telefone xi = 0, 1, 2, ...) Xi ~ Po() , i = 1, 2, 3, ..., n ; > 0 ( = E(X) mdia desconhecida da populao)
As estatsticas seguintes, do
T1 =
i =1 n
Xi
, o n total de eventos observado, por unidade de medida, nos n elementos que constituem a amostra;
(Exemplo: n total de chamadas que caem, por hora, nos n telefones)
T2 =
, o n mdio de eventos, por unidade de medida, por n elemento da amostra. (Exemplo: n mdio de chamadas que caem, por hora, em cada telefone)
i =1
Xi
3. Considere a amostra casual (X1, X2, ..., Xn) de uma populao Normal . v.a. Xi valor observado do i-simo elemento recolhido nas diferentes amostras Xi ~ N( ; ) , i = 1, 2, 3, ..., n ; IR , IR+
( = E(X) mdia desconhecida da populao
So estatsticas:
i =1
Xi
, X=
i =1
Xi
n
n
, X i2
i =1 2
No so estatsticas, as funes:
i =1
(X i )
Xi
i =1
X i2 2
i =1
nota: Clculo de medidas descritivas Seja (X1, X2, ..., Xn) uma amostra casual, de dimenso n, de populao X e considere uma amostra concreta daquela (1) (x1, x2, ..., xn) (dados discretos ou contnuos):
1 n mdia da amostra: x = xi n i =1 1 n 1 n 2 2 varincia da amostra: s = ( x i x ) = xi x 2 n i =1 n i =1 (grande amostra: n 30)
2
xi x1 x2 ... xk
Fi F1 F2 ... Fk Fi = n
fi = Fi /n f1 f2 ... fk fi = 1
nota: Fi - frequncia absoluta de ocorrncia de xi fi - frequncia relativa de ocorrncia de xi
mdia da amostra: k 1 k x = x i Fi = xi f i n i =1 i =1
k 1 k 2 2 varincia da amostra: s = xi Fi x = xi 2 f i x 2 n i =1 i =1 2
Fi F1 F2 ... Fk Fi = n
fi = Fi /n f1 f2 ... fk fi = 1
varincia da amostra:
s2 = 1 2 2 xi Fi x 2 = xi f i x 2 n i =1 i =1
k k
nota: xi ponto mdio da classe [ xi , xi+1[ + Fi - frequncia absoluta de ocorrncia de valores dentro da classe [ xi , xi+1[ + fi - frequncia relativa de ocorrncia de valores dentro da classe [ xi , xi+1[ +
ESTIMAO PARAMTRICA Procedimentos que utilizam a informao contida na amostra para adivinhar os verdadeiros valores dos parmetros, desconhecidos, da distribuio de probabilidades, F(x|1, 2 ,..., m), associada populao X, da qual se obteve a amostra casual (X1, X2, ..., Xn), i.e, mtodos que permitem sugerir valores numricos que possam ser usados como representaes aproximadas dos parmetros. A procura destes valores envolve dois aspectos fundamentais: Preciso e Confiana , ou seja, procuram-se respostas que se encontrem o mais prximo possvel dos verdadeiros valores dos parmetros (preciso), mas, em certas situaes, a confiana que se consegue atribuir resposta encontrada mais importante do que a preciso.
Estimao por Pontos: privilegia a preciso dos valores propostos para os parmetros Estimao Paramtrica
Estimao por Intervalos: privilegia a confiana que se pode atribuir aos valores propostos para os parmetros
=a,
tem-se uma resposta tanto mais precisa, quanto mais aproximado se encontrar o valor obtido, a, do verdadeiro valor do parmetro; ora, considerando, no um valor concreto para , mas um intervalo de nmeros reais no qual h uma elevada possibilidade de o verdadeiro valor do parmetro estar contido : ( a1 , a2 ) , a preciso diminui, mas, em contrapartida, possvel atribuir uma dada confiana ao intervalo proposto. Para uma amostra de dimenso fixa, quanto mais precisa for a resposta obtida, menor a confiana que nela se pode ter.
Estimao por Pontos Considere-se a amostra casual (X1, X2, ..., Xn) de uma populao X com f.d.p. (f.p.) f (x| ), onde um parmetro real desconhecido . Estimador uma Estatstica; denota-se por T = T(X1, X2, ..., Xn) e a v.a. que assumir um valor que se supe representativo do parmetro desconhecido, valor esse designado por estimativa; Estimativa o valor real concreto assumido pelo estimador T = T(X1, X2, ..., Xn) para uma dada amostra particular (x1, x2, ..., xn ) e representa-se por t = T (x1, x2, ..., xn ).
Um Estimador assume, para cada amostra possvel de obter da populao, uma estimativa, gerando-se, assim, um conjunto de estimativas (valores reais concretos possveis para o parmetro ), i.e, Um Estimador uma v.a., cujo conjunto de valores que assume formado pelas estimativas e h tantas estimativas quantas as amostras concretas possveis de recolher da populao. v.a. T = T(X1, X2, ..., Xn) estatstica que gera um valor real representativo do verdadeiro valor do parmetro desconhecido T = { t IR : t = t1, t2, t3, ... }, onde ti = T(xi1, xi2, ..., xin), i = 1,2,3, ... , em que (x11, x12, ..., x1n) , (x21, x22, ..., x2n) , (x31, x32, ..., x3n) , ..., so todas as amostras concretas possveis de obter da populao.
Exemplo. Considere-se (X1, X2, ..., Xn) uma amostra casual de uma populao, X, de Poisson, i.e., X ~ Po(), com desconhecido. Suponha que daquela populao foram recolhidas as seguintes amostras de dimenso n = 5: (x11, x12, x13 , x14, x15) = (11, 8, 10, 9, 7) (x21, x22, x23 , x24, x25) = (6, 7, 13, 8, 8) (1) Intituivamente, uma vez que E(X) = , um estimador possvel para ser a mdia amostral, 1 n T1 = T1 ( X1 , X 2 ,K , X n ) = X i = X . n i =1 Estimativas para : 1 5 45 t11 = T1 ( x11 , x12 , x13 , x14 , x15 ) = x1 = x1i = = 9 5 i =1 5
1 5 42 t12 = T1 ( x21 , x22 , x23 , x24 , x25 ) = x2 = x2i = = 8.4 5 i =1 5
(2) Como Var(X) = , pode considerar-se, tambm, para estimador de , a varincia amostral corrigida,
1 n 1 n 2 n 2 T2 = T2 ( X1 , X 2 ,K , X n ) = (Xi X ) = Xi X 2 = S2 n 1 i =1 n 1 i =1 n1
( )
( )
(3) no entanto, pode tomar-se para estimador de estatstica, como, por exemplo,
T3 ( X1 , X 2 ,K , X n ) = 1
qualquer outra
n2 i =1
X i2
t 31 = t 32 =
1 5 5 1
25
25
ou T4(X1, X2, ..., Xn) = [min(Xi) + max (Xi)] / 2 , i = 1, 2, ..., n t41 = [min(x1i) + max (x1i)] / 2 = (7+11) / 2 = 9 + t42 = [min(x2i) + max (x2i)] / 2 = (6+13) / 2 = 9.5 +
Para cada parmetro a estimar, existe uma infinidade de estimadores possveis. Estes podem ser obtidos por aplicao de um qualquer Mtodo de estimao pontual, sendo os mais usuais o Mtodo dos Momentos (M.M.) e o Mtodo de Mxima Verosimilhana (M.M.V.) De notar que a qualidade de um estimador no deve ser avaliada atravs de uma estimativa isolada que origina, uma vez que esta poder situar-se muito prxima ou muito afastada do verdadeiro valor do parmetro desconhecido (caracterizador da distribuio de probabilidades da populao), mas sim atravs do comportamento probabilstico do conjunto de estimativas que gera; independentemente do mtodo de estimao pontual aplicado, interessa, sobretudo, a obteno de estimadores recomendveis para o parmetro desconhecido, ou seja, de estimadores que verifiquem certas propriedades desejveis.
Mtodo dos Momentos (M.M.) (Karl Pearson sc. XIX / XX) Considere-se uma amostra casual (X1, X2, ..., Xn) de uma populao X com f.d.p. (f.p.) f (x|1, 2, ..., k ) , dependente de k parmetros desconhecidos. Ideia fundamental subjacente a este mtodo: n r Utilizao dos momentos ordinrios da amostra aleatria casual, X i n ,
r = 1, 2 , 3 , ... , para estimar os correspondentes momentos ordinrios
i =1
populacionais, r = E X r , r = 1, 2 , 3 , ... . O clculo dos estimadores para os parmetros desconhecidos, 1 , 2 , ... , k , que caracterizam a distribuio de probabilidades da v.a. X, feito igualando os primeiros k momentos ordinrios populacionais aos momentos ordinrios amostrais respectivos, r =
i =1
( )
X ir n , r = 1 , 2 ,K , k ,
Estimador(es) obtido(s) atravs do M.M. do(s) parmetro(s) das populaes seguintes, das quais foi recolhida uma amostra casual de dimenso n, (X1, X2, ..., Xn): 1. Populao de Bernoulli de parmetro X ~ B(1; ) , 0 < < 1 ; E(X) = e Var(X) = .(1 ) 1 n ~ Estimador para o parmetro obtido pelo M.M.: = X = X i , n i =1 igualmente, estimador para a mdia populacional, uma vez que E(X) = . 2. Populao de Poisson de parmetro X ~ Po( ) , > 0 ; E(X) = e Var(X) = ~ Estimador do parmetro obtido pelo M.M.: = X , estimador, tambm, das mdia e varincia populacionais, uma vez que E(X) = Var(X) = .
3. Populao Normal de parmetros e X ~ N( , ) , IR , IR+ ; E(X) = e Var(X) = 2 Estimadores para e 2 obtidos atravs do M.M.:
~ = X a mdia amostral o estimador para a mdia populacional
Mtodo de Mxima Verosimilhana (M.M.V.) (R. A. Fisher sc. XIX / XX) mais complexo que o M.M., fornecendo, em geral, para os parmetros desconhecidos caracterizadores da distribuio de probabilidades da v.a. em estudo, estimadores de melhor qualidade, embora, em muitos casos, ambos os mtodos originem os mesmos estimadores. Definio. Funo de Verosimilhana Se (X1, X2, ..., Xn) uma amostra casual de uma populao com f.d.p (f.p.) f (x| ), a expresso
f ( x1 , x2 ,K , xn | ) = f ( xi | ) , ( x1 , x 2 ,K, x n ) IR n
i =1 n
a f.d.p. (f.p.) conjunta das variveis que constituem a amostra, i.e., designa, para um dado , a densidade (probabilidade) associada amostra particular (x1, x2, ..., xn ).
Observada a amostra concreta (x1, x2, ..., xn), a expresso anterior interpretada como funo do parmetro designada Funo de Verosimilhana e representa-se por
L( | x1 , x2 ,K, xn ) = L( ) = f ( x i | ) ,
n
em que , denominado espao-parmetro, o conjunto de valores que pode assumir. Ideia fundamental subjacente a este mtodo: Deve procurar-se para estimativa do parmetro , no conjunto de valores que pode assumir, o valor que mais credvel (verosmil), ou seja, aquele que faz com que a amostra observada (x1, x2, ... , xn) tenha a probabilidade mais elevada de ocorrncia (determinao do mximo absoluto de L( | x1, ... , xn )) (nota: tomando, como estimativa para , outro qualquer valor pertencente a , que no o que torna mxima L(), a probabilidade de ocorrer a amostra efectivamente observada menor.)
i =1
Estimador(es) de M.V. do(s) parmetro(s) das populaes seguintes, das quais foi recolhida uma amostra casual de dimenso n, (X1, X2, ..., Xn): 1. Populao de Bernoulli de parmetro X ~ B(1; ) ; f.p.: f ( x | ) =
x
(1 )1 x , x = 0 ,1
n i =1
; 0< <1
Xi
n
=X ,
sendo, tambm, estimador da mdia populacional, uma vez que E(X) = (coincidente com o estimador obtido pelo M.M. pg. 31)
x
x!
, x = 0 ,1 , 2 ,K ; > 0
i =1
Xi
n =X
A mdia amostral, X , , igualmente, estimador das mdia e varincia populacionais, uma vez que E(X) = Var(X) = . (coincidente com o estimador obtido pelo M.M. pg. 31)
, x IR , IR , IR +
= i =1
Xi
n =X e 2 =
i =1
( X i )2 n = S2
X 1 X
Propriedade da Invarincia. Se h( ) uma funo do parmetro e estimador de M.V. para , ento h( ) estimador de M.V. para h( ). Exemplos. 1. Seja (X1, X2, ..., Xn) uma amostra casual de uma populao X de Bernoulli. Determine o estimador de M.V. da varincia de X. X ~ B(1; ) ; f ( x | ) = x (1 )1 x , x = 0, 1 ; 0 < < 1
V ( X ) = (1 )
Pela propriedade da invarincia: V ( X ) = 1 = X (1 X )
2. Seja (X1, X2, ..., Xn) uma amostra casual de uma populao X com f.d.p. Normal. Determine o estimador de M.V. do quantil de ordem (0<<1) . < X ~ N( , )
f(x|,)
q = ?
P( X q ) = ; q = ?
Estimadores de M.V. para os parmetros e : = X e = S (pg. 37)
X ~ N( , ) Z =
~ N(0, 1)
(z)
X P = P( X + ) = 1 24 4 3 Quantil de ordem de X ~ N( , ): q = +
Definio. Estimador Centrado Um estimador T = T(X1, X2, ..., Xn) para o parmetro , existindo E(T), diz-se centrado ou no enviesado quando E(T ) = , , i.e., o valor esperado do estimador deve ser igual ao verdadeiro valor do parmetro a estimar, qualquer que seja pertencente ao espaoparmetro. Um estimador diz-se enviesado se E(T ) , com enviesamento Env(T ) = E(T ) . Se lim E(T ) = , , o estimador T = T(X1, X2, ..., Xn) diz-se assinton + ticamente centrado.
Interpretao da propriedade enunciada: Independentemente da dimenso da amostra, um bom estimador deve, em mdia, originar estimativas iguais ao verdadeiro valor do parmetro. Utilizando um estimador centrado, existe um equilbrio entre os casos de sobrestimao (valor das estimativas, obtidas a partir do estimador definido, superior ao verdadeiro valor do parmetro) e os casos de subestimao (valor das estimativas, obtidas a partir do estimador definido, inferior ao verdadeiro valor do parmetro), de forma a que usado, repetidamente, o estimador tende a fornecer, em mdia, o verdadeiro valor do parmetro, i.e., pela teoria frequencista de probabilidade, ao fim da recolha de um grande n de amostras, a mdia aritmtica das estimativas obtidas estar, certamente, muito prxima do verdadeiro valor do parmetro (valor esperado do estimador).
Exemplo. Considere uma qualquer populao X com f.d.p. (f.p.) f (x), para a qual existem os momentos ordinrios at, pelo menos, 2 ordem, e seja (X1, X2, ..., Xn) uma amostra casual dessa populao com E(X) = e Var(X) = 2 desconhecidas. Nestas condies: 1) a mdia amostral, X , estimador centrado para a mdia da populao, :
1 n 1 n 1 E( X ) = E X i = E( X i ) = n = n n i =1 n i =1
) =
n 1 n 2 1 1 n 1 2 2 = E X i 2 X X i + n X = E X i X 2 = n n i =1 n n i =1 i =1 123 4 4 X 1 n = E X i2 E X 2 n i =1
( ) ( )
( )
( )
E S2
( )
E( 6444 X i2 ) 44 644 72 ) 44 E( 74 8 4X 4 8 1 n = Var( X i ) + (E( X i ))2 Var( X ) + (E( X ))2 = n i =1 1 n 2 X = + 2 Var(4 ) + 2 = 4 n i =1 123 1 n 1 1 n 2 1 2 2 2 = n + n Var X i = 2 Var( X i ) = n n n n i= 141 244 4 3 14 2=1 4 4 i4 3 2 1 2 2 2 2 = 2 n E S = 2 n n4 3 1 24 2 Var ( X ) = S 2 estimador enviesado para 2 : n 2 2 2 2 2 2 2 Env S = E S = = n n
( )
( ) ( )
( )
Para amostras de qualquer dimenso, a varincia amostral corrigida, S 2 , estimador centrado para a varincia da populao, 2 :
1 n ( X i X )2 = E( S ) = E n1 i =1
2
1 n 2 n 1 n n = E 2 X Xi + X2 Xi n1 n i =1 n1 n 1 i =1 123 4 4 X
E S
( )
2
1 n n 2 = E Xi n 1E X 2 = n 1 i =1
2 2 1 n n (3 X ) = Var( X i ) + E(23 n 1 Var(4 ) + E2 ) = 1 2X 1 X 4 3 1 24 1 i 4 3 n 1 i =1 2 2 n
(pg. 46)
( )
( )
n n 1 n 2 + 2 2 2 n1 n1 n1 n1
E S 2 = 2
( )
n S 2 = ( n 1) S 2
Limitao do conceito de Estimador Centrado: No permite a distino entre estimadores que produzem um conjunto de estimativas mais concentradas em torno do verdadeiro valor do parmetro a estimar (i.e., do valor mdio do estimador centrado), de outros estimadores, que originam conjuntos de estimativas, cuja disperso, volta do valor esperado do estimador, superior. Um estimador centrado que produza estimativas mais condensadas volta do valor exacto do parmetro, i.e, com varincia menor, ser um estimador melhor. Utilizao da Varincia para comparar estimadores centrados: procura-se, dentro da classe dos estimadores centrados, aquele que tem varincia mnima.
Definio. Eficincia (relativa) Sejam T1 = T1(X1, X2, ..., Xn) e T2 = T2(X1, X2, ..., Xn) dois estimadores centrados para o parmetro : E(T1 ) = E(T2 ) = . O estimador T1 mais eficiente do que o estimador T2 quando
Var(T1 ) Var(T2 ) , .
se verifica, qualquer que seja outro estimador T = T(X1, X2, ..., Xn) centrado para .
notas: (1) O conceito de eficincia exige a existncia dos momentos ordinrios at, pelo menos, 2 ordem; (2) Na maior parte das situaes, possvel determinar a eficincia relativa entre dois estimadores centrados, no entanto, a determinao do estimador mais eficiente (eficincia absoluta), pela definio dada, mais difcil, uma vez que ser impossvel listar todos os estimadores centrados possveis para o parmetro, de modo a aplicar o conceito de eficincia relativa a cada par de estimadores. Esta questo pode ser resolvida pela aplicao da Desigualdade de Frchet-Cramer-Rao.
Exemplo. A partir da amostra casual (X1, X2, X3) de uma populao X com distribuio exponencial, foram propostos para estimadores para a mdia de X, as estatsticas seguintes
T1 = X 1 ; T2 = X1 + 2 X 2 3 ; T3 = X .
a) Verifique que os trs estimadores propostos so estimadores centrados para a mdia populacional. b) Determine a eficincia relativa entre os trs estimadores. Populao: X ~ Ex( ) , E(X) = 1/ = e Var(X) = 1/ 2 Amostra casual (X1, X2, X3) : Xi ~ Ex( ) , E(Xi) = 1/ = e Var(Xi) = 1/ 2 , i = 1, 2, 3
a) E(T1 ) = E( X 1 ) =
1 1 1 1 X + 2 X2 1 E(T2 ) = E 1 = (E( X 1 ) + 2 E( X 2 )) = + 2 = = 3 3 3
1 3 1 3 1 1 E(T3 ) = E( X ) = E X i = E( X i ) = 3 = 3 3 i = 1 3 i =1
b) Var(T1 ) = Var( X 1 ) =
1 1 1 5 0.5556 = 2 +4 2= 9 9 2 2
1 3 1 3 1 1 0.3333 Var(T3 ) = Var( X ) = Var X i = Var ( X i ) = 3 2 3 9 2 i =1 9 i =1
Var(T3 ) < Var(T2 ) < Var(T1 ) de entre os 3 estimadores centrados analisados, T3 mais eficiente.
O conceito de eficincia de um estimador est associado noo de estimador centrado. Existem critrios de mbito mais geral que permitem a avaliao de estimadores enviesados. Um desses critrios a Consistncia de um estimador. Definio. Estimador Consistente (ou simplesmente consistente) Um estimador Tn = T(X1, X2, ..., Xn) para o parmetro diz-se (simplesmente) consistente se e s se, qualquer que seja o n real > 0,
n +
nota: Se a amostra for de grande dimenso (n + e o valor de muito +) pequeno, quase certo que o estimador Tn assumir valores (estimativas) dentro do intervalo ] , + [. Tendo este uma amplitude, 2, muito pequena, esses valores estaro muito prximos de , verdadeiro valor do parmetro. Assim, entende-se por estimador consistente, aquele cuja preciso aumenta com o crescimento da dimenso da amostra, tal que, no limite, a preciso total, i.e., o estimador Tn assumir valores coincidentes com o verdadeiro valor do parmetro, . Em geral, existem, para um parmetro, muitos estimadores consistentes, o que leva a que esta propriedade no seja muito selectiva. O conceito de consistncia utilizado na negativa: No deve ser utilizado um estimador que no consistente.
Como a aplicao directa da definio de estimador consistente poder ser difcil, o teorema seguinte permite verificar, de forma mais simples, a consistncia de um estimador. Teorema. Considere-se o estimador Tn = T(X1, X2, ..., Xn) para o parmetro . As condies
n +
n +
lim Var(Tn ) = 0
Teorema. Se (X1, X2, ..., Xn) uma amostra casual da populao X, para a qual existem mdia, = E(X), e varincia, 2 = Var(X), tem-se
E( X ) = e Var( X ) =
notas:
2
n
(1) X estimador centrado para , i.e., E( X ) = (pg. 44); (2) quanto maior for a dimenso da amostra (n + menor a +), varincia, i.e, maior a concentrao dos valores observveis de X volta de : lim Var( X ) = 0
n +
Exemplos. 1. Considere a populao X ~ N(,), em que e so desconhecidos. 1 n Se (X1, X2, ..., Xn) uma amostra casual de X, mostre que Tn = X i = X n i =1 um estimador consistente para .
E(Tn ) = e
n +
2
n
n +
=0.
f (tn|,)
n = 100
n = 50
2. O nmero de veculos que passam, entre as 7:30 e as 8:30 horas, num determinado cruzamento, segue uma distribuio de Poisson. A amostra casual seguinte formada pelas observaes efectuadas em 9 dias distintos: (90 ; 102 ; 84 ; 75 ; 109 ; 94 ; 97 ; 91 ; 68) . a) Determine o estimador e a estimativa de mxima verosimilhana para o tempo mdio de espera pela passagem de um veculo no cruzamento entre as 7:30 e as 8:30 horas, sabendo que o estimador de M.V. para o n mdio de veculos que passam no cruzamento, naquele horrio, a mdia amostral. b) Seja a amostra casual (Y1, Y2, ...., Yn) da populao Y representativa do tempo de espera, em horas, pela passagem de um veculo no cruzamento. Verifique a consistncia de Y = Y , estimador para o valor esperado de Y .
c) Calcule a estimativa de mxima verosimilhana para a probabilidade de no decorrerem mais de dois minutos sem passar qualquer veculo, no cruzamento, naquele horrio. a) Populao X nmero de veculos que passam no cruzamento, entre as 7:30 e as 8:30 horas, x = 0, 1, 2, ... X ~ Po( ) ; E(X) = ; Var(X) = Amostra casual (X1, X2, ..., Xn) : vs as Xi ~ Po() , i = 1, 2, ..., n, i.i.d
Estimador de M.V. para : = X Estimativa de M.V. para com n = 9 : = x =
i =1
xi
9
810 = 90 9
v.a. Y tempo de espera pela passagem de um veculo no cruzamento, em horas , y > 0 (nota: entre as 7:30 e as 8:30 horas = 1 hora) Y ~ Ex( ) ; E(Y) = 1/ ; Var(Y) =1/2
1 1 Estimador de M.V. para E(Y) : E(Y ) = = (pela propriedade da invarincia) X
Estimativa de M.V. para E(Y): E(Y ) = 1 horas = 40 segundos 90 b) v.a. Y tempo de espera pela passagem de um veculo no cruzamento, em horas , y > 0 Y ~ Ex( ) ; E(Y) = Y = 1/ ; Var(Y) =1/2
Estimador para Y : Y = Y
n 2
= lim
1
2
n + n
=0
E(Y ) =
1 P Y = 1 e 30
30
= 1 e
90 30
= 0.9502
Probabilidade de, pelo menos, 1 veculo passar no cruzamento em 2 minutos: P(W 1) = 1 P(W = 0) = 1 0.0498 = 0.9502