WWW - Isa.utl - PT DM Estat Estat Seb3

3.
A ` INFERENCIA INTRODUC AO ESTATISTICA
No c oes preliminares sobre estima c ao
Pode dizer-se que as probabilidades e a estat stica t em objectivos diferentes: enquanto nas probabilidades se parte de um dado esquema ou modelo para calcular pr obabilidades de certos resultados ou acontecimentos, na estat stica parte-se de dados ou observa co es e procura saber-se algo sobre o modelo (Tiago de Oliveira (1990) e Murteira (1990)). a infer E encia estat stica que tem como objectivo a constru c ao e desenvolvimento de m etodos que permitem a extens ao do particular para o geral (chamada infer encia indutiva), i.e., a partir de um conjunto de dados e poss vel fazer infer encias ou generaliza co es acerca de uma popula c ao da qual os dados foram extra dos. A infer encia estat stica e ent ao um m etodo cient co de tirar conclus oes sobre os par ametros da popula c ao a partir da recolha, tratamento e an alise dos dados de uma amostra, recolhida dessa popula c ao. O conjunto completo de todas as observa c oes poss veis constitui a popula ca o, enquanto o conjunto dos valores efectivamente observados constitui a amostra. Chama-se popula ca o de amostras ao conjunto de todas as amostras observ aveis. Atenda-se a que par ametro de uma popula c ao e uma constante desconhecida, cujo verdadeiro valor s o se conseguiria saber, nalguns casos, ap os estudos exaustivos e noutros nem sequer e poss vel saber. Num problema de infer encia estat stica ou se admite que a distribui c ao da popula ca o tem uma forma matem atica conhecida, embora contendo um ou mais par ametros desconhecidos, e o que se chama estat stica param etrica ou se pretende conhecer a forma da distribui c ao, e o dom nio da estat stica n ao param etrica. Os dois tipos mais importantes de infer encia estat stica s ao: estima c ao dos par ametros e testes de hip oteses estat sticas. A estima c ao permite-nos adivinhar ou melhor estimar o verdadeiro valor desconhecido do(s) par ametro(s) da popula c ao, estima c ao pontual, ou obter um intervalo de valores plaus veis para esse par ametro, com a indica c ao da conan ca no procedimento, estima c ao por intervalos.
Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves
109
A outra grande area da infer encia estat stica, a dos testes de hip oteses, tem como objectivo decidir se o valor do par ametro pertence ou n ao a um dom nio de valores especicado pelo investigador. A extens ao do particular ao geral que temos estado a referir, chama-se infer encia indutiva. E o caminho para a aquisi c ao de novos conhecimentos. O grau de incerteza que acompanha as infer encias indutivas pode ser medido rigorosamente em termos de probabilidade, se a experi encia foi conduzida segundo determinados princ pios (probabil sticos ou aleat orios). Os procedimentos que levam ` a obten c ao de amostras nestas condi c oes s ao do dom nio da teoria da amostragem. Vejamos alguns conceitos b asicos, deixando como refer encias para um aprofundamento do assunto Murteira (1990), Barnett (1982) e Cochran (1977). A amostra, que ir a ser utilizada para tirar conclus oes sobre par ametros desconhecidos da popula c ao, dever a ser representativa dessa popula c ao. Para isso dever a obedecer a princ pios de aleatoriedade, i.e., a selec c ao dos indiv duos a incluir na amostra e deixada completamente ao acaso. Temos assim um dos conceitos fundamentais da teoria da amostragem, o de amostra aleat oria. Deni c ao 3.1 Diz-se que (1 , 2 , ..., ) e uma amostra aleat oria de dimens ao se as vari aveis ( = 1, , ) s ao independentes e semelhantes, i.e., t em todas a mesma distribui ca o, que e a da popula c ao. Se as vari aveis 1 , 2 , ..., constituem uma amostra aleat oria extra da de uma popula ca o com fun c ao densidade (), ent ao a fun c ao densidade conjunta daquele veca independ encia entre das tor aleat orio = (1 , 2 , ..., ) pode escrever-se (devido ` vari aveis) como: (1 , 2 , ..., ) = (1 ) (2 )... ( ) importante real E car que uma amostra aleat oria (1 , 2 , ..., ) e um conjunto aveis de vari aveis aleat orias. Antes da amostragem ser realizada as quantidades observ s ao vari aveis aleat orias, depois de feitas as observa c oes temos um conjunto de dados que constituem a amostra observada, que passaremos a representar por (1 , ..., ). Note-se que nem todas as amostras conduzem a generaliza c oes v alidas para a popula ca o da qual foram extra das. De facto os m etodos de infer encia que iremos utilizar baseiam-se na hip otese de que estamos a considerar amostras aleat orias. Deni c ao 3.2 Dada uma amostra aleat oria, chama-se estat stica a toda a fun c ao da amostra
110
aleat oria, que n ao contenha par ametros desconhecidos. Uma estat stica, = (1 , 2 , ..., ), fun c ao dos valores aleat orios, e portanto uma vari avel aleat oria. A cada amostra observada (1 , ..., ), corresponde um valor num erico bem determinado para a estat stica, (1 , 2 , ..., ). Para a amostra aleat oria (1 , ... ), vejamos alguns exemplos de estat sticas importantes. M edia Amostral = Mediana Amostral = Vari ancia Amostral =
2
=1
(3.1)
(+1)/2
(/2) +(/2)+1 2
mpar par
(3.2)
=1 (
)2 . 1
(3.3)
Acab amos de referir alguns exemplos de estat sticas. Observe-se que n ao s ao estat sticas, por exemplo, as seguintes fun c oes: por conterem par ametros desconhecidos. ; ,
Suponhamos que de uma popula c ao innita qualquer, extra mos ao acaso uma primeira amostra de observa c oes: 1 , ..., cuja m edia ser a ent ao = . Se, nas mesmas condi c oes, fosse outra pessoa a extrair uma amostra tamb em de dimens ao , ter amos 1 , ..., cuja m edia ser a, digamos, = , que provavelmente ser a diferente da primeira, ; e assim sucessivamente para outras amostras que possam ser extra das, nas mesmas condi c oes das anteriores. Podiamos ent ao considerar , , , , ..., valores observados da vari avel aleat oria .
111
Um processo de amostragem d a lugar, como vimos, a muitas amostras diferentes. Uma amostra particular e apenas uma das muitas amostras (em n umero innito se a popula ca o for innita), que e poss vel extrair da popula c ao. As utua c oes de amostragem s o podem ser controladas quando a amostra e aleat oria. Observe-se que, o facto de se ter considerado a popula c ao innita e no desenvolvimento que se segue, todo o estudo ter este pressuposto como base, n ao e efectivamente uma restri c ao. Muitas das popula c oes que n os estudamos ou s ao innitas, por exemplo, a popula ca o dos pers pedol ogicos de determinada regi ao, as realiza c oes poss veis do mesmo jogo, etc, ou podem ser consideradas teoricamente innitas, por a dimens ao da popula c ao comparada com a dimens ao da amostra ser de tal modo grande, que torna desprez vel o erro cometido ao considerar-se innita. As estat sticas s ao, pela pr opria deni c ao como vimos, vari aveis aleat orias, tendo portanto distribui c oes a que e costume chamar distribui c oes de amostragem. Se (1 , 2 , ..., ) e uma amostra aleat oria extra da de uma popula c ao com fun c ao de probabilidade ou densidade (), onde designa o(s) par ametro(s) desconhecido(s), a distribui c ao de amostragem da estat stica ( , , ..., ) 1 2 pode denir-se a partir da distribui c ao conjunta =1 ( ). Iremos considerar agora as distribui c oes por amostragem das estat sticas mais frequentemente usadas.
Distribui c oes de amostragem

Distribui c ao da M edia Amostral Consideremos uma amostra aleat oria com observa c oes, retirada de uma popula ca o normal, com valor m edio e vari ancia 2 . Sendo assim, por deni c ao de amostra aleat oria, cada observa c ao , = 1, ..., , tem distribui c ao normal, com valor m edio e vari ancia e 2 , respectivamente. Tendo em conta propriedades da distribui c ao normal, sabemos que (, / ) (0, 1). / (3.4)
Por em, se a amostragem foi feita numa popula c ao com distribui c ao desconhecida, a distribui c ao de amostragem de e ainda aproximadamente normal com valor m edio 2 e vari ancia e /, respectivamente, desde que o tamanho da amostra seja grande (teorema limite central), i. e., quando
112
(0, 1). /
(3.5)
Na pr atica, a aproxima c ao anterior e regra geral boa quando > 30 e a distribui ca o tenha apenas uma moda. No caso de < 30 a aproxima c ao ainda e razo avel se a distribui c ao da popula c ao n ao diferir muito da normal. Se a popula c ao for normal, a e exactamente normal qualquer que seja o tamanho da distribui c ao de amostragem de amostra. As distribui c oes apresentadas em (3.4) e (3.5) s ao fundamentais para a realiza c ao de infer encias sobre o par ametro , quando e conhecido. Veremos mais adiante a distribui c ao que surge quando n ao e conhecido. Antes disso, por em, necessitamos do conhecimento da distribui c ao da Vari ancia Amostral. Distribui c ao da Vari ancia Amostral Dada uma amostra aleat oria de dimens ao extra da de uma popula c ao normal 2 com valor m edio e vari ancia , pretendemos determinar a distribui c ao de amostragem da vari ancia amostral 2 , denida em (3.3). Por em, a distribui c ao de 2 tem pouca aplica ca o pr atica em estat stica. Em vez daquela vari avel aleat oria e costume considerar a distribui c ao de amostragem da vari avel aleat oria ( 1) 2 / 2 . Teorema 3.1 Sendo vari aveis aleat orias normais independentes, (, ), a vari avel aleat oria 2 2 2 ( 1) / tem distribui c ao com ( 1) g.l. Dem: Consideremos ( ) 2 = [ ( ) + ( ) ]2 =
( ) 2 + =
( )2 + 2
( )2 + ( )2
( )( ) =
dado que a u ltima parcela e nula. Portanto podemos escrever
( ) 2 ( )2 ( )2 = + 2 2 2
113
O primeiro membro da igualdade (3.6) tem, como se sabe, distribui c ao 2 () , visto ser a soma dos quadrados de v.a. independentes normais reduzidas (ver generaliza c ao 2 do teorema 2.20, p ag. 105) e o segundo termo do segundo membro tem distribui c ao (1) . O resultado que se pretende provar resulta de dois teoremas fundamentais que iremos enunciar sem demonstra c ao. Teorema 3.2 Se ( = 1, , ) s ao vari aveis aleat orias normais independentes, as vari aveis ao independentes. 2 e s Teorema 3.3 Se e s ao duas vari aveis aleat orias independentes tais que + 2 () e 2 2 (1 ) com 1 < , ent ao (1 ) . Como consequ encia destes dois teoremas e da igualdade (3.6) temos ent ao ( 1) 2 2 Exemplo 3.1 Um fabricante de baterias de autom oveis garante que as suas baterias t em uma dura ca o m edia de 3 anos com um desvio padr ao de 1 ano. Se 5 dessas baterias tiverem durado 1.9 2.4 3.0 3.5 e 4.2 anos 2 (1) . (3.7)
( )2
( 1) 2 = + 2
)2
(3.6)
continuar a o fabricante convencido que as suas baterias t em um desvio padr ao de 1 ano? (Nota: admita-se que a dura c ao das baterias se pode considerar uma v.a. normal). Resolu c ao: Consideremos ent ao (3, 1), a v.a. que designa a dura c ao de vida das referidas baterias, sendo o nosso objectivo estudar o seu desvio padr ao. Para isso considere-se a vari avel ( 1) 2 / 2
2 que como sabemos tem distribui c ao 2 (1) = (4) . Vejamos qual o valor desta vari avel no caso da amostra observada:
114
Portanto
( )2 = = 0.815 1
2
( 1)2 = 3.26 2 2 Ora sabemos que 95% dos valores de um 2 est ao entre 2 0.975 e 0.025 , que no nosso 2 caso s ao 2 ao, podemos dizer que o valor 0.975 = 0.484 e 0.025 = 11.143. Como conclus da estat stica calculado considerando 2 = 1 e um valor plaus vel, n ao tendo portanto o fabricante raz oes para suspeitar que o desvio padr ao n ao seja de 1 ano. 2 calculado = Acab amos de estudar as distribui c oes de amostragem da m edia e da vari ancia, por em a distribui c ao da m edia (3.4) ou mesmo a distribui c ao aproximada (3.5) n ao t em interesse quando a vari ancia e desconhecida. No caso de dispormos de amostras de dimens ao grande, podemos substituir em (3.5) 2 pela vari ancia observada na amostra, 2 , tendo-se ent ao a v.a. (0, 1) / (3.8)
Por em, se e pequeno, os valores de 2 est ao sujeitos a grandes utua co es de amostra para amostra e a aproxima c ao (3.8) j a n ao e v alida. Para dar resposta a esta situa c ao, tem-se uma distribui c ao diferente da distribui c ao normal - a distribui c ao 1 . Vejamos em primeiro lugar a deni c ao da distribui c ao . Deni c ao 3.3 denida Sejam (0, 1) e 2 aveis aleat orias independentes. A v.a. assim () , vari = / (3.9)
diz-se ter distribui c ao com par ametro , ou com graus de liberdade e representa-se por () . Propriedades da distribui c ao 1. Trata-se de uma distribui c ao sim etrica, unimodal. 2. A distribui c ao e semelhante a ` distribui c ao normal reduzida (ver gura seguinte)
A distribui c ao de Student, foi introduzida em 1908 por William Gosset, que trabalhava ent ao para uma f abrica de cervejas. Como esta n ao queria que os seus concorrentes soubessem do uso que os seus t ecnicos faziam de m etodos estat sticos, Gosset teve de publicar o seu trabalho sob o pseud onimo de Student.
1
115
0.0
6
0.1
0.2
0.3
0.4
Gr acos da fun c ao densidade de uma v.a. com distribui c ao (0, 1) (a verde), (4) (a vermelho) e (10) (a azul).
Par ametros da distribui c ao ( > 2). 2
[ ] = 0 ( > 1)
[ ] =
(3.10)
Existem tamb em tabelas para esta distribui c ao. As utilizadas no nosso curso de Estat stica d ao-nos para cada par de valores e o ponto () tal que, sendo () , [ > () ] = . Atendendo ao facto de se tratar de uma distribui c ao sim etrica, e f acil vericar a seguinte rela c ao: 1 = . (3.11)
Consideremos agora novamente o estudo da distribui c ao da vari avel , quando a amostra aleat oria prov em de uma popula c ao normal com vari ancia desconhecida. Tem-se o seguinte teorema: Teorema 3.4 Se 1 , ..., e uma amostra aleat oria retirada de uma popula c ao normal de valor 2 m edio e vari ancia , a v.a. (1) / Dem: Nas condi c oes do teorema sabemos que (0, 1) / e ( 1) 2 2 (1) . 2 (3.12)
Al em disso, como no caso de vari aveis aleat orias normais e 2 s ao independentes tem-se, aplicando a deni c ao (3.3)
116
( 1) 2 / 2 ( 1)
( )/(/ )
(1) . /
Distribui c ao da diferen ca entre duas m edias amostrais Consideremos duas amostras aleat orias 11 , 12 , ..., 11 e 21 , 22 , ..., 22 extra das independentemente de duas popula c oes normais 1 (1, 1 ) e 2 (2 , 2 ). As m edias, 1 2 2 =1 1 e 1 = 2 = =1 1 2
s ao tamb em normais independentes. Ent ao aplicando o Exerc cio 2.15, p ag. 97, que generaliza o teorema da estabilidade da soma de normais, temos 2 2 1 2 1 2 1 2 , + (3.13) 1 2 Se as popula c oes s ao n ao normais, a distribui c ao de amostragem de 1 2 e aproximadamente normal, desde que as dimens oes das amostras 1 e 2 sejam ambas grandes.
2 A distribui c ao de amostragem (3.13) s o tem aplica c ao quando as vari ancias 1 e de cada uma das popula c oes s ao conhecidas. No caso de 1 e 2 grandes pode 2 2 2 2 substituir-se 1 por 1 e 2 por 2 sendo a aproxima c ao ` a normal ainda bastante razo avel. Por em, se as dimens oes s ao pequenas, a aproxima c ao j a n ao e v alida. No caso de as vari ancias das popula c oes embora desconhecidas poderem ser supostas iguais (mais tarde veremos como se poder a vericar esta condi c ao), e poss vel usar um procedimento que vai tamb em conduzir ` a distribui c ao . 2 2
Teorema 3.5 Se 11 , 12 , ..., 11 e 21 , 22 , ..., 22 s ao amostras aleat orias extra das independentemente de duas popula c oes normais 1 (1, 1 ) e 2 (2 , 2 ), respectiva2 2 mente, com vari ancias iguais, 1 = 2 , ent ao ( 1 2 ) ( 1 2 )
2 +( 1) 2 (1 1)1 2 1 2 ( 1 + 2 2 1
1 ) 2
(1 +2 2)
Dem: Seja 2 a vari ancia comum ` as duas popula c oes normais, ent ao
117
Sabemos ainda que as vari aveis aleat orias
( 1 2 ) ( 1 2 ) (0, 1) 1 1 2( + ) 2 1
(3.14)
2 2 (2 1)1 (1 1)1 2 e 2 (1 1) (2 1) 2 2 s ao independentes pois as amostras s ao seleccionadas independentemente de cada popula ca o. Pela estabilidade da soma da distribui c ao 2 tem-se 2 2 (1 1)1 + (2 1)2 2 (1 +2 2) 2 Sendo assim, e utilizando de novo a deni c ao (3.3), a vari avel aleat oria denida
como ( 1 2 ) ( 1 2 ) 1 1 2 ( + ) 1 2 = 2 2 (1 1)1 + (2 1)2 2 (1 + 2 2) ( 1 2 ) ( 1 2 )

2 +( 1) 2 (1 1)1 2 1 2 ( 1 + 2 2 1
1 ) 2
(1 +2 2)
costume designar por E

2 = 2 2 (1 1)1 + (2 1)2 a que se chama vari ancia ponderada. 1 + 2 2
No caso de as vari ancias das popula c oes n ao poderem ser consideradas iguais v arios m etodos t em sido sugeridos; referiremos aqui o procedimento devido a WelshSatterthwaite que estabelece que a vari avel aleat oria ( 1 2 ) ( 1 2 ) 2 1 2 + 2 1 2 (3.15)
tem aproximadamente distribui c ao em que o n umero de graus de liberdade , tem de ser estimado directamente a partir dos dados: =
2 2 ( 2 1 /1 + 2 /2 )
2 (2 1 /1 ) 1 1 2 (2 2 /2 ) 2 1
(3.16)
118
Como o valor obtido para pela express ao anterior n ao e necessariamente um inteiro, deve arredondar-se para o inteiro imediatamente inferior. Distribui c ao do quociente de vari ancias amostrais
2 2 2 2 A estat stica 1 /2 , em que 1 e 2 s ao as vari ancias amostrais de duas populac oes, tem um grande interesse em quest oes de infer encia sobre a raz ao entre as vari ancias das duas popula c oes. A distribui c ao de uma vari avel aleat oria fun c ao do quociente entre duas vari ancias amostrais, em popula c oes normais com base em amostras independentes, foi estudada por Fisher e Snedecor. Vamos aqui apresentar a deni c ao e algumas propriedades da distribui ca o .
Deni c ao 3.4
2 Sejam 2 aveis aleat orias independentes. A v.a. assim denida () e () vari
/ /
(3.17)
tem distribui c ao com (, ) graus de liberdade e costuma representar-se por (,), Esta distribui c ao e, juntamente com as distribui c oes normal, qui-quadrado e , uma das mais importantes distribui c oes em estat stica aplicada. Estas distribui c oes constituem um conjunto de instrumentos indispens aveis na resolu c ao de problemas de infer encia estat stica. A distribui c ao encontra a sua grande aplica c ao em problemas de an alise de vari ancia (ANOVA), um dos m etodos mais importantes da an alise estat stica. Na gura seguinte pode ver-se algumas formas da fun c ao densidade para alguns valores dos par ametros.
0.6 df(xval, 5, 50) 0.0
0
0.2
0.4
3 xval
Gr acos da fun c ao densidade de uma v.a. com distribui c ao (5,50) (a preto), (5,5) (a vermelho) e (3,10) (a verde).
Exerc cio 3.1 Seja () . Prove que 2 (1,) .
119
Teorema 3.6 Se Dem: A demonstra c ao e imediata tendo em conta a deni c ao (3.4) de uma vari avel aleat oria com distribui c ao . Consequ encia: Sendo (,) o valor de uma distribui c ao tal que [ > (,) ] = , tem-se 1(,) = 1 (,) (3.18) (,) = 1/ (,) .
Dem: Se (,) temos 1(,) como o ponto tal que ( > 1(,) ) = 1 (1/ < 1/1(,) ) = 1 Portanto ( > 1/1(,) ) = com = 1/ (,) .
1/(,) = 1(,) .
Vejamos agora a utiliza c ao desta distribui c ao na Infer encia Estat stica Teorema 3.7 Suponhamos que temos amostras aleat orias independentes, de tamanhos 1 e 2 2 2 seleccionadas de duas popula c oes normais com vari ancias 1 e 2 , respectivamente. Ent ao a v.a.
2 2 1 /1 2 / 2 2 2
(11,2 1) .
(3.19)
Dem: Como se trata de amostras aleat orias seleccionadas de popula co es normais, sabemos que
2 (1 1)1 2 (1 1) 2 1
2 (2 1)2 2 (2 1) 2 2
e como s ao vari aveis independentes, tem-se atendendo ` a deni c ao (3.4) da distribui c ao ,

2 2 2 2 1 /1 (1 1)1 /(1 1)1 = (1 1,2 1) . 2 2 2 / 2 (2 1)2 /(2 1)2 2 2
120
Teoria da Estima c ao
Consideremos uma popula c ao da qual e conhecida a forma da fun c ao de distribui c ao, mas tendo par ametros desconhecidos, cujo valor pretendemos estimar. Tal como j a foi referido atr as, o problema da estima c ao divide-se em duas grandes areas: estima c ao pontual; estima c ao por intervalos. Estima c ao pontual Seja uma popula c ao cuja distribui c ao iremos supor conhecida, ou pelo menos admitida, mas dependendo de um par ametro desconhecido. Entre outras hip oteses, pode ser, um valor m edio, uma propor c ao, uma vari ancia, etc. Pretendemos ent ao estimar a partir da informa c ao dada por uma amostra aleat oria, (1 , 2 , ..., ), extra da da referida popula c ao. Deni c ao 3.5 Uma estat stica denida sobre a amostra, que sirva para estimar o valor do . Um par ametro , diz-se que e um estimador de e costuma representar-se por estimador e portanto uma v.a. com uma dada distribui c ao. Deni c ao 3.6 Chama-se estimativa ou estimativa pontual de e e costume representar-se por , o valor num erico de para uma amostra concreta. Exemplo 3.2 Se para uma dada popula ca o pretendemos estimar = = ( ) podemos usar como estimador =
1 =1
sendo a estimativa obtida a partir de uma amostra concreta (1 , ..., ), ==

1 =1
121
Nesta disciplina iremos apresentar os estimadores dos par ametros mais comuns e fazer infer encia sobre esses par ametros. Na tabela seguinte encontram-se esses par ametros, os estimadores que iremos considerar e estimativas associadas. Par ametro a estimar 2 1 2
2 2 1 /2
Estimador = 2 =
=1
Estimativa = 2 =
=1
1 ( )
2 =1 ( )
1 ()
2 =1 ( )
1 2
2 2 1 /2
1 2
2 2 1 /2
1 2
com () - v.a. que conta o n umero de sucessos em provas de Bernoulli e () - n umero observado de sucessos na amostra de dimens ao (concretiza c ao daquelas provas de Bernoulli).
1 2
1 2
Para um dado par ametro desconhecido e poss vel propor mais de um estimador, sendo assim, uma vez denido um estimador pontual, p oe-se uma pergunta natural: Qu ao bom e o estimador obtido?. Obviamente, pretendemos que o estimador forne ca estimativas que se espere estarem muito pr oximas do valor de . E necess ario ent ao dispor de crit erios ou propriedades que permitam escolher um estimador como o melhor de entre outros poss veis estimadores do par ametro. Propriedades de um estimador Estimador centrado. Deni c ao 3.7 do par O estimador ametro , diz-se centrado ou n ao enviesado se e s o se = . ()
122
Exemplo 3.3 Seja (1 , ..., ) uma amostra aleat oria de dimens ao extra da de uma popula c ao e um estimador centrado para . com m edia . A m edia amostral De facto ( ) = Exemplo 3.4 A vari ancia amostral 2 denida em (3.3), baseada numa amostra aleat oria de dimens ao , retirada de uma popula c ao com valor m edio e vari ancia 2 e um estimador centrado de 2 . Pretendemos ent ao provar que ( 2 ) = 2 . Ora [ ] [ ] ( ) 2 [( ) ( )]2 ( ) = = 1 1 [ ] ( )2 2( ) ( ) + ( )2 1
2
1 1 (1 + ... + ) = () =
[ ] [ ] [ ] ( )2 ( )2 ( ) 2 ( )2 = 1 1 1 Como s ao elementos da amostra aleat oria, s ao independentes e ( ) = ent ao, [ ] ( ) 2 [( )2 ] 2 = = e 1 1 1 [ ] 2 2 ( )2 = ( )2 = = 1 1 1 1 pois ( )2 = ( ) = 2 / Tem-se ent ao 2 2 ( ) = = 2 1 1
2
( ) = [( )2 ] = 2 ,
logo 2 e um estimador centrado de 2 .
123
importante perceber o que signica centrado: dizer que E e um estimador centrado de , signica que, fazendo repeti c oes de uma experi encia os valores das esti mativas resultantes ao em torno de e a m edia daquelas estimativas 1 , 2 , ..., , variar igualmente importante, compreender o que o termo est a razoavelmente pr oxima de . E centrado n ao implica. De facto o termo centrado n ao implica que uma estimativa esteja muito pr oxima do verdadeiro valor do par ametro a estimar. Por em, regra geral apenas uma amostra e obtida quando se estuda uma dada popula ca o, porque de facto os estudos estat sticos n ao se repetem muitas vezes, por forma a que das estimativas obtidas se possa calcular a m edia. Para ter alguma garantia de que a estimativa obtida est a pr oxima do verdadeiro valor do par ametro , o ideal ser a o estimador usado ser, n ao s o centrado, como ter tamb em vari ancia pequena. Deste modo, mesmo que os valores estimados utuem em torno de , a variabilidade e pequena. Aparece aqui um novo conceito, o conceito de eci encia de um estimador. Estimador eciente. )2 ]. A Uma maneira de denir a eci encia de um estimador e pelo valor de [( esta quantidade chama-se erro quadr atico m edio e o ideal e que seja m nimo. )2 ] = (). Se e um estimador centrado, [( Deni c ao 3.8 diz-se eciente se Um estimador e centrado e tem vari ancia menor ou igual ` a vari ancia de qualquer outro estimador do mesmo par ametro. 1 e 2 s 1 tem menor vari Observe-se que s o ao centrados, mas o estimador ancia do que 2 portanto e mais eciente. Existem outras propriedades que um estimador deve possuir, mas que n ao aboro o daremos neste curso (consultar Murteira 2volume, Tiago de Oliveira 2volume ou ainda Mood, Graybill e Boes). Referimos at e aqui alguns estimadores, algumas propriedades que eles dever ao possuir, por em nunca fal amos em m etodos de estima c ao, i.e., procedimentos para obter estimadores de par ametros. N ao nos e poss vel estudar tais m etodos no decorrer deste curso, cando por em aqui a refer encia aos mais importantes, que se encontram expostos na bibliograa indicada: m etodo dos momentos; m etodo da m axima verosimilhan ca; m etodo dos m nimos quadrados.
124
Estima c ao por intervalos

At e aqui consider amos o problema da estima c ao pontual e zemos refer encia a m etodos de determinar estimadores pontuais de par ametros desconhecidos. Por em, a indica c ao de um u nico valor como estimativa de um par ametro n ao nos d a nenhuma informa c ao sobre a precis ao de tal valor. Por isso em muitas situa c oes, interessa-nos dar uma medida de erro, , para indicar que o verdadeiro valor do par ametro e + . est a muito provavelmente entre Deni c ao 3.9 Um intervalo de estima c ao de um par ametro e um intervalo da forma face a uma 1 < < 2 , onde 1 e 2 s ao dois valores assumidos pelo estimador , amostra concreta. A medida da conan ca com que aquele intervalo conter a o verdadeiro valor do par ametro e feita em termos de probabilidades. Para isso e necess ario conhecer, pelo Assim, xada uma probamenos aproximadamente, a distribui c ao de amostragem de . bilidade que regra geral e elevada, interessa-nos determinar o intervalo aleat orio que com a referida probabilidade cont em o par ametro que se pretende estimar. A constru c ao do intervalo baseia-se na determina c ao de duas vari aveis aleat orias, 1 e 2 tais que xado um valor , com 0 < < 1, 1 < < 2 ) = 1 ( A 1 chama-se coeciente de conan ca e a chama-se n vel de signic ancia. Deni c ao 3.10 O intervalo 1 < < 2 , calculado para uma amostra concreta chama-se intervalo de conan ca a (1 ) 100% . 1 , 2 [ Note-se que o intervalo ] e um intervalo aleat orio e o que vamos determinar 1 e 2 , respectivamente. s ao 1 e 2 , realiza c oes de 2 ) = 0.95, signica que temos uma conan Quando temos (1 < < ca de 95% de que o nosso intervalo contenha o verdadeiro valor do par ametro, ou ainda, signica 1 , 2 [, obtidos a partir de amostras que esperamos que em cerca de 95% dos intervalos ] extra das da popula c ao, o valor esteja l a inclu do e nos restantes 5%, n ao esteja. , produzindo portanto Diferentes amostras, conduzem a diferentes valores de diferentes intervalos de conan ca para o par ametro . Quanto maior for o intervalo, maior e o grau de conan ca que temos de que ele contenha o verdadeiro valor do par ametro desconhecido, mas n ao h a interesse em ter um intervalo muito largo. O ideal seria um intervalo curto com probabilidade elevada.
125
Como j a diss emos, para construir um intervalo de conan ca para um par ametro , e necess ario encontrar um vari avel aleat oria cuja express ao contenha e cuja distribui c ao seja conhecida, pelo menos aproximadamente. Iremos considerar intervalos de conan ca para o valor m edio, vari ancia, diferen ca de valores m edios, quociente de vari ancias e para propor c oes.
Intervalos de conan ca para o valor m edio a) Caso de uma popula c ao normal com conhecido Seja (1 , ..., ) uma amostra aleat oria retirada de uma popula c ao , com distribui c ao normal com valor m edio e vari ancia 2 conhecida. Vimos j a que um estimador para a m edia da popula c ao , e dado pela estat stica , que no nosso caso tem distribui c ao 2 normal com valor m edio e vari ancia /. Sendo assim tem-se = (0, 1) (3.20)
a v.a. , em cuja express E ao interv em como u nico par ametro desconhecido, que vai ser utilizada para a determina c ao do intervalo de conan ca para . Fixado o n vel de signic ancia e designando por /2 o valor da v.a. tal que ( > /2 ) = /2, tem-se (/2 < < /2 ) = 1 (/2 < donde, ap os pequenos c alculos ( /2 < < + /2 ) = 1 Para uma amostra concreta (1 , ..., ), seja o valor da estat stica , tem-se ent ao o intervalo a (1 ) 100% de conan ca para numa popula c ao normal com conhecido e /2

< /2 ) = 1
< < + /2
(3.21)
126
b) Caso de uma popula c ao normal com desconhecido Na verdade, na maioria dos casos n ao conhecemos a vari ancia da popula c ao da qual pretendemos estimar a m edia. Se a amostra e grande, pode substituir-se por em (3.21) e obter assim um intervalo de conan ca para . Tal procedimento resulta da distribui ca o de amostragem (3.8). Por em, e pequena, a distribui c ao de se a amostra de que dispomos ( )/(/ ), a vari avel que resulta de substituir por um seu estimador, j a n ao e normal. Por c ao da popula c ao e normal, a v.a. = em, vimos que se a distribui c ao -Student com ( 1) g.l. ( )/(/ ) tem distribui A constru c ao dos intervalos de conan ca segue aqui um procedimento an alogo ao considerado em a). Sendo /2 o valor da v.a. tal que ( > /2 ) = /2, tem-se (/2 < < /2 ) = 1 (/2 < < /2 ) = 1 /
( /2 / < < + /2 / ) = 1 . Portanto, o intervalo de conan ca para a (1 ) 100%, no caso de 2 desconhecido e a popula c ao ser normal e
/2(1) < < + /2(1)
(3.22)
Exemplo 3.5 Uma amostra de 10 medidas do di ametro de uma esfera apresenta uma m edia = 4.38 e um desvio padr ao = 0.06. Determine um intervalo de conan ca a 99% para o valor do di ametro m edio da esfera, supondo admiss vel que as medidas dos di ametros seguem uma lei aproximadamente normal. Resolu c ao: Como = 10 e pequeno e n ao conhecemos o valor do desvio padr ao da popula c ao das medidas dos di ametros, o intervalo de conan ca para o verdadeiro valor do di ametro e dado por (3.22), portanto como = 0.01, tem-se /2(9) = 0.005(9) = 3.25, donde o intervalo de conan ca pedido e ]4.38 3.25(0.06/ 10), 4.38 + 3.25(0.06/ 10)[=]4.318, 4.442[.
127
c) Caso de uma popula c ao n ao normal Se a amostra de que dispomos tiver dimens ao elevada, o Teorema Limite Central permite-nos resolver a quest ao da determina c ao dos intervalos de conan ca. De facto, se grande, tem-se pelo Teorema Limite Central que, qualquer que seja a forma da distribui c ao da qual se retirou a amostra aleat oria (0, 1) ent ao analogamente ao que foi feito na al nea anterior o intervalo a (1 ) 100% de conan ca para numa popula c ao qualquer com conhecido, desde que a dimens ao da amostra, , seja grande, e dado por (3.21). Se n ao e conhecido, mas a dimens ao da amostra e grande pode ainda substituirse na express ao do intervalo de conan ca (3.21), por (desvio padr ao da amostra). Sendo assim temos o intervalo a (1 ) 100% de conan ca para numa popula c ao qualquer com desconhecido e com grande, e /2 Exemplo 3.6 A m edia e o desvio padr ao da classica c ao m edia de uma amostra aleat oria de 100 alunos de uma dada escola s ao 2.6 e 0.3, respectivamente. Determine um intervalo de conan ca a 95% para a classica c ao m edia de todos os alunos daquela escola. Resolu c ao: Como = 100 e grande, n ao se exige o conhecimento da distribui c ao subjacente as classica ` c oes; o desvio padr ao tamb em n ao e conhecido mas podemos usar , vindo ent ao o intervalo de conan ca dado por (3.23) com = 2.6 e = 0.3. Para = 0.05, tem-se /2 = 0.025 = 1.96; o intervalo de conan ca a 95% para a classica ca o m edia e ent ao 0 .3 0 .3 2.6 1.96 < < 2.6 + 1.96 100 100 2.54 < < 2.66.

< < + /2
(3.23)
128
Um outro problema que se levanta frequentemente e o de saber que dimens ao dever a ter a amostra para assegurar que o erro cometido ao estimar por seja inferior a uma quantidade especicada . Ora, considerando o intervalo de conan ca para /2 / < < + /2 /
se usarmos como uma estimativa de , podemos estar (1 ) 100% conantes que o erro cometido ser a menor que /2 / . Sendo assim, para termos uma estimativa de com erro inferior a devemos escolher tal que /2 / , i.e., ( ) /2 2 (3.24) Por em esta igualdade s o se pode aplicar se conhecermos a vari ancia da popula c ao da qual se vai seleccionar a amostra. Mas, o que acontece na realidade e que na grande maioria dos casos n ao se conhece; ent ao o que se dever a fazer e tomar uma amostra preliminar de > 30, us a-la para obter uma estimativa de e ent ao entrar com este valor na f ormula (3.24).
Intervalos de conan ca para a diferen ca entre duas m edias populacionais a) Caso de popula c oes normais com vari ancias conhecidas Suponhamos duas popula co es normais 1 (1 , 1 ) e 2 (2, 2 ). ao, Um estimador para a diferen ca das m edias 1 2 e dado por 1 2 . Ent para ter uma estimativa pontual para 1 2 seleccionamos duas amostras aleat orias independentes uma de cada popula c ao com dimens oes 1 e 2 , respectivamente. Como vimos j a, 2 2 1 2 1 2 1 2 , + . 1 2 Sendo assim, analogamente ao que zemos atr as, xado o n vel de signic ancia , o intervalo de conan ca a (1 ) 100% para 1 2 no caso de popula c oes normais com vari ancias conhecidas das quais foram extra das amostras independentes e
2 1 1 2 2 2
(1 2 ) /2
< 1 2 < (1 2 ) + /2
2 1 1
2 2 2
(3.25)
129
b) Caso de popula c oes normais, vari ancias desconhecidas O que acab amos de dizer sobre a diferen ca de duas m edias s o e aplic avel no caso 2 2 2 de e 2 conhecidos ou estimados, no caso de grandes amostras. De facto se 1 e 2 s ao 2 2 2 2 desconhecidas e 1 e 2 grandes, podemos substituir em (3.25) 1 por 1 e 2 por 2 , sem haver altera c ao signicativa na precis ao do intervalo de conan ca. Se no entanto as amostras s ao pequenas, podemos contruir intervalos de conan ca para a diferen ca dos valores m edios se forem vericadas as seguintes hip oteses:
2 1
1. ambas as distribui c oes normais; 2. as vari ancias das popula c oes, embora desconhecidas possam ser supostas iguais (veremos mais adiante um procedimento que permite estudar a admissibilidade desta hip otese). Como cou dito atr as, teorema 3.5, se as vari ancias embora desconhecidas, pud2 2 erem ser supostas iguais, seja 1 = 2 = 2 , a v.a. ( 1 2 ) ( 1 2 ) (1 +2 2) 1 1 ( + ) 2 1
2
(3.26)
com
2 2 (1 1)1 + (2 1)2 . = 1 + 2 2 A constru c ao de um intervalo de conan ca para 1 2 segue os procedimentos j a atr as referidos: dado o n vel de signic ancia , tem-se
(/2 < < /2 ) = 1 ( 1 2 ) ( 1 2 ) < /2 = 1 /2 < 1 1 1 + 2
donde, ap os pequenos c alculos se tem
o intervalo de conan ca a (1 ) 100% para 1 2 no caso de amostras de pequena dimens ao retiradas de popula c oes normais com vari ancias descon2 2 2 hecidas mas supostas iguais, 1 = 2 = e
1 1 1 2
(1 2 ) /2
< 1 2 < (1 2 ) + /2
1 1
1 2
(3.27)
130
Exemplo 3.7 Num processo qu mico pretende comparar-se o efeito de dois catalizadores sobre o produto obtido. Utilizaram-se 12 quantidades iguais de produto nas quais se usou o catalizador 1 e 10 outras quantidades nas quais se usou o catalizador 2. Quando foi usado o catalizador 1, obteve-se uma m edia de 85 com desvio padr ao 4, enquanto para o catalizador 2 se obteve m edia 81 com desvio padr ao 5. Determinar um intervalo de conan ca a 90% para a diferen ca entre o efeito m edio dos dois catalizadores, supondo que as popula c oes s ao aproximadamente normais. Resolu c ao: Para j a admitamos poder aceitar-se a igualdade das vari ancias (mais tarde teremos oportunidade de vericar se esta hip otese e admiss vel). Como as amostras t em dimens ao pequena e e suposto terem sido retiradas de popula co es aproximadamente normais, o intervalo de conan ca e dado por (3.27), com
2 (1 1)2 1 + (2 1)2 = 20.05 1 + 2 2 = 0.05(20) = 1.725, o intervalo de conan ca a 90% para 1 2 e
2 =
Como /2(20) ent ao
ou seja,
4 (1.725)(4.478) 1/12 + 1/10 < 1 2 < 4 + (1.725)(4.478) 1/12 + 1/10 0.69 < 1 2 < 7.31.
As hip oteses da normalidade das popula c oes e da igualdade das vari ancias s ao bastante restritivas e muitas vezes n ao s ao vericadas nas aplica c oes. Por em, v arios autores mostraram que o grau de conan ca nos intervalos n ao e seriamente afectado para pequenos afastamentos da normalidade. No caso de as popula c oes serem normais, a hip otese da igualdade das vari ancias pode ser n ao vericada continuando a ter-se bons resultados, desde que estejam a ser consideradas amostras do mesmo tamanho. Portanto, ao planear-se uma experi encia, e de fazer um esfor co para obter amostras com a mesma dimens ao. Se no entanto as amostras tiverem dimens oes diferentes e n ao for admissi vel supor as vari ancias iguais e ainda poss vel contruir intervalos de conan ca aproximados para a diferen ca das m edias das duas popula c oes considerando uma estat stica aproximada, em que o n umero de graus de liberdade tem de ser estimado a partir dos dados. Esta vari avel foi j a estudada atr as, (3.15), vindo-nos portanto o intervalo de conan ca a (1 ) 100% para 1 2 no caso de amostras de pequena dimens ao retiradas de popula c oes normais com vari ancias diferentes
131
1 2 /2
2 1 1
2 2 2
< 1 2 < 1 2 + /2
2 1 1
2 2 2
(3.28)
onde /2 e o valor de uma vari avel aleat oria , com distribui c ao com g.l., denido em (3.16). c) Caso de popula c oes quaisquer e amostras de dimens ao grande Quando as popula c oes 1 e 2 n ao s ao normais mas as dimens oes das amostras retiradas independentemente de cada uma delas s ao grandes, (como regra pr atica 1 e 2 ambos maiores que 30) o intervalo de conan ca (3.25) d a uma aproxima c ao bastante boa 2 2 quando as vari ancias de cada uma das vari aveis 1 e 2 s ao conhecidas. 2 2 2 Se 1 e 2 s ao desconhecidas e 1 e 2 grandes, podemos substituir em (3.25) 1 2 2 por 2 avel a precis ao do intervalo de conan ca. 1 e 2 por 2 , sendo razo Exemplo 3.8 Foi feito um teste a 50 raparigas e 75 rapazes. As raparigas tiveram uma pontua ca o m edia de 76 com desvio padr ao 6 e os rapazes tiveram uma pontua c ao m edia de 82 com desvio padr ao 8. Construindo um intervalo de conan ca a 95% para a diferen ca da pontua c ao m edia entre os rapazes e as raparigas, interprete o resultado obtido. Resolu c ao: Designando por 1 a popula c ao dos rapazes e 2 a popula c ao das raparigas, temos 1 = 75 e 2 = 50. Como as amostras t em dimens oes grandes n ao e necess ario exigir a normalidade das popula c oes a estudar, assim como o conhecimento das vari ancias de cada uma delas. ca a 95% para Dado que 1 = 82, 2 = 76, 1 = 8 e 2 = 6, o intervalo de conan a diferen ca da pontua c ao m edia entre os rapazes e as raparigas e (82 76) 1.96 64/75 + 36/50 < 1 2 < (82 76) + 1.96 64/75 + 36/50 3.54 < 1 2 < 8.46.
donde o intervalo de conan ca a 95% e
Dado que o intervalo de conan ca cont em apenas valores positivos para 1 2 , podemos dizer que, com uma conan ca de 95%, as pontua c oes m edias obtidas pelos rapazes s ao superiores ` as obtidas pelas raparigas.
132
e) Caso de amostras emparelhadas At e aqui consider amos intervalos de conan ca para a diferen ca das m edias de duas popula c oes, quando as amostras obtidas de cada uma dessas popula c oes eram independentes. o caso de observa Por em, em muitas situa c oes tal n ao acontece. E c oes de uma o dada experi encia ocorrendo aos pares, sendo o 1elemento do par de uma amostra e o 2o elemento da outra. Por exemplo, ao ser feito um teste sobre uma nova dieta em indiv duos, os pesos registados antes e ap os o tempo de teste constituem as observa c oes de cada uma das nossas amostras. Como se v e, as observa c oes em cada uma das amostras est ao relacionadas (emparelhadas) pelo indiv duo. Uma outra situa c ao e a de haver factores estranhos ao fen omeno em estudo, que causam diferen cas signicativas nas m edias. E o caso de se pretender fazer um ensaio de dois adubos na produ c ao de trigo. Se para isso escolhermos v arios talh oes aplicando numa parte deles um dos adubos e na outra parte o outro adubo, pode acontecer que ao compararmos as produ c oes m edias, as diferen cas vericadas se devam n ao aos adubos mas a condi c oes diferentes de solo e clima a que os talh oes estejam sujeitos. A inu encia de factores estranhos pode reduzir-se considerando aquilo a que chamamos observa c oes emparelhadas. De facto, ao compararmos dois tratamentos (o termo tratamentos usa-se regra geral para designar coisas que se pretendem comparar), e desej avel que as unidades experimentais (s ao os elementos b asicos a que s ao aplicados os tratamentos) sejam o mais homog eneas poss vel, por forma que, as diferen cas que se verique existirem entre os dois grupos em estudo possam ser atribu das a diferen cas nos tratamentos. Se existirem certos factores variando nas unidades experimentais e que possam inuenciar a resposta , tais factores podem obscurecer as diferen cas reais devidas ao efeito dos tratamentos. O requerimento da homogeneidade entre as duas amostras, que poderia resolver este problema, pode impor restri c oes grandes ao n umero de elementos a incluir nas amostras. Por exemplo, para comparar dois analg esicos pode ser impratic avel obter um n umero razo avel de doentes que tenham as mesmas caracter sticas: idade, sexo, condi co es f sicas gerais e o mesmo grau de severidade de doen ca. Al em de ser muitas vezes impratic avel obter amostras com mesmas caracter sticas, tamb em n ao tem interesse o estudo feito com um grupo t ao restrito. Um estudo com muito mais interesse consistir a em considerar uma variedade grande de doentes, com idades, sexos, condi c oes gerais diferentes e para aplicar os tratamentos tentar formar pares de indiv duos o mais semelhantes poss vel em cada par, mas variando de par para par. Em cada par escolhe-se aleatoriamente um elemento para receber um tratamento cando o outro com outro tratamento. Surge ent ao um conceito muito importante, e o conceito de bloco que se mostra fundamental por permitir uma situa c ao de compromisso entre o requesito da homogeneidade e da diversidade das unidades experimentais. O procedimento consiste ent ao em formar grupos ou blocos por forma que em cada bloco as referidas unidades sejam homog eneas e nos diferentes blocos sejam bastante heterog eneas. Temos ent ao amostras a
133
que chamamos amostras emparelhadas. Depois em cada bloco e atribu do aleatoriamente o tratamento 1 a uma das unidades, cando a outra para o tratamento 2. Este processo permite a compara c ao efectiva dentro de cada bloco e a diversidade de condi c oes poss veis de existir entre os blocos. No caso dos adubos, a experi encia deve ent ao ser planeada de modo a formar talh oes emparelhados, i.e., o mais semelhantes poss vel quanto ao tipo de solo, humidade, exposi ca o ao sol, etc, e num deles aplicar um adubo e no outro o outro adubo. O emparelhamento serve portanto para remover fontes de varia c ao que possam existir entre as duas popula c oes em estudo e que obscure cam o efeito dos tratamentos. A diferen ca nas respostas dos dois grupos ser a assim atribu da a `s diferen cas nos tratamentos e n ao aos grupos. Consideremos a amostra emparelhada ( , ) ( = 1, ..., ), composta por pares de observa c oes independentes, mas dentro de cada par e s ao correlacionadas. Designemos por (1 , 2 , ..., ), a amostra aleat oria das diferen cas, i.e., 1 = 1 1 ; 2 = 2 2 ; ... = .
As vari aveis aleat orias 1 , 2 , ..., s ao independentes. Supondo que 1 , 2 , ..., s ao observa c oes de uma popula c ao normal com valor 2 m edio e vari ancia , desconhecida, pelas propriedades do valor m edio v e-se que = , por conseguinte a infer encia sobre a diferen ca das m edias entre as duas popula co es e o mesmo que fazer infer encia sobre a m edia da diferen ca. 2 2 Naturalmente, como estimador pontual de temos e como estimador pontual de temos sendo 1 = =1
Para determinarmos um intervalo de conan ca para , uma vez xado um n vel , temos de considerar a v.a. (1) / donde o intervalo de conan ca a (1 ) 100% para , onde as diferen cas = s ao supostas normais e independentes e
/2 < < + /2
1 = ( ) 2 . 1 =1
(3.29)
(3.30)
Observa c ao: Tal como tem vindo a ser referido se grande n ao e necess aria a hip otese da normalidade para a popula c ao das diferen cas.
134
Exemplo 3.9 Numa investiga c ao m edica pretende-se estudar o efeito de determinado medicamento na redu c ao da tens ao arterial. Para isso registaram-se as tens oes arteriais de 15 pessoas e posteriormente usaram o referido medicamento durante seis meses, no m dos quais as suas tens oes arteriais foram de novo registadas. Que infer encias e poss vel efectuar a partir dos dados obtidos? Indiv duo Antes ( ) Depois ( ) = 1 2 70 80 68 72 2 8 3 4 5 6 7 8 72 76 76 76 72 78 62 70 58 66 68 52 10 6 18 10 4 26 9 10 11 12 13 14 82 64 74 92 74 68 64 72 74 60 74 72 18 -8 0 32 0 -4 15 84 74 10
Resolu c ao: Estamos perante observa c oes emparelhadas, por pessoa, feitas antes e ap os o uso do medicamento. Tem-se 1 1 = = 8 .8 , = ( )2 = 10.98. 15 14 Supondo que as diferen cas s ao valores de uma amostra aleat oria extra da de uma popula ca o normal, um intervalo de conan ca a 95% para a diferen ca m edia, obtido a partir de (3.30) e 10.98 10.98 ]8.8 2.145 , 8.8 + 2.145 []2.72, 14.88[ 15 15 Sendo assim, podemos dizer que, com 95% de conan ca, a redu ca o m edia est a entre 2.72 e 14.88 e como o intervalo de conan ca inclui apenas valores positivos h a fortes raz oes para acreditar que h a redu c ao da tens ao arterial. Observa c oes: Na altura de planear uma experi encia para comparar dois tratamentos, por vezes teremos de decidir entre fazer amostras emparelhadas ou amostras independentes. Vejamos algumas considera c oes: Ao considerarmos amostras emparelhadas e dispondo de pares de observa c oes, a vari avel a usar na constru c ao do intervalo de conan ca tem distribui c ao com ( 1) g.l.; se as amostras fossem consideradas independentes com observa c oes cada, a vari avel a usar teria distribui c ao com (2 2) g.l. Vemos ent ao que amostras emparelhadas resultam numa perda de graus de liberdade, o que acarreta um valor maior para /2 e consequentemente um intervalo de conan ca maior.
135
Mas, se nas unidades experimentais existem condi c oes que possam inuenciar a resposta e que produzam uma grande variabilidade nos dois grupos em estudo, e pela amostragem emparelhada que devemos optar. Sempre que estejamos a trabalhar com unidades experimentais que sejam homog eneas ou cuja heterogeneidade n ao se pode relacionar a factores identic aveis e ent ao prefer vel fazer amostras independentes.
Intervalo de conan ca para a vari ancia Dada uma amostra aleat oria a que um estimador da (1 , 2 , ..., ), vimos j vari ancia 2 da popula c ao era 2 = ( )2 /( 1). Por outro lado sabemos que se a amostra for extra da de uma popula c ao normal de par ametros e , ( 1) 2 2 (1) . 2 esta vari E avel aleat oria que n os vamos utilizar para construir um intervalo de conan ca para 2 . Fixado um n vel , e sendo 2 c ao 2 /2 o valor de uma v.a. com distribui (1) tal 2 2 que ((1) > /2 ) = /2 [ ] ( 1) 2 2 2 1/2 < < /2 = 1 2 [ ] 2 ( 1) 2 ( 1) < 2 < 2 = 1 2 1/2(1) /2(1) Ent ao o intervalo de conan ca a (1 ) 100% para a vari ancia de uma popula c ao normal e
(1)2 2 /2(1)
< 2 <
(1)2 2 1/2(1)
(3.31)
Intervalo de conan ca para o quociente entre duas vari ancias Suponhamos que temos duas popula c oes normais (1, 1 ) e (2 , 2 ) das quais retiramos duas amostras independentes de dimens oes 1 e 2 , respectivamente. Pretendemos comparar as vari ancias das duas popula c oes, determinando um in2 1 tervalo de conan ca para 2 . 2
136
2 2 2 1 tem distribui c ao (1 1,2 1) 2 2 1 2 Para construir um intervalo de conan ca, para um n vel de signic ancia , basta ent ao ter em conta que ] [ 2 2 2 1 1/2 < 2 2 < /2 = 1 1 2 ] [ 2 2 2 1 1 1 < 2 < 2 = 1 . 2 2 /2 2 2 1/2
Vimos, teorema 3.7, que a vari avel aleat oria
Portanto, tendo ainda em conta o resultado (3.18) para a distribui c ao , 2 1 o intervalo de conan ca para 2 , raz ao das vari ancias de duas pop2 ula c oes normais das quais foram extra das duas amostras independentes, e
2 2 2 1 /2;(1 1,2 1)
<
2 1 2 2
<
2 1 /2;(2 1,1 1) 2 2
(3.32)
Mais uma vez e de referir que estamos a supor as popula c oes normais. A viola c ao desta hip otese pode levar-nos a conclus oes incorrectas. Por em, tem-se vericado que tal tal problema e minimizado se as amostras tiverem a mesma dimens ao.
Intervalos de conan ca para propor c oes. Dada uma popula c ao com distribui c ao binomial de par ametros (, ), regra geral e o par ametro desconhecido. Um estimador de e = , (3.33) onde , designando o n umero de sucessos em provas, tem ent ao distribui c ao (, ) Como sabemos ( ) = e ( ) = , portanto ) = ( ( ) e ent ao um estimador centrado de e ( ) = 1 = . 2
) = (
Se estivermos nas condi c oes de ser poss vel aproximar a v.a. binomial pela normal, teorema de De Moivre, sabemos que (, )
137
. Portanto ( ) / , = (0, 1) (3.34)
Usando esta vari avel aleat oria podemos determinar um intervalo de conan ca para a propor c ao , atendendo a que ( ) /2 < < /2 = 1
( ) / /2 < < /2 = 1 . ) ( /2 + /2 = 1 << Observe-se por em que e desconhecido, por isso os limites da express ao anterior n ao se conseguem obter. No entanto, como toda esta constru c ao s o e v alida para grande, nos limites da express ao anterior pode substituir-se por = /. Temos ent ao um intervalo de conan ca para a (1 ) 100% de conan ca para amostras de dimens ao grande e /2 com = /.
(1 )
<< + /2
(1 )
(3.35)
Exemplo 3.10 Numa amostra de 400 fam lias extra da de entre os habitantes de Lisboa, vericouse que 140 tinham televis ao via sat elite. Determine um intervalo a 95% de conan ca para a propor c ao de fam lias possuindo TV sat elite. Resolu c ao: Designando por a v.a. que conta o n umero de fam lias possuindo TV sat elite na amostra seleccionada, trata-se de uma vari avel com distribui c ao hipergeom etrica. Mas = 400 e muito pequeno relativamente ` a dimens ao da popula c ao (todas as fam lias de Lisboa) e por isso e poss vel fazer uma aproxima c ao ` a binomial. Temos ent ao a v.a. aproximadamente binomial de par ametros ( = 400, ). O par ametro , desconhecido, tem como estimativa = 140/400 = 0.35. O intervalo de conan ca, para a propor c ao pedida, obtido a partir de (3.35) e ent ao dado por (0.35) (0.65) (0.35) (0.65) 0.35 1.96 < < 0.35 + 1.96 400 400
138
ou seja 0.303 < < 0.397. O intervalo de conan ca (3.29) pode escrever-se sob a forma < /2
permitindo-nos dar uma ideia do erro cometido ao estimar por . Teorema 3.8 Se e usado como uma estimativa de , podemos ter (1 ) 100% de conan ca que o erro cometido ao usarmos em vez de e inferior a /2 /.
Aplicando este teorema podemos determinar a dimens ao da amostra que se deve tomar por forma que o erro cometido ao estimar por seja inferior a um certo valor especicado . Assim, basta fazer /2
2 / 2 . 2
Podemos enunciar ent ao o Teorema 3.9 Se e usado como estimativa de , o erro cometido e inferior a com (1)100% de conan ca, quando a dimens ao da amostra f or
2 / 2
(3.36)
Observe-se por em que, na determina c ao do tamanho da amostra necess aria para ter uma estimativa de com um erro inferior a uma quantidade especicada, usa-se , calculado a partir da amostra. Regra geral este problema e resolvido do seguinte modo: Se for poss vel ter uma estimativa grosseira de sem necessidade de recolher uma amostra usa-se essa estimativa na express ao que nos d a o valor de . na falta dessa estimativa, extrai-se uma primeira amostra de dimens ao > 30, estima-se e depois este valor entra na express ao que permite determinar . Note-se ainda que, independentemente do grau de conan ca e poss vel ter um limite inferior para , tendo em conta que = (1 ) = 2 = 1/4 ( 2 + 1/4) = 1/4 ( 1/2)2 1/4
139
Sendo assim o m aximo valor que podem tomar e 1/4. Substituindo na express ao (3.36) obtemos um valor para a dimens ao da amostra que se deve recolher para termos uma estimativa com um erro inferior a , independentemente do grau de conan ca
2 / 2
42
(3.37)
Intervalo de conan ca para a diferen ca entre duas propor c oes Consideremos duas popula co es binomiais das quais retiramos duas amostras aleat orias independentes, sucientemente grandes, de dimens oes 1 e 2 . Dena-se as vari aveis aleat orias (1 , 1 ) 1 = /1 e (2 , 2 ) 2 = /2
Pretendemos determinar um intervalo de conan ca para 1 2 . Sejam e estimadores de 1 e 2 , respectivamente. Como estamos a considerar 1 e 2 grandes, temos ( ) 1 1 1 1 , 1 2 ( 2 2 2 )
2 ,
Como as amostras s ao independentes as v.a.s e s ao independentes e portanto 1 e 2 tamb em independentes , logo ( ) 1 1 2 2 1 2 1 2 , + . 1 2 Procedendo como temos feito at e aqui temos o intervalo de conan ca a (1 ) 100% para a diferen ca 1 2 de duas popula c oes binomiais das quais se retiraram amostras independentes e de dimens ao elevada e
( 1 2 ) /2
1 1 1
2 2 2
< 1 2 < ( 1 2 ) + /2
1 1 1
2 2 2
(3.38)
140
Exemplo 3.11 Pretende-se saber se a propor c ao de ulmeiros afectados pela graose e id entica em duas zonas A e B. Na zona A foi recolhida uma amostra de 150 ulmeiros e vericou-se que 107 estavam afectados e na zona B recolheu-se uma amostra de 100 havendo 63 afectados. Que conclus oes se pode tirar ao n vel de signic ancia de 0.05? Resolu c ao: Sejam 1 e 2 as propor c oes de ulmeiros afectados pela graose nas zonas A e B respectivamente. Em face dos resultados obtidos temos como estimativas 63 107 = 0.71 2 = = 0.63. 150 100 Um intervalo de conan ca para 1 2 , aplicando directamente (3.38) e 1 = (0.71 0.63) 1.96 0.06 < 1 2 < (0.71 0.63) + 1.96 0.06 0.04 < 1 2 < 0.20 Atendendo a que o intervalo de conan ca cont em valores positivos e negativos, podemos dizer com 95% de conan ca que n ao h a diferen ca signicativa entre as propor co es de ulmeiros afectados em cada uma das zonas.
141
Testes de hip oteses

Vamos aqui introduzir uma outra metodologia usada em infer encia estat stica que j a referimos atr as, chamada Testes de Hip oteses Estat sticas. Grosseiramente falando o objectivo dos testes de hip oteses estat sticas e determinar se certas arma c oes sobre uma popula ca o s ao suportadas pelos dados da amostra. Portanto apresenta procedimentos adequados para p or ` a prova ideias que formulamos sobre factos desconhecidos. Uma ideia, mesmo que pare ca muito boa, deve ser pelo menos transitoriamente negada, e s o se a evid encia factual nos levar a rejeitar essa nega c ao e que deve ser acolhida como promissora ... Pestana e Velosa (2008), Introdu c ao ` a Probabilidade e ` a Estat stica Vejamos em primeiro lugar algumas
No c oes b asicas
Deni c ao 3.11 Uma hip otese estat stica e uma conjectura sobre: - um par ametro desconhecido da popula c ao ou - a forma da distribui c ao de uma caracter stica em estudo na popula co Pode ser ent ao sobre a forma da distribui c ao ou sobre o valor de par ametros desconhecidos da popula c ao, conhecida ou n ao a forma da distribui c ao. Tal conjectura pode ou n ao ser verdadeira. A verdade ou falsidade nunca pode ser conrmada, a menos que observ assemos toda a popula c ao, o que nalguns casos e impratic avel (quando a popula c ao e muito grande) ou noutros mesmo imposs vel (caso de popula c oes innitas ou mesmo de a caracter stica em estudo levar ` a destrui c ao da popula ca o dura c ao de vida de um elemento, etc.) E ent ao atrav es da informa c ao fornecida por uma amostra que n os rejeitamos ou n ao a hip otese formulada. Iremos tratar aqui hip oteses sobre o(s) valor(es) do(s) par ametro(s) desconhecidos da popula c ao (testes param etricosou testes de hip oteses param etricas). Ent ao, por exemplo, admitamos que temos uma popula c ao cuja lei e conhecida com excep c ao de um par ametro (escalar ou vector) desconhecido. A teoria de Neyman-Pearson sobre testes de hip oteses estabelece uma dicotomia no espa co, , do par ametro (conjunto de valores poss veis para o par ametro desconhecido),i.e., = 0 1 e 0 1 = . Tal dicotomia consiste anal na formula c ao de duas hip oteses alternativas, que e costume serem designadas por 0 hip otese nula e 1 hip otese alternativa.
142
A formula c ao matem atica das hip oteses e ent ao a seguinte: 0 : 0
1 : 1 , e dizemos que queremos testar 0 contra 1 , escrevendo muitas vezes 0 vs 1 . Se 0 (1 ) cont em um s o elemento, 0 (1 ) diz-se hip otese simples, se cont em mais de um elemento diz-se hip otese composta.
Escolha da hip otese nula e da hip otese alternativa Ao testar uma hip otese nula contra uma hip otese alternativa a nossa atitude dever a ser admitir 0 como verdadeira at e que os dados testemunhem fortemente contra ela; nesse caso dever a ser rejeitada a favor de 1 . Uma analogia ` a formula c ao das hip oteses nula e alternativa, pode ser a que se estabelece num julgamento, onde os jurados ter ao de decidir por considerar culpado ou inocente um r eu. Deve considerar-se culpado apenas se houver provas verdadeiramente convincentes da culpa, portanto a hip otese nula deve ser aquela que deve ser olhada como verdadeira e s o rejeitada quando os dados apresentarem forte evid encia disso. Portanto devem ser assim formuladas as hip oteses: 0 : 1 : n ao culpado culpado.
Regra geral toma-se como hip otese 0 a hip otese a ensaiar, por exemplo, 0 eo valor de um par ametro cuja plausibilidade se pretende vericar, e a situa c ao actual, etc. Um teste de hip oteses e anal uma regra que permite especicar um subconjunto do espa co-amostra (Chama-se espa co amostra o conjunto de todas as amostras poss veis), , que permita decidir se a amostra observada conduz ` a rejei c ao ou n ao de 0 Designe-se por - regi ao de aceita c ao de 0 e - regi ao de rejei c ao de 0 , com = e = . Para tomarmos uma decis ao e necess ario ent ao estabelecer um conjunto de regras: Denir uma vari avel aleat oria, fun c ao da amostra aleat oria, cujo valor ser a calculado a partir de uma amostra observada: se o valor calculado , rejeita-se 0 se o valor calculado , aceita-se 0 Podemos dizer que um teste de uma hip otese nula e o decurso de uma ac c ao que especica o conjunto de valores de uma v.a. , para os quais 0 e
143
rejeitada. A v.a. cujos valores permitem decidir qual a atitude a tomar diz-se Estat stica do teste e o conjunto de valores dessa vari avel que conduzem ` a rejei ca o de 0 chama-se Regi ao de Rejei c ao ou Regi ao Cr tica.
Os dois tipos de erros e a fun c ao pot encia de um teste Sendo um teste de hip oteses um tipo particular de infer encia estat stica, e portanto um procedimento que leva do particular ao geral, podendo assim conduzir a erros. Ao proceder-se a um teste de hip oteses podem cometer-se dois tipos de erros: rejeitar a hip otese nula, sendo ela verdadeira chama-se a este erro do tipo I ou erro de primeira esp ecie e n ao rejeitar 0 e ela ser falsa chama-se a este erro do tipo II ou erro de segunda esp ecie. Vejamos esquematizadas no seguinte quadro as situa c oes que podem ocorrer Conclus oes do teste N ao rejeitar 0 Rejeitar 0 Situa c oes correctas desconhecidas 0 verdadeira Correcto Errado Erro tipo I 0 falsa Errado Erro tipo II Correcto
A decis ao do teste e portanto errada nas duas situa c oes seguintes: Rejeitar 0 e 0 ser verdadeira (erro de 1a esp e cie); N ao rejeitar 0 e 0 ser falsa (erro de 2a ecie). esp ` As probabilidades de cometer cada um dos erros anteriores e costume designar por e : = (erro tipo I)= (Rejeitar 0 / 0 verdadeiro) e chamado o n vel de signic ancia do teste; = (erro tipo II)= (n ao rejeitar 0 / 0 falso) e a 1 = (rejeitar 0 / 0 falso) chama-se a pot encia do teste. O aspecto fundamental da teoria dos testes de hip oteses consiste na escolha da regi ao cr tica de modo a controlar cada um dos dois tipos de erros. A situa c ao ideal seria aquela que minimizasse simultaneamente e . Mas, na realidade, mantendo xa a dimens ao da amostra, e variam em sentidos contr arios. O que se faz e xar o n vel de signic ancia (o erro tipo I e considerado o mais gravoso e portanto o que deve ser controlado) e tomar o teste que minimize , ou seja, que maximize a pot encia do
144
teste (na verdade a procura de um teste que minimize s o tem sentido quando 0 e 1 s ao hip oteses compostas, porque neste caso as probabilidades de cometer erros de 1a e 2a esp e cie dependem do valor particular do par a metro em cada uma das regi o es). Vejamos esquematicamente os principais passos na formula c ao de um teste de hip oteses, respeitante a um par ametro de uma popula c ao: 1. 0 : 0 ou 0 : 0 ou 0 : = 0 ; e respectivamente 2. 1 : < 0 ou > 0 ou = 0 ; 3. Escolher o n vel de signic ancia ; 4. Seleccionar a estat stica do teste e denir a regi ao de rejei c ao; 5. Calcular o valor da estat stica para uma amostra observada, de dimens ao ; 6. Decis ao: stica pertence ` a regi ao critica Rejeitar 0 , se o valor da estat N ao rejeitar 0 , caso contr ario. Podem se consultados os quadros com os diferentes testes que ir ao ser considerados neste curso, e que s ao testes ao valor m edio, vari ancia, diferen ca de valores m edios no caso de amostras independentes e emparelhadas, quociente de vari ancias e propor co es.
Notas sobre Regras de decis ao em Testes de Hip oteses A indica c ao do valor observado da estat stica do teste, seguido da consulta de uma tabela para a procura de um valor cr tico de modo a tirar conclus oes, tem sido recentemente substitu do pelo c alculo da probabilidade de se observar um valor igual ou mais extremo do que o observado, se a hip otese nula e verdadeira chama-se a isto valor de prova; valor-p (p-value ) Nota: e esta quantidade que hoje em dia qualquer software est a preparado para calcular e indicar quando se manda realizar um teste. Podemos interpretar o valor de prova, valor-p ou p-value como a medida do grau de concord ancia entre os dados e H0 . Assim Quanto menor for o p-value, menor e a consist encia entre os dados e a hip otese nula
145
Habitualmente adopta-se como regra de decis ao: rejeitar H0 se p-value .
Testes de Normalidade Vamos aqui considerar apenas o caso de se pretender testar a forma da distribui c ao. Estamos ent ao no dom nio dos testes n ao param etricos que neste caso se designam por testes de ajustamento. Comecemos com um teste muito importante nas nossas aplica c oes - um teste de ajustamento para averiguar se um dado conjunto de observa c oes se pode considerar proveniente de uma popula c ao lue com distribui c ao normal e um teste de normalidade, o Teste de Shapiro Wilk, que se tem revelado ser um dos mais potentes. Vejamos em s ntese como se processa. O teste de Shapiro-Wilk Seja X a caracter stica em estudo na popula c ao. Formulam-se as hip oteses: H0 : X tem distribui c ao normal H1: X n ao tem distribui c ao Normal Calcula-se o valor da estat stica do teste = 2 ( )
2
com constante
=1
a determinar a partir dos dados e com recurso a uma tabela (que neste ano lectivo n ao ser a dada). Valores pequenos de indicam n ao normalidade, i.e. RC: <
Com valor cr tico a consultar na tabela. Aqui iremos utilizar o teste de Shapiro-Wilk, apenas com recurso ao valor-, para a tomada de decis ao. Rejeita-se H0 se valor , signicando que n ao se pode admitir que tem distribui c ao normal; Se valor > n ao se rejeita H0 , o que signica que a distribui c ao normal e uma distribui c ao poss vel para X.
146
Exerc cios propostos 1. Suponhamos que se pretende comparar, numa mesma regi ao, as produ c oes leiteiras de duas ra cas bovinas e que se escolheu com esse objectivo, aleat oria e independentemente, uma amostra de 50 animais de cada ra ca. Se obtivermos para cada uma das amostras rendimentos m edios de 1 = 4360 kg e 2 = 4190 kg, deve-se admitir que existe realmente uma diferen ca entre as duas ra cas? Justique a resposta. 2. Um fabricante de sacos de pl astico vende os sacos, a peso, em lotes de 100. Cada lote deveria ter um peso de 500 gr. Recolhida uma amostra de 20 lotes de sacos, observaram-se os seguintes valores: = 502.5 = 4.31.
Diga se e de admitir que o peso m edio dos sacos e efectivamente 500 gr. 3. Pretende-se comparar dois m etodos para determinar a percentagem de magn esio existente num composto qu mico. Para isso foram submetidos ` aqueles m etodos dez compostos diferentes, tendo-se obtido os seguintes resultados: no de composto M etodo A M etodo B 1 2 3 4 5 6 7 13.3 17.6 4.1 17.2 10.1 3.7 5.1 13.4 17.9 4.1 17.0 10.3 4.0 5.1 8 9 10 7.9 8.7 11.6 8.0 8.8 12.0
Haver a diferen ca signicativa entre os dois m etodos, a um n vel de signic ancia de 5%? 4. Para controlar a qualidade dos lotes de um dado produto que vai ser vendido a peso, produzidos numa linha de fabrico, decidiu-se usar o seguinte esquema: recolher uma amostra e dimens ao , de cada lote e calcular a m edia , dos pesos das embalagens; se > aceitar o lote. se rejeitar o lote;
Decidiu-se ainda que, se a verdadeira m edia do peso das embalagens no lote () for inferior ou igual a 5.3 a probabilidade de rejeitar o lote deve ser pelo menos 99% e, se for superior ou igual a 5.5 a probabilidade de aceitar o lote deve ser pelo menos 90%. Admita que o desvio padr ao do peso, em cada lote, e de 0.2. Calcule o valor de e o menor valor de requerido por este esquema de amostragem. Justique.
147
Refer encias bibliogr acas Bhattacharyya, G.K. and Johnson R.A.(1977), Statistical Concepts and Methods, John Wiley & Sons Inc. Dagnelie, P.(1973), Estat stica, Teoria e M etodos, trad. do Prof. Doutor A. St.Aubyn, Europa Am erica, vol I e II. Walpole, R.E (1993), Mathematical Statistics, 3th edition, Englewood Clis, N.J., Prentice-Hall. Milton, J.S. and Arnold, J.C. (1987), Probability and Statistics in the Engineering and Computing Sciences, Mc Graw Hill. Mood, A. Graybill, F. and Boes D. (1985). Introduction to the Theory of Statistics , Mc Graw Hill. Murteira, B. (1990), Probabilidades e Estat stica (vol I), Mc Graw Hill. Murteira, B., Ribeiro, C.S., Silva, J.A. e Pimenta C.(2002), Introdu c ao ` a Estat stica, Mc Graw Hill. Pestana, D.D. e Velosa, S.F. (2008), Introdu c ao ` a Probabilidade e ` a Estat stica 3 edi ca o. Funda c ao Calouste Gulbenkian.
148

WWW - Isa.utl - PT DM Estat Estat Seb3

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

WWW - Isa.utl - PT DM Estat Estat Seb3

Uploaded by

Copyright:

Available Formats

3.

A ` INFERENCIA INTRODUC AO ESTATISTICA

No c oes preliminares sobre estima c ao

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Distribui c oes de amostragem

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

dado que a u ltima parcela e nula. Portanto podemos escrever

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Par ametros da distribui c ao ( > 2). 2

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Sabemos ainda que as vari aveis aleat orias

como ( 1 2 ) ( 1 2 ) 1 1 2 ( + ) 1 2 = 2 2 (1 1)1 + (2 1)2 2 (1 + 2 2) ( 1 2 ) ( 1 2 )

costume designar por E

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Exerc cio 3.1 Seja () . Prove que 2 (1,) .

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

e como s ao vari aveis independentes, tem-se atendendo ` a deni c ao (3.4) da distribui c ao ,

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

sendo a estimativa obtida a partir de uma amostra concreta (1 , ..., ), ==

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

logo 2 e um estimador centrado de 2 .

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Estima c ao por intervalos

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

(/2 < < /2 ) = 1 ( 1 2 ) ( 1 2 ) < /2 = 1 /2 < 1 1 1 + 2

donde, ap os pequenos c alculos se tem

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Como /2(20) ent ao

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

donde o intervalo de conan ca a 95% e

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Vimos, teorema 3.7, que a vari avel aleat oria

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

. Portanto ( ) / , = (0, 1) (3.34)

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Testes de hip oteses

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

A formula c ao matem atica das hip oteses e ent ao a seguinte: 0 : 0

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Habitualmente adopta-se como regra de decis ao: rejeitar H0 se p-value .

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves

Introdu c ao ` a Estat stica e ` a Probabilidade - ISA(2009) - Manuela Neves