You are on page 1of 86

5 - Testes de hipteses

5.1 - Introduo

Neste captulo, vamos discutir as idias fundamentais sobre testes de hipteses. Ao ser feita determinada afirmao sobre uma populao, mais especificamente sobre um parmetro dessa populao, natural desejar saber se os resultados experimentais provenientes de uma amostra contrariam, ou no, tal afirmao. Para isso, fazemos um teste de hipteses. Nesta seo vamos estudar o procedimento bsico de teste de hiptese sobre determinado parmetro de uma populao. Vamos supor uma situao em que um fabricante quer saber se um determinado tipo de barra produzido por sua fbrica atende a exigncia de ter um comprimento mdio de 70 cm. Na verdade, o que o fabricante est fazendo levantando hipteses sobre uma caracterstica (parmetro), neste caso a mdia (mdia do comprimento), de sua produo (populao) de barras. Eventualmente ele poderia fazer conjecturas a respeito da distribuio da varivel comprimento de barra, ou ainda, poderia estar questionando a proporo de defeituosas, etc. Essas conjecturas ou suposies so chamadas de hipteses estatsticas. De maneira genrica, podemos enunciar: hiptese estatstica uma a firmao ou conjectura sobre um parmetro, ou parmetros; pode tambm referir-se ao tipo ou natureza da populao. Uma hiptese estatstica, como a formulada acima em relao a mdia dos comprimentos das barras, chamada de Hiptese Nula e ser denotada por H0. O termo "Hiptese Nula" usado para ver se alguma hiptese estabelecida inicialmente pode ser rejeitada ou no. A idia de se estabelecer uma hiptese nula comum mesmo em um raciocnio no-estatstico. exatamente o que feito em processos criminais, onde um acusado (ru) dito ser inocente at que se prove o contrrio. A pressuposio de inocncia uma hiptese nula. Vamos supor, por exemplo, que queremos mostrar que um mtodo de fabricao to eficiente quanto outro. Para isso poderamos formular a hiptese de que os dois mtodos so igualmente eficientes e buscar evidncias (nos dados) contra ou a favor desta hiptese. A hiptese que usamos como alternativa hiptese nula, isto , a hiptese que aceitamos quando a hiptese nula rejeitada chamada Hiptese Alternativa e ser denotada por H1. Assim, considerando o exemplo do ru, formulamos as hipteses:

Observao: Alguns autores denotam H1 por HA. Agora voltemos ao exemplo introdutrio do fabricante de barras. O tal fabricante est interessado em decidir se as barras tem uma mdia igual a 70 cm ou diferente de 70 cm. Nesse caso, as hipteses seriam:

Ainda com relao a esse exemplo poderamos ter hipteses do tipo:

Em todas as situaes a hiptese nula H0 do tipo "simples", enquanto que H1 do tipo "composta" em (1), (2), (3), e do tipo "simples" em (4). Casos como as situaes (1) e (2) so chamados de testes unilaterais. Consideremos, agora, um exemplo para ilustrarmos a situao (1). Exemplo 5.1.1: Um gerente de produo est estudando a possibilidade de comprar uma nova mquina de estampar partes metlicas. Seja 0 o nmero mdio de partes estampadas por hora pela mquina velha e a mdia da mquina nova. O gerente no quer comprar a mquina nova a menos que ela seja mais produtiva que a mquina velha. Vamos encontrar as hipteses. O gerente deve usar a hiptese nula = 0 e a hiptese alternativa > 0. Ou seja,

Assim, o gerente deve optar por comprar a mquina nova somente se a hiptese nula for rejeitada. Regra de deciso: A regra de deciso nos permite distinguir entre as duas hipteses. Esta definida a partir do estimador de mxima verossimilhana do parmetro e est sempre baseada na hiptese H1. Regio de Rejeio: A regio de rejeio ou regio crtica (RC) o conjunto de valores assumidos pela estatstica de teste para os quais a hiptese nula rejeitada. Seu complementar a regio de aceitao (RA). No Exemplo 5.1.1, tomamos o estimador para o parmetro de interesse para determinarmos a regra de deciso, que definida por: rejeitamos H 0 se

, no qual XC o valor crtico para a mdia amostral. Se a mdia amostral for maior que o valor crtico XC, temos evidncia para assumir que a mdia da populao maior que 0. Assim, no caso do Exemplo 5.1.1 temos evidncia para assumir que a nova mquina apresenta uma mdia de produo maior que a mquina velha. A regio que nos leva a rejeio da hiptese H0 a regio de rejeio (ou regio crtica).

Para cada tipo de hiptese determinamos uma regio de rejeio apropriada, sempre conforme a hiptese H1. Por exemplo, para testarmos as hipteses

tomamos como regio crtica so os valores crticos para o teste.

. Os valores

Independente dos valores crticos utilizados para determinar a regio crtica, as decises que tomamos esto sujeitas a erros. Atravs da discusso destes erros, definiremos um mtodo para encontrar valores crticos apropriados.

5.1.1 - Erros cometidos nos testes de hipteses

So dois os tipos de erros que podemos cometer na realizao de um teste de hipteses:


1. Rejeitar a hiptese H0, quando ela verdadeira. 2. No rejeitar a hiptese H0, quando ela falsa.

A Tabela a seguir resume as situaes acima. Aceitar H0 H0 verdadeira H0 falsa Deciso correta Erro do tipo II Rejeitar H0 Erro do tipo I Deciso correta

Se a hiptese H0 for verdadeira e aceita, ou for falsa e rejeitada, a deciso estar correta. No entanto, se a hiptese H0 for rejeitada sendo verdadeira, ou se for aceita sendo falsa, a deciso estar errada. O primeiro destes erros chamado de Erro do Tipo I e a probabilidade de comet-lo denotada pela letra grega (alfa); o segundo chamado de Erro do Tipo II e a probabilidade de comet-lo denotada pela letra grega (beta). Assim temos,

Considere um teste unilateral dado pelas hipteses:

Neste caso, a regio de rejeio determinada por interpretao dos erros pode ser vista como:

, e a

A situao ideal aquela em que ambas as probabilidades, e , so prximas de zero. No entanto, fcil ver que a medida que diminuimos , aumenta. A Figura a seguir apresenta esta relao.

Para um teste de hipteses do tipo acima, onde estamos interessados em testar a mdia de uma populao, utilizamos a expresso

que a estatstica do teste de hipteses. A partir do Teorema Central do Limite, sabemos que, desde que tenhamos um tamanho amostral suficientemente grande, esta estatstica tem distribuio Normal padro, isto ,

A partir dos valores de Z e da especificao do erro cometido, podemos definir a regio crtica. Vamos considerar que o erro mais importante a ser evitado seja o Erro do Tipo I. A probabilidade de ocorrer o erro do tipo I () denominada nvel de significncia do teste. O complementar do nvel de significncia (1 - ) denominado nvel de confiana. Supondo que o nvel de significncia seja

conhecido, temos condies de determinar o(s) valor(es) crtico(s). Se considerarmos o teste bilateral

a figura a seguir representa a regio de rejeio para um valor fixo de .

Se considerarmos o teste unilateral direita

a regio crtica representada segundo a figura abaixo.

E, se considerarmos unilateral esquerda

teste

a regio crtica representada segundo a figura abaixo.

Os valores -Z e Z nas duas ltimas figuras so tais que as reas esquerda e direita, respectivamente, sob a curva Normal padro, valem . Agora, os valores -Z/2 e Z/2, na primeira figura, so tais que as reas esquerda e direita, respectivamente, sob a curva Normal padro, valem . Como foi dito inicialmente, o objetivo do teste de hiptese determinar, atravs de uma estatstica, se a hiptese nula aceitvel ou no. Essa deciso tomada considerando a regio de rejeio ou regio crtica (RC). Caso o valor observado da estatstica pertena regio de rejeio, rejeitamos H0; caso contrrio, no rejeitamos H0. Analogamente, definimos a regio de aceitao (complementar da regio de rejeio): caso o valor observado pertena regio de aceitao, no rejeitamos H0; se no pertencer, rejeitamos. Se o nvel de significncia 0,05, os valores crticos so -1,645 ou 1,645 para as alternativas unilaterais e -1,96 e 1,96 para a alternativa bilateral; se o nvel de significncia 0,01, os valores crticos so -2,33 ou 2,33 para as alternativas unilaterais e -2,575 e 2,575 para a alternativa bilateral (valores obtidos na Tabela da distribuio Normal). A tabela a seguir apresenta alguns critrios para o teste de hiptese. Hiptese Alternativa Rejeita H0 se Aceita H0 se

ou Exemplo 5.1.1.1: Um supervisor da qualidade quer testar, com base numa amostra aleatria de tamanho n = 35 e para um nvel de significncia = 0,05,

se a profundidade mdia de um furo numa determinada pea 72,4mm. O que podemos falar se ele obteve = 73,2mm e se sabe, de informaes anteriores, que = 2,1mm? 1. Primeiro vamos estabelecer as hipteses:

2. Como = 0,05, temos que

3. Critrio: rejeitar H0 se Xobs < -1,96 ou se Xobs > 1,96, onde

4. Substituindo 0 = 72,4, = 2,1, n = 35, = 73,2 na equao acima, obtemos

5. Concluso: Como Xobs = 2,25 > 1,96, a hiptese nula deve ser rejeitada. Em outras palavras, a diferena entre =73,2 e = 72,4 significativa. Veja a figura abaixo
5.1.2 - Clculo e interpretao do p-valor

P-valor

O p-valor, tambm denotado como nvel descritivo do teste, a probabilidade de que a estatstica do teste (como varivel aleatria) tenha valor extremo em relao ao valor observado (estatstica) quando a hiptese H0 verdadeira.

Para exemplificar a definio de p-valor, considere um teste de hipteses para a mdia no qual o valor da estatstica dado por , ver exemplo 5.1.1.1. As figuras a seguir representam, respectivamente, o p-valor nos casos em que temos um teste de hipteses bilateral (com rejeio da hiptese nula e sem rejeio da hiptese nula).

A seguir, temos a figura de um teste de hipteses unilateral para mdia. Na primeira das figuras, rejeitamos a hiptese nula e na segunda no rejeitamos.

Observe que se o p-valor menor que o nvel de significncia proposto ( ), o est na regio crtica e portanto, rejeitamos a hiptese nula H0. Por outro lado, se o p-valor maior que o nvel de significncia, no rejteitamos a hiptese nula (ver figura acima). Alm disso, quanto menor for o p-valor, mais "distante" estamos da hiptese nula H0. Portanto, o p-valor tem mais informaes sobre a evidncia contra H0 e assim o experimentador tem mais informaes para decidir sobre H0 com o nvel de significncia apropriado. Tambm podemos interpretar o p-valor como o menor valor do nvel de significncia para o qual rejeitamos H0. Desta forma, se o nvel de significncia ( ) proposto para o teste for menor que o p-valor no rejeitamos a hiptese H0.

Em muitas situaes, a regio de rejeio de um teste de hiptese com nvel de significncia apresenta seguinte forma: Rejeitamos se e somente se ,

em que W(X) a estatstica do teste apropriada para o problema, e a constante escolhida de modo que o teste tenha nvel de significncia . Neste caso, o p-valor para o ponto amostral definido matematicamente como

em que um parmetro pertencente ao espao paramtrico nula (H0).

sob a hiptese

Voltando ao Exemplo 5.1.1.1, vamos calcular o p-valor do teste de mdias. No decorrer deste mdulo calculamos o p-valor para todos os testes estatsticos clssicos. Neste caso, como temos um teste bilateral, segue que o p-valor dado por

Portanto, podemos concluir que, para qualquer nvel de significncia maior que 0,0244, temos evidncias para rejeitar a hiptese nula.

Detalhes do p-valor Consideremos uma regio de rejeio com nvel de significncia . Para diferentes valores de , essas regies podem ser encaixadas no sentido que

Sob essa situao, alm de conseguirmos saber se a hiptese rejeitada ou no, conseguimos ainda determinar o p-valor, que aqui definido matematicamente por

Exemplo: Suponhamos que uma varivel aleatria com distribuio , com conhecido.Consideremos sob , e sob , ,para algum . Seja denotado a funo densidade de probabilidade da normal padro e o quantil da distribuio normal padro. Ento, a regio de rejeio pode ser denotada como

Dessa maneira, para um valor observado de que a ltima desigualdade se mantm

dado, o nfimo sobre todos em

Alternativamente, podemos escrever que o p-valor , em que o valor obeservado de . Notemos ainda que sob a hiptese nula, , a distribuio de dada da seguinte maneira:

pois uniformemente distribudo sobre , portanto uniformemente distribudo em . Esse resulatado segue da transformao integral de probabilidade (probability integral transformation), que garante que : Se tem uma funo de distribuio contnua distribudo sobre . , ento uniformemente

O Lema a seguir traz uma propriedade geral do p-valor. Lema: Suponhamos que tem distribuio de probabilidade , para algum . Consideremos , em que representa o espao paramtrico sob a hiptese nula . Assumimos ainda que as regies de rejeio satisfazem

i) Se

ento a distribuio de sobre

satisfaz

Prova: Se que para

, pela definio do p-valor, todo , Assim, escrevendo

que

, temos implica em

como ii) Se, para

vlido, segue que ,

ento

ou seja,

uniformemente distribudo sobre

Prova: Novamente pela definio do p-valor, temos que se . Dessa forma, segue que

ento

Assim, por conclumos que

temos que . Do resultado obtido em (i), ou seja, tem distribuio uniforme .

Passos para realizao do teste de hipteses


1. Estabelecer as hipteses;

2. Determinar o nvel de significncia do teste (); 3. Determinar a regio de rejeio; 4. Calcular o p-valor A seguir, vamos aplicar os conceitos discutidos acima para tratar diversos exemplos de testes de hipteses.

5.1.3 - Poder do teste

Seja T um teste estatstico com regio crtica C para avaliarmos hipteses a respeito do parmetro . A funo poder do teste a probabilidade de rejeitarmos H0 dado o valor de . Neste caso, temos que

para todo valor de . Suponha que queremos testar a hiptese H0 : = 0 contra a hiptese alternativa H1 : 0. De forma ideal, ns gostaramos de rejeitar a hiptese H0 para todo valor de em H1 com probabilidade 1, e da mesma forma, ns gostaramos de aceitar (no rejeitar) a hiptese H0 para todo valor de em H0 com probabilidade 1 (figura a seguir).

O Poder do Teste tem como objetivo conhecer o quanto o teste de hipteses controla um erro do tipo II, ou qual a probabilidade de rejeitar a hiptese nula se realmente for falsa. Na prtica, importante que se tenham testes com nvel de significncia prximos do nvel de significncia nominal e que o poder seja alto, mesmo em situaes de amostras pequenas. O poder de um teste de hipteses afetado por trs fatores:

Tamanho da amostra: Mantendo todos os outros parmetros iguais, quanto maior o tamanho da amostra, maior o poder do teste. Nvel de Significncia: Quanto maior o nvel de significncia, maior o poder do teste. Se voc aumenta o nvel de significncia, voc reduz a regio de aceitao. Como resultado, voc tem maior chance de rejeitar

a hiptese nula. Isto significa que voc tem menos chance de aceitar a hiptese nula quando ela falsa, isto , menor chance de cometer um erro do tipo II. Ento, o poder do teste aumenta.

O verdadeiro valor do parmetro a ser testado: Quanto maior a diferena entre o "verdadeiro" valor do parmetro e o valor especificado pela hiptese nula, maior o poder do teste.

Novamente, consideremos a estatstica

e o teste de hipteses

O Erro do tipo II o erro cometido ao aceitar a hiptese nula H0 quando esta falsa (H1 verdadeira). P[Erro do tipo II] = P[aceitar H0 | H1 verdadeira] = Para que isto seja possvel, suponha que a hiptese nula falsa e que o verdadeiro valor da mdia = 0 + . Ento, a estatstica do teste

Portanto, a distribuio de

quando

E, com isso, para um teste bilateral, temos que a probabilidade de erro do tipo II a probabilidade de que esteja entre e dado que verdadeira. Esta probabilidade calculada da seguinte maneira

onde a funo distribuio acumulada da distribuio normal padro. Para os testes unilaterais direita e esquerda, temos que as probabilidades de erro do tipo II so dadas, respectivamente por

O Poder do Teste calculado como: 1 menos a probabilidade do erro do tipo II, ou seja, 1 - . Neste caso, as frmulas utilizadas para o clculo do poder so

se o teste bilateral. Se o teste unilateral esquerda a frmula utilizada

e se unilateral direita, ento

onde a funo distribuio acumulada de uma varivel aleatria Normal padro. Considere novamente o Exemplo 5.1.1.1. Suponha que queiramos calcular o poder do teste de hipteses em detectar uma diferena = 1 entre as hipteses nula e alternativa. Como n = 35, = 0,05 e = 2,1, temos que a probabilidade de erro do tipo II dada por

Deste modo, temos que o poder P do teste de hipteses em detectar uma diferena = 1 entre as hipteses nula e alternativa dado por

portanto, o poder do teste de hipteses em detectar uma diferena = 1 entre as hipteses nula e alternativa de, aproximadamente, 80,43%.

5.2 - Teste para mdia

Considere uma populao da qual retiramos uma amostra X1, X2, ..., Xn. Estamos interessados em realizar inferncia sobre a mdia populacional .

Se no conhecemos o valor do desvio padro populacional e a amostra pequena, n < 30, devemos subtituir a expresso

pela expresso

onde T tem distribuio t de Student com n-1 graus de liberdade. Para facilitar a execuo do teste, podemos seguir os passos: 1. Estabelecer as hipteses: Fixamos H0: = 0. Dependendo da informao que fornece o problema que estivermos estudando, a hiptese alternativa pode ter uma das trs formas abaixo:

H1: 0 (teste bilateral); H1: > 0 (teste unilateral direita); H1: < 0 (teste unilateral esquerda).

2. Fixar o nvel de significncia . 3. Determinar a regio crtica. Se o teste bilateral, determinamos os pontos crticos n-1 graus de liberdade. e tais que

a partir da distribuio t de Student com

Se o teste unilateral, determinamos o ponto crtico

tal que

Se o teste unilateral esquerda, determinamos o ponto .

tal que

4. Calcular, sob a hiptese nula, o valor:

onde

: valor da mdia amostral. 0: valor da mdia populacional sob a hiptese nula. s: valor do desvio padro amostral. n: tamanho da amostra.

5. Critrio:

Teste bilateral: se contrrio, aceitamos H0.

ou se

, rejeitamos H0. Caso

Teste unilateral direita: se aceitamos H0. Teste unilateral esquerda: se contrrio, aceitamos H0.

, rejeitamos H0. Caso contrrio, , rejeitamos H0. Caso

6. O p-valor no teste bilateral dado por

Se o teste unilateral direita, o p-valor dado por

e, se o teste unilateral esquerda, o p-valor dado por

7. Como vimos na Seo 4.1.2 o intervalo de confiana dado por

se o teste bilateral. Se o teste unilateral direita, ento o intervalo de confiana para o parmetro dado por

e, se o teste unilateral esquerda, ento o intervalo de confiana para o parmetro dado por

8. O Erro do tipo II cometido ao aceitar H0 quando esta falsa (H1 verdadeira).

Para isto, suponha que a hiptese nula falsa e que o verdadeiro valor da mdia = 0 + . Ento, a estatstica do teste

que pode ser escrita na forma

Como

segue que T0 tem distribuio t no central com parmetro de no-centralidade e n - 1 graus de liberdade. Ento, temos que para o teste bilateral, a probabilidade de erro do tipo II a probabilidadfe de T0 estar entre e isto ,

e, para os casos unilaterais direita e esquerda, as probabilidades de erro do tipo II so dadas, respectivamente, por

onde

a funo distribuio acumulada da varivel aleatria t no central e graus de liberdade.

com parmetro de no-centralidade

9. O poder do teste calculado como 1 menos a probabilidade de erro do tipo II, ou seja, 1 - . Podemos tambm utilizar o software Action para calcular o poder (dado o tamanho amostral) ou o tamanho amostral necessrio para detectar determinada diferena, com um poder previamente especificado. No Action, temos como parmetros o tamanho da amostra (n), a diferena entre as hipteses nula e alternativa (), o valor do poder (P), o nvel de signi

cncia do teste () e o desvio-padro (). Para calcular o poder, fornecemos os valores de n, , e . As frmulas utilizadas so

se o teste bilateral. Se o teste unilateral esquerda, ento

e se o teste unilateral direita, ento

onde a funo distribuio acumulada da varivel t no central com n - 1 graus de liberdade e parmetro de no-centralidade . J para o clculo do tamanho da amostra necessria para que o teste detecte uma diferena pr-determinada entre as hipteses nula e alternativa, com um determinado poder, basta lanarmos os valores da diferena , do desviopadro , do nvel de signicncia e do poder P. Com isso, o Action nos fornece o valor do tamanho amostral n. As frmulas utilizadas para cada teste so as mesmas acima, basta resolv-las isolando n. Exemplo 5.2.1: Um engenheiro de produo quer testar, com base nos dados da tabela a seguir, e para um nvel de significncia = 0,05, se a altura mdia de uma haste est prxima do valor nominal 1055 mm. Uma amostra de 20 hastes foi analisada as medidas obtidas so dadas a seguir. 903,88 1020,70 934,52 860,41 936,78 1036,92 915,38 1214,08 1039,19 1086,98 1098,04 1014,53 993,45 950,38 1144,94 1011,26 1097,79 1120,19 941,83 1066,12

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Usando o software Action temos os seguintes resultados:

Para entender como executar essa funo do Software Action, voc pode consultar o manual do usurio. A partir dos dados, temos que = 1019,37 e s = 91,37. Para = 0,05 e n = 20 temos, pela tabela da distribuio t de Student que = 2,093. Com isso, rejeitamos H0 se tobs < -2,093 ou se tobs > 2,093, onde

Substituindo 0 = 1055, = 1019,37, n = 20 e s = 91,37 na equao obtemos:

Assim, como tobs maior que -2,093 e menor que 2,093, a hiptese nula no deve ser rejeitada. Em outras palavras, a diferena entre =1019,37 e = 1055 no significativa.

O p-valor dado por

Como = 1019,37, s = 91,37, n = 20 e = 0,05, o intervalo de confiana dado por

Usando o software Action temos os seguintes resultados:

Para entender como executar essa funo do Software Action, voc pode consultar o manual do usurio. Para calcular o poder do teste em detectar uma diferena = 35,63, utilizamos o software Action. Neste caso, temos como valores n = 20, = 35,63, = 0,05, desvio-padro = s = 91,37 e tipo do teste bilateral. Ento, lanando esses valores no Action, nos fornecido o resultado do poder P = 0,38069. Os resultados calculados e o grfico so dados a seguir

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Poder do teste 0,380692

N 20

Diferena 35,63

Nvel de significncia 0,05

Desvio 91,37

Hiptese Bilateral

Suponha que neste exerccio queremos calcular o tamanho da amostra necessrio para garantir a rejeio da hiptese nula com probabilidade no mnimo 0,9 quando a diferena entre o valor verdadeiro da mdia e seu valor hipottico no mximo 35,63, dado um desvio padro = s = 91,37. Para resolver este problema, utilizamos o Action, fornecendo os valores = 0,05, = 35,63, = 91,37 e P = 0,9. Como resultado temos n = 72. Os resultados calculados e o grfico so dados a seguir Poder do teste 0,90385 N 72 Diferena 35,63 Nvel de significncia 0,05 Desvio 91,37 Hiptese Bilateral

5.3 - Teste para proporo

Vamos considerar uma populao em que a proporo de indivduos portadores de certa caracterstica p. Definimos a varivel X como sendo 1 se o indviduo tiver a caracterstica e 0 (zero) caso contrrio. Assim, temos que X Bernoulli(p). Retiremos uma amostra X1, ..., Xn desta populao. Cada Xi, com i = 1, ..., n, tem distribuio de Bernoulli(p), isto ,

com mdia p e varincia p(1-p).

Para um teste de propores, utilizaremos as seguintes abordagens: Teste para proporo utilizando o teorema central do limite, teste qui-quadrado de Pearson e binomial exata.
5.3.2 - Teste qui-quadrado de Pearson

Aproximao Normal
Este outro tipo de teste assinttico para uma proporo. Consideremos, como no caso anterior, uma amostra aleatria simples X1, ..., Xn onde cada Xi, com i = 1, ..., n, tem distribuio de Bernoulli(p), isto ,

Se n suficientemente grande, a estatstica de Pearson, dada por

tem distribuio Qui-Quadrado com 1 grau de liberdade, onde O1 o nmero de sucessos e E1 = np a frequncia esperada relativa ao nmero de sucessos, O2 = n - O1 e E2 = n(1 - p), onde n = O1 + O2 o tamanho da amostra. Lembramos que uma distribuio qui-quadrado com 1 grau de liberdade igual a uma distribuio normal padronizada ao quadrado, ou seja, se Z N(0,1), ento

Neste caso, se y tal que P[

> y] = , ento como

= Z2, temos que

ou seja,

Desta forma, podemos realizar o teste utilizando a distribuio normal padro ao invs da qui-quadrado, o que mais vantajoso, j que podemos considerar a sua simetria. Vamos ver os passos para realizar o teste Qui-Quadrado de Pearson. 1. Estabelecer as hipteses

se o teste for bilateral,

se o teste unilateral direita ou

se o teste unilateral esquerda 2. Fixar o nvel de significncia . 3. Determinar a regio crtica.

Teste bilateral.

Se o teste bilateral, devemos encontrar um ponto crtico da distribuio , baseado nos pontos crticos da distribuio normal padro Z. Os pontos crticos da distribuio normal padro so e .

Como Z2 =

, temos que

Portanto, o ponto crtico da distribuio qui-quadrado com um grau de liberdade .

Testes unilaterais.

Se o teste unilateral direita ou a esquerda, devemos determinar o ponto crtico da distribuio baseado nos pontos crticos da distribuio normal padro Z. Os pontos crticos para a distribuio normal Z so dados por para o teste unilateral esquerda ou para o teste unilateral direita.

Para o caso unilateral esquerda, como Z2 =

, ento temos que

e, no caso unilaterl direita, temos que

Portanto, o ponto crtico da distribuio qui-quadrado com um grau de liberdade Z2. Podemos observar tambm que

4. Calcular, sob a hiptese nula, a estatstica de Pearson

5. Critrio

Se o teste bilateral e rejeitamos H0.

, rejeitamos H0. Caso contrrio, no

Se o teste unilateral esquerda temos duas possibilidades:

1. Se O1 E1 e

rejeitamos H0, caso contrrio, no rejeitamos H0. . .

2. Se O1 > E1 ento no rejeitamos H0, qualquer que seja o valor de

Se o teste unilateral direita tambm temos duas possiblidades: rejeitamos H0, caso contrrio, no rejeitamos H0.

1. Se O1 < E1 ento no rejeitamos H0, qualquer que seja o valor de 2. Se O1 E1 e

6. O p-valor determinado por

se o teste bilateral,

se o teste unilateral esquerda ou

se o teste unilateral direita. Podemos calcular o poder do teste ou o tamanho amostral necessrio para se obter determinado poder utilizando o Action. Os parmetros utilizados pelo Action so o tamanho da amostra (n), as propores (p0) da hiptese nula e (p) da hiptese alternativa, os graus de liberdade (df), o valor do poder (P) e o nvel de significncia (). Para o clculo do poder, a frmula utilizada

tal que a funo densidade acumulada da distribuio Qui-quadrado nocentral com df graus de liberdade e parmetro de no centralidade dado por

onde p0i so as probabilidades sob a hiptese nula e p1i as probabilidades sob a hiptese alternativa, satisfazendo

Exemplo 5.3.2.1: Resolver o Exemplo 5.3.1.1 utilizando o teste qui-quadrado de Pearson.

clique aqui para efetuar o download dos dados utilizados nesse exemplo

1. Estabelecemos as hipteses

2. Fixemos o nvel de significncia = 0,05. 3. Como = 0,05, -Z = -1,6448. Desta forma, temos que -Z2 = 2,7055. 4. Temos que O1 = 175 e, sob a hiptese nula, p0 = 0,9. Logo E1 = 0,9 x 200 = 180. Alm disso, O2 = 25 e E2 = 0,1 x 200 = 20. Assim,

5. Concluso: como O1 E1 e Q2obs = 1,3889 < 2,7055 no rejeitamos H0. Portanto, temos evidncias de que a afirmao do fabricante verdadeira.

6. O p-valor dado por

Para entender como executar essa funo do Software Action, voc pode consultar o manual do usurio.

Aproximao normal com correo de continuidade


Ao aplicar o Teste Qui-Quadrado de Pearson estamos, novamente, aproximando uma distribuio discreta por uma contnua. Assim, sugere-se uma correo de continuidade, neste caso tambm chamada de correo de Yates. Os passos para a realizao deste teste so anlogos aos do caso anterior, com uma nica diferena: se o valor Q2 for maior que o valor crtico substituiremos a equao

pela sua correo Q2c dada por

Observaes: 1) Evidentemente, no preciso usar a correo de Yates se o valor obtido Q2 for menor que ponto crtico, pois o novo valor ser menor que o primeiro, continuando a no ser significativo. 2) A ideia aqui tambm evitar que a rejeio de H0 seja resultante da aproximao feita, o que poderia ocorrer eventualmente quando Q2obs fosse bastante prximo do valor crtico. Exemplo 5.3.2.2: Consideremos que de 75 peas, 12 so defeituosas. O fabricante garante que 90% dessas peas esto de acordo como as especificaes exigidas. Ao nvel de 5% de significncia, podemos falar que vlida a afirmao do fabricante? (Resolva utilizando a correo de continuidade.) 1. Estabelecemos as hipteses

2. Fixemos o nvel de significncia = 0,05. 3. Como = 0,05, Z2 = 2,7055. 4. Temos que O1 = 63 e, sob a hiptese nula, p0 = 0,9. Logo, E1 = 0,9 x 75 = 67,5. Alm disso, O2 = 12 e E2 = 0,1 x 75 = 7,5. Assim,

Como Q2 > 2,7055, calculamos Qc2.

5. Concluso: como Q2c = 2,3703 < 2,7055 no rejeitamos H0. Portanto, temos evidncias de que a afirmao do fabricante verdadeira. Observaes: 1) Conforme vimos na Observao 1 acima, se revolvermos o Exemplo 5.3.2.1 utilizando a correo de continuidade no rejeitamos a hiptese nula. 2) Realizando o Exemplo 5.3.2.2 sem utilizar a correo de continuidade, obtemos

e, como Q2 = 3 > 2,7055 rejeitamos H0, ao contrrio do teste com correo. Assim, realizando o teste com a correo de continuidade, evitamos a rejeio de H0, que ocorreu no teste sem a correo por causa da aproximao assinttica.

5.3.3 - Teste binomial exata

Consideremos, como nos casos anteriores, uma amostra aleatria simples X1, ..., Xn onde cada Xi, com i = 1, ..., n, tem distribuio de Bernoulli(p), isto ,

Consideremos

Neste caso, Y uma varivel aleatria com distribuio Binomial(n,p). O teste de propores binomial exata um teste de propores composto das seguintes etapas: 1. Para os testes bilateral e unilaterais esquerda e diretia estabelecemos uma das seguintes hipteses, respectivamente.

2. Fixamos o nvel de significncia . 3. Determinamos a regio crtica.

Se o teste bilateral, determinamos os valores t1 e t2 na tabela da distribuio Binomial tais que . . . Se o teste unilateral esquerda, determinamos o valor t na tabela da distribuio Binomial tal que Se o teste unilateral direita, determinamos o valor t na tabela da distribuio Binomial tal que

4. Determinar a estatstica Y = nmero de sucessos. 5. Utilizamos os seguintes critrios para rejeitar ou no o teste de hipteses:

Se o teste bilateral e Y > t2 ou Y < t1 rejeitamos H0. Caso contrrio, no rejeitamos H0. Se o teste unilateral esquerda e Y < t, rejeitamos H0. Caso contrrio, no rejeitamos H0. Se o teste unilateral direita e Y > t, rejeitamos H0. Caso contrrio, no rejeitamos H0.

6. O p-valor dado por

Exemplo 5.3.3.1: Um industrial afirma que seu processo de fabricao produz 90% de peas dentro das especificaes. Deseja-se investigar se este processo de fabricao ainda est sob controle. Uma amostra de 15 peas foi analisada e foram constatadas 10 peas dentro das especificaes. Ao nvel de 5% de significncia, podemos dizer ser verdadeira essa afirmao?
clique aqui para efetuar o download dos dados utilizados nesse exemplo

1. As hipteses a serem testadas so

2. fixar o nvel de significncia = 0,05. 3. Determinar a regio crtica. Neste caso, determinar o valor t, tal que P(X t) , tendo p0 = 0,9 e n = 15. Desta forma, temo que, t = 11. 4. A estatstica Y = nmero de sucessos igual a 10. 5. Concluso: como Y = 10 < 11 = t rejeitamos H0. Assim, h evidncias de que a afirmao no verdadeira. 6. O p-valor dado por

Usando o software Action temos os seguintes resultados:

5.4 - Teste para taxa

Consideremos uma populao e X uma varivel aleatria que representa determianda caracterstica desta populao com distribuio de Poisson com parmetro . Retiremos uma amostra aleatria X1, ..., Xn desta populao. Cada Xi, i = 1, ..., n, tem distribuio de Poisson com parmetro , isto ,

Como

um estimador de mxima verossimilhana para , ento, utilizando o Teorema Central do Limite, temos que

o que implica que

Agora vamos ver os passos para se realizar o teste para taxa: 1. Estabelecer as hipteses. Fixemos H0: = 0. Dependendo da informao que fornece o problema que estivermos estudando, a hiptese alternativa pode ter uma das trs formas abaixo:

H1: 0 (teste bilateral); H1: > 0 (teste unilateral direita); H1: < 0 (teste unilateral esquerda).

2. Fixar o nvel de significncia . 3. Determinar a regio crtica.

Se o teste bilateral, determinamos os pontos crticos que

tais

Se o teste unilateral direita, determinamos o valor crtico

tal que

Se o teste unilateral esquerda, determinamos o valor crtico que

tal

4. Calcular, sob a hiptese nula, o valor

5. Critrio:

Teste bilateral: Se contrrio, aceita-se H0. Teste unilateral direita: Se aceita-se H0.

ou se

, rejeita-se H0. Caso , rejeita-se H0. Caso contrrio, , rejeita-se H0. Caso

Teste unilateral esquerda: Se contrrio, aceita-se H0.

6. O p-valor dado por

no caso bilateral. No caso unilateral direita determinado por

e no caso unilateral esquerda, por

7. Como vimos na Seo 4.3 , o intevalo de confiana para o parmetro dado por

se o teste bilateral. Caso o teste seja unilateral direita, ento o intervalo de confiana para o parmetro dado por

e se o teste unilateral esquerda, ento o intervalo de confiana para o parmetro dado por

8. O erro do tipo II calculado ao se aceitar H0 quando esta falsa (H1 verdadeira).

9. O poder do teste calculado por: 1 menos a probabilidade de erro do tipo II, ou seja

Como trata-se de um teste normal, para o clculo do poder ou do tamanho amostral, utilizamos as mesmas tcnicas utilizadas para o teste para a mdia com varincia conhecida, ou seja, no Action, se queremos calcular o poder do teste, lanamos como parmetro o tamanho da amostra (n), a diferena (), o nvel de significncia () e o desvio-padro (). Analogamente, podemos calcular o tamanho amostral necessrio para que o teste detecte uma diferena especfica com determinado poder. Exemplo 5.4.1: O gerente de produo de uma empresa tem como objetivo avaliar a performance de uma nova metodologia de ensino para novos operrios contratados. Com a metodologia antiga, tem-se uma taxa mdia de 4 erros por operrio na primeira semana de trabalho. Em uma amostra de 25 operrios foi aplicada a nova metodologia e observou-se que a mdia foi de 5 erros por semana. Com essas informaes podemos falar que h diferena significativa entre a antiga e a nova metodologia?

clique aqui para efetuar o download dos dados utilizados nesse exemplo

1. Primeiro, vamos estabelecer as hipteses:

uma vez que estamos querendo testar se a nova metodologia melhor que a antiga, isto , se ela possui uma taxa mdia de erros menor que a antiga. 2. Fixemos o nvel de significncia = 0,05. 3. Como = 0,05 , 4. Temos que = 5 e, sob a hiptese nula, . . Assim,

5. Concluso: como Zobs = 2,5 > -1,64, no rejeitamos H0. Assim, no temos evidncias de que a taxa mdia de erros da nova metodologia menor que a antiga.

6. Vamos agora calcular o p-valor:

7. Como n=25, = 5 e por

= 1,64, temos que o intervalo de confiana dado

Para entender como executar essa funo do Software Action, voc pode consultar o manual do usurio. Utilizando o software Action, vamos calcular o poder do teste em detectar uma diferena = -1. Como o desvio padro = 2, o tamanho da amostra n = 25 e o nvel de significncia = 0,05, temos os seguintes resultados.

O grfico mostrado na figura abaixo

5.6 - Teste para comparao de duas varincias

Suponha que queremos comparar as varincias 12 e 22 de duas populaes Normais independentes. Para isso, retiramos uma amostra aleatria X1, X2, ..., Xn1 da populao 1, com distribuio N(1, 12), e uma amostra Y1, Y2, ..., Yn2 da populao 2, com distribuio N(2, 22). Como vimos anteriormente,

onde s12 a varincia amostral da populao 1 e s22 a varincia amostral da populao 2. Neste caso, a expresso F definida por

tem distribuio F de Snedecor com n1 - 1 graus de liberdade no numerador e n2-1 graus de liberdade no denominador, a qual denotamos por F(n1-1;n2-2). Para executar o teste, podemos realizar os seguintes passos: 1. Estabelecer uma das seguintes hipteses

que so equivalentes s hipteses

2. Fixar o nvel de significncia . 3. Determinar a regio crtica.

Se p teste bilateral, devemos determinar os pontos crticos

da distribuio F com n1 - 1 graus de liberdade no numerador e n2 - 1 graus de liberdade no denominador usando a tabela da distribuio Fisher-Snedecor de modo que .

Se o teste unilateral direita, determinamos o ponto .

tal que

Se o teste unilateral esquerda, determinamos o ponto .

tal que

4. Calcular, sob a hiptese nula, o valor

5. Critrio:

Teste bilateral: Se contrrio, no rejeitamos H0.

ou

devemos rejeitar H0, caso devemos rejeitar H0. Caso devemos rejeitar H0. Caso

Teste unilateral esquerda: Se contrrio, no rejeitamos H0. Teste unilateral direita: Se contrrio, no rejeitamos H0.

6. O p-valor dado por

no teste bilateral. J no teste unilateral direita, o p-valor dado por

e, no teste unilateral esquera, o p-valor dado por

7. O intervalo de confiana para a razo entre as varincias, como vimos na Seo 4.5, dado por

se o teste bilateral. Caso o teste seja unilateral direita, ento o intervalo de confiana para a razo entre as varincias dado por

e, se o teste unilateral esquerda, ento o intervalo de confiana para a razo entre as varincais dado por

Exemplo 5.6.1: Um analista da qualidade quer avaliar se existe diferena entre as variabilidades na produo de eixo comando desenvolvido por dois sistemas de usinagem. A Tabela a seguir apresenta as medies de duas populaes independentes com distribuio Normal. Podemos dizer que as varincias de ambas so iguais? Sistema de usinagem 1 18,7997 20,5035 18,6214 19,9192 21,117 20,8353 17,527 17,078 17,6197 18,7545 19,2026 18,4187 20,7641 21,0553 17,5905 18,7561 18,9772 20,3084 19,1688 19,2898 22,0590 18,5854 17,8896 Sistema de usinagem 2 21,1609 26,1371 21,4737 30,9934 22,8421 24,4133 20,4137 25,5475 21,8791 24,7531 25,7219 22,6389 26,2308 26,7998 28,4708 26,9941 25,1489 24,6179 25,0589 22,1119 20,3069 23,6758 27,1201 29,6136 25,9948 18,223 23,7336

21,4255

18,8988

22,6706

27,0194

22,4208

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Da amostra 1, temos que

Da amostra 2, temos que

Vamos estabelecer as hipteses

Fixemos o nvel de significncia = 0,05. Como s1 = 1,36 e s2 = 2,89 temos que

Observando a tabela da distribuio Fisher-Snedecor com 24 graus de liberdade no numerador e 29 no denominador temos que F(24;29;0,975) = 2,154 e F(24;29;0,025) = 0,451. Como Fobs = 0,223 < F(24;29;0,025) = 0,451, rejeitamos H0. Agora vamos calcular o P-valor

O intervalo de confiana dado por

uma vez que o teste bilateral. Veja a seguir os resultados obtidos pelo software Action.

Para entender como executar essa funo do Software Action, voc pode consultar o manual do usurio.

5.7 - Teste para comparao de duas mdias

Suponha que queremos comparar duas mdias de duas populaes independentes e ambas com distribuio Normal. Da populao 1 retiramos uma amostra aleatria X1, X2, ..., Xn1 de tamanho n1 e da populao 2 retiramos uma amostra aleatria Y1, Y2, ..., Yn2 de tamanho n2. Vamos supor que X ~ N(1,12) e Y ~ N(2,22). Assim temos que

Alm disso,

Consideramos dois casos distintos para o teste de hipteses para comparao de duas mdias. O primeiro caso em que temos as varincias das populaes desconhecidas, porm iguais e o segundo caso em que temos as varincias desconhecidas e distintas.
5.7.1 - 1 Caso: Varincias iguais, porm desconhecidas

Consideraremos agora, que as varincias das populaes so iguais, porm, desconhecidas, ou seja, 12 = 22 = 2. Ento, para testar a igualdade das mdias, vamos considerar a varivel

que tem distribuio t de Student com n1 + n2 - 2 graus de liberdade. Aqui, sp o desvio padro pooled (agrupado) que dado por

onde

s12: varincia da amostra proveniente da populao 1. s22: varincia da amostra proveniente da populao 2.

Para realizar o teste para igualdade de duas mdias com varincias iguais, porm desconhecidas, devemos realizar os seguintes passos: 1. Estabelecer uma das hipteses, por exemplo:

2. Fixar o nvel de significncia . 3. Determinar a regio crtica.

Se o teste bilateral, determinamos os pontos crticos que .

tais

Se o teste unilateral direita, determinamos o ponto crtico .

tal que

Se o teste unilateral esquerda, determinamos o ponto crtico que .

tal

4. Calcular

que o valor da varivel T sob a hiptese nula. Como

temos que

dada por

5. Critrio:

Teste bilateral: Se contrrio, no rejeitamos H0. Teste unilateral direita: Se rejeitamos H0.

ou

, rejeitamos H0. Caso rejeitamos H0. Caso contrrio, no rejeitamos H0. Caso

Teste unilateral esquerda: Se contrrio, no rejeitamos H0.

6. O p-valor determinado por

se o teste bilateral. Se o teste unilateral direita, o p-valor dado por

e se o teste unilateral esquerda, o p-valor dado por

7. Como vimos na Seo 4.6.2, se considerarmos b o nmero de graus de liberdade, ou seja, b = n1 + n2 - 2, o intervalo de confiana para a diferena de duas mdias com varincias desconhecidas, porm iguais, dado por

se o teste bilateral. No caso em que o teste unilateral direita, o intervalo de confiana dado por

e, se o teste unilateral esquerda, o intervalo de confiana ser dado por

8. O erro do tipo II calculado ao se aceitar H0 quando esta falsa (H1 verdadeira). Suponha, por exemplo que a hiptese nula falsa e que a verdadeira diferena entre as mdias = 1 - 2. Ento, analogamente ao caso de uma amostra, temos que

tem distribuio t no central, com n1 + n2 - 2 graus de liberdade e parmetro de no-centralidade

Com isso, concluimos que o erro do tipo II dado por


se o teste bilateral; se o teste unilateral direita;

se o teste unilateral esquerda.

onde a funo distribuio acumulada da distribuio t no central com n1 + n2 - 2 graus de liberdade e parmetro de no-centralidade .

9. O poder do teste calculado como 1 menos a probabilidade de erro do tipo II, ou seja,

Utilizamos o software Action para o clculo do poder (dado o tamanho amostral) ou o clculo do tamanho amostral necessrio para o teste detectar certa diferena entre as diferenas entre as mdias, com um determinado poder. No Action, temos como parmetros o tamanho da primeira amostra (n1), o tamanho da segunda amostra (n2), a diferena a ser detectada (), o poder (P), o nvel de significncia () e o desvio-padro (). Ento, para calcular o poder do teste, lanamos os valores de n1, n2, , e e nos fornecido o poder do teste. As frmulas utilizadas para o clculo do poder so

para o teste bilateral,

para o teste unilateral esquerda e

para o teste unilateral direita. Aqui a funo distribuio acumulada da distribuio t no central com n1 + n2 -2 graus de liberdade e parmetro de nocentralidade .

J para o clculo do tamanho da amostra necessria para que o teste detecte uma diferena pr-determinada entre as hipteses nula e alternativa, com um determinado poder, basta lanarmos os valores da diferena , do desviopadro , do nvel de signi

cncia e do poder P. Com isso, o Action nos fornece o valor do tamanho das amostras n = n1 = n2. As frmulas utilizadas para cada teste so as mesmas acima, basta reescrev-las isolando n. Exemplo 5.7.1.1: Para ilustrar a aplicao deste teste de hiptese, considere os dados de duas amostras apresentadas a seguir e, a um nvel de significncia = 0,05, decida se existe diferena significativa entre as mdias populacionais 1 e 2. Amostra 1 18,800 20,504 18,621 19,919 21,117 17,591 18,756 18,977 20,308 18,899 20,835 17,527 17,078 17,620 21,426 Amostra 2 22,284 21,901 25,302 22,447 22,771 22,057 22,881 17,968 23,382 21,043 22,629 22,860 24,515 22,426 21,203 24,620 22,058 23,150 22,787 24,009 21,491 22,699 24,662 21,983 21,917 21,198 22,909 23,327 24,534 21,152 19,169 19,290 22,059 18,585 17,890 18,755 19,203 18,419 20,764 21,055

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Vamos testar se as mdias das amostras 1 e 2 so iguais ou diferente, portanto 1. Estabelecemos as hipteses

que so equivalentes as hipteses

Temos a partir dos dados que a mdia e o desvio padro da amostra 1 so = 19,3267 e s1 = 1,36228, respectivamente. A mdia e desvio padro da amostra 2

so = 22,6055 e s2 = 1,43822, respectivamente. O tamanho de cada amostra n1 = 25 e n2 = 30. Com isso, temos que o desvio padro agrupado (pooled) dado por

2. Para este exemplo, fixamos o nvel de significncia = 0,05. 3. Como o teste bilateral e sabendo que o nmero de graus de liberdade b = n1 + n2 - 2 = 53, encontramos na Tabela da distribuio t de Student os seguintes valores crticos -t0,025 = -2,005 e t0,025 = 2,005. 4. Calculamos o valor da estatstica .

5. Como Tobs < -2,005, rejeitamos a hiptese nula, ou seja, rejeitamos a hiptese de que as mdias so iguais. 6. Vamos agora calcular o p-valor. Como o teste bilateral, temos que

7. J o intervalo de confiana para a diferena

dado por

ou seja,

Os resultados obtidos no Action so dados na tabela a seguir.

Para entender como executar essa funo do Software Action, voc pode consultar o manual do usurio. Vamos calcular o poder do teste ao se aceitar H0 quando esta falsa (H1 verdadeira), para uma diferena = 3,2 entre as diferenas das mdias. Faremos isso utilizando o software Action. Como n1 = 25, n2 = 30, = 0,05 e sp = 1,40434, temos que o clculo do poder dado por

Para entender como executar essa funo do Software Action, voc pode consultar o manual do usurio.

Suponha agora que queremos calcular os tamanhos das amostras necessrias para detectar uma diferena = 1,2 entre as hipteses nula e alternativa com um poder de, no mnimo, 0,9, com desvio padro 1,40434. Os resultados obtidos no Action so dados na tabela a seguir.

5.7.2 - 2 Caso: varincias desconhecidas e diferentes

Vejamos agora como realizar um teste para igualdade das mdias tendo varincias desconhecidas e diferentes (12 22). Para isto consideramos a varivel T tal que

ou seja, a varivel T dada tem distribuio t de Student com liberdade, onde

graus de

Na prtica, podemos seguir os passos 1. Estabelecer as hipteses

ou as hipteses equivalentes

2. Fixar o nvel de significncia . 3. Determinar a regio crtica.

Se o teste bilateral, devemos determinar os pontos crticos da distribuio t de Student com .

graus de liberdade tais que

Se o teste unilateral direita, determinamos o ponto crtico .

tal que

Se o teste unilateral esquerda, determinamos o ponto crtico que .

tal

4. Calcular, sob H0,

5. Concluso:

Teste bilateral: Se contrrio, no rejeitamos H0.

ou

, rejeitamos H0. Caso rejeitamos H0. Caso rejeitamos H0. Caso contrrio, no

Teste unilateral esquerda: Se contrrio, no rejeitamos H0. Teste unilateral direita: Se rejeitamos H0.

6. Temos que o p-valor dado por

se o teste bilateral. Se o teste unilateral direita o p-valor dado por

e se o teste unilateral esquerda, o p-valor dado por

onde tem distribuio t de Student com graus de liberdade. 7. O intevalo de confiana, como visto na Seo 4.6.3 dado por

se o teste bilateral. Caso o teste seja unilateral esquera, o intervalo de confiana dado por

e, se o teste unilateral direita, ento o intervalo de confiana dado por

Exemplo 5.7.3.1: Compare as mdias das amostras dadas no Exemplo 5.7.1.1, considerando que as varincias so desconhecidas e diferentes.
clique aqui para efetuar o download dos dados utilizados nesse exemplo

1. Inicialmente estabelecemos as hipteses

que so equivalentes s hipteses

A partir dos dados, temos que a mdia e o desvio padro da amostra 1 so = 19,3267 e s1 = 1,36228, respectivamente. A mdia e o desvio padro da amostra 2 so = 25,0664 e s2 = 2,37289, respectivamente. O tamanho de cada amostra n1 = 25 e n2 = 30. Com isso, temos que o grau de liberdade dado por:

2. Fixamos o nvel de significncia = 0,05. 3. Como o teste bilateral e temos graus de liberdade, segue que os pontos crticos so -t0,025 = -2,007 e t0,025 = 2.007. 4. Calculamos a estatstica .

5. Como Tobs < -2,007, podemos dizer que rejeitamos a hiptese de que as mdias so iguais. O p-valor dado por

J o intervalo de confiana

ou seja,

5.8 - Teste T pareado

Para realizarmos os testes de igualdade de varincias e os testes de mdias, precisamos que as duas populaes sejam independentes. Porm, na prtica, temos algumas situaes onde as populaes no so independentes. Numa

situao de comparao inter laboratorial onde dois laboratrios medem a mesma pea, por exemplo, as medidas entre os laboratrios no so independentes. Neste caso, utilizamos o teste T pareado. Consideremos duas amostras dependentes X1, ..., Xn e Y1, ..., Yn. Neste caso consideraremos observaes pareadas, isto , podemos considerar que temos na realidade uma amostra de pares (X1,Y1), ..., (Xn,Yn). Vamos definir Di = Xi - Yi, para i = 1, 2, ..., n. Assim obteremos a amostra D1, ..., Dn, resultante das diferenas entre os valores de cada par. Aqui, apesar das amostras serem dependentes, vamos considerar que Di ~ N(D, D2). Para realizar o teste T pareado devemos primeiramente estabelecer uma das hipteses

O parmetro D ser estimado pela mdia amostral das diferenas, ou seja, , O parmetro D2 ser estimado pela varincia amostral da diferena, ou seja,

O teste ser realizado pela expresso

que sob H0 segue uma distribuio t de Student com n - 1 graus de liberdade. Tudo o que foi dito para o teste T comum serve para o teste T pareado, basta substituir a mdia por D e o desvio padro amostral por sD. Com isto, temos que a um nvel de significncia : 1. Os pontos crticos so determinados por e para o caso bilateral, para o caso unilateral direita e para o unilateral esquerda.

2. Calculamos sob a hiptese nula, o valor

3. Critrio:

Teste bilateral: se contrrio, no rejeitamos. Teste unilateral direita: se rejeitamos H0.

ou

rejeitamos H0. Caso rejeitamos H0. Caso contrrio, no rejeitamos H0. Caso contrrio

Teste unilateral esquerda: se no rejeitamos H0.

4. O p-valor no caso bilateral dado por

Se o teste unilateral direita, o p-valor dado por

e se o teste unilateral esquerda, o p-valor dado por

5. O intervalo de confiana para o parmetro

dado por

para o caso bilateral. Se o teste unilateral direita, o intervalo de confiana para o parmetro dado por

e, se o teste unilateral esquera, o intervalo de confiana para o parmetro dado por

6. A probabilidade de erro do tipo II dada por

para o caso bilateral e, para os casos unilateria direita e esquerda, as probabilidades de erro do tipo II so dadas, respectivamente, por

onde

a funo densidade acumulada da distribuio t com n - 1 graus de

liberdade e parmetro de no-centralidade 7. Para calcular o poder do teste ou o tamanho amostral, utilizamos o software Action da mesma forma que no teste T comum. Exemplo 5.8.1: Consideremos X1, ..., X20 uma amostra de medies do laboratrio da Empresa A e Y1, ..., Y20 uma amostra de medies do laboratrio da Empresa B (tabela a seguir). Os testes dos dois laboratrios so realizados no mesmo padro, por isso, existe uma correlao entre eles, ou seja, as amostras so dependentes. Avalie a compatibilidade das medies entre o laboratrio da empresa A e do laboratrio da empresa B. Laboratrio da Empresa A (Xi) 1,00552 -1,49928 Laboratrio da Empresa B (Yi) 0,01942 -0,46512 Diferena (Di) 0,98610 -1,03416

0,21367 0,44658 0,62766 0,31091 -0,83878 -0,29054 -0,08487 -1,26465 -0,06353 -1,07632 -1,34134 -0,55062 1,61848 0,50997 0,76027 0,68061 -1,91464 -0,20072

0,53218 -0,14844 -0,60021 0,06495 0,33013 0,12116 0,74269 -1,64232 0,05497 0,76342 1,74131 -0,06392 -1,88146 -0,76135 -0,23009 -1,16800 0,88392 0,96512

-0,31851 0,59502 1,22787 0,24596 -1,16891 -0,41170 -0,82756 0,37767 -0,11850 -1,83974 -3,08265 -0,48670 3,49994 1,27132 0,99036 1,84861 -2,79856 -1,16584

clique aqui para efetuar o download dos dados utilizados nesse exemplo

Neste caso, para minimizarmos o impacto desta correlao, tomamos a diferena entre as medies dos dois laboratrios e aplicamos um teste T pareado. Temos que = -0,110499 e sD = 1,56908 ento, sob H0,

Considerando = 0,05, encontramos na tabela t de Student com 19 graus de liberdade os valores crticos -t0,025 = -2,093 e t0,025 = 2,093. Assim, como -2,093 <

Tobs < 2,093, podemos dizer que no temos evidncias para rejeitar a hiptese de que as mdias so iguais. O p-valor dado por

O intervalo de confiana dado por

Veja a seguir os resultados obtidos pelo software Action.

Para entender como executar essa funo do Software Action, voc pode consultar o manual do usurio. Vamos utilizar o Action para calcular o poder do teste em detectar uma diferena = 1,2 entre o valor real e o hipottico. Ento lanando os valores n = 20, = 1,2, = 1,56908 e = 0,05 temos como resultado P = 0,90024. A probabilidade de erro do tipo II dada por

de onde conclumos que o poder do teste em detectar esta diferena

Veja a seguir os resultados obtidos pelo software Action.

5.9 - Teste para comparao de duas propores

Consideremos X e Y variveis aleatrias que representam determinada caracterstica de duas populaes com distribuio de Bernoulli com parmetros p1 e p2 respectivamente. Retiremos duas amostras aleatrias independentes, X1, ..., Xn1 e Y1, ..., Yn2 , dessas populaes. Cada Xi, i = 1, ..., n1, e cada Yj , j = 1, ..., n2, tem distribuio de Bernoulli com parmetros p1 e p2 respectivamente, isto ,

com mdias p1 e p2 e varincias 12 = p1(1-p1) e 22 = p2(1-p2), respectivamente. As variveis e so estimadores de mxima verossimilhana para p1 e p2, respectivamente, e tem distribuio amostral aproximadamente normal:

Assim, temos que

ou seja,

Para realizarmos o teste para duas propores com aproximao Normal vamos considerar a hiptese nula p1 = p2. Assim, sob a hiptese nula, tem distribuio Normal com mdia = 0 e desvio padro

onde p = p1 = p2. Como no conhecemos o valor p, vamos estim-lo como uma mdia ponderada de e :

Este o valor que ser utilizado em lugar de p para o clculo de . Portanto, temos que

Tendo essas informaes, vejamos os passos padra se construir um teste de hipteses para duas propores: 1. Estabelecer alguma das hipteses

ou seja

2. Fixar o nvel de significncia . 3. Determinar a regio crtica.

Se o teste bilateral, devemos determinar os pontos crticos tais que .

Se o teste unilateral direita, devemos determinar o ponto crtico tal que .

Se o teste unilateral esquerda, determinamos o ponto crtico que .

tal

4. Calcular o valor de . 5. Calcular, sob a hiptese nula, o valor

6. Critrios:

Para o caso bilateral, se contrrio, aceita-se H0.

ou

, rejeita-se H0. Caso , rejeita-se H0. Caso , rejeita-se H0. Caso

Para o caso unilateral direita, se contrrio, aceita-se H0. Para o caso unilateral esquerda, se contrrio, aceita-se H0.

7. Para calcular o poder necessrio para que o teste de duas propores detecte a diferena entre as propores p1 e p2, utilizamos o software Action. O Action recebe como parmetros o tamanho da primeira amostra (n1), o tamanho

da segunda amostra (n2), as propoes (p1) e (p2), o valor do poder (P) e o nvel de significncia (). As frmula utilizadas so dadas por

para o teste bilateral,

para o teste unilateral esquerda e

para o teste unilateral direita. J para o clculo do tamanho das amostras necessrias para que o teste detecte uma diferena entre as propores p1 e p2, com determinado poder, basta lanarmos os valores das propores p1 e p2, do poder P e do nvel de significncia . Com isso, o Action nos fornece o valor dos tamanhos das amostras. As frmulas utilizadas seguem das acima, isolando n em funes dos demais parmetros. Exemplo 5.9.1: Uma empresa que presta servios de assessoria econmica a outras empresas est interessada em comparar a taxa de reclamaes sobre os seus servios em dois dos seus escritrios em duas cidades diferentes. Suponha que a empresa tenha selecionado aleatoriamente 100 servios realizados pelo escritrio da cidade A e foi constatado que em 12 deles houve algum tipo de reclamao. J do escritrio da cidade B foram selecionados 120 servios e 18 receberam algum tipo de reclamao. A empresa deseja saber se estes resultados so suficientes para se concluir que os dois escritrios apresentam diferenaa significativa entre suas taxas de reclamaes.
clique aqui para efetuar o download dos dados utilizados nesse exemplo

Primeiramente, vejamos que as propores amostrais de reclamaes sobre os sevios dos escritrios das cidades A e B so, respectivamente, = 0,88 e = 0,85. 1. Queremos testar as seguintes hipteses:

ou seja

2. Fixemos o nvel de significncia em 5%. 3. Como = 0,05, temos que 4. Como n1 = 100, n2 = 120, = -1,96 e = 0,88 e = 1,96.

= 0,85, temos que

5. Assim temos, sob a hiptese nula, que

6. Concluso: como -1,96 < Zobs = 0,645 < 1,96 no se deve rejeitar a hiptese nula de igualdade entre as propores com base nos dados amostrais obtidos. Assim, ao nvel de significncia de 5%, h evidncias de que as taxas de reclamaes sobre os servios prestados pelos escritrios da empresa nas cidades A e B so iguais. Veja a seguir os resultados obtidos pelo software Action.

Para entender como executar essa funo do Software Action, voc pode consultar

o manual do usurio. 7. Vamos calcular o poder do teste em detectar a diferena entre as propores p1 = 0,88 e p2 = 0,75. Para isto, utilizamos o software Action. Lanando os valores n1 = 100, n2 = 120, p1 0,88, p2 = 0,75, a um nvel de significncia = 0,05, nos fornecido o poder P = 0,7085. O Poder calculado a seguir:

para o teste bilateral, Os resultados calculados so dados na tabela a seguir.

6 - Testes de normalidade

Os testes de normalidade so utilizados para verificar se a distribuio de probabilidade associada a um conjunto de dados pode ser aproximada pela distribuio normal. As principais tcnicas discutidas so:

You might also like