Professional Documents
Culture Documents
The contents of this document are the sole responsibility of the authors. O contedo do presente documento de nica responsabilidade dos autores.
Anlise de Varincia
Wagner Oliveira de Araujo
waoa@bol.com.br
Resumo. Este meta-artigo descreve uma sntese da Anlise Univariada de Varincia, tcnica estatstica para determinar, com base em uma medida dependente, se vrias amostras so oriundas de populaes com mdias iguais.
1 Introduo
a) A anlise da varincia uma tcnica que pode ser usada para determinar se as mdias de duas ou mais populaes so iguais. ANalysis Of Variance (ANOVA); b) Permite determinar se as mdias de 2 ou mais populaes so iguais. c) Populao: o grupo (universo) do qual se extrai a amostra d) Amostra: parcela do grupo examinada e) Suposies: - As amostras devem ser aleatrias e independentes - As amostras devem ser extradas de populaes normais - As populaes devem ter varincias iguais, isto :
2 2 2 2 1 = 3 = 2 = . . . = k
(1)
Observaes: Mdia y=
yi
i=1 n
1 n1
(yi y)2
i=1
n i=1 (xi yi
nx y) n1
Mestrando em Sociedade, Tecnologia e Meio Ambiente Responsvel pelo texto do artigo. Orientador, Centro Universitrio de Anpolis UniEVAGLICA
Tabela 1: Dados de Quilometragem Tipos de Gasolina Observao 1 2 3 4 1 15,1 14,9 15,4 15,6 2 15,0 15,2 15,2 15,5 3 14,9 14,9 16,1 15,8 4 15,7 14,8 15,3 15,3 5 15,4 14,9 15,2 15,7 6 15,1 15,3 15,2 15,7 Mdias Amostrais 15,2 15,0 15,4 15,6 Varincias Amostrais 0,088 0,040 0,124 0,032 Tabela 2: Extrai-se uma amostra de cada populao e, para cada uma delas, calcula-se a mdia e a varincia. Populao 1 Populao 2 Populao 3 Populao k Parmetros desconhecidos 1 2 3 k 1 2 3 k Estatstica Amostral x1 x2 x3 xk s2 s2 s2 s2 1 2 3 k Duas hipteses possveis: H0 : as mdias das populaes so todas iguais (nula); H1 : as mdias das populaes no so iguais (alternativa). Se a hiptese nula for verdadeira: diferenas devidas variaes aleatrias nas amostras Caso contrrio as diferenas so muito grandes para serem causadas apenas devido a aleatoriedade Fundamentos lgicos: Se H0 verdadeira: conceitualmente idntico a uma situao em que todas as amostras tenham sido tiradas de uma nica populao Se H0 "falsa": as amostras vm de populaes com mdias diferentes (mas normais e com varincias iguais) Varincia populacional a mdia das varincias amostrais. Varincia "dentro":
2 k Sw = 1 2 3K 4 2 s1 = varincia da amostra 1 s2 = varincia da amostra 2 2 . . . s2 +s2 +s2 +s2 +...+s2
Estimativa "dentro"da varincia no afetada pela veracidade de H0 => no pode ser usada sozinha para julgar se as mdias populacionais so iguais; Estimativa "entre"da varincia sensvel s diferenas das mdias populacionais. Desvio padro da distribuio amostral : x =
x n
x => desvio padro da populao n = tamanho da amostra No conhecemos o desvio padro da distribuio amostral, neste caso, usa-se o desvio padro da distribuio da qual se extraiu a amostra; A determinao da varincia das mdias amostrais possibilita estimar a varincia da distribuio da qual se extraiu a amostra.
2 Sx =
2 Sb n
Estimativa "entre"da varincia (Sb ): Veja Tabela 1 pgina 2 Calcular a mdia das mdias amostrais: x=
2 Calcular Sx 2 Sx =
k 2 j=1 (xj x)
k j=1
xj =
= 15, 3
k1
= 0, 067
Figura 1: Teste de hiptese No nosso exemplo sabemos que Sb maior, mas no sabemos se signicativamente maior (a variao casual devida a amostragem pode ser responsvel por isso). Calculemos ento a razo F : Razo F =
2 Sb 2 Sw
O valor obtido com a estatstica comparado com uma tabela de valores F As formas da distribuio F variam de acordo com os graus de liberdade do numerador e denominador. Ver Figura 2
Figura 2: Grau de liberdade do numerador e denominador Os graus de liberdade so calculados como: Numerador: nmero de amostras menos 1 (k 1) Denominador: nmero de amostras x (tamanho da amostra -1) {k[n 1]} Exemplo:
(k1) {k[n1]}
41 4(61)
3 20
Utilizao da tabela F Representam a linha divisria entre o aleatrio e o no aleatrio; Compara-se a razo F calculada com o valor tabelado Se o valor calculado for maior que o tabelado rejeitasse a hiptese nula. Ver Figura 3
0,402 0,071
= 5, 661 5, 70
Este valor maior que o tabulado => rejeita-se H0 . Ver Figura 4 Atualmente os programas estatsticos fornecem diretamente o valor p
Tabela 3: Fontes Fonte de variao Soma de quadrados G.L. Varincia Razo F 2 k Sx 2 2 entre mdias n j=1 (xj x) k1 = Sb F = S2 w 2 dentro de amostras k(n 1) = Sw Total kn 1 k = nmero de amostras n = nmero de observaes em cada amostra nk = nmero total de observaes Nota: i se refere s linhas, e j s colunas
Tabela 4: Exemplo de tabela amostral Amostra Observaes 1 2 3 ... n1 x1 x1 x1 . . . x1 n2 x2 x2 x2 . . . x2 n3 x3 x3 x3 . . . x3 . . . . . . . . n4 . . . . n5 n6 Mdias Amostrais xn x1 xn x2 xn x3 ... ... xn xk
%Valores de Sada X = 15.1000 15.0000 14.9000 15.7000 15.4000 15.1000 14.9000 15.2000 14.9000 14.8000 14.9000 15.3000 15.4000 15.2000 16.1000 15.3000 15.2000 15.2000 15.6000 15.5000 15.8000 15.3000 15.7000 15.7000
p = 0.0058 >>
16
15.8
15.6 Values
15.4
15.2
15
Referncias
FREUND, J. E.; SIMON, G. A. Estatstica Aplicada: economia, administrao e contabilidade. 9.ed. Porto Alegre: Bookman, 1997. HAIR, J. F.; ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C. Multivariate Data Analsys. 5.ed. New Jersey-USA: Prentice-Hall, 1998. MANLY, B. J. F. Mtodos Estatsticos Multivariados: uma introduo. 3.ed. Porto Alegre: Bookman, 2005. RENCHER, A. C. Methods of Multivariate Analysis. 2.ed. Nova York: John Wiley & Sons, Inc, 2002. STEVENSON, W. J. Estatstica: aplicada administrao. 1.ed. So Paulo: HARBRA, 2001.