You are on page 1of 12

Universidade do Estado do Rio de Janeiro Depto. de Qumica Analtica Introduo Quimiometria Prof. M.Sc.

Igor Lima

3 lista de exerccios (caps. 11 e 13)

1) Considere um experimento com quatro grupos, com oito valores em cada um dos grupos. Para a tabela resumida de ANOVA apresentada a seguir, preencha todos os resultados que esto faltando: Fonte Entre grupos Dentro dos grupos Total RESPOSTA: 4 grupos (c), com 8 valores. Logo, n = 32. Fonte Graus de liberdade c1=41 =3 Soma dos quadrados SQE = MQE * c 1 = 80 * 3 = 240 Mdia dos quadrados (varincia) F Graus de liberdade Soma dos quadrados 80 560 Mdia dos quadrados (varincia) F

Entre grupos

Dentro dos grupos

n c = 32 4 = 28 n 1 = 32 1 = 31

SQD = 560

Total

SQT=SQE+SQD=800

2) Ainda trabalhando com o mesmo experimento anterior: a) No nvel de significncia de 0,05, expresse a regra de deciso para testar a hiptese nula de que todos os quatro grupos possuem iguais mdias aritmticas de populao.

RESPOSTA: H0: Fcalc Fcrit (2,95) e Ha: Fcalc > Fcrit (2,95). O 2,95 um valor tabelado, que obtemos fazendo o tste F em ANOVa de um fator: no denominador. b) Qual a sua deciso estatstica? Como o valor de Fcalc > Fcrit (4 > 2,95, respectivamente), rejeita-se a hiptese nula, H0. c) No nvel de significncia de 0,05, qual o valor crtico para a cauda (lateral) superior, a partir da distribuio do intervalo de Student? Da tabela ANOVA, obtivemos no numerador (c = 4 g.l.) e no denominador (n c = 32 4 = 8 g.l.). Ao verificar a tabela de valores crticos de amplitude de Student, Q, vemos que no h valor tabelado para 28 gl no denominador, logo, adotaremos o valor maior mais prximo (30 gl de denominador e 4 gl no numerador (tabela E.9 do livro do Levine, pg. 707), que 3,90. Logo, Qs = 3,90 d) Para realizar o procedimento de Tukey-Kramer, qual o intervalo crtico? RESPOSTA Para executar o teste de Tukey-Kramer, precisamos do limite superior da amplitude de Student, Qsup. Logo, ( ) ( ) , com c-1gl no numerador e n-c gl

3) Os dados a seguir (armazenados no arquivo rendimentocd.xls) representam os rendimentos mais altos nos EUA para diferentes tipos de contas (extrado de Bankrate.com, 24 de janeiro de 2006). Mercado CD de 6 meses CD de 1 ano CD de 2,5 CD de 5 anos monetrio anos 4,55 4,75 4,94 4,95 5,05 4,50 4,70 4,90 4,91 5,05 4,40 4,69 4,85 4,85 5,02 4,38 4,65 4,85 4,82 5,00 4,38 4,65 4,85 4,80 5,00 a) No nvel de significncia de 0,05, existem evidncias de alguma diferena na mdia aritmtica dos rendimentos das diferentes contas?

RESPOSTA Primeiro, enunciar o teste de hipteses: H0: 1 = 2 = 3 = 4 = 5 ,onde cada corresponde a uma varivel. Ha: Nem todas j so iguais, onde j = 1, 2, 3, 4, 5. Agora, realizar a ANOVA (5 grupos (c), com 5 valores. Logo, n = 25). Pelo Excel: Barra de menu/Dados/Anlise de dados/ANOVA: fator nico. Na mo: Mercado Monetrio 4,55 4,50 4,40 4,38 4,38 4,44 4,78 CD-6 Meses CD-1 Ano CD- 2,5 Anos 4,75 4,94 4,95 4,70 4,90 4,91 4,69 4,85 4,85 4,65 4,85 4,82 4,65 4,85 4,80 4,69 4,88 4,87 CD- 5 Anos 5,05 5,05 5,02 5,00 5,00 5,02

Mdia mdia global

a) Variao total em ANOVA de fator nico: Soma quadrtica total, SQT Xi1-Xglobal -0,23 -0,28 -0,38 -0,40 -0,40

Xi2-Xglobal -0,03 -0,08 -0,09 -0,13 -0,13 (Xi2Xglobal)^2 0,00 0,01 0,01 0,02 0,02

Xi3-Xglobal 0,16 0,12 0,07 0,07 0,07 (Xi3Xglobal)^2 0,03 0,01 0,00 0,00 0,00

Xi4-Xglobal 0,17 0,13 0,07 0,04 0,02 (Xi4Xglobal)^2 0,03 0,02 0,00 0,00 0,00

Xi5-Xglobal 0,27 0,27 0,24 0,22 0,22 (Xi5Xglobal)^2 0,07 0,07 0,06 0,05 0,05

(Xi1-Xglobal)^2 0,05 0,08 0,14 0,16 0,16 SQT = 1,052496

b) Variao entre grupos em ANOVA de fator nico:

SQE = 5*(4,44-4,78)^2+5*(4,69-4,78)^2+5*(4,88-4,78)^2+5*(4,87-4,78)^2+5*(5,024,78)^2 = 0,996216


3

c) Variao dentro em ANOVA de fator nico: Xi1-Xmedia1 0,11 0,06 -0,04 -0,06 -0,06

Xi2-Xmedia2 Xi3-Xmedia3 Xi4-Xmedia4 Xi5-Xmedia15 0,06 0,06 0,08 0,03 0,01 0,02 0,04 0,03 0,00 -0,03 -0,02 0,00 -0,04 -0,03 -0,05 -0,02 -0,04 -0,03 -0,07 -0,02 (Xi2(Xi3(Xi4(Xi5Xmedia2)^2 Xmedia3)^2 Xmedia4)^2 Xmedia15)^2 0,00 0,00 0,01 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

((Xi1-Xmedia1)^2 0,01 0,00 0,00 0,00 0,00 SQD = 0,056280

d) Mdia quadrtica entre grupos: MQE = 0,996215999999998 / (5 -1) = 0,249054 e) Mdia quadrtica dentro dos grupos: MQD = 0,056280 / (25 5) = 0,0028140 f) Mdia quadrtica total: MQT = 1,052496 / (25 1) = g) Valor de Fcalc: Valor de Fcrit(0,05, 4, 20): 4,43 Logo, a tabela ANOVA torna-se: Fonte Graus de liberdade Soma dos quadrados Mdia dos quadrados (varincia) 0,249054 F

0,996216 Entre grupos 4 88,51 Dentro dos 0,056280 20 0,002814 grupos Total 24 1,052496 Como Fcalc > Fcrit, rejeita-se H0. No h evidncia suficiente para acreditar que haja uma

diferena significativa entre as mdias das diferentes contas.

b) Caso seja apropriado, determine quais contas diferem na mdia aritmtica dos rendimentos. 1) Teste de hipteses

2) Realizar a ANOVA. Copiar as mdias e inserir na planilha TukeyKramer5, do arquivo Tukey-Kramer.xls Com (0,05), c=5 (g.l. numerador) e n-c=25-5=20 (g.l. denominador), da tabela E.9 (tabela de valores crticos da amplitude de Student, Q), obtemos: Q=4,23

c) No nvel de significncia de 0,05, existem evidncias de alguma diferena na variao nos rendimentos das diferentes contas? H0: Ha: Ao menos uma varincia diferente.

Mercado Monetrio
|X1-Med| |X2-Med| |X3-Med| |X4-Med| |X5-Med| Mediana 0,15 0,1 0 0,02 0,02 4,40

CD-6 Meses
0,06 0,01 0 0,04 0,04 4,69

CD-1 Ano
0,09 0,05 0 0 0 4,85

CD- 2,5 Anos


0,1 0,06 0 0,03 0,05 4,85

CD- 5 Anos
0,03 0,03 0 0,02 0,02 5,02

Anova: fator nico RESUMO Grupo Mercado Monetrio Contagem 5 Soma 0,29 Mdia 0,058 Varincia 0,00412

CD-6 Meses CD-1 Ano CD- 2,5 Anos CD- 5 Anos

5 5 5 5

0,15 0,14 0,24 0,1

0,03 0,028 0,048 0,02

0,0006 0,00167 0,00137 0,00015

ANOVA Fonte da variao Entre grupos Dentro dos grupos Total SQ 0,004904 0,03164 0,036544 gl 4 20 24 MQ 0,001582 F valor-P F crtico 0,001226 0,774968394 0,554345 2,866081

Como p-valor < 0,05, no rejeitar H0. No h evidncia suficiente para concluir que existe uma diferena significativa na variao mdia de rendimento entre as cinco contas.

d) Que efeito o seu resultado em (c) exerce sobre a validade dos resultados em (a) e (b)? O resultado em (a) depende da suposio de que a varincia do rendimento mdio entre as cinco contas so diferentes.

4) Considerando um experimento fatorial de dois fatores e a tabela resumida de ANOVA apresentada a seguir, preencha todos os resultados que esto

faltando:ERRATA: SQB=220 e no SQA=220 Fonte Fator A Fator B Graus liberdade r1=2 c1=? de Soma dos Mdia dos quadrados (varincia) SQA = ? SQB = 220 quadrados F

Interao AB

(r 1)(c 1)= SQAB = ? 8 rc(n -1) = 30 n1 =? SQR = ? SQT = ?

Erro Total

;
6

RESPOSTA Fonte Fator A Fator B Graus de Soma dos Mdia dos liberdade quadrados (varincia) r 1 = 3 1 = SQA = 2 2*80=160 c 1 = 5 - 1 = SQB = 220 4 quadrados F

(r 1)(c 1)= SQAB = 8 10*8=80 Erro rc(n -1) = 30 SQR = 30*5 = 150 Total n1 =? SQT = 610 (r-1)(c-1)=8 2(c-1)=8 c-1=4 c=5 Interao AB n=rcn 2*5*(n-1)=30 10n-10=30 n=4 n=rcn = 2*5*4=40 Fcalc = MQB/MQR 11 = 55/MQR MQR = 55/11 = 5

5) Os dados no arquivo rigidez.xls fornecem medies sobre a rigidez e a resistncia de 35 tipos de alumnio anodizado. Acredita-se que a rigidez (medida em unidades do padro Rockwell E), pode ser utilizada para prever a resistncia tenso (medida em milhares de libras por polegada quadrada, PSI). a) Construa um grfico de disperso.

Grfico de disperso
Resistncia tenso, 10^3lb/psi 120 100 80 60 40 20 0 0 10 20 Rigidez, Rockwell E 30 40

b) Pressupondo uma relao linear, utilize o mtodo dos mnimos quadrados para encontrar os coeficientes de regresso. RESPOSTA

Coef angular:

Coef linear: = 67,6514285714286 30,5108571428571= 6,04827081860548 = 6,05

2,01905693649924*

d) Faa a previso para a mdia aritmtica da resistncia tenso do alumnio anodizado que tenha uma rigidez de 30 unidades.

6) Voc deseja desenvolver um modelo para prever o valor de avaliao de casas, com base na rea aquecida. Foi selecionada uma amostra de 15 residncias unifamiliares em uma determinada cidade. O valor de avaliao (em milhares de dlares) e a rea aquecida das casas (em milhares de ps quadrados) so registrados, com os seguintes resultados, armazenados no arquivo casa2.xls: Casa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Valor Avaliao 184,4 177,4 175,7 185,9 179,1 170,4 175,8 185,9 178,5 179,2 186,7 179,3 174,5 183,8 176,8 de rea Aquecida 2,00 1,71 1,45 1,76 1,93 1,20 1,55 1,93 1,59 1,50 1,90 1,39 1,54 1,89 1,59

a) Construa um grfico de disperso e, pressupondo uma relao linear, utilize o mtodo dos mnimos quadrados para calcular os coeficientes de regresso.

Valor de Avaliao
Valor de avaliao, milhares de dlares 188 186 184 182 180 178 176 174 172 170 168 0.00 0.50 1.00 1.50 2.00 2.50 rea aquecida, milhares de ps quadrados

xi yi 2,00 184,4 1,71 177,4 1,45 175,7 1,76 185,9 1,93 179,1 1,20 170,4 1,55 175,8 1,93 185,9 1,59 178,5 1,50 179,2 1,90 186,7 1,39 179,3 1,54 174,5 1,89 183,8 1,59 176,8 SOMA 24,93 2693,40 MDIA 1,66 179,56 Coef angular: Coef linear:
{

xixmed 0,34 0,05 -0,21 0,10 0,27 -0,46 -0,11 0,27 -0,07 -0,16 0,24 -0,27 -0,12 0,23 -0,07 0,00

(xixmed)^2 0,11 0,00 0,04 0,01 0,07 0,21 0,01 0,07 0,01 0,03 0,06 0,07 0,01 0,05 0,01 0,77

yiymed 4,84 -2,16 -3,86 6,34 -0,46 -9,16 -3,76 6,34 -1,06 -0,36 7,14 -0,26 -5,06 4,24 -2,76 0,00

(xi-xmed)(yiymed) 1,63592 -0,10368 0,81832 0,62132 -0,12328 4,23192 0,42112 1,69912 0,07632 0,05832 1,69932 0,07072 0,61732 0,96672 0,19872 12,89

= 179,56 16,633* 1,66= 151,92

b) Interprete o significado do intercepto de Y, e da inclinao, neste problema.

c) Utilize a linha de previso desenvolvida em (a) para prever o valor de avaliao de uma casa cuja rea aquecida igual a 1750 ps quadrados.

d) Determine o coeficiente de determinao, r2, e interprete o seu significado. r2=0,6593. Ento, 65% da variao no valor de avaliao pode ser explicada pela variao no tamanho.

e) Realize a anlise de resduos em seus resultados e determine a adequao do ajuste de seu modelo.

rea Aquecida Plotagem de resduos


10 Resduos 5 0 -5 -10 0.00 0.50 1.00 1.50 2.00 2.50

rea Aquecida

O grfico de resduos no revela qualquer potencial violao dos seguintes pressupostos: linearidade, varincia igual e normalidade.

f) No nvel de significncia de 0,05, existem evidncias de uma relao linear entre o valor de avaliao e a rea aquecida? t=5,0161 com 13 g.l., p-valor= 0,0002. Como p-valor < 0,05, rejeitar H0. Logo, h evidncia entre uma relao linear entre o valor avaliado e a rea de aquecimento.

g) Construa uma estimativa para o intervalo de confiana de 95% da mdia aritmtica do valor de avaliao de casas em uma rea aquecida de 1750 ps quadrados. 179,2778 milhares de dlares Y|X=1,75 182,7697 milhares de dlares. h) Construa um intervalo de previso de 95% da mdia aritmtica do valor de avaliao de uma casa individual com uma rea aquecida de 1750 ps quadrados.
10

174,4805 milhares de dlares YX=1,75 187,5669 milhares de dlares. i) Construa uma estimativa para o intervalo de confiana de 95% da inclinao da populao. 9,4695 23,7972

j) Calcule o coeficiente de correlao de Pearson.


{ {[ ][ } ]}

=0,81

h) Calcule a covarincia. ( )( )

7) Para determinar a molaridade de uma soluo de hidrxido de sdio a partir de uma soluo-padro de cido clordrico, os seguintes resultados foram obtidos: 0,5027 0,5030 0,5024 0,5032 0,5026 0,5113 a) Aplicando o teste Q (95%), podemos considerar correto o valor 0,5113? Enuncie as hipteses nula e alternativa. H0: no h valor extremo Ha: o valor testado um valor extremo. 1) 0,5024 / 0,5026 / 0,5027 / 0, 5030 / 0,5032 / 0,5113 2) Como Qcalc > Qcrit, rejeita-se H0. O valor em questo um outlier. O novo conjunto passa a ser: 0,5024 / 0,5026 / 0,5027 / 0, 5030 / 0,5032.

b) Calcular o valor mdio, o desvio-padro, o coeficiente de variao, o erro-padro da mdia e o intervalo de confiana (95%).

11

0,502275

0,503085

12

You might also like