You are on page 1of 9

ANLISIS DE LA VARIANZA

Esta es una tcnica estadstica que se utiliza para separar y estimar las diferentes causas de variacin.

Fuentes de variacin:
- Error aleatorio en la medicin
- Factor controlado o de efecto fijo

En general, el anlisis de varianza se puede aplicar a situaciones en donde hay ms de un factor y ms
de una fuente de variacin aleatoria. A continuacin se explora la tcnica ANOVA de un factor y
posteriormente el caso de dos factores.

Es necesario organizar los datos de manera que puedan aplicarse frmulas generales para su
tratamiento. Se considera que existen h muestras, cada una con n repeticiones, organizadas de la
siguiente manera:

Muestra 1 x
11
x
12
x
1j
x
1n
<x>
1

Muestra 2 x
21
x
22
x
2j
x
2n
<x>
2


Muestra i x
i1
x
i2
x
ij
x
in
<x>
i


Muestra h x
h1
x
h2
x
hj
x
hn
<x>
h

Nmero total de medidas =N =nh Media global = <x>

Los datos de diferentes experimentos
efectuados bajo las mismas condiciones
constituyen un grupo. El nmero total de
grupos es t. Cada grupo posee un nmero
de datos n
i
. El total de datos es n. Para
estudiar la varianza se construyen sumas
de cuadrados designadas con la letra Q. Q
es la suma de cuadrados total. Q
A
es la
suma de cuadrados entre los grupos y Q
W

es la suma de cuadrados dentro de los
grupos. Q =Q
A
+Q
W
.



Se acostumbra a resumir la informacin en una tabla, tal como la siguiente:
Fuente de la
variacin
SS (suma de
cuadrados)
DF (grados de
libertad)
MS (cuadrado
promedio)
F
Entre grupos Q
A
t-1 s
2
A

s
2
A
/s
2
W
Dentro de
grupos
Q
W
n-t s
2
W

Suma Q n-1 s
2



Ejemplo 1

( )
( )
( )
Q
ij
i
ij i
t n t
Q
n
x
x
Q
n x
x
Q
x x
s
Q
s
Q
s
j i
A
i
i
W
j i
A
A
W
W
=
=
=
=


2
2
2
2 2 2
1 1
; ;
Se estudi la influencia de tres condiciones experimentales diferentes sobre el tamao de los cristales
del hidrato de procrastinina. Las condiciones experimentales se llaman condiciones I, II y III. La
siguiente tabla contiene las longitudes de cristal mximas (m) halladas en 10 experimentos. En la
tabla tambin aparecen, a continuacin de las filas de datos de experimentos, valores de promedios y
sumas de cuadrados que son necesarios para el anlisis de varianza, los cuales usted tiene que
identificar.

Experimento condicin experimental
I II III
1 19 40 32
2 45 28 26
3 26 15 30
4 23 24 17
5 36 26 23
6 23 35 24
7 26 27 29
8 33 28 20
9 22 19
10 26

Con base en estos datos, se construy la siguiente tabla de anlisis de varianza, segn la cual las
diferentes condiciones no tuvieron un efecto significativo sobre el tamao mximo del cristal.
Fuente SS DF MS F
Entre grupos 38 2 19.0
0.377 Dentro de
grupos
1209 24 50.4
Suma 1247 26 47.8

Ejemplo
En la siguiente tabla aparecen los resultados de una investigacin sobre la estabilidad de un reactivo
fluorescente en diferentes condiciones de almacenamiento. Los valores son las seales de
fluorescencia de soluciones diluidas de la misma concentracin.
Condiciones Medidas repetidas Media
A recientemente preparada 102, 100, 101 101
B una hora en la oscuridad 101, 101, 104 102
C una hora con luz tenue 97, 95, 99 97
D una hora con luz brillante 90, 92, 94 92
Media global 98

- Variacin dentro de la muestra: Para esto se calculan las varianzas.
Muestra A: [(102-101)
2
+(100-101)
2
+(101 - 101)
2
]/(3-1) =1
Muestra B: [(101 - 102)
2
+(101 - 102)
2
+(104 - 102)
2
]/(3-1) =3
Muestra C: [(97 - 97)
2
+(95 - 97)
2
+(99 - 97)
2
]/(3-1) =4
Muestra D: [(90 - 92)
2
+(92 - 92)
2
+(93 - 92)
2
]/(3-1) =4

La varianza dentro de la muestra es el promedio de estos valores: (1+3+4+4)/4 =3.
El nmero de grados de libertad en esta varianza es 8, porque se usaron cuatro muestras y en la
estimacin de la varianza de cada muestra hay dos grados de libertad.

La frmula utilizada para la variacin dentro de las muestras es:

- Variacin entre muestras:
Para estimar esta variacin se utilizan las medias, aprovechando que la distribucin muestral de las
medias posee una varianza o
2
o
/n.

Con los datos de este ejemplo:
Varianza de la media muestral =[(101-98)
2
+(102-98)
2
+(97-98)
2
+(92-98)
2
]/(4-1)
=62/3

Entonces, si 62/3 es o
2
o
/n, el valor de o
2
o
es: 62. Esta estimacin tiene 3 grados de libertad porque se
calcul a a partir de 4 medias muestrales. La frmula que corresponde a la estimacin de o
2
o
entre
muestras es:

La prueba F se aplica a continuacin, para determinar si es significativa la diferencia entre los
cuadrados medios hallados:

Cuadrado medio dentro de las muestras =3, con 8 grados de libertad.
Cuadrado medio entre muestras =62, con 3 grados de libertad.

F
3
,
8
=62/3 =20.7

El valor crtico de F se obtiene consultando tablas =4.066. Como el valor calculado es mayor que el
crtico, se concluye que las medias muestrales difieren en forma significativa.

ANOVA DE DOS FACTORES CON UNA LECTURA POR MUESTRA

Organizacin de los datos: x son los resultados de cada experimento, segn los valores de los factores
A y B.
Factor A


Factor B A
1
A
2
A
i
A
I


x
11
x
21
x
31
... x
i1
x
I1

x
12
x
22


x
1j
x
2j


B
J
x
1J
x
2J
x
IJ




( )
( )
o
i
n
i
h
x
x
2
2
1

( )
( )
o
j i
ij
i
h n
x
x
2
2
1



i
ij
j
x
J
x
.
=
1
( )
A i
i
Q J
x
x =
2
.









SS Grados de
libertad
Cuadrado promedio F
Factor A Q
A
I-1 S
2
A
=Q
A
/(I-1) F
(A)
=S
2
A
/S
2
W

Factor B Q
B
J-1 S
2
B
=Q
B
/(J-1) F
(B)
=S
2
B
/S
2
W

Dentro de grupos Q
W
(I-1)(J-1) S
2
W
=Q
W
/[(I-1)(J-1)]
Suma Q IJ-1 S
2
=Q/(IJ-1)


ANOVA DE DOS FACTORES CON MS DE UNA LECTURA POR MUESTRA


SS Grados de
libertad
Cuadrado promedio F
Factor A QA I-1 S
2
A
=Q
A
/(I-1) F
(A)
=S
2
A
/S
2
W

Factor B QB J-1 S
2
B
=Q
B
/(J-1) F
(B)
=S
2
B
/S
2
W

Interaccin QAB (I-1)(J-1) S
2
AB
=Q
AB
/[(I-1)(J-1)] F
(AB)
=S
2
AB
/S
2
W

Dentro de grupos QW IJ(K-1) S
2
W
=Q
W
/[IJ(K-1)]
Suma Q IJK-1 S
2
=Q/(IJK-1)

El subndice k corresponde a las rplicas.


















( )
B j
j
Q I
x
x =
2
.
( )

+ =
i j
W
x
x x x
Q
j i ij . .
2
( )
Q
ijk
x
x
k j i
=


2
( )
A
i
Q
x
x
JK
i
=

2
..

( )
( )


=
=
i j k
W
j
B
x
x Q
x
x
Q
ij
ijk
j
IK
.
. .
2
2
( )
AB
j i
Q
x
x
x x
K
ij i j
=
+

2
. .. . .
EJEMPLO
En un experimento para comparar el porcentaje de eficiencia en la extraccin de iones metlicos en
solucin acuosa por agentes quelantes, se obtuvieron los siguientes resultados:
AGENTE QUELANTE
Das A B C D
1 84 80 83 79
2 79 77 80 79
3 83 78 80 78
Cada da se prepararon soluciones del ion metlico (con concentracin especificada) y se realiz la
extraccin con cada uno de los agentes quelantes, tomados de una manera aleatoria.

Tratamiento de los datos:
Para simplificar, a todas las mediciones se les resta 80. A continuacin aparecen detalles de los
clculos.

Tratamientos
Bloques A B C D Ti. Ti.
2

Da 1 4 0 3 -1 6 36
Da 2 -1 -3 0 -1 -5 25
Da 3 3 -2 0 -2 -1 1
T.j 6 -5 3 -4 0
T.j
2
36 25 9 16
suma de T.j
2
=86. suma de Ti.
2
=62

r =3 c =4 N =12 Suma de los cuadrado de todos los resultados =86

Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio
Entre tratamientos 86/3-0
2
/12 =28.6667 3 28.6667/3 =9.5556
Entre bloques 62/4 -0
2
/12 =15.5 2 15.5/2
Residual por diferencias: 9.833 6 9.8333/6 =1.6389
Total 54 - 0
2
/12 =54.0 11

F
2
,
6
=7.75/1.6389 =4.76
Como el valor crtico de F es 5.143 y no es superado por el valor anterior, se concluye que no hay
diferencias significativas entre das.

Ejercicio:
En un experimento de colaboracin entre laboratorios sobre la determinacin de arsnico en carbn, se
enviaron muestras de carbn de tres regiones diferentes a tres laboratorios. Cada laboratorio realiz un
anlisis por duplicado de cada muestra con los resultados que se muestran en la tabla siguiente
(medidos en g/g). Compruebe que no existe interaccin significativa laboratorio-muestra y pruebe las
diferencias significativas entre laboratorios.

Muestra 1 2 3
A 5.1, 5.1 5.3, 5.4 5.3, 5.1
B 5.8, 5.4 5.4, 5.9 5.2, 5.5
C 6.5, 6.1 6.6, 6.7 6.5, 6.4

Objetivo del experimento: Determinar si una solucin de un compuesto particular es apropiada para
ser usada como estndar de absorbancia.

Metodologa: Se midi el valor de la absortividad molar, c, de soluciones de tres
concentraciones diferentes a cuatro longitudes de onda diferentes. Dos mediciones por cada pareja
concentracin-longitud de onda. Se aleatoriz el orden en que se hicieron las mediciones.



Resultados: En cada casilla aparecen los valores de c multiplicados por 100.
Concentracin (g/L) \ (nm) 240 270 300 350
0.02 94 96 106 108 48 51 78 81
0.06 93 93 106 105 47 48 78 78
0.10 93 94 106 107 49 50 78 79

Tratamiento de los datos:
1. Clculo de sumas de cuadrados por filas y columnas.
Concentracin (g/L) \ (nm) 240 270 300 350 Ti. Ti.
2

0.02 190 214 99 159 662 11697
8
0.06 186 211 95 156 648 11247
8
0.10 187 213 99 157 656 11478
8
Tj. 563 638 293 472
Tj.
2
316969 407044 85849 222784
Sumas: de T.j
2
=10322646 de Ti.
2
=1288484 T =1966

APLICAR MTODO DE LAS SUMAS Q

Resultados de los clculos:
Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio
Entre filas 12.34 2 6.17
Entre columnas 11059.506 3 3686.502
Interaccin 1.994 6 0.3323
Residual 16 12 1.3333
Total 11089.84 23

Interpretacin:
1. Determinar si las fuentes de variacin son significativas.
Para esto se compara el cuadrado medio de la fuente de variacin con el cuadrado medio residual. Si el
primero es mayor, la fuente es significativa. La variacin residual es la debida al error aleatorio,
obtenida al examinar la variacin entre rplicas. Al hacer la comparacin se encuentra que
- la interaccin no es significativa (0.3323 <1.3333).
- la variacin entre columnas es significativa. O sea, la respuesta (c) depende de la longitud de onda.
El factor F para 3 y 12 grados de libertad y una probabilidad del 95% tiene un valor crtico de 3.49. Al
usar los datos del problema:
F
3
,
12
=3686.502/1.3333 =2765 >3.49
- la variacin entre filas es significativa. El factor F para 2 y 12 grados de libertad y una probabilidad
del 95% tiene un valor crtico de 3.885. Al usar los datos del problema:
F
3
,
12
=6.17/1.3333 =4.63 >3.885
O sea que la solucin no sirve como estndar de absorbancia porque hay mucha variacin entre filas.
La respuesta depende de la concentracin.

El siguiente grfico ilustra la situacin:



Notar lo siguiente sobre el grfico:

- Las lneas son paralelas, lo que indica ausencia de interaccin.
- Las lneas no son muy horizontales, lo que indica que la absortividad molar vara con la
concentracin.
- Las lneas se encuentran a diferente altura en la grfica, lo que indica que la absortividad molar
depende de la longitud de onda.


EJEMPLO DE DISEO CON TRES FACTORES Y DOS NIVELES

Notacin para las combinaciones: La presencia de la letra en minscula correspondiente al factor indica que ste
se halla en su nivel superior, y su ausencia, que el factor est en el nivel inferior. Cuando todos los factores est en
el nivel bajo, aparece el nmero 1.
Combinacin A B C Respuesta
1 - - - y
1

a + - - y
2

b - + - y
3

c - - + y
4

bc - + + y
5

ac + - + y
6

ab + + - y
7

abc + + + y
8

0
20
40
60
80
100
120
0 0.05 0.1 0.15
A
b
s
o
r
t
i
v
i
d
a
d

m
o
l
a
r
Concentracin, g/L
240 nm
270 nm
300 nm
350 nm

Objetivo del experimento: Determinar cmo es afectado el parmetro de retencin k' de HPLC por el pH, la
concentracin de un contrain y la concentracin de un solvente orgnico en la fase mvil.

Metodologa: Observable =k'; Factores =P (pH), T (conc. contrain) y C (conc. solvente).
Se utilizaron dos niveles para cada factor y se realizaron dos mediciones, una rplica de la otra, para cada
combinacin. Las mediciones se aleatorizaron.

Resultados experimentales: La siguiente tabla da el valor medio de k' para cada par de rplicas.
Combinacin k'
1 4.7
p 9.9
t 7.0
c 2.7
pt 15.0
pc 5.3
tc 3.2
ptc 6.0



Tratamiento de datos e interpretacin:
1. Efecto de cada factor por separado: El efecto de cambiar los niveles de P se puede hallar de la diferencia
media en respuesta cuando P cambia de nivel alto a bajo y los niveles de C y T se mantienen fijos. En la tabla
siguiente aparecen los cuatro casos correspondientes.

Nivel de P
Nivel de C Nivel de T + - Diferencia
- - 9.9 4.7 5.2
+ - 5.3 2.7 2.6
- + 15.0 7.0 8.0
+ + 6.0 3.2 2.8
Total =18.6

El efecto promedio de alterar P es 18.6/4 =4.65. Similarmente se construyen tablas para C y T para encontrar que
sus efectos promedios son: para C =-4.85 y para T =2.15.

2. Interaccin entre dos factores: Considerando primero la pareja de factores P y T, si no hubiera interaccin
se esperara que el cambio de respuesta al variar P fuera independiente de T. En la tabla anterior, las dos
primeras filas corresponden a la variacin de P de alto a bajo, estando T en bajo. El promedio del cambio
en respuesta ( k') es (5.2 +2.6)/2 =3.9. Las siguientes dos filas de la tabla son para T en nivel alto. El
promedio en respuesta es (8.0 +2.8)/2 =5.4. El efecto de la interaccin PT se expresa como el promedio
de la variacin en estas dos diferencias: (5.4 - 3.9)/2 =0.75. Esta cantidad expresa la falta de aditividad
de los efectos de P y T actuando individualmente. Sigiendo un proceso similar, se puede encontrar:
efecto de interaciin CP =-1.95
efecto de interaccin CT =-1.55

3. Interaccin entre tres factores: La interaccin PT se puede dividir en dos partes con respecto al nivel de C.
Con C bajo, la interaccin sera (8.0 - 5.2)/2 =1.4. Con C alto sera (2.8 - 2.6)/2 =0.1. Si no hubiera interaccin
entre los tres factores ni error aleatorio, estas estimaciones de la interaccin PT deberan ser iguales. La
interaccin de los tres factores se estima como la mitad de la diferencia entre estos dos resultados: (0.1 - 1.4)/2 =-
0.65.

Resumiendo, los efectos hallados son:
Efecto
Un nico factor (efecto principal)
P 4.65
T 2.15
C -4.85
Interaccin de dos factores
TP 0.75
CT -1.55
CP -1.95
Interaccin de tres factores
PTC -0.65

4. Determinar si los efectos hallados son significativos: Para esto se usa el cociente F entre el cuadrado
medio del efecto y el cuadrado medio residual (el cual estima la contribucin del error aleatorio). Estos clculos
requieren disponer previamente de las sumas de cuadrados. Se puede demostrar que para experimentos de dos
niveles, siendo N el nmero total de mediciones, incluyendo rplicas:
Suma de cuadrados =N * (efecto estimado)
2
/4
Para este ejemplo, N =16. Las sumas de cuadrados son:
Factor P T C PT TC PC PTC
Suma de cuadr 86.49 18.49 94.09 2.25 9.61 15.21 1.69

Tambin puede demostrarse que cada suma de cuadrados tiene un grado de libertad. Por lo tanto, cada cuadrado
medio es igual a la suma de cuadrados (cuad.medio =suma de cuad/ grad.libert.).
El cuadrado medio del error residual se obtiene de las diferencias entre las rplicas. Para este problema =0.012,
con 8 grados de libertad.

Aplicando el parmetro F a la interaccin PTC: F
1
,
8
=1.69/0.012 =141. Este resultado es mucho mayor que el
umbral. Por lo tanto, la interaccin es significativa. Necesariamente, los dems efectos tambin lo sern.

You might also like