Professional Documents
Culture Documents
El primer diseño que se piensa abordar es el diseño que tiene dos factores, A y B; y cada
uno tiene dos niveles, alto (+) y bajo (-). Para los diseños de tipo factorial se acostumbra a
realizar n repeticiones por tratamiento, abarcando un mayor margen de información con
respecto a los diseños en bloque.
Cabe mencionar que el orden para realizar cada corrida experimental es completamente
aleatorio, lo que supone un trabajo más arduo a la hora de preparar la experimentación, ya
que a diferencia del diseño de bloque se podía elegir un orden en particular.
Un bacteriólogo está interesado en los efectos de dos medios de cultivo diferentes y dos
tiempos diferentes sobre el crecimiento de un virus particular. Se realizan seis réplicas de
un diseño 2^2, haciendo las corridas de manera aleatoria. Se requiere analizar los datos del
crecimiento viral que se presentan enseguida y sacar conclusiones apropiadas.
Medio de cultivo
Tiempo (hrs)
1 2
12 21 22 25 26
23 28 24 25
20 26 29 27
18 37 39 31 34
38 38 29 33
35 36 30 35
Un ingeniero industrial empleado por una compañía refresquera está interesado en los
efectos de dos diferentes tipos de botellas de 32 onzas sobre el tiempo de entrega de cajas
de 12 botellas del producto. Los dos tipos de botellas son de vidrio y de plástico. Se usan
dos empleados para realizar una tarea que consiste en mover 40 cajas de producto 50 pies
en una plataforma de carga estándar y acomodarlas en un estante de venta. Se hacen cuatro
réplicas de un diseño factorial 22 y los tiempos observados se enlistan en la siguiente tabla.
Empleado
Tipo de botella
1 2
Vidrio 5.12 4.89 6.65 6.24
4.98 5.00 5.49 5.55
Plástico 4.95 4.95 5.28 4.91
4.27 4.25 4.75 4.71
Como observamos los experimentos del tipo factorial tienen características muy sencillas
en cuanto a la concepción, pero exigen una mayor demanda al momento de experimentar
por la cantidad de corridas experimentales que se pueden llegar a realizar y lo costoso que
puede resultar eso.
𝐴 = [𝐴− + 𝐴+ ]/2
𝐵 = [𝐵 − + 𝐵 + ]/2
donde observamos que cada uno es el promedio entre las dos variaciones y nos da una
manera de medir que tanto varía en general pasar de un nivel a otro independientemente
del nivel de factor de el otro factor.
El efecto de la interacción AB se obtiene de la siguiente manera
Ejemplo 2.3
luego
𝐴− = −1.0625
𝐴+ = 1.625
𝐵− = −15.125
𝐵+ = −12.4375
𝐴 = 0.281
𝐵 = −13.781
𝐴𝐵 = 1.3437
Para hacer una representación gráfica de los efectos principales de un diseño 22 se empieza
por establecer en el eje horizontal los dos niveles de factor y en el eje vertical la media de
la respuesta observada en los correspondientes niveles como se observa en el siguiente
gráfico:
La notación de Yates [(1), a, b, ab] tiene un significado diferente a las demás: con ella se
representa el total o la suma de las observaciones en cada tratamiento. La lógica de la
notación de Yates es la siguiente: si una letra minúscula está presente, entonces el factor
correspondiente se encuentra en su nivel alto; si está ausente,
el factor está en su nivel bajo. De esta forma los datos se verían
gráficamente como se muestra en la figura.
Ahora supongamos que está presente una interacción. Si en el diseño de un factor a la vez
indicara que a- b+ y a+ b- dieron mejores respuestas que a- b-, esto nos podría llevar a concluir
que a+ b+ sería todavía mejor. Lo cual no necesariamente es cierto si hay interacción entre
los factores.
Así, el diseño factorial reduce el error sin tener que hacer más observaciones esto resulta
económico en el material experimental al obtener información sobre varios factores sin
aumentar el tamaño del experimento. Se obtiene más información que en un experimento
de un solo factor pues permite el estudio de la interacción y esto ayuda a dar mejores
conclusiones del experimento.
Modelo matemático
Supongamos que se tienen los factores A y B, con dos niveles cada uno. Supongamos
también que se hicieron n repeticiones. El orden en que se hacen las 2*2*n observaciones
se selecciona al azar, por lo que es un diseño completamente aleatorizado
𝑖 = 1, 2
𝑌𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼𝛽)𝑖𝑗 + 𝜖𝑖𝑗𝑘 { 𝑗 = 1, 2
𝑘 = 1, … , 𝑛
donde μ es la media global, αi es el efecto debido al i-ésimo nivel del factor A, βi es el efecto
debido al j-ésimo nivel del factor B, (αβ)ij representa al efecto de interacción de A y B en la
combinación ij y εijk es el error aleatorio.
Análisis de varianza
NOTACIÓN:
2 2 𝑛
𝑌…
𝑌 … = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅ … =
𝑖=1 𝑗=1 𝑘=1
4𝑛
2 𝑛
𝑌𝑖 . .
𝑌𝑖 . . = ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅𝑖 . . = 𝑖 = 1, 2
2𝑛
𝑗=1 𝑘=1
2 𝑛
𝑌.𝑗 .
𝑌.𝑗 . = ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅.𝑗 . = 𝑗 = 1, 2
2𝑛
𝑖=1 𝑘=1
𝑛
𝑌𝑖𝑗 .
𝑌𝑖𝑗 . = ∑ 𝑌𝑖𝑗𝑘 𝑌̅𝑖𝑗 . =
𝑛
𝑘=1
Tabla ANOVA
Fuente de Suma de Cuadrados G.L. CM F0 Valor p
Variación
Efecto A 2 1 𝐶𝑀𝐴 𝐶𝑀𝐴
𝑌2𝑖 . . 𝑌2 …
𝑆𝐶𝐴 = ∑ − 𝐶𝑀𝐸
2𝑛 4𝑛
𝑖=1
Efecto B 2
𝑌 2 .𝑗 . 𝑌 2 … 1 𝐶𝑀𝐵 𝐶𝑀𝐵
𝑆𝐶𝐵 = ∑ − 𝐶𝑀𝐸
2𝑛 4𝑛
𝑗=1
Efecto AB 2 2
𝑌 2 𝑖𝑗 . 𝑌 2 … 1 𝐶𝑀𝐴𝐵 𝐶𝑀𝐴𝐵
𝑆𝐶𝐴𝐵 = ∑ ∑ − − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 𝐶𝑀𝐸
𝑛 4𝑛
𝑖=1 𝑗=1
Total 2 2 𝑛 4n-1
𝑌2 …
𝑆𝐶𝑇 = ∑ ∑ ∑ 𝑌 2 𝑖𝑗𝑘 −
4𝑛
𝑖=1 𝑗=1 𝑘=1
Los Cuadrados Medios es la división de su Suma de Cuadrados entre sus respectivos
grados de libertad. Recordemos que F0 ~ 𝐹(1 − 𝛼, 𝑔. 𝑙., 4(𝑛 − 1) ). Notemos que los
grados de libertad de la suma de cuadrados del error son 4(n-1), por lo cual se necesitan al
menos dos repeticiones para poder construir la tabla ANOVA.
Supuesto Prueba
Normalidad Kolmogorov o Shapiro-Wilk
Homocedasticidad Levene o Barlett
Independencia Durbin-Watson
El primer paso para verificar los supuestos del ejemplo 1 es establecer una forma de como
introducir los datos a R. A continuación, se muestra el formato que se le puede dar al
ejemplo 1:
La anterior tabla se puede convertir desde Excel a un documento de texto delimitado por
tabulaciones y ser leído así en R.
Una vez leído en el formato correcto en R la forma de ingresar los datos para considerar la
interacción es con la siguiente línea de código
resultados<-aov(Distorcion~Tamaño+Posicion+Tamaño:Posicion, data=datos)
tabla.anova<-anova(resultados)
tabla.anova
Una vez calculado esto podemos hacer el análisis de residuales y poder aplicar la prueba
Shapiro-Wilk.
residuos=resid(resultados)
shapiro.test(residuos)
De la cual obtenemos el siguiente valor p = 0.7045, por lo que se cumple el supuesto de
normalidad.
leveneTest(Distorcion~Tamaño*Posicion, data=datos)
durbinWatsonTest(lm(Distorcion~Tamaño*Posicion, data=datos))
Una combinación lineal que satisface ∑𝑛𝑖=1 𝑐𝑖 𝑌𝑖 , con ∑ 𝑐𝑖 = 0 se llama contraste. Dentro del
contexto del diseño factorial 22 se pueden definir tres contrastes correspondientes a los
tres efectos 𝐴,𝐵 y 𝐴𝐵, que están definidos como:
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒𝐴 = [𝑎 + 𝑎𝑏 − 𝑏 − (1)]
𝐶𝑜𝑛𝑠𝑡𝑟𝑎𝑠𝑡𝑒𝐵 = [𝑏 + 𝑎𝑏 − 𝑎 − (1)]
Observamos que son contrastes porque son combinaciones lineales donde los coeficientes
suman cero (1 +1 -1 -1 = 0). Notemos que los contrastes se pueden expresar en términos de
los efectos principales y de interacción como:
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒𝐴 = 𝐴 ∗ 2𝑛
𝐶𝑜𝑛𝑠𝑡𝑟𝑎𝑠𝑡𝑒𝐵 = 𝐵 ∗ 2𝑛
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒𝐴𝐵 = 𝐴𝐵 ∗ 2𝑛
𝐻0 : 𝐴 = 0
𝐻𝑎 : 𝐴 ≠ 0
𝐻0 : 𝐵 = 0
𝐻𝑎 : 𝐵 ≠ 0
𝐻0 : 𝐴𝐵 = 0
𝐻𝑎 : 𝐴𝐵 ≠ 0
Para obtener la suma de cuadrados de cada efecto se siguen las siguientes expresiones:
𝑆𝐶𝐴 = A2 × n
𝑆𝐶𝐵 = B 2 × n
𝑆𝐶𝐴𝐵 = AB 2 × n
donde cada uno tiene un solo grado de libertad, debido a que cada factor tiene únicamente
dos niveles. La suma de cuadrados totales se calcula con la expresión:
2 2 𝑛
2 𝑌…2
𝑆𝐶𝑇 = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘 −
𝑛22
𝑖=1 𝑗=1 𝑙=1
y tiene 𝑛22−1 grados de libertad. La suma de cuadrados del error se calcula como la
diferencia:
Donde recordemos que los cuadrados medios son la suma de cuadrado entre los grados de
libertad.
Aplicando las fórmulas mencionadas pasaremos a calcular la tabla ANOVA para el ejemplo
1 remitiéndonos a la información de la tabla #.
482.52
𝑆𝐶𝑇 = 9745.25 − = 2470.06
8 × 22
Consideremos un nivel de significancia del 95%. Luego la tabla ANOVA del ejemplo 1 es la
siguiente:
𝐻0 : 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑌1 = 0
𝐻𝑎 : 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑌1 ≠ 0
𝐻0 : 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑌2 = 0
𝐻𝑎 : 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑌2 ≠ 0
𝐻0 : 𝐿𝑎 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑌1 𝑦 𝑌2 = 0
𝐻𝑎 : 𝐿𝑎 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑌1 𝑦 𝑌2 ≠ 0
Por otro lado, si consideramos el modelo de regresión asociado a este ejemplo como:
𝑖 = 1, 2
𝑌𝑖𝑗𝑘 = 𝜇 + 𝑌1𝑖 + 𝑌2𝑗 + (𝑌1𝑌2)𝑖𝑗 + 𝜖𝑖𝑗𝑘 { 𝑗 = 1, 2
𝑘 = 1, … ,8
Luego, por los resultados obtenidos en la tabla ANOVA pasamos a quitar el factor Y1 del
modelo, tanto el de la interacción, reduciendo el modelo de regresión asociado a:
𝑖 = 1, 2
𝑌𝑖𝑗𝑘 = 𝜇 + 𝑌2𝑗 + 𝜖𝑖𝑗𝑘 { 𝑗 = 1, 2
𝑘 = 1, … ,8
Revisar el final
Los diseños factoriales 23 consideran tres factores, cada uno de ellos con dos niveles. En un
diseño factorial 23 se pueden realizar 𝑛 repeticiones por tratamiento, teniendo al final 𝑛23
corridas experimentales, lo cual hace que este tipo de experimentos sean más complicados
de realizar.
Ejemplo 3.1
Ejemplo 3.2
Un ingeniero quiere medir la exquisitez de un brownie y para ello quiere identificar las
variables que producen el brownie más exquisito. Para ello considera tres factores:
material del molde, marca de harina para brownies y el método de batido. Los niveles de
los factores fueron los siguientes:
Combinación A B C Etiquetas A B C
1 - - - (1) 0 0 0
2 + - - a 1 0 0
3 - + - b 0 1 0
4 + + - ab 1 1 0
5 - - + c 0 0 1
6 + - + ac 1 0 1
7 - + + bc 0 1 1
8 + + + abc 1 1 1
La representación geométrica de las ocho combinaciones se ve en la figura siguiente:
bc abc
c
+ ac
Factor C b ab
+
_ Factor B
(1) a -
- Factor A +
Modelo estadístico
𝑖, 𝑗, 𝑙 ∈ {1, 2}
Hipótesis
Estas hipótesis son para probar formalmente la significancia de los efectos principales y de
interacciones:
𝐻0 ∶ 𝛽1 = 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴 𝑛𝑜 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)
𝐻𝐴 ∶ 𝛽1 ≠ 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)
De esta última igualdad observamos que el efecto de A se puede obtener con los contrastes.
Suma de cuadrados
(Contrasteefecto )2
𝑆𝐶𝑒𝑓𝑒𝑐𝑡𝑜 =
8𝑛
2 2 2 𝑛
𝑌2 … .
𝑆𝐶𝑇 = ∑ ∑ ∑ ∑ 𝑌 2 𝑖𝑗𝑙𝑚 −
8𝑛
𝑖=1 𝑗=1 𝑙=1 𝑚=1
Tabla ANOVA
Fuente de Suma de
G.L. CM F0 Valor p
Variación Cuadrados
A 𝑆𝐶𝐴 1 𝐶𝑀𝐴 𝐶𝑀𝐴 ⁄𝐶𝑀𝐸
B 𝑆𝐶𝐵 1 𝐶𝑀𝐵 𝐶𝑀𝐵 ⁄𝐶𝑀𝐸
C 𝑆𝐶𝐶 1 𝐶𝑀𝐶 𝐶𝑀𝐶 ⁄𝐶𝑀𝐸
AB 𝑆𝐶𝐴𝐵 1 𝐶𝑀𝐴𝐵 𝐶𝑀𝐴𝐵 ⁄𝐶𝑀𝐸
AC 𝑆𝐶𝐴𝐶 1 𝐶𝑀𝐴𝐶 𝐶𝑀𝐴𝐶 /𝐶𝑀𝐸
BC 𝑆𝐶𝐵𝐶 1 𝐶𝑀𝐵𝐶 𝐶𝑀𝐵𝐶 /𝐶𝑀𝐸
ABC 𝑆𝐶𝐴𝐵𝐶 1 𝐶𝑀𝐴𝐵𝐶 𝐶𝑀𝐴𝐵𝐶 /𝐶𝑀𝐸
Error 𝑆𝐶𝐸 8(n-1) 𝐶𝑀𝐸
Total 𝑆𝐶𝑇 8n-1
Recordemos que F0 ~ 𝐹(1 − 𝛼, 𝑔. 𝑙., 8(𝑛 − 1) ). Y notemos que los grados de libertad de
la suma de cuadrados del error son 4(n-1), por lo cual se necesitan al menos dos
repeticiones para poder construir la tabla ANOVA.
Ejemplo 2
En una fábrica de dientes se tiene problemas con la calidad de porosidad (burbujas de aire
dentro de los dientes). Manchas blancas, dientes sucios, dientes quebrados. En los intentos
por resolver los problemas han hecho cambios en algunos factores del proceso. En
particular se analizaron los factores de temperatura (90º y 130º C), tiempo de prensado (8
y 15 minutos) y tamaño de partícula (sin tamizar y con tamizador); la variable respuesta fue
el porcentaje de diente bueno en cada corrida. Se realizaron 2 repeticiones por cada
tratamiento. Los datos son los siguientes:
Estimación de los efectos, utilizando las fórmulas de los contrastes con n=2:
Supuestos
Los diseños factoriales 2k son diseños en los que hay k factores con dos niveles cada uno. El
modelo para este diseño incluiría k efectos principales, (𝑘2) interacciones de dos factores,
(𝑘3) interacciones de tres factores, …, y una interacción de k factores. Entonces el modelo
completo contendría 2k -1 efectos. Los modelos que vimos; 22 y 23, son casos particulares
del diseño factorial 2k.
Checar p.p. 6
http://wpd.ugr.es/~bioestad/wp-content/uploads/Factorial-tres-factores.pdf
Hipótesis
Las hipótesis son para probar formalmente la significancia de los efectos principales y de
interacciones:
𝐻0 ∶ 𝛽1 = 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴 𝑛𝑜 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)
𝐻𝐴 ∶ 𝛽1 ≠ 0 (𝐸𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝐴 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜)
EJEMPLO DE UN DISEÑO 𝟐𝟐
Un ingeniero industrial empleado por una compañía refresquera está interesado en los efectos de
dos diferentes tipos de botellas de 32 onzas sobre el tiempo de entrega de cajas de 12 botellas del
producto. Los dos tipos de botellas son de vidrio y de plástico. Se usan dos empleados para realizar
una tarea que consiste en mover 40 cajas de producto 50 pies en una plataforma de carga estándar
y acomodarlas en un estante de venta. Se hacen cuatro réplicas de un diseño factorial 22 y los
tiempos observados se enlistan en la siguiente tabla.
Solución
Para resolver este diseño optaremos primero por expresar la información de la siguiente manera:
EJEMPLO DE UN DISEÑO 𝟐𝟐
Un ingeniero quiere medir la exquisitez de un brownie y para ello quiere identificar las variables
que producen el brownie más exquisito. Para ello considera tres factores: material del molde,
marca de harina para brownies y el método de batido. Los niveles de los factores fueron los
siguientes:
La variable respuesta fue la exquisitez, una medida subjetiva derivada de un cuestionario aplicado
a los sujetos que hicieron el muestreo de cada lote de brownies. Un panel integrado por ocho
personas hizo el muestro de cada lote y llenó el cuestionario. La matriz de diseño y los datos de la
respuesta se presentan a continuación:
Ahora revisaremos los supuestos del modelo mediante el uso del software estadístico R y a un nivel
de significancia del 99%.
Tabla ANOVA
Fuente de Suma de
G.L. CM F0 Valor p
Variación Cuadrados
A 64 1 64 10.2254 0.00228
B 14.06 1 14.062 2.2468 0.13951
C 0.56 1 0.563 0.0899 0.76545
AB 0.56 1 0.562 0.0899 0.76545
BC 3.06 1 3.062 0.4893 0.48713
AC 2.25 1 2.250 0.3595 0.55121
ABC 1 1 1 0.1598 0.69089
Error 350.5 56 6.259
Total 197.099375 63
Observamos de la tabla ANOVA que la única fuente de variación a considerar es la del tratamiento
A, que corresponde a el material del molde.
Respuesta Grupos
A+ 12.5 a
A- 10.5 b
Donde A+ corresponde a realizar el brownie en aluminio y A- a realizar el brownie en vidrio.
Observamos que es mejor realizar el brownie en aluminio ya que produjo una exquisitez por
encima de dos que al haberlo elaborado en vidrio.
Los diseños factoriales axb son diseños con dos factores; factor A con a niveles y factor B
con b niveles, y supongamos que se hicieron n repeticiones. Sea 𝑦𝑖𝑗𝑘 la respuesta observada
cuando el factor A tiene el i-ésimo nivel, B tiene el j-ésimo nivel y en la k-ésima repetición.
Las abn observaciones se seleccionan al azar, por lo que este es un diseño completamente
aleatorizado. Una manera de escribir la matriz de diseño seria:
Factor B
Factor A 1 … b
1 𝑦111 , 𝑦112 , 𝑦1𝑏1 , 𝑦1𝑏2 ,
… , 𝑦11𝑛 … , 𝑦1𝑏𝑛
…
a 𝑦𝑎11 , 𝑦𝑎12 , 𝑦𝑎𝑏1 , 𝑦𝑎𝑏2 ,
… , 𝑦𝑎1𝑛 … , 𝑦𝑎𝑏𝑛
Modelo
𝑖 = 1, … , 𝑎
𝑌𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼𝛽)𝑖𝑗 + 𝜖𝑖𝑗𝑘 { 𝑗 = 1, … , 𝑏
𝑘 = 1, … , 𝑛
donde μ es la media global, αi es el efecto debido al i-ésimo nivel del factor A, βi es el efecto
debido al j-ésimo nivel del factor B, (αβ)ij representa al efecto de interacción de A y B en la
combinación ij y εijk es el error aleatorio.
Hipótesis
𝐻0 ∶ 𝛼1 = 𝛼2 = ⋯ = 𝛼𝑎 = 0
𝐻𝐴 ∶ 𝛼𝑖 ≠ 0 para algún 𝑖
𝐻0 ∶ 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑏 = 0
𝐻𝐴 ∶ 𝛽𝑗 ≠ 0 para algún 𝑗
Notación
𝑎 𝑏 𝑛
𝑌…
𝑌 … = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅ … =
𝑎𝑏𝑛
𝑖=1 𝑗=1 𝑘=1
𝑏 𝑛
𝑌𝑖 . .
𝑌𝑖 . . = ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅𝑖 . . = 𝑖 = 1, … , 𝑎
𝑏𝑛
𝑗=1 𝑘=1
𝑎 𝑛
𝑌.𝑗 .
𝑌.𝑗 . = ∑ ∑ 𝑌𝑖𝑗𝑘 𝑌̅.𝑗 . = 𝑗 = 1, … , 𝑏
𝑎𝑛
𝑖=1 𝑘=1
𝑛
𝑌𝑖𝑗 .
𝑌𝑖𝑗 . = ∑ 𝑌𝑖𝑗𝑘 𝑌̅𝑖𝑗 . =
𝑛
𝑘=1
Análisis de varianza
Sea N=abn
Tabla ANOVA
Fuente de
Suma de Cuadrados G.L. CM F0 Valor p
Variación
𝑎 𝐶𝑀𝐴
Efecto A 𝑌2 𝑖 . . 𝑌2 … a-1 𝐶𝑀𝐴
𝑆𝐶𝐴 = ∑ − 𝐶𝑀𝐸
𝑏𝑛 𝑁
𝑖=1
Efecto B 𝑏 b-1 𝐶𝑀𝐵 𝐶𝑀𝐵
𝑌 2 .𝑗 . 𝑌 2 …
𝑆𝐶𝐵 = ∑ − 𝐶𝑀𝐸
𝑎𝑛 𝑁
𝑗=1
Efecto AB 𝑎 𝑏 (a-1)(b-1) 𝐶𝑀𝐴𝐵 𝐶𝑀𝐴𝐵
𝑌 2 𝑖𝑗 . 𝑌 2 …
𝑆𝐶𝐴𝐵 = ∑∑ − − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 𝐶𝑀𝐸
𝑛 𝑁
𝑖=1 𝑗=1
Error 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 − 𝑆𝐶𝐴𝐵 ab(n-1) 𝐶𝑀𝐸
Total 𝑎 𝑏 𝑛 abn-1
2
𝑌 …
𝑆𝐶𝑇 = ∑ ∑ ∑ 𝑌 2 𝑖𝑗𝑘 −
𝑁
𝑖=1 𝑗=1 𝑘=1
Donde los cuadrados medios es la división de su suma de cuadrados entre sus respectivos
grados de libertad. Recordemos que F0 ~ 𝐹(1 − 𝛼, 𝑔. 𝑙., 𝑎𝑏(𝑛 − 1) ). Y notemos que los
grados de libertad de la suma de cuadrados del error son ab(n-1), por lo cual se necesitan
al menos dos repeticiones para poder construir la tabla ANOVA.
Ejemplo 7.4
Se estudia el rendimiento de un proceso químico. Se piensa que las dos variables más
importantes son la presión y la temperatura. Se seleccionan tres niveles de cada factor y
se lleva a cabo un experimento factorial con dos repeticiones. Los datos del rendimiento
son:
B: Presión (psig)
A: Temperatura 200 215 230
(°C)
150 90.4 90.7 90.2
90.2 90.6 90.4
160 90.1 90.5 89.9
90.3 90.6 90.1
170 90.5 90.8 90.4
90.7 90.9 90.1
Este es un diseño 3x3 con 2 repeticiones, entonces el modelo estadístico está dado por:
𝑖 = 1,2,3
𝑌𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼𝛽)𝑖𝑗 + 𝜖𝑖𝑗𝑘 { 𝑗 = 1,2,3
𝑘 = 1,2
𝐻0 ∶ 𝛼1 = 𝛼2 = 𝛼3 = 0
𝐻𝐴 ∶ 𝛼𝑖 ≠ 0 para algún 𝑖
𝐻0 ∶ 𝛽1 = 𝛽2 = 𝛽3 = 0
𝐻𝐴 ∶ 𝛽𝑗 ≠ 0 para algún 𝑗
Tabla ANOVA
Fuente de
Suma de Cuadrados G.L. CM F0 Valor p
Variación
Efecto A 0.30111 2 0.15056 8.4687 0.0085392
Efecto B 0.76778 2 0.38389 21.5937 0.0003673
Efecto AB 0.06889 4 0.01722 0.9687 0.4700058
Error 0.16000 9 0.01778
Total 1.29778 17
Vemos que el valor p del efecto AB es mayor que 0.05 por lo que no hay evidencia
estadística para rechazar H0. Entonces el efecto de la interacción AB no es significativo, así
que procedemos a quitarlo del modelo:
Tabla ANOVA
Fuente de
Suma de Cuadrados G.L. CM F0 Valor p
Variación
Efecto A 0.30111 2 0.15056 8.4687 0.004264
Efecto B 0.76778 2 0.38389 21.803 7.03e-05
Error 0.22889 13 0.01778
Total 1.29778 17
Veamos qué tratamiento es mejor; comparando los niveles de factor mediante Tukey con
ayuda de R:
Hipótesis Valor p Conclusión
𝐻0 : 𝜇 𝑇150 = 𝜇 𝑇160
0.1131230 Iguales
𝐻𝑎: 𝜇 𝑇150 ≠ 𝜇 𝑇160
𝐻0 : 𝜇 𝑇150 = 𝜇 𝑇170
0.1621386 Iguales
𝐻𝑎: 𝜇 𝑇150 ≠ 𝜇 𝑇170
𝐻0 : 𝜇 𝑇170 = 𝜇 𝑇160
0.0031390 Diferentes
𝐻𝑎: 𝜇 𝑇170 ≠ 𝜇 𝑇160
𝐻0 : 𝜇𝑃215 = 𝜇𝑃200
0.0031390 Diferentes
𝐻𝑎: 𝜇𝑃215 ≠ 𝜇𝑃200
𝐻0 : 𝜇𝑃230 = 𝜇𝑃200
0.0777138 Iguales
𝐻𝑎: 𝜇𝑃230 ≠ 𝜇𝑃200
𝐻0 : 𝜇𝑃215 = 𝜇𝑃230
0.0000534 Diferentes
𝐻𝑎: 𝜇𝑃215 ≠ 𝜇𝑃230
Los diseños factoriales 𝑎 × 𝑏 × 𝑐 son diseño que consideran tres factores; el factor A con 𝑎 niveles;
el factor B con 𝑏 niveles y el factor C con 𝑐 niveles. Por lo tanto, se tienen 𝑎𝑏𝑐 tratamientos, de
donde se pueden hacer 𝑛 repeticiones de cada tratamiento. Existe particularidades dentro de este
tipo de arreglos como por ejemplo los diseños 22 y los diseños 33 .
Hipótesis
𝐻0 ∶ 𝛼1 = 𝛼2 = ⋯ = 𝛼𝑎 = 0
𝐻𝐴 ∶ 𝛼𝑖 ≠ 0 para algún 𝑖
𝐻0 ∶ 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑏 = 0
𝐻𝐴 ∶ 𝛽𝑗 ≠ 0 para algún 𝑗
𝐻0 : γ1 = γ2 = ⋯ = γ𝑐 = 0
𝐻𝐴 : γ𝑘 ≠ 0 para algún
Notación
𝑎 𝑏 𝑐 𝑛
2
𝑌….2
𝑆𝐶𝑇 = ∑ ∑ ∑ ∑ 𝑌𝑖𝑗𝑘𝑙 −
𝑁
𝑖=1 𝑗=1 𝑘=1 𝑙=1
2𝑐
𝑌..𝑘 𝑌….2
𝑆𝐶𝐶 = ∑ −
𝑎𝑏𝑛 𝑁
𝑘=1
𝑎 𝑏
𝑌𝑖𝑗.. 𝑌….2
𝑆𝐶𝐴𝐵 = ∑ ∑ − − 𝑆𝐶𝐴 − 𝑆𝐶𝐵
𝑐𝑛 𝑁
𝑖=1 𝑗=1
𝑎 𝑐
𝑌𝑖.𝑘. 𝑌….2
𝑆𝐶𝐴𝐶 = ∑ ∑ − − 𝑆𝐶𝐴 − 𝑆𝐶𝐶
𝑏𝑛 𝑁
𝑖=1 𝑘=1
𝑏 𝑐
𝑌.𝑗𝑘. 𝑌….2
𝑆𝐶𝐵𝐶 = ∑ ∑ − − 𝑆𝐶𝐵 − 𝑆𝐶𝐶
𝑎𝑛 𝑁
𝑗=1 𝑘=1
𝑎 𝑏 2 𝑐
𝑌𝑖𝑗𝑘. 𝑌….2
𝑆𝐶𝐴𝐵𝐶 = ∑∑∑ − − 𝑆𝐶𝐴𝐵 − 𝑆𝐶𝐴𝐶 − 𝑆𝐶𝐵𝐶
𝑛 𝑁
𝑖=1 𝑗=1 𝑘=1
Luego
Análisis de varianza
Fuente de Suma de G. L C. M 𝐹0
variación cuadrados
Efecto A 𝑆𝐶𝐴 𝑎−1 𝐶𝑀𝐴 𝐶𝑀𝐴
𝐶𝑀𝐸
Efecto B 𝑆𝐶𝐵 𝑏−1 𝐶𝑀𝐵 𝐶𝑀𝐵
𝐶𝑀𝐸
Efecto C 𝑆𝐶𝐶 𝑐−1 𝐶𝑀𝐶 𝐶𝑀𝐶
𝐶𝑀𝐸
Efecto AB 𝑆𝐶𝐴𝐵 (𝑎 − 1)(𝑏 − 1) 𝐶𝑀𝐴𝐵 𝐶𝑀𝐴𝐵
𝐶𝑀𝐸
Efecto AC 𝑆𝐶𝐴𝐶 (𝑎 − 1)(𝑐 − 1) 𝐶𝑀𝐴𝐶 𝐶𝑀𝐴𝐶
𝐶𝑀𝐸
Efecto BC 𝑆𝐶𝐵𝐶 (𝑏 − 1)(𝑐 − 1) 𝐶𝑀𝐵𝐶 𝐶𝑀𝐵𝐶
𝐶𝑀𝐸
Efecto ABC 𝑆𝐶𝐴𝐵𝐶 (𝑎 − 1)(𝑏 − 1)(𝑐 − 1) 𝐶𝑀𝐴𝐵𝐶 𝐶𝑀𝐴𝐵𝐶
𝐶𝑀𝐸
Error 𝑆𝐶𝐸 𝑎𝑏𝑐(𝑛 − 1) 𝐶𝑀𝐸
Total 𝑆𝐶𝑇 𝑎𝑏𝑐𝑛 − 1
Donde los cuadrados medios es la división de su suma de cuadrados entre sus respectivos
grados de libertad.
Ejemplo
Factor 1 2 3
A = Tiempo 3 horas 4 horas
B = Presión 400 500 650
C = Porcentaje 2 4 8
Ahora revisaremos los supuestos del modelo mediante el uso del software estadístico R y a un nivel
de significancia del 99%.
Por lo tanto, se cumplen todos los supuestos del modelo y podemos concluir con la tabla ANOVA.
Tabla ANOVA
Fuente de Suma de
G.L. CM F0 Valor p
Variación Cuadrados
A 20.25 1 20.25 55.3951 0
B 19.3739 2 9.6869 26.4992 0
C 7.7639 2 3.8819 10.6193 0
AB 2.1950 2 1.0975 3.0023 0.07
BC 2.0817 2 1.0408 2.8473 0,08
AC 6.0911 4 1.5228 4.1657 0.014
ABC 1.9733 4 0.4933 1.3495 0.29
Error 6.58 18 0.3656
Total 197.099375 35
Observamos de la tabla ANOVA que las únicas fuentes de variación a considerar son las de A, B y C,
tanto como el de la interacción de AC. Por lo tanto, son los únicos que consideramos en el modelo.