You are on page 1of 23

Notas de Clases

Diseño de Experimentos
Luis Nava
CAPÍTULO TRES

DISEÑO DE BLOQUES ALEATORIZADOS

3.1. INTRODUCCIÓN

Uno de los principales objetivos que se persigue al diseñar un experimento, es reducir el


error aleatorio y de esta forma, incrementar la precisión de los resultados. Los mecanismos
utilizados para lograr tal objetivo son llamados Control Local. Uno de ellos es, disponer de
unidades experimentales en varios grupos homogéneos, llamados generalmente bloques,
admitiendo variación entre ellos.

El diseño completamente aleatorizado carece de tales medidas, solo se requiere unidades


experimentales homogéneas, lo que no es sencillo de garantizar, fundamentalmente cuando
el experimento requiere de un gran numero de unidades experimentales.

Consideramos el problema de determinar si distintas máquinas exhiben diferente velocidad


en el ensamblaje de un artículo. El gerente de una empresa desea comparar cuatro máquinas
diferentes y tomar alguna decisión acerca de cual máquina adquirir de acuerdo a la
velocidad de ensamblaje mostrada. El factor de interés es sólo la máquina. Es importante
tomar en cuenta que la operación de las máquinas requiere determinada destreza, esto
implica que habrá una diferencia entre los operadores, es decir, habrá una variación debido
a operadores.

Ahora bien, para obtener una medida del error es necesario usar en la investigación más de
una máquina de cada marca, por ejemplo, un conjunto de cuatro máquinas de cada marca.
Supongamos además que el experimento involucra cuatro operadores. Un diseño que
requiera que cada máquina sea operada una vez por cada operador, permitirá evaluar
independientemente la variación debida a operadores y por ende removerla del término del
error. A este diseño, se le denomina diseño de bloques completamente aleatorizado. Los
datos a ser analizados pueden ser arreglados en una tabla de doble clasificación, donde las
filas representan digamos, bloques y las columnas tratamientos (o viceversa).

Dependiendo del tamaño del bloque usado, existen dos tipos básicos de diseños de bloques
aleatorizados:

a. Diseño de bloque completo: Cada bloque contiene todos los tratamientos. Esto es,
el material experimental es dividido en b bloques de k unidades experimentales cada
uno, donde k representa el número de tratamientos (Tabla 1)

b. Diseño de bloque incompleto: El tamaño de al menos un bloque es menor que el


número de tratamientos en el experimento. Existen dos tipos de bloques
aleatorizados incompletos:

44
Notas de Clases
Diseño de Experimentos
Luis Nava
b.1. Balanceado: Todos los bloques tienen el mismo tamaño y el número de
bloques en el que cualquier par de tratamientos aparece juntos, es constante. Si
además, el número de tratamientos es igual al número de bloques, decimos que el
diseño es simétrico. (Tabla 2)

b.2. No Balanceado: El número de bloques que contiene cualquier par de


tratamientos no es constante, puede diferir de un par a otro. (Tabla 3)

TABLA 1
TRATAMIENTOS
A B C D
BLOQUES B A C D
D C B A

TABLA 2 TABLA 3

TRATAMIENTOS TRATAMIENTOS
A B C D B A E D
A B C E A B C D
A B D E B A C D
BLOQUES A C D E BLOQUES E D C A
B C D E D C A B

Cada uno de estos casos debe ser analizado a través de una técnica en particular. Esto es,

TECNICA
Completo Andeva de dos vías
DISEÑO DE
BLOQUES Balanceado - Andeva ajustado
Incompleto
No -Método de Mínimos Cuadrados
Balanceado General

3.2. DISEÑO DE BLOQUES ALEATORIZADOS CON BLOQUES


COMPLETOS

Consideremos ahora en detalle el diseño de bloques aleatorizados con bloques completos.


La aleatorización se da de la siguiente manera: Los tratamientos son primero numerados de
1 a k en cualquier orden. Las unidades en cada bloque son además numeradas,
convenientemente de 1 a k. Los k tratamientos son asignados en forma aleatoria a las k
unidades en cada bloque. La distribución aleatoria puede ser hecha o bien, consultando una
tabla de números aleatorios, sorteos de lotes o el lanzamiento de una moneda como se
describe en el diseño completamente aleatorizado.

45
Notas de Clases
Diseño de Experimentos
Luis Nava
Consideremos el diseño de efectos fijos discutido en el capítulo anterior con una restricción
adicional, el material experimental es agrupado en bloques homogéneos. Si  i representa el
efecto debido al i-ésimo bloque, el correspondiente modelo puede ser formulado como:

Yij     i   j   ij i = 1,2,...,b (1)


j = 1,2,…,k

donde ijNID(0,2), ,  i y j son parámetros tales que  i representa el efecto del i-


ésimo bloque, j representa el efecto del j-ésimo tratamiento y  la media general.
En este modelo,

 i = i.-  , j = .j-  (2)

 i.: es el valor esperado de la población de la cual son tomadas las observaciones


para el i-ésimo bloque.
 .j: es el valor esperado de la observación en el j-ésimo tratamiento.

Suponiendo que el modelo es de efectos fijos, se sigue que:

b k

   
i 1
i
j 1
j 0 (3)

Un supuesto adicional a los ya considerados, es que el efecto de cada tratamiento es el


mismo en todos los bloques. Esto significa que no existe interacción entre bloques y
tratamientos.

Del modelo anterior se tiene que

(Yij -) = (i.- ) + (.j - ) + (Yij - i.-.j + ) (4)

Ahora bien, los datos observados de un diseño en el cual los tratamientos son arreglados en
b bloques completos pueden presentase como en la Tabla 4.

Tabla 4. Datos de un Diseño de Bloques


Aleatorizados con Bloques Completos
Tratamientos
1 2 3 ... j ... k Total
Bloques
1 Y11 Y12 Y13 ... Y1j ... Y1k Y1.
. . . . ... . ... .
. . . . ... . ... .
Bloques
b Yb1 Yb2 Yb3 ... Ybj ... Ybk Yb.
Total Y.1 Y.2 Y.3 ... Y.,j ... Y.k Y..
Tratamiento

46
Notas de Clases
Diseño de Experimentos
Luis Nava
En el desarrollo analítico del ANDEVA se necesita calcular:

b k b k
a.- El gran total Y..   Yi.   Y. j   Yij
i 1 j 1 i 1 j 1
k
b.- Y. j   Yij = Total por tratamientos.
j 1
b
c.- Yi.  Yij = Total por bloques (5)
i 1

Los promedios:

Y. j Yi. Y ..
Y. j  ; Yi.  ; Y..  (6)
b k kb

representan los estimadores para .j, i. y ,, respectivamente.

De aquí que se puede, entonces, en términos de los estimadores, expresar la ecuación de la


desviación estándar total de la forma siguiente:

(Yij  Y.. )   (Y i.  Y.. )  (Y . j  Y.. )  (Yij  Y i.  Y . j  Y.. )


__ __ __ __ __ __ __ __

(7)

Si elevamos al cuadrado esta expresión y sumamos para todas las observaciones, se tiene
que:

b k b k

ij  Y.. )    (Y i .  Y.. )  (Y . j  Y.. )  (Yij  Y i .  Y . j  Y.. )


__ __ __ __ __ __ __ __

 (Y 2
2
i 1 j 1 i 1 j 1

b k __ __ b k __ __ b k __ __ __ b k __ __ __ __ __
  (Y i.  Y.. ) 2    (Y . j  Y.. ) 2   (Yij  Y i.  Y . j  Y.. ) 2  2 (Y . j.  Y.. )(Yij  Y i.  Y . j  Y.. )
i 1 j 1 i 1 j 1 i 1 j 1 i 1 j 1

b k
 2 (Y i.  Y.. ) (Y . j  Y.. )  (Yij  Y i.  Y . j  Y.. )
__ __ __ __ __ __ __

i 1 j 1

k k __ __ k k __ k k __ __ __
  (Y i.  Y.. ) 2   (Y. j  Y.. ) 2   (Yij  Y i.  Y . j  Y.. ) 2
i 1 j 1 i 1 j 1 i 1 j 1
(8)

La ecuación (8) es la ecuación fundamental de un análisis de varianza de dos vías, la cual


establece que:

SCTot = SCBl + SCTr + SCE (9)

47
Notas de Clases
Diseño de Experimentos
Luis Nava
Cada una de estas sumas de cuadrado tiene asociado sus correspondientes grados de
libertad:

TOTAL BLOQUES TRATAMIENTOS ERROR (10)


(bk-1) (b-1) (k-1) (b-1)(k-1)

Para efecto de cálculos, las formulas dadas en (8) usualmente se desarrollan y rescriben de
la forma siguiente:

b
Y2
k k Y. 2j Y..2
SCTot   Y  .. 2
ij SCTr   
i 1 j 1 bk j 1 b bk
(11)

2
b
Yi.2 Y..2 b k b
Yi.2 k Y. j Y..2
SCBl    SCE   Yij2      SCTo  SCBl  SCTr
i 1 k bk i 1 j 1 i 1 k j 1 b bk

Ahora bien, si el bloqueo es usado para reducir el error experimental, comparando los
modelos para los diseños completamente aleatorizados y de bloques completamente
aleatorizados para la i-ésima observación bajo el j-ésimo tratamiento se tiene que:

 *ij   ij   i
(12)

donde  ij* es el error aleatorio del diseño completamente aleatorizado,  ij el error para el
diseño de bloques completamente aleatorizado y  i el efecto de bloque.

Esta igualdad implica que la suma de cuadrados del Error en el Diseño Completamente
Aleatorizado es igual a la Suma de Cuadrados de Bloques más la Suma de Cuadrados del
Error en le Diseño de Bloques, es decir :

SCE(D.C.A.) = SCBl + SCE(D.B.C.A.) (13)

Las sumas de cuadrados dadas en (11), divididas por sus grados de libertad proveen otros
estadísticos, llamados cuadrados medios.

SCE SCTr SCBl


CME  CMTr  CMBl 
(k  1)(b  1) (k  1) (b  1)

Si la varianza de los errores se supone constante,  2,  i y j fijos, entonces los valores


esperados de estos cuadrados medios están dados por:

E CME  E SCE k  1b  1  (k  1)(b  1) 2 (k  1)(b  1) (14)

48
Notas de Clases
Diseño de Experimentos
Luis Nava
b
k   i2
1  b

E CMBl    k   i2  (b  1) 2    2  i 1 (15)
(b  1)  i 1  (b  1)

k
b 2j
E CMTr  
1
 (k  1) 2  b 2j 2  j 1
(16)
(k  1) j 1 (k  1)

Existen dos posibles hipótesis a probar aquí, una sobre el efecto de los bloques y otra sobre
el efecto de los tratamientos.

H 01 :  i  0 (Igualdad de efectos de Bloques)


H 02 :  j  0 (Igualdad de efectos de Tratamientos)

Si H 01 es verdadera, el valor esperado del cuadrado medio de los bloques está dado por:

E CMBl    2 (17)

Por consiguiente, bajo la hipótesis nula cierta, el cociente

CMBl
Fc1  F(b-1),(b-1)(k-1) (18)
CME

De aquí podemos indicar que cuando la hipótesis nula H 01 no es verdadera, se espera que
ocurra un valor grande para Fc1 , es decir, H 01 debe ser rechazada. Fc1 es chequeado contra
el valor crítico F(b-1),(b-1)(k-1); , si Fc1 es mayor que este valor crítico, rechazamos H 01 .

Por razones similares, si H 02 es verdadera, el valor esperado del cuadrado medio de los
tratamientos está dado por:

E CMTr    2 (19)

Bajo H 02 cierta, el cociente

CMTr
Fc2  F(k-1),(b-1)(k-1) (20)
CME

49
Notas de Clases
Diseño de Experimentos
Luis Nava
2 2
y H se rechaza si F es mayor que el valor crítico.
0 c

Todo este desarrollo lo podemos resumir como se muestra en la Tabla 5. Esta tabla recibe
el nombre de Tabla de Análisis de Varianza par el Diseño de Bloques Completamente
Aleatorizado.

Tabla 5. Tabla de Análisis de Varianza para el


Diseño de Bloques Completamente Aleatorizado
Fuente de g.l. Sumas de Cuadrados Medios Fc
Variación Cuadrados
Tratamientos (k-1) SCTr CMTr=SCTr/(k-1) CMTr/CME
Bloques (b-1) SCBl CMBlr=SCBl/(b-1) CMBl/CME
Error (b-1)(k-1) SCE CME=SCE/(b-1)(k-1)
Total kb-1 SCT

EJEMPLO 1

Se realiza un experimento para determinar el efecto que tiene el grado de trabajo (vueltas
por pulgada) en la resistencia del algodón. Se decide utilizar cinco niveles para el grado de
trabajo; 150, 163, 169, 178 y 10 vueltas por pulgadas. Se sabe que además de este factor,
existen otras posibles fuentes de variación, como las máquinas, operadores, material
experimental, entre otros. Después de una discusión se decide ignorar el efecto de estos
factores, excepto el factor máquinas, el cual será controlado. La variable respuesta medida
es el número de roturas por cada cien libras de material. La tabla 3-1 muestra los resultados
obtenidos:

Tabla 3-1
Número de Rupturas por cada cien libras

Grados de Trabajo
10 163 169 178 190
1 9 24 42 29 68
2 12 27 23 49 34
Máquinas 3 12 22 22 17 60
4 31 16 47 45 50
5 22 25 17 39 57
6 10 24 23 44 37

Probar la hipótesis de que no existen efectos de tratamientos a un nivel de significación del


5%.

Solución:

El diseño utilizado en esta investigación es un diseño de bloques completos, donde:

50
Notas de Clases
Diseño de Experimentos
Luis Nava
- Tratamientos: Grados de Trabajo
- Bloques: Máquinas
- Variable Respuesta: Número de roturas por cada cien libras de material

La primera hipótesis a probar es:

Ho:1=2=3=4=5=0

Bajo el supuesto de normalidad se puede hacer uso de la técnica de análisis de varianza


para probar dicha hipótesis.

Y.1 = 96 Y1. = 172 Y..1 = 106 k=5


b=6
Y.2 = 138 Y2. = 145 Y..2 = 102

Y.3 = 174 Y3. = 133 Y..3 = 91 Y.. = 937

Y.4 = 224 Y4. = 189 Y..4 = 104 5 6

 Y
j 1 i 1
2
ij  36 .475

Y.5 = 305 Y5. = 160 Y..5 = 104

Y6. = 138

937 2 937 2
SCTo = 36.475 - = 7.209,367 SCTr = 33.650,167 - = 4.384,533
30 30

937 2
SCBl = 29.732,600 - = 466,967
30

SCE = 7.209,367 – 4.384,533 – 466,967 = 2.357,867

De aquí se puede construir la siguiente tabla de Análisis de Varianza:

F.V. G.L. S.C. C.M. FC


Tratamiento 4 4.384,533 1.096,133 9,298
Bloques 5 466,967 93,393 0,792
Error 20 2.357,867 117,893
Total 29 7.209,367

Si se usa un nivel de significación del 5%, el valor crítico es F4,20,0.05 = 2,87 y dado que
9,298 es mayor que 2,87, entonces se rechaza la hipótesis, es decir, se concluye que existe
efectos del grado de trabajo sobre el número de roturas.

51
Notas de Clases
Diseño de Experimentos
Luis Nava
Al observar el valor de la Fc asociada con los bloques, 0.792, podemos concluir que no
existen diferencias significativas entre las máquinas, lo que implica que el diseño de
bloques no se justifica.

3.2.1. ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO

Bajo el supuesto de un modelo de efectos fijos, podemos usar el método de mínimos


cuadrados para estimar los parámetros del modelo de diseño de bloques completo
aleatorizado.

El modelo es:
Yij     i   j   ij
i=1,...,b
j=1,...,k

El método de mínimos cuadrados implica la obtención de un conjunto de ecuaciones,


llamadas ecuaciones normales. Las ecuaciones normales para este modelo pueden
obtenerse mediante el procedimiento mostrado en el capitulo anterior, o mediante la
aplicación de las siguientes reglas, las cuales son válidas para cualquier modelo.

 Regla 1: Hay una ecuación normal para cada parámetro a ser estimado.
 Regla 2: El lado derecho de cualquier ecuación normal es la suma de todas las
observaciones que contienen el parámetro asociado con esa ecuación normal particular.
 Regla 3: El lado izquierdo de cualquier ecuación normal es la suma de todos los
parámetros, donde cada parámetro es multiplicado por el número de veces que aparece
en el total derecho.

Para este modelo se tiene entonces:

: kb ̂ + b ˆ1 + b ˆ2 +… + b ˆk + k̂ 1 + k̂ 2 +… + k̂ b = Y..


1 : b ̂ + b ˆ1 + ̂ 1 + ̂ 2 +… + ̂ = Y.1
b

2 : b ̂ + b ˆ2 + ̂ 1 + ̂ 2 +… + ̂ b = Y.2
      
k : b ̂ + b ˆk + ̂ 1 + ̂ 2 +… + ̂ b = Y.k
1 : k ̂ + ˆ1 + ˆk + k ̂ 1 = Y1.
2 : k ̂ + ˆ1 + ˆk +k ̂ 2 = Y2.
       
b : k ̂ + ˆ1 + ˆk … + k ̂
b
= Yb.

Obsérvese que al sumar las ecuaciones asociadas con los  j , reproducen la ecuación
asociada con  . Situación similar ocurre con las ecuaciones asociadas con los  i . Hay por

52
Notas de Clases
Diseño de Experimentos
Luis Nava
lo tanto, dos dependencias lineales en este sistema de ecuaciones normales. Surge la
necesidad de usar los contrastes usados en la ecuación (3). De aquí se tiene que:

kb ̂ = Y..
b ̂ + b ˆ j = Y.j (21)
k ̂ +k ̂ i = Yi.

Su solución está dada por:

̂ = Y../kb = ..Y
ˆ j = (Y.j-b ..Y )/b = Y. j  Y.. (22)
̂ i = (Yi.-k ..Y )k = Yi.  Y..

3.2.2. ADECUACIDAD DEL MODELO

Para chequear los supuestos de normalidad, igualdad de varianzas y la no interacción


bloques-tratamientos en el diseño de bloques, igual que en el Diseño Completamente
Aleatorizado, se usa el análisis de residuos.

El gráfico de probabilidad normal nos permitirá chequear el supuesto de normalidad; los


gráficos por tratamientos y por bloques, serán usados para comprobar la igualdad de
varianza para tratamientos y bloques respectivamente. El gráfico de los Yˆij .. versus los
residuos, puede ser usado para chequear la aditividad del modelo, es decir, para chequear el
supuesto de no interacción bloques-tratamiento.

3.2.3. EFICIENCIA RELATIVA DEL DISEÑO DE BLOQUES


COMPLETAMENTE ALEATORIZADO

En muchas situaciones prácticas es bastante obvio que existe una diferencia sustancial
entre los efectos de bloque, es decir, entre los  i . En tales casos, no hay duda que los
bloques serán utilizados con el propósito de reducir el error experimental. Existen casos en
los que esta diferencia no es tan clara o, no se tiene información precisa sobre los bloques
al comienzo del experimento.

De esta forma, podemos estar corriendo un modelo ineficiente, lo que se traduce en una
pérdida de grados de libertad para la SCE , para el mismo número de observaciones, con
respecto a un diseño completamente aleatorizado. Esto entonces, puede resultar en una
pérdida de potencia o sensibilidad con respecto a la comparación de tratamientos.

Una vez que un experimento ha sido conducido en un Diseño de Bloques Completamente


Aleatorizado, no puede ignorarse el bloqueo en el análisis. Podemos preguntarnos entonces:

53
Notas de Clases
Diseño de Experimentos
Luis Nava
¿Cuánto hemos ganado usando Diseño de Bloques Completamente Aleatorizado en lugar
de un Diseño Completamente Aleatorizado con el mismo número de unidades
experimentales?

Para estudiar este problema, se propone estimar la eficiencia relativa del Diseño de Bloques
Completamente Aleatorizado comparado con el Diseño Completamente Aleatorizado.
(Yates 1935)

Eficiencia Relativa. Si se desea estimar la eficiencia relativa de un primer diseño respecto


a un segundo diseño, se hace uso de la expresión

(1  1)(2  3) CME(2)


Eficiencia Relativa = E.R.  (23)
(1  3)(2  1) CME(1)

donde CME(1) y CME(2) son los cuadrados medios del error de los diseños 1 y 2
respectivamente, y 1 y 2 sus grados de libertad.

Se dice que el primer diseño es mas preciso que el segundo sólo sí E.R. > 1.

Par el Diseño de Bloques Completamente Aleatorizado respecto al Diseño Completamente


Aleatorizado, esta eficiencia es definida por:

E.R. 
(k  1)(b  1)  1(kb  k )  3  CME( D.C.A.) (24)
(k  1)(b  1)  3(kb  k )  1 CME( D.B.C.A.)

Donde CME(D.C.A) y CME(D.B.C.A) son el cuadrado medio del error de los diseños
completamente aleatorizados y de bloques completamente aleatorizados respectivamente.

Este estadístico puede ser visto como e incremento en replicaciones que se requieren para
que un diseño completamente aleatorizado sea tan efectivo como el diseño de bloques
completamente aleatorizado.

Ahora bien, debemos definir los cuadrados medios antes mencionados, para poder calcular
la eficiencia relativa.

El CME(D.B.C.A) es el cuadrado medio del error de lo diseño de bloques completamente


aleatorizados.

El CME(D.C.A) está dado por:

(b  1)CMBl  b(k  1)CME( D.B.C. A)


CME( D.C. A)  (25)
kb  1

54
Notas de Clases
Diseño de Experimentos
Luis Nava
EJEMPLO 2

Para los datos del ejemplo 1 de esta sección, calcular e interpretar la eficiencia relativa del
diseño de bloques respecto del diseño completamente aleatorizado.

E.R. 
(k  1)(b  1)  1(kb  k )  3  CME( D.C.A.)
(k  1)(b  1)  3(kb  k )  1 CME( D.B.C.A.)
donde:
(b  1)CMBl  b(k  1)CME( D.B.C. A)
CME( D.C. A) 
kb  1

5 * 93,393  24 *117 ,893


=  113,669
2
Por lo tanto;

21 * 28 113,669
E.R.  *  0,948
23 * 26 117 ,893

Lo que indica que no existe ninguna ganancia en cuanto a la precisión al usar de bloques.

3.2.4. OBSERVACIONES FALTANTES

En ocasiones puede ocurrir que por razones que no pueden atribuirse al efecto de los
tratamientos, una o varias observaciones pueden no estar disponibles. Esto introduce un
nuevo problema dentro del análisis, puesto que los tratamientos ya no son ortogonales a
bloques, esto es, todos los tratamientos no ocurren en todos los bloques.

Este problema podemos enfrentarlo estimando las observaciones faltantes y realizar el


análisis, considerando esta situación como el dato real y los grados de libertad reducirlos en
uno.

Supongamos que la observación para el tratamiento j* en el bloque i*, ( Yi* j * ), es faltante.

La suma de cuadrados del error para el diseño de bloques completamente aleatorizados,


está dada por:

SCE = SCTo-SCBl-SCTr

2
b k
Yi.2 k Y. j Y..2
b
 SCE  Y      2
ij
i 1 j 1 i 1 k j 1 b bk

55
Notas de Clases
Diseño de Experimentos
Luis Nava
(  Yi.2  (Yi * .  Yi * j * ) 2 ) (  Y  (Y. j *  Yi * j * ) ) (   Yij  Yi * j * )
2 2 2
.j

SCE  (   Yij2  Yi *2 j * )  i  i
j  j* i i* j  j*
 
*

k b kb (25)
i i* j  j*

Una buena estimación de Yi* j * puede considerarse aquella que minimice la suma de
cuadrados del error. Luego, derivando SCE con respecto a Yi* j * e igualando a cero, lo cual
es una condición necesaria para minimizar SCE, obtenemos:

bYi* .  kY. j *  Y..*


Yi* j *  (26)
(k  1)(b  1)

donde :

Y..*    Yij ; Yi * .  Yij ; Y. j *  Y ij


i i j  j
* *
i i *
j  j*

Podemos entonces, sustituir Yi* j * para la observación faltante y efectuar ahora, el análisis de
varianza usual.

Aunque el valor estimado hace que la suma de cuadrados del error sea mínima, la suma de
cuadrados de tratamiento es producida con sesgo hacia arriba. Este sesgo es una cantidad
dada por:

(Yi * .  (k  1)Yi * j * ) 2
Sesgo  1
k (k  1)

En la siguiente tabla , se muestran los cambios en los grados de libertad:

TOTAL BLOQUES TRATAMIENTOS ERROR

(bk-2) (b-1) (k-1) (k-1)(b-1)-1

Los grados de libertad del error se ven reducidos por cada observación faltante.

Otra forma de enfrentar el problema, es haciendo uso del análisis de covarianza. Para el
caso de una observación faltante el modelo a considerar estaría dado por:

Yij     i   j  X jl   ij (27)

donde:

1
Steel y Torrie, Bioestadística Principios y Procedimientos, Segunda Edición, 1988, Pág. 202

56
Notas de Clases
Diseño de Experimentos
Luis Nava
0 si ii ;j j
* *

Yij =
Yij en otro caso

-1 si i  i* ; j  j *
Xij =
0 en otro caso

De aquí ̂ es una restricción de Yi* j * .

Este modelo puede extenderse en el caso de que haya dos o mas observaciones faltantes,
incluyendo una covariable por cada observación faltante.

EJEMPLO 3

En el ejemplo 1, de esta sección, suponga que la observación asociada con el tratamiento 3


en el bloque 2 es faltante. Se pide:

a.- Estimar la observación faltante.


b.- Analizar esta información con el dato estimado.

Solución:

a.- Para estimar la observación faltante, c, se debe evaluar

bYi* .  kY. j *  Y..*


Yi* j * 
(k  1)(b  1)

6Y2..  5Y.3  Y..*


Y23 
(5  1)(6  1)

donde: Y2. = Total para el bloque 2 con la observación faltante =122


Y.3 = Total para el tratamiento 3 con la observación faltante =151
Y.. = Gran total con la observación faltante =914

Luego:
6 * 122  5 * 151  91
Y23   21,15
20

57
Notas de Clases
Diseño de Experimentos
Luis Nava
b.- La siguiente tabla muestra los resultados del análisis de varianza donde Y23 ha sido
estimado por el valor 21,15

F.V. G.L. S.C. C.M. FC


Grados 4 4360,815 1090,204 8,865
Máquinas 5 445,048 89,010 0,724
Error 19 2336,585 7,66
Total 28 7142,448

A un nivel de significación del 5% (F4;19;0,05=2,90), se puede concluir que existe efectos de


tratamientos.

Como se dijo anteriormente, la suma de cuadrados de tratamientos obtenida al usar la


observación estimada, esta sesgada hacia arriba, por lo tanto, para obtener una estimación
insesgada, debemos obtener el sesgo y restarlo a la suma de cuadrados obtenida. Una
alternativa es la utilizada por el SAS en su procedimiento GLM, en el que la suma de
cuadrados tipo III, representa la suma de cuadrados de tratamientos insesgada.

EJEMPLO 4

Sean los siguientes datos correspondientes a un diseño de bloques completos aleatorizados:

Bloques
1 2 3 4
1 12 18 9
Tratamientos 2 17 21 15 11
3 14 19 17 8
4 16 22 14 13

Usando el método tradicional, debemos inicialmente estimar Y21.

4Y2*.  4Y.1*  Y..*


Y2*1*   19,7778
9

Luego, este valor se incorpora a los datos sustituyendo a la observación faltante y la tabla
de análisis de varianza en este caso es:

F.V. G.L. S.C. C.M. FC


Tratamientos 3 9,537 3,179 0,722
Bloques 3 210,981 70,327 15,976
Error 8 35,222 4,402
Total 14 255,740

58
Notas de Clases
Diseño de Experimentos
Luis Nava
El sesgo viene dado por:

(Yi * .  (k  1)Yi * j * ) 2
Sesgo   0,59256
k (k  1)

Por lo tanto,

SCTr(Insesgada) = 9,537 – 0,59256 =8,9444

Usando el paquete estadístico SAS, la observación faltante es reemplazada por un punto (.).
El análisis de varianza resultante se muestra en la siguiente tabla:

The GLM Procedure


Class Level Information
Class Levels Values
trat 4 1 2 3 4
blq 4 1 2 3 4

Number of observations 16

NOTE: Due to missing values, only 15 observations can be used in this analysis.

Dependent Variable: Y
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 6 199.7111111 33.2851852 7.56 0.0059
Error 8 35.2222222 4.4027778
Corrected Total 14 234.9333333

R-Square Coeff Var Root MSE Y Mean


0.850076 13.92664 2.098280 15.06667

Source DF Type I SS Mean Square F Value Pr > F


trat 3 23.1833333 7.7277778 1.76 0.2332
blq 3 176.5277778 58.8425926 13.36 0.0018

Source DF Type III SS Mean Square F Value Pr > F


trat 3 8.9444444 2.9814815 0.68 0.5901
blq 3 176.5277778 58.8425926 13.36 0.0018

La suma de cuadrados de tratamiento tipo III, como observamos, es insesgada.

Este procedimiento resulta, por lo tanto, mas eficiente que el tradicional, principalmente
cuando hay mas de una observación faltante.

Esta tabla es el resultado de correr el siguiente programa:

data prueba bloques;


do trat = 1 to 4;
do blq = 1 to 4;
input Y @;
output;
end;

59
Notas de Clases
Diseño de Experimentos
Luis Nava
input;
end;
cards;
12 . 18 9
17 21 15 11
14 19 17 8
16 22 14 13
;
proc glm;
class trat blq;
model Y=trat blq;
run;

3.2.5. COMPARACIÓN DE MEDIAS DE TRATAMIENTO

Cuando la hipótesis acerca de la igualdad de efectos de tratamientos es rechazada, surge la


necesidad de determinar que medias de tratamiento difieren. Para ello, cualquiera de los
procedimientos propuestos para el Diseño Completamente Aleatorizado son válidos. Estos
procedimientos también son útiles para comparar bloques. Aquí n debe ser reemplazado por
k.

EJEMPLO 5

Para los datos del ejemplo 1, determina mediante el método de Scheffé, que pares de
medias difieren.

Solución:

Se tiene para este ejemplo que las medias para cada uno de los cinco tratamientos son:

Y.1  16 ; Y.2  23 , Y.3  29 ; Y.4  37 ,17 ; Y.5  51

La siguiente tabla muestra las diferencias entre todos los posibles pares de medias:

Y.4 Y.3 Y.2 Y.1


Y.5 13,83 22* 28* 35*

Y.4 -- 8,17 14,2 21,17*

Y.3 -- -- 6 13

Y.2 -- -- -- 7

El valor crítico está dado por:

60
Notas de Clases
Diseño de Experimentos
Luis Nava
2
r  (k  1) Fk 1;( k 1)(b 1);  CME
b

2  117 ,893
r  4  2,87  21,09
6

Luego, la media del tratamiento 5 difiere en forma significativa de las medias de los
tratamientos 1,2 y 3. De la misma forma, la media del tratamiento 4 difiere de la del
tratamiento 1, a un nivel de significación del 5%.

3.4. TEST DE SIGNIFICACIÓN DE MÍNIMOS CUADRADOS

Vamos a ilustrar aquí, como es aplicada la metodología de regresión general a los diseños
de bloques, considerando los siguientes modelos:

3.4.1. Modelo Aditivo


3.4.2. Modelo con interacción

3.4.1. Modelo Aditivo: Este modelo supone que no existe interacción entre bloques y
tratamientos. El modelo de análisis de análisis de varianza puede ser escrito en
este caso, como:

Yij     i   j   ij

donde: i = 1,2,...,b j=1,2,...,k

Supongamos ahora que ̂ , ̂ i y ˆ j son los estimadores mínimos cuadrados de  ,  i y


 j , respectivamente, luego, el valor ajustado o estimado de Yij es dado por:

Yˆij  ˆ  ˆ i  ˆ j (28)

 Yi.  Y. j  Y..

Ahora bien, la reducción en la suma de cuadrados por ajuste del modelo completo es:

SC Re g (  , ,  )  ˆY..   ˆ i Yi.  ˆ j Y. j


i j

 Y..Y..   (Yi.  Y.. )Yi.   (Y. j  Y.. )Y. j


i j
2 2 2
b
Y Y k
Y
  
i. .j ..
(29)
i 1 k j 1 b kb

61
Notas de Clases
Diseño de Experimentos
Luis Nava

y la suma de cuadrados del error


b k
SCE   Yij2  SC Re g (  ,  ,  ) (30)
i 1 j 1

Estas sumas de cuadrado tienen asociados (k+b-1) y (k-1)(b-1) grados de libertad,


respectivamente.

Si deseamos probar la hipótesis que todos los tratamientos no son significativos, esto es,
H o :  j  0 para todo j, el modelo reducido puede ser escrito como:

Yij     i   ij

La reducción en la suma de cuadrados por ajuste de este modelo es:


b

Y 2
i.
SC Re g (  ,  )  ˆY..   ˆ i Yi.  i 1
(31)
i k

la cual tiene b grados de libertad. Además, la suma de cuadrados debido a  j después de


ajustados  y  i es:
SC Re g ( / ,  )  SC Re g ( , ,  )  SC Re g (,  )

k Y. j Y..2
  (32)
j 1 b kb

Esta ecuación es la que hemos denominado suma de cuadrados de tratamientos y tiene (k-1)
grados de libertad. Ahora bien, si se desea probar si el efecto de bloques es o no
significativo, el modelo reducido puede ser escrito como:

Yij     j   ij (33)

La reducción en la suma de cuadrados por ajuste de este modelo es:

K Y. 2j
SC Re g  ,   
j 1 b

la cual tiene k grados de libertad. Además, la suma de cuadrados debido a i después de


ajustados  y  j es:

SC Re g (  / , )  SC Re g ( , ,  )  SC Re g (, )

62
Notas de Clases
Diseño de Experimentos
Luis Nava
b 2
Yi. Y
  ..
(34)
i 1 k kb

Esta ecuación representa la suma de cuadrados de bloques y tiene (b-1) grados de libertad.
Estos resultados se resumen en la tabla 9.

Tabla 9. Tabla de ANDEVA. Modelo Aditivo


Fuente grados Sumas de Cuadrados F
De Variación de libertad Cuadrados Medios
Tratamiento (k-1) SCTr  SC Re g ( / ,  ) SCTr/(k-1) CMTr/CME

Bloques (b-1) SCBl  SC Re g (  / , ) SCBl/(b-1) CMBl/CME

Error N-k-b+1 SCE=SCTo-SCBl-SCTr SCE/(k-1)(b-1)

b k
Y...2
Total (N-1) SCTo   Y  2
ijl
i 1 j 1 l N

3.4.2. Modelo con Interacción: Hay muchos experimentos en el cual es posible


analizar el cambio esperado en la variable respuesta debido a bloques y
tratamientos.

Denotemos por ij el efecto de la interacción debido al tratamiento j y al bloque


i. El modelo apropiado en este caso es:

Yij     i   j  ij   ij (35)

Para analizar este efecto de interacción, será necesario coleccionar varias


observaciones para cada posible combinación de tratamientos y bloques. Sea nij
el número de repeticiones para la combinación del tratamiento j y el bloque i. Si
el número de repeticiones es igual a 1, entonces debemos considerar mejor, el
modelo aditivo.

Consideremos que se tienen k tratamientos, b bloques y r repeticiones en cada celda. Sean


ˆ , ˆ i ,ˆ j , y, ̂ij , los estimadores mínimos cuadrados de , i, j y ij respectivamente,
entonces el valor ajustado de Yijl esta dado por:

Yˆijl  ˆ  ˆi  ˆ j  ˆij

De aquí que:

eijl  Yijl  ˆ  ˆi  ˆ j  ˆij

63
Notas de Clases
Diseño de Experimentos
Luis Nava

Si elevamos al cuadrado y sumamos para todo i, j, l , tenemos:

 e
i j l
2
ijl  SCE   (Yijl  ˆ  ˆi  ˆ j  ˆij )2
i j l
(36)

Obtenemos ahora las derivadas parciales de (55) con respecto a ˆ , ˆ i ,ˆ j , y, ̂ij e igualando
a cero se obtiene el siguiente conjunto de ecuaciones normales:

Y...  r (bkˆ  k  ˆ i  bˆ j   ˆ ij )


i j i j

Yi..  r (k̂  k ̂ i  bˆ j   ˆij )


j j

Y.. j.  r (bˆ   ˆi  bˆ j   ˆij ) (37)


i i

Yij.  r ( ˆ  ˆ i  bˆ j  ˆ ij ) para i=1,2,...,b; j=1,2,...,k; l=1,2,...,nij

Podemos verificar fácilmente que estas ecuaciones son linealmente dependientes. Una
Yij.
solución a estas ecuaciones es ˆ  0 , ˆ i  0 para todo i, ˆ j  0 para todo j y ˆ ij  .
r
Por lo tanto,
Yij2.
SC Re g (  , ,  , )   (38)
i j r
Yij2.
SCE   Yijl2 
i j l i j r

Para probar la hipótesis H 0 : ij  0 i , j el modelo reducido es:

Yijl     i   j   i jl

Considerando que  ̂
i
i 0 y ˆ
j
j  0 , podemos llegar a la siguiente solución:

ˆ  Y...
ˆ i  Yi..  Y...
ˆ j  Y. j.  Y...

La reducción en la suma de cuadrados por ajuste de este modelo es:

Yi..2 Y. 2j . Y...2
SC Re g (  ,  i , j )     (39)
i kr j br N

64
Notas de Clases
Diseño de Experimentos
Luis Nava
y
Y...2 Yi..2 Yij2. Y. 2j .
SC Re g (ij /  ,  i , j )      (40)
N i kr i j r j br

Si deseamos probar las hipótesis H 0 :  j  0 para todo j , el modelo reducido a ser


considerado es:
Yijl    i   i jl

La reducción en la suma de cuadrados por ajuste de este modelo es:

Yi..2
SC Re g (  ,  i )   (41)
i kr
y
SC Re g ( j /  ,  i )  SC Re g (  ,  i ,  j )  SC Re g (  ,  i )

Y. 2j .
Y...2
SC Re g ( j /  ,  i )    (42)
j br N

Para probar la hipótesis H 0 :  i  0  i , el modelo reducido a considerar es:

Yijl     j   i jl

La reducción en la suma de cuadrados por ajuste de este modelo es:

Y. 2j .
SC Re g (  , j )   (43)
i br
y
SC Re g (  i /  ,  j )  SC Re g (  ,  i ,  j )  SC Re g (  ,  j )

Yi..2 Y...2
SC Re g (  i /  ,  j )    (44)
j kr N

La Tabla 10 , muestra la Tabla de nálisis de Varianza para este modelo

Tabla 10. Tabla de ANDEVA para Modelo con Interacción


Fuente grados Sumas de Cuadrados Medios F
De Variación de libertad Cuadrados
Tratamiento (k-1) SCTr  SC Re g ( j /  ,  i ) SCTr/(k-1) CMTr/CME

Bloques (b-1) SCBl  SC Re g (  i /  , j ) SCBl/(b-1) CMBl/CME

65
Notas de Clases
Diseño de Experimentos
Luis Nava

Interacción (k-1) (b-1) SCInt  SC Re g (ij /  ,  i , j ) SCInt/(k-1) /(b-1) CMInt/CME

Error N-kb SCE=SCTo-SCB-SCTr SCE/(k-1)(b-1)

b k
Y...2
Total (N-1) SCTo   Y  2
ijl
i 1 j 1 l N

66

You might also like