Professional Documents
Culture Documents
1
PREFACIO
El presente trabajo tuvo su origen en una consulta planteada por un estudiante acerca de cómo
realizar el análisis de un diseño en parcelas divididas con submuestreo. Se revisó una amplia
literatura disponible, encontrándose que los libros de Diseños Experimentales, Métodos
Estadísticos o Modelos Lineales que tocan el tema de submuestreo, lo ejemplifican invariablemente
en el Diseño Completamente al Azar o en el de Bloques al Azar, dejando implícito que los otros
diseños se siguen de manera natural. Lo anterior no es cierto, ya que, para realizar un análisis
donde hay submuestreo se requiere conocer la fuente de variación que conforma el error
experimental, el cual, en el caso de los dos diseños antes citados es fácil, mas no es el caso en
diseños con estructuras más complejas. Con esta motivación se trató de encontrar un algoritmo
general para analizar diseños con igual número de submuestras. Para ello, se desarrolló la teoría
necesaria a fin de determinar las sumas de cuadrados y las esperanzas de cuadrados medios
pertinentes que establecieran un puente entre la variabilidad de las unidades experimentales, según
el diseño general que se estuviera usando y la variabilidad de las submuestras. Por fortuna, se
alcanzó el objetivo anterior y pudo constatarse en los resultados finales que el análisis de un diseño
en estas condiciones es extremadamente fácil. El método estadístico se sintetiza en la construcción
de dos tablas de Análisis de Varianza: una sobre las unidades experimentales y otra sobre las
submuestras; de las anteriores, se construye la correspondiente al diseño que se esté analizando,
completándose así el análisis.
Es de especial interés este trabajo porque en la experimentación ocurre con mucha frecuencia el
caso de submuestreo y si el objetivo es estimar las componentes de varianza en un estudio de
progenies o procedencias (producción animal y vegetal) se obtendrán las estimaciones reales que
proporciona el método de mínimos cuadrados. Si, de otro modo, se usan las medias aritméticas en
casa parcela como usualmente se hace, se obtendrán estimaciones erróneas de estas componentes.
Se debe remarcar el valor académico que se desprende del modo en que se hizo el análisis, pues
permite observar con nitidez cómo se descompone la variación de la unidad experimental en los
distintos factores que intervienen en un diseño, según sea el caso.
Es de importancia para los autores que este trabajo sea de utilidad, por lo que cualquier
sugerencia al mismo será bienvenida.
2
CONTENIDO
Índice de cuadros
Prefacio
1. Introducción
2. Antecedentes
3. Diseño de las unidades experimentales
3.1. Diseño de las unidades experimentales con submuestreo
3.2. Diseños de las unidades experimentales con submuestreo en notación matricial
3.2.1. Las sumas de cuadrados como normas al cuadrado de proyecciones
del vector de observaciones
3.2.2. Esperanza de una forma cuadrática
4. Diseño completamente aleatorio
4.1. Esperanzas de las sumas de cuadrados
5. Diseño de bloques completos al azar
5.1. Esperanzas de las sumas de cuadrados
6. Diseño general con el mismo número de submuestras por unidad experimental
6.1. Diseño general sobre las observaciones originales Yij
Yi .
6.2. Diseño general sobre las variables
r
6.3. Aspectos metodológicos de la teoría general
7. Un algoritmo general para diseños experimentales con submuestreo
7.1. Ejemplo del diseño completamente aleatorio
7.2. Ejemplo del diseño bloques completos al azar
7.3. Ejemplo del diseño en cuadro latino
8. Literatura Citada
ÍNDICE DE CUADROS
Tabla A. Análisis de varianza de un diseño completamente aleatorio con submuestreo
Tabla B. Análisis de varianza de un diseño de bloques completos al azar con submuestreo
Tabla 1. Datos de tres unidades experimentales hipotéticas con dos submuestras por cada una
Tabla 2. Presentación general de los datos de un diseño experimental con submuestreo
Tabla 3. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño
de las unidades experimentales con submuestreo
Tabla 4. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño
completamente aleatorio con submuestreo
Tabla 5. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño
bloques completos al azar con submuestreo
Tabla 6. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño
general con submuestreo sobre las variables originales Yij
Tabla 7. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño
Y.
sobre las variables transformadas i
r
Tabla 8. Porcentaje de hinchamiento de tableros remojados durante dos horas.
Tabla 9. Programa SAS para el análisis de un diseño completamente aleatorio con submuestreo.
Tabla 10. Salida de SAS de un diseño completamente aleatorio con submuestreo.
Tabla 11. Análisis de varianza a partir de Tabla 10.
Tabla 12. Tratamientos aplicados en un lote experimental.
3
Tabla 13. Programa SAS para analizar un diseño bloques completos al azar.
Tabla 14. Contenido de nitrato (NO3) en ppm de muestras de suelo analizadas.
Tabla 15. Salida de SAS del diseño bloques completos al azar con submuestreo
Tabla 16. Análisis de Varianza a partir de la Tabla 15.
Tabla 17. Incremento del diámetro normal (cm) de un bosque en cuatro años.
Tabla 18. Programa SAS para analizar un experimento en cuadro latino con submuestreo.
Tabla 19. Salida de SAS de un experimento en cuadro latino con submuestreo.
Tabla 20. Análisis de varianza a partir de la Tabla 19.
4
1. INTRODUCCIÓN
La técnica del submuestreo se usa, en general, en los experimentos de diversos campos, así
como en la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la
información para estudiar el efecto de los tratamientos y de las otras componentes que afectan la
variable respuesta, suele presentarse alguna de las siguientes posibilidades mal entendidas:
a) Se considera cada observación o submuestra como repetición de un tratamiento determinado.
b) Se obtienen los promedios de las submuestras por cada unidad experimental y se usan
únicamente estos valores para hacer el Análisis de Varianza (ANOVA).
En este escrito se presenta la forma general del análisis de diseños experimentales con igual
número de submuestras por unidad experimental. Para lograr esto, primero se desarrollan
matricialmente las sumas de cuadrados (SC) y las esperanzas de los cuadrados medios (E(CM)) del
diseño basado en las unidades experimentales y se resalta que los diseños más sencillos como el
completamente aleatorio y el bloques completos al azar con submuestreo, pueden representarse a
partir del diseño de las unidades experimentales. Después, se concatenan las SC y las E(CM) de los
dos diseños más elementales el completamente aleatorio y el bloques al azar con las del diseño
de las unidades experimentales para generar el Análisis de Varianza del diseño general con igual
número de submuestras por unidad experimental; a partir del diseño general, es posible derivar el
análisis de cualquier diseño experimental con submuestreo.
Finalmente, para el lector que no tenga la intención de revisar las bases del análisis de diseños
experimentales con submuestreo, se presenta un algoritmo sencillo de tres pasos (Capítulo 7),
derivado de la teoría general, para resolver cualquier diseño experimental planeado con igual
número de submuestras por parcela. Para ejemplificar, se desarrollan tres casos con datos reales
resueltos con programa en SAS (Statistical Analysis System) que se generan siguiendo los pasos
del mencionado algoritmo.
5
2. ANTECEDENTES
Los libros que abordan los diseños experimentales con submuestreo coinciden, en términos
generales, en presentarlo sólo para los diseños completamente aleatorio y bloques completos al
azar, sin vincular ambos análisis, de modo que no dejan explícita la forma de hacer el análisis con
submuestreo de cualquier otro diseño; este enfoque es de gran utilidad para quien desee resolver
problemas parecidos a los que se presentan en los textos. A continuación se escriben las tablas de
análisis de varianza de los diseños completamente aleatorio y de bloques completos al azar,
tomados de la literatura y haciendo homogénea la nomenclatura.
UE n 1 k ,i
C
r
t
Yk2.. SCtrat CMtrat
trat t 1 k 1
C
rnk t 1 CMEE
t SCEE CMEE
EE t ( nk 1 ) SC( UE ) SCtrat
nt CMEM
k 1
SCEM
EM n r 1 SCT SC( UE )
nr n
Total rn 1 Ykij2 C
k ,i , j
Y...2
C
rn
La nomenclatura de la tabla anterior es:
FV: Fuente de variación
GL: Grados de libertad
6
C: Factor de corrección
SC: Suma de cuadrados
CM: Cuadrado medio que es el resultado de dividir una SC entre sus correspondientes GL.
Fcal: F calculada
UE: Unidades experimentales
trat: Tratamientos
EE: Error experimental
EM: Error muestral
En la Tabla B se tiene el análisis de varianza del diseño bloques completos al azar con
submuestreo, resultado de conjuntar las que presentan Ching (1971), Martínez Garza (1988) y Steel
& Torrie (1988). Sea Yikj la j-ésima submuestra del tratamiento k que está dentro del bloque i, i =
1,2, ..., b, k = 1,2, ..., t, j = i, 2, ..., r. En el experimento se tienen n bt unidades experimentales y
rt submuestras.
FV GL SC Fcal
Yik2.
UE tb 1 i ,k
C
r
b
Yi2.. CMbloq
bloq b 1 i 1
C CEEE
rt
t
Y.2k . CMtrat
trat t 1 k 1
C CMEE
rb
CMEE
EE b 1 t 1 SC( UE ) SCbloq SCtrat CMEM
Yik2.
EM tb r 1 ijk Y 2
i ,k
j r
Y...2
C ; bloq: Bloques.
rtb
7
3. DISEÑO DE LAS UNIDADES EXPERIMENTALES
El diseño basado en las unidades experimentales se caracteriza por no ser un arreglo geométrico
específico de los tratamientos en el terreno. Es un diseño conceptual con el que se puede visualizar
cualquier diseño experimental; lo anterior significa que cualquier tipo de arreglo geométrico de los
tratamientos sobre las unidades experimentales, se puede presentar como un diseño de las unidades
experimentales. En este diseño cada observación Yij , con i 1,2,, n , j 1,2,,r , se explica por
el efecto general de la media , un efecto aleatorio general controlado de la i-ésima unidad
experimental U i , más un efecto aleatorio no controlado ij de dicha observación dentro de la
unidad experimental a la que pertenece, que es el error muestral. El modelo lineal propuesto que
explica la j-ésima observación de la i-ésima unidad experimental en el diseño de las unidades
experimentales es:
Yij Ui ij (1)
bajo los supuestos de que EU i i , varU i 2 , E ij 0 , var ij 2m , cov U i , ij 0 .
bajo el supuesto adicional que i ~ N 0, 2 .
Se aclara que el modelo lineal en (2) es válido tanto para diseños en los que sólo se tome una
muestra por parcela (que llamaremos diseños estándar) como para diseños experimentales con
submuestreo; en el primer caso r 1 y ij 0. En este capítulo se aborda el diseño de las unidades
experimentales con igual número de submuestras por unidad experimental, que se utilizará para
plantear el diseño general.
8
Tabla 1. Datos de tres unidades experimentales hipotéticas con
dos submuestras por cada una.
Unidad experimental (UE)
UE 1 UE 2 UE 3
Submuestras (r=2) 4 5 1
5 3 4
total de UE Yi. 9 8 5
promedio de UE Yi. 4.5 4 2.5
n r 2
SCT Yij Y.. (4)
i 1 j 1
Para los datos de la Tabla 1, la SCT es:
SCT = [(4 - 3.66)2 + (5 - 3.66)2 + (5 - 3.66)2 + (3 - 3.66)2 + (1 - 3.66)2 + (4 - 3.66)2
= 11.333
n 2
SC( UE ) r Yi . Y.. , (5)
i 1
que se ejemplifica con los datos de la Tabla 1 así:
SC(UE) = 2[(4.5 - 3.66)2 +(4 - 3.66)2 + (2.5 - 3.66)2
= 2 [(0.7056) + (0.1156) + (1.3456) = 4.333
n r 2
SCEM Yij Yi . , (6)
i 1 j 1
que para el ejemplo que se sigue es:
9
SCEM = [(4 - 4.5)2 + (5 - 4.5)2 + [(5 - 4)2 + (3 - 4)2 + [(1 - 2.5)2 + ( 4 - 2.5)2
= 7.0
Observe que adicionando los resultados hallados con las fórmulas (5) y (6), se obtiene el mismo
valor que aplicando la fórmula (4). Por lo tanto, se constata numéricamente que se cumple la
identidad (3) para los valores propuestos de Yij en la Tabla 1. A continuación se presentará la
verificación algebraica de (3).
En donde:
Yij : es la j-ésima submuestra de la i-ésima unidad experimental, i = 1, 2, ..., n y j = 1, 2, ..., r
Yi. : totaliza las observaciones de la i-ésima unidad experimental
Y.. : adiciona todas las Yi.
Al generalizar, se pretende recalcar que la idea central del análisis de diseños experimentales con
submuestreo, que toma forma en la expresión (3), es completamente válida indistintamente del
diseño experimental con el que se esté trabajando. Esto es, haciendo caso omiso del diseño
experimental, la suma de cuadrados de las desviaciones individuales (SCT) se puede hallar también,
obteniendo la suma de cuadrados de las variaciones entre unidades experimentales (SC(UE)) que se
adiciona a la suma de cuadrados de la variación entre observaciones dentro de unidades
experimentales (SCEM).
n 2
SC( UE ) r Yi . Y..
I 1
n n n
r Yi .2 2Y.. Yi . Y..2
i 1 i 1 i 1
r Yi2. r 2Y.. Yi . rn Y..2
2
r rn r ( rn )2
10
Yi2. 2Y .. Yi . Y..2
r rn rn
Yi. 2Y.. Y..2
2 2
r rn rn
de donde se obtiene la siguiente identidad,
n
Yi2. Y..2
i 1
SC( UE )
r rn (7)
c) A partir de la fórmula (6),
n r 2
SCEM Yij Yi .
i 1 j 1
n r
Yij2 2Yi .Yij Yi .2
i 1 j 1
n r 2 Yi . r Yi2.
Yij2 Yij
i 1 j 1 r j 1 r2
n r 2 Yi2. r Yi2.
Yij2 2
i 1 j 1 r r
se obtiene la identidad (8)
n r Y2
SCEM Yij2 i . (8)
i 1
j 1 r
d) Observe que SC(UE) + SCEM, se obtiene adicionando los valores expresados en el lado derecho
de (7) y (8):
Yi2. Y..2 Y2 n r Y2
Yij2 i . Yij2 ..
r rn r i 1 j 1 rn
e) Por otro lado, por definición, la suma de cuadrados total (SCT) es:
n r 2
SCT Yij Y ..
i 1 j 1
n r
Yij2 2YijY ..Y..2
i 1 j 1
n r n r n r
Yij2 2Y.. Yij Y..2
i 1 j 1 i 1 j 1 i 1 j 1
n r
Yij2 2rnY..2 rnY..2
i 1 j 1
n r
Yij2 rnY..2
i 1 j 1
n r Y..2
Yij2 (9)
i 1 j 1 rn
11
esto es, la suma de cuadrados total (SCT) es igual a la suma en el inciso d). Por lo tanto, queda
demostrado que SCT SC( UE ) SCEM .
3.2. Diseño de las unidades experimentales con submuestreo en notación matricial
Todas las observaciones Yij de la Tabla 2, pueden presentarse en un vector columna Y de orden
nr x 1.
Y Y11 Y12 Y1r Y21 Y22 Y2r Yn1 Yn2 Ynr
A partir del vector Y de tamaño nr, se reescribirán las expresiones (7), (8) y (9) en notación
matricial, usando formas cuadráticas, para facilitar la presentación de los datos y los resultados en
forma concisa.
12
n
Yi2. Y..2 n 1 1
i 1
Y' A i J nr Y (11)
r nr i 1 r nr
donde,
Jr Or Or Or
O Or O r
r Jr 1 1 0 0
y Or
; y
n 1 1
A i Or Or J r Or con J r
n 1 r r
1 1 r r 0 0 r r
Or Or Or J r nrxnr
1 1
J nr 1nr 1`nr ;
1 1 nr nr
ya que,
2
n r
n
Yi2. Yij
i 1 i 1 j 1 1 n r r
Yij Yij .
r r r i 1 j 1 j 1
Haciendo,
Or O r Or
0
A i Or J r Or
'
ei 1r A i ei ei ,
0
Or O r Or
nr x nr
se tiene que,
n
Y 2i . 1
Y' ei Y' ei Y' ei ei' Y
n 1
i 1
r r i 1 r
1 n
Y' A i Y
r i 1
13
1
Y' J nr Y
nr
n
n r Yi2.
Ya que, i Yij2 Y' Y 1 x 1 y i 1 n 1
Y A i Y , la matriz asociada a la forma cuadrática en
1 j 1 r i 1 r
(12) es:
n 1
A I nr A i
i 1 r
o de forma equivalente es:
Br Or Or
O Br O r
A
r
,
O r Or Or Br
con
14
1 1 1
0 0 0 1 r r r
0 1 1
0 0 1
1
Or y Br r r r
0 0 0 r x r 1 1 1
1
r r r r x r
i 1 j 1 rn nr
al factorizar se tiene que:
1
SCT Y' I nr J nr Y (13)
nr
y la matriz asociada a la forma cuadrática en (13) se puede escribir como:
1 1 1
1 nr nr nr
1 1 1
1
nr nr nr
1 1 1
1
nr nr nr nr x nr
3.2.1. Las sumas de cuadrados como normas al cuadrado de proyecciones del vector de
observaciones Y
A continuación se reescribirán las expresiones (11), (12) y (13) usando proyectores de matrices;
por lo que, es importante la siguiente definición:
Definición 2. Sea X una matriz de orden n x m; la expresión X X' X X' se define como el
1
De acuerdo a Searle (1966), se mencionan sin verificar las siguientes propiedades del proyector
PX :
15
1 1 0 0
1 1 0 0
.
1 1 0 0
1 0 1 0
1 0 1 0
C1 C2 .
1 0 1 0
.
1 0 0 1
1 0 0 1
.
1 nr 1 0 0 1 nr n
De acuerdo a la Definición 2, se presentan los proyectores de C1 y C 2 . Así:
1 '
PC1 C1 C'1 C1 C1
donde,
C C
1 1 1 1
C1' C1 = nr ; '
1 1 = ; C1 C1' C1 1
nr
1
nr
1
nr nr x 1
; PC1 11' .
nr nr
donde,
1
0 0
r 0 0 r
0 1
r 0 1 0 0
C2C2 ; C2C2 r
0 0 r n x n 1
0 0 r
1
1r 0 0 r J r 0r 0r
1
1 0 1r 0 0r 0r
C2 C2C2
1 J
; PC2 r
r
r
0 0 1r 1
0r 0r
r
Jr
SCUE Y' PC2 PC1 Y (14)
16
SCEM Y' I nr PC2 Y (15)
SCT Y' I nr PC1 Y (16)
A continuación se escribirán los grados de libertad asociados a (14), (15) y (16). Para esto, es
necesaria la definición siguiente:
Definición 3. Los grados de libertad (GL) correspondientes a una forma cuadrática de la forma
Y' AY , se definen como el rango (r) de la matriz A asociada a dicha forma cuadrática.
Observe que la matriz A asociada a la forma cuadrática Y' AY es idempotente. Haciendo uso de
Definición 3, se tiene que los GL correspondientes a (14), (15) y (16) son n-1, nr-n y nr-1,
respectivamente. En donde también se hace uso de que trA B tr A tr B .
EY' AY tr A Var Y E Y ' AE Y
(17)
ya que,
EY' AY EtrY' AY Etr AYY' tr E AYY' tr AE YY' .
De la expresión anterior,
E YY E Y E Y E Y Y E Y E Y '
EY E Y Y E Y ' Y E Y E( Y )' E Y Y E Y ' E Y E Y '
VarY E Y E Y '
Por lo que,
tr AE YY' tr A Var Y E Y E Y '
tr A Var Y AE Y E Y '
tr A Var Y tr A E Y E Y '
= tr A Var Y tr E Y A E Y
Como la traza de un escalar es el mismo número, entonces se obtiene la expresión en (17), que es la
esperanza de una forma cuadrática.
17
Entonces,
var Y ij E i ij
2
E 2i 2 i ij 2ij
E 2i 2E i ij E 2ij
var i var ij
2 2m ;
además,
Cov Y ij ,Yij cov i i ij , i i ij
E i ij i ij '
E 2
i i ij ij i ij ij
E 2i 2
Por lo que, la matriz de varianzas y covarianzas, denotada por R, de la i-ésima unidad experimental
se puede escribir como:
2m 2 2 2
2 2m 2 2
R
2 2 2m 2 r x r
y la matriz de varianzas y covarianzas del vector Y es:
R O O
O R O
Var( Y ) (18)
O O R nr x nr
Así también, a partir de la expresión (17) se presentarán enseguida las esperanzas de la suma de
cuadrados de las unidades experimentales y del error muestral que se denotarán como E[SC(UE)] y
E[SCEM], respectivamente. Pero antes, es importante el siguiente Lema:
18
PC2 Var Y C 2 C 2C 2 C 2Var Y
ya que C 2 C 2
1 1 1
C 2C 2Var Y , In ;
r r
2m r 2 1'r 0' 0'
1
C2
0' 2m r 21'r 0'
r .
0' 0'
2m r 2 1'r
Así que:
2
Jr O O
r
1 2
PC2 Var( Y ) O Jr O
r r
O 2
O Jr
r
2
donde, 2m r 2 . Entonces,
r
1 2
a) tr PC 2 Var Y nr n
r r
2
r ,
y
b) E Y ' PC2 E Y ' C' PC2 C CC ya que PC2 C C.
1 1 Var Y
1
PC1Var Y
nr nr nr
1 2 2 2 '
1nr 1'r 1'r 1r ;
nr r r r
así que,
2 2 2
1' r 1' r 1' r
r2 r r
1 1' r 2
1' r
2
1' r
PC1Var( Y ) ;
nr r r
r
2
1' r 2
2
1' r 1' r
r r r nr x nr
para escribir,
19
c) tr PC1Var Y
1
nr
nr
2 2
r
r
.
Asimismo, se tiene que.
1
d) E Y ' PC1 E Y ' C' PC1 C' C' 1nr 1nr C
nr
Con todo lo anterior, es posible presentar la esperanza de la suma de cuadrados de las unidades
experimentales como sigue:
2
i
n
n 1 r
2
E( SC( UE ) (19)
r i 1
1 n
donde, , ya que,
n i 1 i
E SCUE E Y' PC 2 PC1 Y
2 1
( n 1 ) ' C' C ' C' 1nr 1nr C
r nr
donde,
2
1 n 1 n
' C' C ' C' J nr C r i r i
2
nr I 1 nr i 1
n 1n
2
r i i
2
i 1 n i 1
2
n
r i .
i 1
a) tr I nrVar Y nr 2m 2
b) tr PC2 Var Y 1r n n
2 2 r 2
m
c) E( Y )' I nr E( Y ) ' C' C
d) E Y ' PC2 E( Y ) ' C' C
20
E( SCEM ) nr( 2m 2 ) n 2m 2
2m n r 1 (20)
El resumen de los resultados del diseño basado en las unidades experimentales se presenta a
continuación:
Tabla 3. Sumas de cuadrados y esperanzas de los cuadrados
medios del diseño de las unidades experimentales.
FV GL SC E(CM)
2 r n
2
UE n 1
Y' PC2 PC1 Y
r n 1 i 1
i
EM n r 1 Y' I nr PC2 Y 2m
21
4. DISEÑO COMPLETAMENTE ALEATORIO CON SUBMUESTREO
El modelo lineal original (2) transformado al diseño completamente aleatorio se presenta como:
Y kij k ki kij (21)
en el que se entiende que cada Ykij es la j-ésima submuestra de la i-ésima unidad experimental que
lleva el tratamiento k, con k = 1, 2, ..., t, i = 1, 2, ..., nk, y j = 1, 2, ..., r. Observe que el efecto fijo i
de la unidad experimental U i del modelo (2) ha sido sustituido por el efecto del tratamiento k
que lleva dicha unidad experimental; así también, el efecto aleatorio de la unidad experimental
(error experimental) y el error aleatorio de la j-ésima submuestra dentro de la i-ésima unidad
experimental se han sustituido por errores que a los anteriores incorpora la presencia del
tratamiento. Los supuestos del modelo lineal del diseño completamente aleatorio en (21) son los
siguientes:
a) E ki 0 var ki 2
b) E( kij ) 0 var( kij ) 2m
c) cov( ki , kij ) 0 k ,i , j
22
T1 T2 Tt
1 2 n1 1 2 n2 1 2 nt
1r 1r 0 r 0 r 0 r 0 r 0 r 0 r 0 r 0 r
1 0 1 0 0 0 0 0 0 0
r r r r r r r r r r
1r 0 r 0 r 1r 0 r 0 r 0 r 0 r 0 r 0 r
1r 0 r 0 r 0 r 1r 0 r 0 r 0 r 0 r 0 r
1r 0 r 0 r 0 r 0 r 1r 0 r 0 r 0 r 0 r
C
1r 0 r 0 r 0 r 0 r 0 r 1r 0 r 0 r 0 r
1r 0 r 0 r 0 r 0 r 0 r 0 r 1r 0 r 0 r
1r 0 r 0 r 0 r 0 r 0 r 0 r 0 r 1r 0 r
1r 0 r 0 r 0 r 0 r 0 r 0 r 0 r 0 r 1r
o de manera equivalente, se puede escribir en términos de sus submatrices como:
C 1nr T1 T2 Tt
A partir de la asignación de los t tratamientos a las n unidades experimentales de la matriz diseño
C, se deriva la matriz X que corresponde a los tratamientos y es de nr x (t + 1). En la matriz C, la
primera columna corresponde a y las restantes n columnas corresponden a las observaciones de
las unidades experimentales, a las cuales, se asignaron los tratamientos. Por su parte, la primera
columna de la matriz diseño X, que corresponde al efecto de , se denota como C1 , del mismo
modo que en C; las siguientes t columnas de los tratamientos, conforman la submatriz T y se
denominan X 1 , X 2 ,, ..., X t ; esto es,
T X1 X2 Xt
y
23
T
X1 X 2 X t
1 1 0 0
1 1 0 0
1 1 0 0
1 0 1 0
1 0 1 0
X
1 0 1 0
1 0 0 1
1 0 0 1
1 0 0 1
La suma de cuadrados de los tratamientos (SCtrat) está dada por:
SCtrat Y' PT Y Y' PC1 Y
y al factorizar se obtiene:
SCtrat Y' PT PC1 Y (23)
donde,
1
PT T T' T T'
1
PC1 11' y
nr
A continuación se presenta el desarrollo del proyector PT anterior:
1
n r 0 0
n1r 0 0 1
0 n r 0 1
0 0
; T' T
1
T' T
2
n2 r ;
0 nt r n x n
0 0 1
0
nt r n x n
premultiplicando a (T´T)-1, por T:
1 1 1 0 0 0 0 0 0
n1r n1r n1r
1 1 1
0 0 0 0 0 0
T TT
1
n2r n2r n2r
;
0 0 0 0 0 0 1 1 1
nt r nt r nt r
24
y finalmente, el proyector de la matriz T es:
n r 1 J 0 0
1 n1r
PT
0 n2 r 1 J n r 0
2
nt r J nt r
1
0 0
donde,
1 1 1
1 1 1
J nk r k 1, , t .
1 1 1 n r x n r
k k
En la suma de cuadrados del error experimental (SCEE) esto es, la suma de cuadrados de
unidades experimentales dentro de tratamientos, cada grupo de nk unidades experimentales
dentro del tratamiento k tienen una contribución que se expresa como:
SCUE trat 1 Y' PT1 Y Y' P X 1 Y
SCUE trat 2 Y' PT2 Y Y' P X 2 Y
SCUE trat t Y' PTt Y Y' P X t Y
1
r 0 0
r 0 0
0 1
r 0 0 0
; Tk Tk
1
Tk Tk r ;
0 0 rn x n 1
k k
0 0
r
1
la matriz Tk Tk' Tk es:
25
'
0'p r 1 r 1 r 1 0 0 0 0 0 0 0'q
'
0 p 0 0 0 r 1 r 1 r 1 0 0 0 0'q
'
0 p 0'q
0' 0 0 0 0 0 0 r 1
r 1
r 1 0'q
p nr nk
k 1 t k 1 t
donde p n g r; q n g r ; nr n g r n k r n g r .
g 1 g k 1 g 1 g k 1
Entonces:
O O O
1
Jr Or Or
r
1
Or Jr Or
PTk O r O
1
Or Or Jr
r
O O O nr nr
Por lo tanto:
1
r Jr Or Or
1
t
O Jr Or
PTk r r
k 1
1
O r Or Jr
r nr nr
t n
1
PTk Ai PC2
i 1 r
Observe que k 1
2) Similarmente,
X
1
PX k X k X k ' X k X k ; de donde X 'k X k nk r ;
1 1
'
k Xk ;
nk r
como X k ' X k
1
es un escalar, se puede reescribir PX k así:
1
PX k X X k'
nk r k
o equivalentemente,
26
O O O O
O O O
1
PX k Jn r
nk r k ,
O O O nr nr
por lo que:
1
n r J n1r O O
1
O 1
t Jn r O
PX k n2 r 2 ;
k 1
1
O O J nt r
nt r nr nr
t
observe que PX k PT .
k 1
SC( UE ) Y' PC2 PC1 Y
como, de hecho, se presentó en (14). Observe que si se adiciona la SCtrat en (23) y la SCEE en
(25), se obtiene de forma directa el resultado anterior.
Se ha escrito que, los grados de libertad asociados a una suma de cuadrados en forma cuadrática
Y'AY corresponden al r A tr A , por ser A idempotente en estos casos. Así, la SCtrat tiene
t 1 grados de libertad y la SCEE tiene n t grados de libertad.
27
Considerando el modelo lineal del diseño completamente aleatorio en (22) bajo los supuestos
enumerados antes, se procederá a desarrollar las esperanzas de la SCtrat y la SCEE, haciendo uso
de la expresión (17) sobre el cálculo de E Y' AY .
1. A continuación se muestra que,
E SCtrat E Y' PT PC1 Y
tr P T
PC1 Var Y E Y ' PT PC1 E Y
2 t
t 1 r nk k
2
(26)
r k 1
1 t
donde nk k .
n k 1
Ahora bien, PTVar Y T T' T T' Var Y ; como la matriz T T' T
1 1
se obtuvo en el desarrollo
del PT , entonces sólo falta desarrollar:
2
1'n1r 0' 0'
r
2
T' Var Y 0' r
1' n2 r 0'
0' 2
0' 1' nt r
r t x nr
Por lo que,
2
J n1r O O
n1r
2
PT Var Y
1 O J n2 r O
n2 r
r
2
O O J nt r
nt r nr x nr
28
PT X C1 T X .
b) En consecuencia,
t
E Y ' PT E Y ' X' X nk r k .
2
K 1
c) Del desarrollo de (19) se sabe que:
2
tr PC1Var Y r
,
d) y
E Y ' PC1 E Y
1
nr
' X' J nr X
1
nr
nk r k .
2
Por lo tanto:
2
2
t
nk r k nk r k
1
E SCtrat t 1 2
r k 1 nr
2 t 1 t
2
t 1 r nk k nk k ,
2
r k 1 n k 1
y factorizando, se obtiene la expresión (26).
2
n t
r
ya que,
2
a) De la verificación de (19), tr PC2 Var Y r
n
2
b) De la verificación de (26), tr PTVar Y r
t
t
c) Así también, de verificar (26), E Y ' PT E Y nk r k
2
k 1
Entonces,
E Y ' PC2 E Y ' X' PC2 X XX
ya que aplicando el Lema 1, PC2 X X .
t
d) Finalmente, E Y ' PC2 E Y nk r k ,
2
k 1
y usando los resultados de estos cuatro incisos se obtiene (27).
29
Tabla 4. Sumas de cuadrados y esperanzas de los cuadrados medios del
diseño completamente aleatorio con submuestreo.
FV GL SC E(CM)
Trat
t 1 Y' PT PC1 Y 2
m r 2
r t
nk k
t 1 k 1
2
EE nt Y' P P Y C T
m r
2
2
2
EM nr n Y' I nr PC Y
2
2m
Total nr 1 Y' I nr PC Y
1
2
Recuerde que 2m r 2
r
30
5. DISEÑO DE BLOQUES COMPLETOS AL AZAR CON SUBMUESTREO
El modelo original escrito en (2) transformado al diseño de bloques completos al azar queda
como:
Yikj Bi k ik ikj (28)
en donde:
Yikj : j-ésima observación del tratamiento k perteneciente al bloque i, i 1,2,,b, k 1,2,,t ,
j 1,2,,r .
: efecto de la media
Bi : efecto del bloque i
k : efecto del tratamiento k
ik : interacción del bloque i y el tratamiento k
ikj : error muestral
Los supuestos del modelo (28) son:
a) ik ~ N 0, 2
b) ikj ~ N 0, 2
m
c) cov ik , ikj 0
El modelo (28) escrito en forma matricial es:
Y C1 X B XT B ik ikj (29)
donde, Y es el vector de observaciones de orden nr x 1, donde n = bt; C1 X B
XT es la matriz
diseño del diseño bloques completos al azar; B es el vector de parámetros; es el vector
del error experimental y es el vector del error muestral. De esta forma, se presenta en (30) la
suma de cuadrados total corregida (SCT) de este diseño.
SCT Y' I nr PC1 Y
SCbloq SCtrat SCEE SCEM
Y' PX B PC1 Y Y' PXT PC1 Y Y' PC2 PX B PXT PC1 Y Y' I nr PC2 Y (30)
Siguiendo el mismo razonamiento presentado en las esperanzas de las sumas de cuadrados del
diseño completamente aleatorio, se expondrán a continuación las que corresponden al diseño de
bloques completos al azar.
1. E SCbloq E Y' PX B PC1 Y
31
tr PX B PC1 Var Y E Y ' PX B PC1 E Y
De la expresión anterior es necesario conocer:
1.a) La tr PX B Var Y ; desarrollándolo por pasos:
rt 0 0 1 0 0
0 rt 0
1 0 1 0
XB X B
;
XB X B
1
;
rt
0 0 rt b b 0 0 1 b b
1rt 0rt 0rt J rt Ort Ort
0 1rt 0rt
1 1 Ort J rt Ort
X B XB X B rt
1
; PX B .
rt rt
0rt 0rt 1rt rtb b Ort Ort J rt rtb rtb
Una vez teniendo la expresión del proyector PX B , se postmultiplica por la Var Y ,
2
J rt Ort Ort
r
1 2
PX B Var Y Ort r
J rt Ort
rt
O 2
rt Ort J rt
r rtb rtb
De ahí, se obtiene que:
2 rtb 2
tr PX B Var Y
r rt
r
b.
1.b) Del desarrollo de (19) y sustituyendo nr por rtb se tiene:
1 1 2
PC1Var Y C1 C'1Var Y J nr
rtb rtb r ,
y su traza es:
1.b) tr PC1Var Y 2 1
r rtb
rtb
2
r
.
Considere que lik Bi k y que el vector l tiene r elementos de cada lik . Entonces la
E Y l . De esta forma, se escribe que:
2
1 1 b t
1.c) E Y ' PX B E Y l' X B X 'B l r lik
rt rt i 1k 1
y
2
1 1 b t
1.d) E Y ' PC1 E Y l' J rtb l r lik
rtb rtb i 1k 1
32
Por lo tanto:
2 2
2 1 b t 1 b t
E Y' PX B PC1 Y b 1 i1 r lik r lik
r rt k 1 rtb i 1k 1
2
2 r r b t
b 1 lik 2 lik
r t bt i 1k 1
2
b 1
r b 2
2
t Bi B
r t i 1
1 b
donde, B Bi ; obteniéndose que:
b i 1
E SCbloq E Y' PX B PC1 Y
b 1 rt B B
2 b 2
i (31)
r i 1
2. Así también,
E SCtrat E Y' PXT PC1 Y
tr P XT
PC1 Var Y E Y ' PXT PC1 E Y
2 t
t 1 rb k 2 , (32)
r k 1
1 t
donde, k . Para mayor claridad en la obtención de (32), se presentan a continuación el
t k 1
desarrollo del proyector PXT y de PXT Var Y para conocer la tr PXT Var Y y E Y ' PXT E Y .
Así,
PXT XT XT XT XT de donde,
rb 0 0 1 0 0
0 rb 0 1 0
1 0
XT XT
; XT XT 1 rb
;
0 0 rb 0 0 1
1'r 0'r 0'r 1'r 0'r 0'r 1'r 0'r 0'r
'
1'r 0'r 0'r 1'r 0'r 0'r 1'r 0'r
XT XT XT r
0
;
'
0r 0'r 1'r 0'r 0'r 1'r 0'r 0'r 1'r
33
Jr Or Or Jr Or Or J r Or Or
O J r Or Or J r Or Or J r Or
r
O r Or J r Or Or J r Or Or J r
Jr Or Or Jr Or Or J r Or Or
O r Jr Or Or Jr Or Or J r Or
1
PX T
rb
O r Or J r Or Or J r Or Or J r
Jr Or Or Jr Or Or J r Or Or
O r Jr Or Or Jr Or Or J r Or
Or Or J r Or Or J r Or Or J r rtb rtb
De ahí que,
Jr Or Or Jr Or Or J r Or Or
O J r Or Or J r Or Or J r Or
r
Or Or J r Or Or J r Or Or J r
Jr Or Or Jr Or Or J r Or Or
Or Jr Or Or Jr Or Or J r Or
1
2
PX T Var Y
r rb
Or Or J r Or Or J r Or Or J r
Jr Or Or Jr Or Or J r Or Or
Or Jr Or Or Jr Or Or J r Or
Or Or J r Or Or J r Or Or J r rtb rtb
2.a) Entonces,
1 2 2
tr PXT Var Y
rb r
rtb
r
t,
2.b) y
2
1 1 t b
E Y ' PX T E Y l' XT XT l r lik
rb rb k 1i 1
Por lo tanto:
2 2
2 1 t b 1 b t
E SCtrat t 1 r lik r lik
r rb k 1 i 1 rtb i 1k 1
34
2 2
2 r t b r b t
t 1 lik lik
r b k 1 i 1 tb i 1 k 1
r t b
2 2
2 1 b t
t 1 lik lik
r b k 1 i 1 t i 1 k 1
2 r t
t 1 b2 k
2
r b k 1
2 t
t 1 rb k 2 ,
r k 1
como se presentó en (32).
3. Para obtener la esperanza del tercer término de (30) es decir, la esperanza de la SCEE,
primero se va a desarrollar la E SC( UE ):
3.a) E SCUE E Y' PC2 PC1 Y
tr P
C2
PC1 Var Y E Y ' PC2 PC1 E Y
De 3.a) hay que conocer,
1 2
2
1
a.1) tr PC2 Var Y tr C2C2 Var Y rtb bt ,
r r r r
ya que,
J r Or Or
1 2 Or J r Or
PC 2 Var Y
r r
Or Or J r rtb rtb
r r i 1k 1 i 1k 1
Por lo tanto:
E SCUE E Y' PC2 PC1 Y
2
bt 1 r lik2 lik 2
1
r bt
bt 1 r Bi k B
2 2
r
2
2
bt 1 r Bi B k
b t
(33)
r i 1 k 1
3b) Considerando que en el diseño de bloques completos al azar, se cumple que
SC( UE ) SCbloq SCtrat SCEE se procederá a obtener la E SCEE de la expresión (34) como
sigue:
E SCEE E Y' PC2 PX B PXT PC1 Y
35
E Y' PC2 PC1 PX B PC1 PX T PC1 Y ,
sustituyendo en la expresión anterior los resultados de (31), (32) y (33) se tiene que:
2
bt 1 b 1 t 1 r i1k1 Bi B k
b t b t
rt Bi B rb k
2 2 2
r i 1 k 1
2
b 1 t 1 2r Bi B k
r
obteniéndose finalmente,
2
E( SCEE ) b 1 t 1 , (34)
r
b t
ya que, Bi B k 0 .
i 1 k 1
4. Por último, haciendo uso de la expresión (17) sobre el cálculo de E Y' AY , se presenta la
E SCEM así:
E SCEM E Y' Irtb PC2 Y
trI rtb
PC2 Var Y E Y ' I rtb PC2 E Y
De la expresión anterior, se requiere lo siguiente:
4.a) A partir de (20) y sustituyendo n por tb se tiene que,
tr IrtbVar Y 2m 2 rtb
4.b) A partir de (19) y sustituyendo n por tb,
2
tr PC2 Var Y r
tb
4.c) Se tiene también que:
b t
E Y ' I rtb E Y E Y ' E Y r l 2ik
i 1 k 1
4d) y
b t
E Y ' PC2 E Y r l 2ik
i 1 k 1
Por lo tanto,
E SCEM 2m 2 rtb 2
r
tb
2m 2 rtb 2m r 2 tb
tb 2m r 1
Obsérvese que la expresión inmediata anterior es equivalente a la que se presentó en (20), para el
diseño basado en las unidades experimentales y para el diseño completamente aleatorio.
Aplicando la Definición 3, los grados de libertad de las SCtrat, SCbloq, SC(UE), SCEE y SCEM
son:
36
tr PXT PC1 r PXT PC1 t 1 ,
tr PXB PC1 r P XB PC1 b 1,
tr PC2 PC1 r PC2 PC1 tb 1,
tr PC2 PX B PXT PC1 r PC2 PX B PXT PC1 bt b t 1 b 1 t 1,
respectivamente.
Finalmente, los resultados del diseño de bloques completos al azar con submuestreo, se resumen en
el siguiente cuadro.
trat t 1
Y' PXT PC1 Y 2
rb t
k
2
r t 1 k 1
EE b 1 t 1
Y' PC2 PX B PXT PC1 Y 2m r 2
2
r
Y' I 2
PC2 Y
EM bt r 1 rtb m
37
6. DISEÑO GENERAL CON EL MISMO NÚMERO DE SUBMUESTRAS POR UNIDAD
EXPERIMENTAL
Se han desarrollado en los capítulos precedentes, las sumas de cuadrados y las esperanzas de los
cuadrados medios, de las fuentes de variación correspondientes al diseño abordado. En este
Capítulo se expone el planteamiento general, para obtener resultados de cualquier diseño
experimental planeado con igual número de submuestras por unidad experimental. La exposición se
hará en dos pasos: primero se presenta el análisis directamente sobre las observaciones originales
Y r
Yij y luego, se realiza el análisis sobre las variables i. , donde Yi . Yij . Sin embargo, antes de
r j 1
continuar es indispensable conocer los siguientes hechos:
a) Para cualquier matriz diseño X con n unidades experimentales y r submuestras en cada una de
ellas, existe una matriz A tal que:
X C2 A (35)
nr x k nr x n n x k
donde C2 es la matriz basada en las unidades experimentales y k, es definida por las columnas del
diseño.
b)
1
C2C2 r I n C2C2 I n (36)
r
c) Usando (36) se tiene que:
38
1
r X rC2 A r A r C2C2 A rC2 A r X (37)
r
d) La Var Y que se presentó en (18) puede reescribirse como:
Var Y 2C2C2 2m I nr
(38)
e) A partir del resultado B' B O B O en donde B es una matriz, se escriben los siguientes
resultados sobre la inversa generalizada de X'X, es decir, sobre X' X :
Observe que,
X' X X' X X' X X' X X' X X' X X' X
'
X' X X' X X' X X X' X X' X O
'
X' X X' X '
X' X X' X X' X X' X X' X X X' X X' X O
'
Por lo tanto:
X' X .
X X' X X' X X X' X
Además,
X X' X X' X X' X X'
'
e.2)
ya que
X X' X X' X X X' X X' X O
'
X' .
X X' X X' X X' X
Por último,
X X' X1 X' X X' X 2 X'
e.3) (39)
ya que,
X' X X' X1 X' X X' X X' X 2 X' X O
X' X X' X X' X' X X' X X' X X' X X' X X' X X' X O
1
2
1
2
Por lo que,
X' X X' X1 X' X' X X' X 2 X' ,
entonces:
X' X X' X1 X' X X' X 2 X' O
X X' X
1
X X' X 2 X' X X' X1 X' X X' X 2 X' O
39
Por lo tanto:
X X' X1 X' X X' X 2 X'
con i ~ 0, 2 , , ij ~ 0, 2m y cov i , ij 0,
en donde es el efecto de la media que es común a todas las unidades experimentales, i d es el
efecto asociado a la unidad experimental i según el diseño y es la que conformará la matriz diseño
X en correspondencia a las fuentes de variación a las que esté asociada esta unidad, i corresponde
al efecto aleatorio de la i-ésima unidad experimental (error experimental) y ij es el efecto aleatorio
de la j-ésima observación dentro de la unidad experimental i (error muestral ); Yij es la variable
respuesta que es explicada por las fuentes de variación descritas en el lado derecho de (40).
La suma de cuadrados total (SCT) en el diseño general sobre las observacioes Yij es:
SCT SCModelo SCEE SCEM
Y' I nr
P1nr Y Y' PX P1nr Y Y' PC2 PX Y Y' I nr PC2 Y (42)
E SCEE tr PC2 PX Var Y E Y ' PC2 PX E Y
De esta última expresión es importante conocer que,
a) tr PC2 Var Y tr PC2 C2C2' 2 2mI nr 2 tr C2C'2 n 2m
2
nr 2 n 2m n
r
b) E Y ' PC2 E Y ' X' PC2 X ' A' C2' PC2 C2 A ' A' C2' C2 A
40
' X' X
c) tr PXVar Y tr PX 2C2C2 2mI nr
2 tr PXC2C2 2m r X
donde r(X) denota el rango de la matriz X.
La tr PXC2C2 trC2' PXC2 tr C2 X X' X X' C2
tr C2C2 A AC2C2 A AC2C2
r tr PA r r A r r X
Por lo tanto:
2
tr PXVar Y r 2 r X 2m r X
r
r X
E SCModelo E Y' PX P1nr Y
2
r
r X 1 ' X' X nr1 ' X' J nr X (44)
Puede apreciarse que adicionando SCModelo y SCEE se obtiene la SC(UE) que se presentó en
la expresión (14) de la Sección 3.2.1.
Y' PX P1nr Y Y' PC2 PX Y Y' PC2 P1nr Y
A continuación, se resumen los resultados del diseño general que se desarrollaron.
41
FV GL SC E(CM)
EM n r 1
Y' I nr PC2 Y 2m
Total nr 1 Y' I nr P1 Y nr
2
como siempre 2m r 2
r
Yi.
6.2. Diseño general sobre las variables
r
A continuación se muestra que las sumas de cuadrados del diseño general sobre las
observaciones Yij lo son también del diseño correspondiente a las unidades experimentales sobre
Yi.
las variables :
r
' '
1 Z Z Z 1 Z
J n 1n 1'n1n 1'
n r r r r
Z Z
P1n .
r r
Y' PC2 P1nr Z
r
Z
Y I n P1n ,
r
(45)
42
que se puede interpretar diciendo: “la SC(UE) obtenida sobre las observaciones originales Yij es
Yi.
igual a la SCT obtenida sobre las nuevas variables ”.
r
y que:
'
Z
r
Z
Y' PX P1nr Y PA P1n .
r
(47)
Este último análisis de varianza el de la expresión (48) corresponde a un diseño donde la
Z
matriz del mismo es A y el vector de respuestas es . Es claro que la matriz A, corresponde a
r
la matriz diseño de las unidades experimentales, así como X es la matriz diseño de las
Z
observaciones originales. Como se ha mencionado, los elementos del vector de dimensión
r
Y
n 1 son i. (los totales de unidad experimental entre la raíz cuadrada del número de
r
submuestras), de manera que, a las unidades experimentales se les asigna este último valor en el
análisis de varianza al que se está haciendo referencia.
43
C2 Y C2C2 A C2 C2
Z r A C2 C2
lo cual es equivalente a escribir,
Z
r
A r
1
r
C2
1
r
C2 , (49)
Y
que es el modelo lineal sobre los valores i. de las unidades experimentales.
r
Observe que
1 1 1
Var C2 C2 Var C2
r r r
1 1
Var C2' Y Var Z .
r r
Por lo tanto:
1 1 1
Var Z Var C2 Y C2Var Y C2 ; usando (38),
r r r
1
C2 2C2C2 2mI nr C2
r
1
2r 2I n 2m r I n
r
1
r 2 2 r 2m I n 2m r 2 I n
r
2
In
r
Además:
1 1
E C2 C2 0
r r
1
Entonces, si se hace, w C2' , puede reescribirse (49) como:
r
Z
r
A r w (50)
2
donde E w 0 y Var w I n ; el análisis de (48), corresponde al modelo (50).
r
1
Para escribir el análisis de varianza de (48), sólo resta desarrollar ' X' I nr J nr X en
nr
términos de la matriz diseño A, de las unidades experimentales. Esto se escribe enseguida:
1 1
' X' I nr J nr X ' A' C2' I nr J nr C2 A
nr nr
44
r2
' A' r I nr J n A
nr
1
r ' A' I nr J n A
n
r .
Yi.
Entonces la tabla de análisis de varianza para el modelo (48), es decir, sobre las variables
r
es:
r A 1
'
Modelo Z
Z
PA P1n
r r
2
r
1
r A 1
1
r ' A' I n J n A
n
r
'
EE n r A
Z
Z
I n PA
r r
2m r 2
'
Total n 1
Z
Z
r I n P1n r
Puede observarse que a partir de las Tablas 3 y 7 puede construirse la Tabla 6 del modelo general;
se toman las primeras dos hileras de la Tabla 7 y las últimas dos de la Tabla 3 para colocarlas en
el orden descrito y obtener así la Tabla 6.
El resumen de los resultados del diseño general propuesto, se puede observar en las Tablas 6 y
7; en el Análisis de Varianza de la Tabla 6 se utilizan las observaciones originales Yij y se puede
ver que, la SCT es particionada en la SC(UE) y la SCEM tal como en la expresión (1). Obsérvese
que adicionando (43) y (44) se obtiene la SC(UE). Ahora bien, para particionar la SC(UE) en las
Y
fuentes de variación del diseño correspondiente, será necesario analizar las variables i. y el
r
Análisis de Varianza se presenta en la Tabla 7. Observe que la SCT en la Tabla 7 puede
considerarse "ficticia" ya que corresponde al valor de la SC(UE) que se obtiene con los datos
originales Yij .
1
Dr. Ángel Martínez Garza. 1993. Montecillo, Edo. de México, Colegio de Postgraduados. (Comunicación
personal).
45
Yi.
Análisis de Varianza de la Tabla 7. Otro aspecto relevante, es que al analizar las variables o
r
alguno de sus múltiplos, como el valor promedio de las submuestras por parcela Yi. , no se alterarán
los valores de las F calculadas para las pruebas de hipótesis de los tratamientos; sin embargo, las
Y
sumas de cuadrados que se obtendrán con datos diferentes a i. , no serán las correctas.
r
Y
Particularmente, cuando se usa Y i. en lugar de i. , las sumas de cuadrados y los cuadrados medios
r
resultantes son r veces más pequeños con respecto a los valores correctos.
46
7. UN ALGORITMO GENERAL PARA DISEÑOS EXPERIMENTALES CON SUBMUESTREO
En este Capítulo se presenta un algoritmo útil para resolver cualquier diseño planeado con igual
número de submuestras por unidad experimental, y es válido aún en los casos en los que resulte
complicado conocer las componentes del error experimental. Este algoritmo se ha derivado de la
teoría que se presenta en el planteamiento del diseño general (Capítulo 6), pero no se requieren leer
todos los capítulos anteriores para entenderlo y estar en posición de resolver un problema particular
con submuestreo, a menos que, se desee comprender los fundamentos de este tema. Por último, se
desarrollan tres ejemplos con datos reales y se escriben los programas de SAS (Statistical Analysis
System) para resolverlos en la microcomputadora.
El algoritmo
PASO 1. Se ajusta un modelo basado en las unidades experimentales puede ver modelo (2) ó
(10) para obtener la suma de cuadrados total (SCT), la suma de cuadrados de las unidades
(SC(UE)) y la suma de cuadrados del error muestral (SCEM). En este paso se usarán los datos
originales Yij como variable respuesta, i 1,2,, n , j 1,2,,r . Las sumas de cuadrados se
calculan con:
n r 2
SCT Yij Y ..
i 1 j 1
n
SCUE r Y i . Y ..
2
i 1
n r 2
SCEM Yij Y i .
i 1 j 1
Estas fórmulas se escribieron en las expresiones (4), (5) y (6), respectivamente, del Capítulo 3; ahí
puede ver también un ejemplo numérico del cálculo de estas sumas de cuadrados con los datos de
la Tabla 1. Observe que en este primer paso del algoritmo, sólo se requiere saber en qué unidad
experimental se registró cada submuestra; no hace falta saber si la observación pertenece a tal
bloque, o recibió el tratamiento fulano, o se obtuvo en la intersección de una hilera y una columna
específicos, etc.
Yi.
PASO 2. Enseguida se ajusta otro modelo que usa como variable respuesta a las (total de la i-
r
ésima unidad experimental entre la raíz cuadrada del número de submuestras) puede ver el
modelo en (49), para particionar a la SC(UE), obtenida en el paso anterior, en las sumas de
cuadrados de las fuentes de variación correspondientes a un diseño experimental particular: por
ejemplo, en el diseño completamente al azar, la partición de la SC(UE) se hace en la suma de
cuadrados de tratamientos (SCtrat) y la suma de cuadrados del error experimental (SCEE); en el
47
diseño de bloques completos al azar, la partición de la SC(UE) se hace en la suma de cuadrados de
bloques (SCbloq), la SCtrat y la SCEE.
Yi .
En este segundo paso, los valores son los que se asignan a las unidades experimentales para
r
el análisis de varianza como si fueran los datos observados en las mismas, en condiciones de un
diseño estándar (o sea, sin submuestreo) y para ello, se hace uso de las fórmulas reportadas en la
literatura dependiendo del diseño de donde provengan los datos.
Para que esta explicación resulte más clara, pensemos por el momento, que estamos en el caso
de un diseño completamente al azar con submuestreo suponiendo que las sumas de cuadrados del
Y
primer paso ya fueron obtenidas y renombremos a i . X kh como la h-ésima repetición del k-
r
ésimo tratamiento, con k 1,,t , h 1,, nk . Observe que ¡ahora sí!, a diferencia del Paso 1, es
indispensable saber qué tratamiento se le asignó aleatoriamente a cada unidad en el
experimento. Hechas estas aclaraciones, entonces la SCT sobre las nuevas variables X kh se calcula
con:
t nk
SCT X kh X .. ;
2
k 1h 1
y la partición de las SC(UE) del primer paso, se obtiene calculando las siguientes sumas de
cuadrados:
t
X k2.
k 1 X ..2
SCtrat ,
nk n
SCEE SCT SCtrat .
t
En estas fórmulas, nk es el número de repeticiones del k-ésimo tratamiento y n nk . La SCT
k 1
sobre las X kh es igual a la SC(UE) sobre las observaciones Yij que se calculó en el Paso 1.
¿Qué situación se presenta si el diseño de donde provienen los datos experimentales es un bloques
Y
al azar con submuestreo? Bueno, pues de manera similar, podemos renombrar a las i . X kh ,
r
haciendo que sea éste el valor que se asigna a la unidad experimental del h-ésimo bloque que
recibió el k-ésimo tratamiento, con k 1,,t , h 1,,b . La SCT sobre las nuevas variables X kh
es:
SCT X kh X .. .
t b 2
k 1h 1
Para particionar la SC(UE) obtenida con el Paso 1, en las sumas de cuadrados de las fuentes de
variación correspondientes a un bloques al azar, se calculan:
b
X .h2
h 1 X ..2
SCbloq
t tb
48
t
X k2.
k 1 X ..2
SCtrat
b tb
SCEE SCT SCbloq SCtrat
De manera análoga, esta explicación se puede extender a otros diseños.
Es conveniente reiterar, que la SCT que se obtenga en el Paso 2 corresponde en realidad al valor
de la SC(UE) que se obtuvo en el Paso 1, ya que precisamente, se trata de particionar esta última
suma de cuadrados en sus fuentes de variación correspondientes al diseño experimental particular.
PASO 3. En los dos primeros pasos, se obtienen los valores de las sumas de cuadrados. Ahora sólo
falta ordenarlos, tomando las sumas de cuadrados en que se particionó la SC(UE) en el segundo
paso y la SCEM y la SCT obtenidos en el primer paso para que la Tabla de Análisis de Varianza
(ANOVA) de su diseño con submuestreo quede completa.
A continuación se presentarán tres ejemplos de casos reales que son resueltos con programas en
SAS que se generaron siguiendo los tres pasos de este algoritmo.
49
41.88 42.04 32.59 31.83 23.55 20.72 40.77 38.39
42.29 40.62 34.80 30.94 22.22 19.28 33.19 36.61
38.59 37.38 28.76 28.05 20.09 18.83 29.65 31.39
37.55 34.68 29.77 27.27 21.97 18.30 29.20 28.38
Fuente: Datos sin publicar, usados por cortesía del Ing. M. Fuentes Salinas,
Universidad Austral de Chile. 1991.
El análisis de los datos de la Tabla 8 fue hecho con el Paquete Estadístico SAS y se usó el
siguiente programa:
50
Tabla 10. Salida de SAS de un diseño completamente al azar con
submuestreo
Mean
0.856366 9.789623 3.0379 31.03181
Source DF Anova SS Mean F Value Pr > F
Square
UE 7 3521.5154 503.0736 54.41 0.0001
PARTICION 2: "SC(UE) = SCtrat + SCEE"
Analysis of Variance Procedure
Dependent Variable: RESPM
Source DF Sum of Mean F Value Pr > F
Squares Square
Model 3 3493.6044 1164.5348 166.89 0.0001
Error 4 27.9110 6.978
Corrected 7 3521.5154
Total
R-Square C.V. Root MSE RESPM
Mean
0.992074 2.837458 2.6415 93.09542
Source DF Anova SS Mean F Value Pr > F
Square
TRAT 3 3493.6044 1164.5348 166.89 0.0001
en donde, como de costumbre, trat: tratamientos; EE: error experimental; EM: error muestral.
51
de un periodo de haber aplicado los tratamientos; para facilitar la presentación de este ejemplo, se
utiliza sólo el contenido de nitrato (NO3) en ppm como variable respuesta. Los tratamientos se
repitieron en tres bloques y se tomaron 3 submuestras por unidad experimental. Los datos de este
experimento son reportados por Baus Picard y Alcalde (1979); los tratamiento aplicados se
presentan en la Tabla 12 y la porción de los datos usados en este ejemplo, se presentan en la Tabla
13.
52
El programa SAS para obtener el Análisis de Varianza (ANOVA) de los datos de un diseño de
bloques completos al azar con submuestreo, está estructurado bajo el mismo razonamiento en que
se basa el programa del diseño completamente aleatorio. En la primera partición, la SCT es dividida
en la SC(UE) y la SCEM; con el segundo modelo se particiona a la SC(UE) en la SCbloq, SCtrat y
SCEE, que son las fuentes de variación que componen a la SC(UE) en este diseño. El programa en
SAS se presenta en la Tabla 14.
Tabla 14. Programa SAS para el análisis de un diseño de bloques completos al azar con
submuestreo
DATA DBCAS;
INFILE 'A;\EJDBCA.DAT';
INPUT BLOQUE TRAT RESP;
UE = (10 *BLOQUE) + TRAT;
PROC ANOVA; CLASS UE;
MODEL RESP=UE;
TITLE 'PARTICION 1: "SCT = SC(UE)+ SCEM";
PROC SORT;BY BLOQUE TRAT;
PROC MEANS; BY BLOQUE TRAT; VAR RESP;
OUTPUT OUT=B SUM=SRESP;
DATA NUEVAS; SET B; Y=SRESP/SQRT(3);
KEEP BLOQUE TRAT Y;
PROC ANOVA; CLASSES BLOQUE TRAT;
MODEL Y=BLOQUE TRAT;
TITLE 'PARTICION 2: "SC(UE) = SCbloq + SCtrat + SCEE"';
RUN;
Al ejecutar el programa anterior usando los datos de la Tabla 13, se obtiene una salida de SAS
que se presenta a continuación:
Tabla 15. Salida de SAS del diseño de bloques completos al azar con submuestreo
PARTICION 1: "SCT = SC(UE) + SCEm"
Analysis of Variance Procedure
Dependent Variable: RESP
Source DF Sum of Mean F Value Pr > F
Squares Square
Model 20 83901.746 4 195.087 148.81 0.001
Error 42 1184.000 28.190
Corrected 62 85085.746
Total
R-Square C.V. Root MSE RESP
Mean
0.98 085 3.635043 5.3095 146. 635
Source DF Anova SS Mean F Value Pr > F
Square
UE 20 83901.746 4 195.087 148.81 0.001
53
PARTICION 2: "SC(UE) = SCbloq + SCtrat + SCEE"
Analysis of Variance Procedure
Dependent Variable: Y
Source DF Sum of Mean F Value Pr > F
Squares Square,
Model 8 65621.651 8202.706 5.38 0.048
Error 12 18280.095 1523.341
Corrected 20 83901.746
Total
R -Square C.V. Root MSE Y Mean
0.78 125 15.42753 39.030 252.894
Source DF Anova SS Mean F Value Pr > F
Square
Bloq 2 44295.460 22147.730 14.54 0.006
TRAT 6 21326.190 3554.365 2.33 0.998
Para ejemplificar el análisis del diseño en cuatro latino con submuestreo, se usan los resultados
parciales de un experimento de aclareos del área basal realizado en el ejido La Victoria, Pueblo
Nuevo, Durango en un bosque de Pinus cooperi. Se usó un cuadro latino de 6 x 6 para ensayar seis
diferentes intensidades (en %) de aclareo del área basal (tratamientos) y estudiar la influencia que
esta práctica silvícola ejerce sobre el diámetro, la altura, la proyección de copa, etc, del arbolado.
Como variable respuesta, se estudian los incrementos del diámetro normal (a 1.3 m) en un periodo
de cuatro años, y se consideran tres submuestras por unidad experimental. El % de aclareo del área
basal en los seis tratamientos aplicados en este experimento, son los siguientes:
54
E 100
F 0
y los datos usados para fines de este ejemplo son los siguientes:
Tabla 17. Incremento en diámetro normal (en cm) en un bosque en cuatro años
Columnas
Hileras I II III IV V VI
1.6 1.5 3.0 2.9 1.9 1.5
I 2.2 2.1 1.8 1.8 1.6 3.0
2.7 3.4 3.1 3.7 2.8 3.3
Para hacer el análisis de los datos de un experimento en cuadro latino con submuestreo y
basándose en los primeros dos pasos del algoritmo anteriormente expuesto, se tiene el siguiente
programa:
55
Tabla 18. Programa SAS para un experimento en cuadro latino
DATA DCLS;
INFILE 'A:\EJDCL.DAT';
INPUT HIL COL TRAT $ RESP; UE=(HIL * 10)+ COL;
PROC ANOVA; CLASS UE;
MODEL RESP=UE;
TITLE 'PARTICION 1: SCT = SC(UE) + SCEM ';
PROC SORT;BY HIL COL TRAT;
PROC MEANS; BY HIL COL TRAT; VAR RESP;
OUTPUT OUT=B SUM=SRESP;
DATA NUEVAS;SET B;Y=SRESP/SQRT(3);
KEEP HIL COL TRAT Y;
PROC ANOVA; CLASSES HIL COL TRAT;
MODEL Y = HIL COL TRAT;
TITLE 'PARTICION 2: SC(UE) = SCHIL +SCcol + SCtrat + SCEE ';
RUN;
56
COL 5 0.2492593 0.0498519 0.35 0.8748
TRAT 5 0.8792593 0.1758519 1.24 0.3268
Ordenando los datos de la Tabla 19 como se indica en el tercer paso del algoritmo, se genera
una Tabla de Análisis de Varianza como:
Observe que la SC(UE) es el resultado de adicionar las sumas de cuadrados siguientes: SChil,
SCcol, SCtrat y SCEE; para obtener la SCT se suman la SC(UE) y la SCEM.
57
8. LITERATURA CITADA
BAUS PICARD y ALCALDE. 1979. Efecto de la Gallinaza sobre Algunos Cambios Físicos y
Químicos en un Suelo de Ando. Publicado en "Los Suelos de Ando", Colegio de
Postgraduados, Chapingo, Méx. pp. 89-108.
CHING CHUN, L. 1969. Introducción a la Estadística Experimental. Traducido por Griselda Ribó.
Barcelona, España, Omega. pp. 109-111.
GRAYBILL, F. 1969. Introduction to Matrices with Applications in Statistics. Belmont, California,
Wadsworth Publishing. pp. 14-17.
MARTINEZ GARZA, A. 1988. Diseños Experimentales: Métodos y Elementos de Teoría. México,
D.F., Trillas. 755 p.
SEARLE, S:R: 1966. Matrix Algebra for the Biological Sciences. New York, USA, John Wiley &
Sons. pp. 199-201.
SNEDECOR, G. & W. COCHRAN. 1967. Statistical Methods. Sixth edition. Ames, USA, Iowa
State University. pp. 285-288.
STEEL, R. y J. TORRIE. 1988. Bioestadística: Principios y Procedimientos. Traducido por Ricardo
Martínez. México, D.F., McGraw-Hill. 621 p.
58