DE Cap 1-3 PDF

Diseño de Experimentos Químicos
Capítulos 1-3
Programa de Química
Departamento de Matemáticas y Estadística
Arsenio Hidalgo Troya - Docente

Temática:
1. Introducción al Diseño experimental (DE)
1.1 Introducción
1.2 Conceptos básicos
1.3 Principios básicos del DE
1.4 Etapas en el Diseño Experimental
2. Diseños Completamente Aleatorizados (DCA)

2.1 Características
2.2 Modelo estadístico de efectos fijos
2.3 Modelo estadístico de efectos aleatorios
2.4 Modelo ANOVA
2.5 Contrastes y comparaciones múltiples
2.5 Componentes de la varianza
Msc. Arsenio Hidalgo Troya 2

Temática:
3. Diseño en Bloques al Azar (DBA)

3.1 Características
3.2 Modelo estadístico
3.3 Diseño Bloque Completo al Azar
3.4 Diseños de Cuadrado Latino y Grecolatino

INTRODUCCIÓN:
Orígenes de la Metodología
El desarrollo del análisis de varianza (ANOVA) y de los métodos de

diseño de experimentos (DE) se debe a Ronald A. Fisher (1880 –
1962).
Quién en su trabajo en la Estación de Experimentación Agrícola de

Rothamsted, Inglaterra desarrolló los principios de la
experimentación científica que se plasmaron en su influyente
libro Design of Experiments.
El trabajo de Fisher fue continuado por F. Yates (1902 –1978). Yates

estudió los diseños factoriales y desarrolló nuevos diseños.

D. J. Finney que estudió las fracciones factoriales y en sus
estudios de ensayos biológicos introduce modelos de
regresión con variable de respuesta cualitativa, como los
modelos probit y logístico.
En Estados Unidos W. G. Cochran (1909 – 1980) fundamenta

matemáticamente el análisis de varianza y escribe con G. M.
Cox (1900 – 1978) un texto básico sobre diseños
experimentales.
G. W. Snedecor (1881 – 1974) hace aportes muy

importantes en cuanto al contraste de hipótesis en estos
modelos.

La aplicación de los diseños experimentales en la industria
es debida en gran parte al trabajo de G. Box, quien
desarrolla la metodología de superficies de respuesta
(MSR); teniendo como base los trabajos presentados por
Deming y Taguchi.
Actualmente el DE se emplea en casi todas las áreas del

conocimiento, química, biología, ingeniería, ciencias
agrícolas, ciencias de la salud y del comportamiento
humano, educación, etc.

CONCEPTOS BÁSICOS
Qué es un experimento?
Una prueba o serie de pruebas donde se introducen cambios
deliberados en las variables de entrada que forman un sistema o
proceso, con el objetivo de medir el efecto del cambio sobre una
o mas variables del producto o salida de dicho proceso.
Qué es diseñar un experimento?

Planear y realizar un conjunto de pruebas (tratamientos) con el
objetivo de generar datos que, al ser analizados
estadísticamente, proporcionen evidencias objetivas para
obtener conclusiones válidas sobre el sistema o proceso.

DISEÑO EXPERIMENTAL (DE):
Es un estudio de investigación en el que se manipulan

deliberadamente una o más variables independientes (supuestas
causas) para analizar las consecuencias que la manipulación
tiene sobre una o más variables dependientes (supuestos
efectos), dentro de condiciones controladas por el investigador.
Por ejemplo, en un proceso químico se pueden probar diferentes

temperaturas y presiones, y medir el cambio observado en el
rendimiento del proceso. Al analizar los efectos (datos) se
obtiene conocimiento acerca del proceso químico, lo cual
permite mejorar su desempeño.
Los objetivos de un DE son los siguientes:
1. Verificar si la diferencia entre los tratamientos es una diferencia

verdadera (significación estadística) o se debe a un proceso casual o
por azar,
2. Establecer tendencias entre las variables y predicciones de

resultados a través de modelos estadísticos.
El DE es el procedimiento que se sigue para asignar los tratamientos a

las denominadas unidades experimentales (UE).

En un método aleatorio (asignación al azar), se asigna el tratamiento a

cada unidad experimental mediante un sorteo o por medio de una
tabla de números aleatorios
Ejemplo 1 . Efecto de la cloración sobre la resistencia a la abrasión de

un tipo particular de caucho. Se toman 10 piezas de caucho y se clora
la mitad al azar y otra mitad no se clora.


UNIDAD EXPERIMENTAL (UE)
Pieza, unidad o muestra que se utiliza para generar un valor que

sea representativo del resultado de la prueba.
Material al cual se le aplica un tratamiento.
Ejemplo 2. Del ejemplo 1, la pieza de caucho.
Para el Químico la unidad puede ser una muestra de agua; para el Ingeniero Agrícola
la unidad experimental puede ser una matera, una parcela, una finca; para el
Veterinario un animal, 10 pollos de corral, día de la semana, etc.; para el Médico
puede ser un paciente, un consultorio, un hospital, en otros casos puede ser el hígado
o parte de la piel. Igualmente la UE puede ser un sitio en un río, una profundidad en
un lago, un cuadrante de un bosque , un árbol, una rama, una flor o fruto, etc.

UNIDAD DE MUESTREO O UNIDAD OBSERVACIONAL (UO)
Es la fracción de la unidad experimental sobre la cual se mide el efecto
del tratamiento. El muestreo de observaciones no implica replicación.
Ejemplo 3: Cuando se aplica un tipo de alimento (tratamiento) a los peces en

una piscina, si en una misma piscina hay 100 peces que se les alimenta con la
misma ración, la UE es la piscina con los 100 peces. Se necesitan otras
piscinas de 100 peces antes de poder medir la variación entre unidades
tratadas en forma semejante. Sin embargo, las observaciones de aumento de
peso se hacen a cada pez (UO).
En algunos casos las UE y las UO son iguales pero en otros no.

Dato
Es el resultado de las observaciones o mediciones hechas a cada
unidad experimental y un conjunto de ellos, conforman la base de
datos para hacer los cálculos y análisis estadísticos.
Población
Es el conjunto de todas las UEs que podrían recibir uno de los
tratamientos. El objeto de la investigación debe establecerse en
términos de esta población. Para el estadístico la población es el
conjunto de todos los datos que podrían obtenerse de todas las
UEs.
Universo ----> UEs

Población ----> Datos

VARIABLE RESPUESTA (Dependiente)
Característica de interés para el investigador
Cada unidad experimental entrega un valor de la variable
respuesta. Se logrará tantos datos de la variable respuesta como
tantas unidades experimentales se hayan incluido
A través de esta(s) variable(s) se conoce el efecto o los resultados
de cada prueba experimental
FACTORES CONTROLABLES
Variables de entrada qué el investigador fija en un punto o nivel
de operación. Variables experimentales independientes
cualitativas o cuantitativas que influyen sobre la variable
respuesta y son el principal objetivo de la investigación
Ejemplo 4: Si un proceso trabaja con agua y existe algún
mecanismo que permita fijar la temperatura del agua en 60, 65 ó
70 grados Celsius, entonces decimos que la Temperatura es un
factor controlable. Msc. Arsenio Hidalgo Troya 15
FACTORES NO CONTROLABLES (Factores de ruido)
Generalmente son variables que pueden afectar nuestra
variable de respuesta y que NO se pueden controlar
durante el experimento o la operación normal del proceso.
Un factor NO controlable puede llegar a ser controlable en

la medida en que se desarrolle el mecanismos de control.
Covariables, factores de clasificación
Ejemplo 5: la temperatura ambiente, la humedad, el

estado de ánimo de los operadores, su edad, el pH del
agua, la cantidad de lluvia, etc. son factores que suelen ser
NO controlables.

NIVELES Y TRATAMIENTOS
Diferentes valores que se asignan (fijan o seleccionan) a cada

factor estudiado en un DE.
Una combinación de niveles de todos los factores estudiados se

denomina tratamiento o punto de diseño.

ERROR EXPERIMENTAL
Componente del error aleatorio que refleja los errores del
experimentador en la planeación y ejecución del experimento.
ERROR ALEATORIO
Variabilidad observada que no se puede explicar por los factores
estudiados; resulta del pequeño efecto de los factores no
estudiados y/o no conocidos y del error experimental.

INTERACCIÓN
Se presenta cuando el efecto de un factor depende del nivel
en que se encuentra otro(s) factor(es).
MATRIZ DE DISEÑO
Es el arreglo formado por los tratamientos que serán
corridos, incluyendo las repeticiones.

PRINCIPIOS BÁSICOS DEL DE
• Aleatorización
• Replicación
• Bloqueo

PRINCIPIOS BÁSICOS DEL DE
Aleatorización (Random):
Consiste en hacer corridas experimentales en orden aleatorio
Aumenta la posibilidad de que el supuesto de independencia de los

errores se cumpla
Garantiza que la variabilidad ocasionada por los factores no

estudiados y/o no controlados se reparta de manera homogénea en
todos los tratamientos, sin favorecer o desfavorecer al alguno de
ellos.
A cada unidad experimental se asigna de manera aleatoria el

correspondiente tratamiento;
Además, el orden en que cada UE será sometida al respectivo

tratamiento también se asigna de manera aleatoria.
Replicación:
Cada tratamiento se asigna a dos o más UEs.
Si no se cumple este principio no será posible estimar el error

del modelo y en consecuencia tampoco se pueden probar las
respectivas hipótesis de los efectos investigados.
A mayor cantidad de réplicas se obtendrán estimaciones más

precisas de los efectos estudiados.
Excepcionalmente existen algunos diseños que permiten

utilizar sólo una réplica en cada punto experimental sin perder
validez estadística en los análisis.
Bloqueo:
Permite tomar en cuenta en forma adecuada todos los factores
que pueden afectar la respuesta observada.
Se utiliza para mejorar la precisión de las comparaciones que se

realizan entre los factores de interés.
Generalmente se utiliza para aislar la variabilidad transmitida por

factores perturbadores, es decir, factores que se piensa si influyen
sobre la variable de respuesta pero no son de interés directo para
el investigador.
Disminuye el valor estimado del error del modelo, haciendo más

probable la detección de los efectos que los factores estudiados
ejercen sobre la variable de respuesta.

DISEÑO BALANCEADO
Cuando se utiliza el mismo número de replicas en cada
tratamiento.
DISEÑO NO BALANCEADO
Cuando el número de replicas en cada tratamiento no es el
mismo.

MODELOS DE EFECTOS FIJOS Y MODELOS DE EFECTOS
ALEATORIOS
De acuerdo a la forma como se consideren los tratamientos existen los

siguientes tipos de modelos:
• Modelo Tipo I o de Efectos Fijos: En el cual los tratamientos son

seleccionados por el investigador porque tienen un interés
particular.
• Modelo Tipo II o Aleatorio: En el cual los tratamientos son una

muestra aleatoria de su población.
• Modelo Tipo III o Mixto: Se obtiene cuando en el experimento hay

factores con niveles fijos y factores con niveles aleatorios.

Diferencias entre los tipos de modelo I y II
Para el modelo tipo I, una repetición del experimento se realiza sobre el mismo
conjunto de tratamientos; en tanto que para el modelo tipo II una repetición
producirá un nuevo conjunto de tratamientos.
En el modelo tipo I la inferencia se hace estrictamente sobre los parámetros

asociados con los tratamientos considerados. En el modelo Tipo II la inferencia
es respecto a la población de tratamientos.
En el modelo tipo I los parámetros son generalmente las medias de los

tratamientos y el objetivo es la comparación y estimación de éstos parámetros.
En el modelo tipo II los parámetros de interés son las varianzas y el objetivo
primordial es estimar sus magnitudes absolutas y relativas.
Las hipótesis nulas son de la forma:
H0: 𝜇𝑖 = 𝜇 para todo i; modelo Tipo I

H0: 𝜎𝐴2 = 0 ; modelo Tipo II
Precisión y exactitud
La Precisión se refiere a la variabilidad de los datos muestrales con respecto a su
promedio (VARIANZA). La Exactitud tiene que ver con la cercanía de las mediciones con
el valor teórico esperado (SESGO).
Tiro al blanco hay precisión si todos sus tiros tienen puntos cercanos entre sí y
exactitud si los tiros dan en el blanco o muy cerca de él.
Datos sesgados (error sistemático) son datos inexactos aunque podrían ser precisos. La
estadística practica asume que los datos están libres de errores sistemáticos y que la
variabilidad restante son errores aleatorios que tratan de minimizarse.
Si el sesgo es grande, una medición puede ser de alta precisión pero baja exactitud. Las
repeticiones, las mediciones adicionales y el agrupamiento hábil del material actúan
sobre la precisión del experimento. Si el método de medición permanece sesgado,
estos procedimientos no afectan a ese sesgo.
Un refinamiento en la técnica consiste en minimizar el sesgo y aumentar la precisión.

Una varianza pequeña indica alta precisión
ETAPAS EN EL DISEÑO EXPERIMENTAL
En un DE podemos distinguir las siguientes etapas:
1. Planeación y Realización:
• Delimitar el problema u objeto de estudio.
• Elegir la(s) variable(s) de respuesta.
• Determinar los factores a investigar, de acuerdo a la
supuesta influencia que tienen sobre la respuesta.
• Seleccionar los niveles de cada factor, el número de
repeticiones, así como el DE adecuado a los factores que
se tienen y al objetivo del experimento.
• Planear y organizar el trabajo experimental.
• Realizar el experimento.
2. Análisis
Recurrir a métodos estadísticos inferenciales para ver si las
diferencias o efectos muestrales (experimentales) son lo
suficientemente grandes para que garanticen diferencias
poblacionales (o a nivel proceso).
La técnica estadística central en el análisis de los experimentos es
el llamado Análisis de Varianza ANOVA (acrónimo en inglés).
3. Interpretación
Analizar con detalle lo que ha pasado en el experimento, desde
contrastar las conjeturas iniciales con los resultados del
experimento, hasta observar los nuevos aprendizajes que sobre el
proceso se lograron, verificar supuestos y elegir el tratamiento
ganador u óptimo, siempre con apoyo de las pruebas estadísticas.
4. Control y conclusiones finales

Decidir qué medidas implementar para generalizar el resultado
del estudio y para garantizar que las mejoras se mantengan.
Ver ejercicios de Gutierrez – De la Vara págs. 15-16
Taller 1

Temática:
2. Diseños Completamente Aleatorizados (DCA)
2.1 Clasificación de los DE

2.1 Características del DCA
2.2 Modelo estadístico de efectos fijos
2.3 Modelo estadístico de efectos aleatorios
2.4 Modelo ANOVA
2.5 Contrastes y comparaciones múltiples
2.5 Componentes de la varianza

CLASIFICACIÓN Y SELECCIÓN DE:
Existen muchos tipos de DE que permiten estudiar la gran diversidad de

problemas o situaciones que ocurren en la práctica. Es necesario saber
elegir el más adecuado para una situación dada y, por tanto saber cómo
se clasifican los diseños de acuerdo con su objetivo y su alcance.
Hay 5 aspectos que influyen mucho en la selección de un DE, en el
sentido de que cuando cambian por lo general nos llevan a cambiar de
diseño, son:
1. El objetivo del experimento.
2. El número de factores a estudiar.
3. El número de niveles que se prueban en cada factor.
4. Los efectos que interesa investigar (relación factores-respuesta).
5. El costo del experimento, tiempo y precisión deseada.

CLASIFICACIÓN DE LOS D.E.:
El objetivo del experimento se utiliza como un criterio general de

clasificación de los diseños experimentales, mientras que los otros 4
aspectos son útiles para subclasificarlos. En este sentido, de acuerdo
con su objetivo y sin pretender ser exhaustivos, los diseños se pueden
clasificar como:
1. Diseños para comparar dos o más tratamientos (DCA, BLOQUES).

2. Diseños para estudiar el efecto de varios factores sobre la(s)
respuesta(s) (FACTORIALES)
3. Diseños para determinar el punto óptimo de operación del
proceso.(MSR)
4. Diseños para la optimización de una mezcla.(MEZCLA)
5. Diseños para hacer el producto o proceso insensible a factores no
controlables (ROBUSTOS-TAGUCHI).
CLASIFICACIÓN DE LOS D.E. (G utierrez -De la Vara) :

OTRA CLASIFICACIÓN DE LOS D.E.:
1. Según la cantidad de variables respuestas

• Univariantes
• Multivariantes
2. Según el número de factores en el diseño

• Unifactorial o de una vía
• Multifactorial o de varias Vías
3. Según el número de factores de control o agrupación

• Completamente al aleatorizados
• Con un bloque aleatorizado
• Cuadrado latino
• Cuadrado Grecolatino
4. Según el número de repeticiones por tratamiento

• Balanceado
• No balanceado
CLASIFICACIÓN DE LOS D.E.:
5. Según la combinación de niveles de los factores

• Cruzados
• Anidados
6. Según la forma de selección de los niveles de cada factor

• Modelo I o de efectos fijos
• Modelo II o de efectos aleatorios
• Modelo III, de efectos fijos y aleatorios

DISEÑO COMPLETAMENTE ALEATORIZADO (DCA):
Se tiene un material experimental bajo un DCA con igual número de
réplicas por tratamiento, lo que significa que debe realizar el siguiente
protocolo descrito por Hinkelman y Kempthorne (1994):
Suponga n=tr UE homogéneas; t niveles o tratamientos y r replicas.

Las n UE se dividen en t grupos de r UE.
Los t tratamientos se asignan al azar a los t grupos.
El i-ésimo tratamiento es aplicado a cada una de las r UE en el j-
ésimo grupo (i, j = 1, 2,….,t). Ver figura:
Se tiene un diseño aleatorizado, si y solo si hay una asignación aleatoria

de los tratamientos a las UE.
Ventajas
• Flexibilidad: Cualquier número de tratamientos y de réplicas pueden

ser usadas, siempre y cuando se tengan suficientes UE homogéneas.
• Análisis Estadístico simple: ya sea cuando todos los tratamientos

tengan igual número de réplicas (balanceado), diferente número de
réplicas (desbalanceado) o con pérdida de datos, caso en el cual se
trata como un análisis desbalanceado.
• Máximo número de grados de libertad para el error: Puesto que el

diseño tiene solo 2 fuentes de variación que son los tratamientos y el
error. Los g.l. para este error están dados por la expresión t(r-1).
• Precisión: Teniendo en cuenta que se tienen UE homogéneas.

Desventajas
Se puede obtener baja precisión cuando las unidades experimentales
no sean muy homogéneas y así ser ineficiente.
Usos
Es recomendado cuando es posible que gran parte de las UE no
respondan al tratamiento o puedan perderse durante el experimento.
Es útil en experimentos en los que el número de UE es limitado, ya que

provee el máximo número de grados de libertad del error.

Aleatorización
La realización del protocolo descrito anteriormente requiere del
procedimiento llamado aleatorización, que permite: (i) la validación del
error experimental, (ii) evita sesgos y (iii) garantiza la independencia de
los errores.
La aleatorización puede realizarse por medio de muchos métodos:
1. Función Random en calculadora o Excel

2. Una bolsa con papeletas
3. Tabla de números aleatorios
4. En Statgraphics

Presentación de datos
Al arreglar el material experimental de manera aleatoria utilizando un
procedimiento de aleatorización para el caso de un experimento con 15
UE y 3 tratamientos y 5 réplicas por tratamiento usted puede obtener
por ejemplo el siguiente arreglo
Tratamiento
2 1 3
01 08 15
05 06 02
09 07 04
11 12 10
14 03 13
Decidir cuál tratamiento se aplica primero y a que UEs. Se recomienda

al experimentador asegurar la independencia de los errores
aleatorizando la manera de aplicar los tratamientos a las UE
Previo a la ejecución del experimento se supone que: ha estandarizado
la técnica de medición, ha calibrado el instrumento, el examinador ha
realizado su calibración inter-examinador (para determinar su exactitud
con respecto a un gold estándar) e intra-examinador (tomando varias
veces la misma para evaluar su precisión en la medida).
Las pruebas estadísticas utilizadas para validar la calibración del

examinador depende de la escala en que es medida la variable, si la
variable es categórica, de escala nominal u ordinal, se puede utilizar
entre otros el coeficiente de concordancia Kappa, si la variable es
contínua se utilizar entre otros, el coeficiente de variación, el
coeficiente de correlación concordancia de Lin.
La teoría estadística no arregla datos originados de mediciones erróneas

y la calibración de equipos y examinadores es una de las condiciones
para validar los resultados de su investigación.

Luego de ejecutar el experimento se recomienda organizar los datos
como se presenta en la tabla 1.
Tabla 1 Arreglo de datos para un DCA
Tratamiento
1 2 3
25 14 30
22 16 32
20 18 30
24 13 31
25 15 30
Análisis de datos
Se procede a la depuración de los datos, verificando los resultados
obtenidos y registrados en la digitación para posteriormente iniciar el
análisis estadístico, por medio de la técnica de análisis de varianza
(ANOVA). Msc. Arsenio Hidalgo Troya 44
DISEÑO COMPLETAMENTE ALEATORIZADO (DCA):
Ejemplo 6
Los datos siguientes se refieren al porcentaje de cantidad disuelta de
una resina fenólica en alcohol, en un tiempo de 8 horas, mediante la
aplicación de 3 dispositivos de agitación.
Tratamiento
T1 T2 T3
47 50 62
52 54 65
50 56 74
51 48 50
47 50 62
T1: Dispositivo 1, T2: Dispositivo 2, T3: Dispositivo 3

Modelo estadístico de efectos fijos (Modelo I)
Descripción
Consiste en escribir una ecuación matemática que permite determinar de

manera teórica el valor de la respuesta observada (peso final). Siempre en
un arreglo experimental bajo un DCA con un solo factor, la respuesta
observada se puede modelar como:
Y𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝑒𝑖𝑗
Donde en la situación de estudio se tiene que:

Yij= el peso final obtenido al aplicar el i-ésimo (i=1,2, .., t) tratamiento en la j-
ésima (j=1, 2, …, r) UE
μ = la media global en la variable respuesta sin importar el tratamiento
aplicado
τ i = es el verdadero aporte del i-ésimo tratamiento = μi – μ
ei j = error experimental de la observación Y i j
Tratamiento 1 ……… j …………………r
T1 Y11…….Y1j…… Y1r
T2 Y21…….Y2j…… Y2r
… ……. …….
Ti Yi1…….Yij…… Yir
… …….. ……
Tt Yt1…….Ytj…… Ytr
1
𝑦.. = 𝑦𝑖𝑗 ; 𝑦= 𝑦
𝑛 ..
𝑖 𝑗
1 1
𝑦𝑖. = 𝑗 𝑦𝑖𝑗 ; 𝑦𝑖. = 𝑟 𝑦𝑖. (balanceado) 𝑦𝑖. = 𝑟 𝑦𝑖. (no balanceado)
𝑖

Tabla ANOVA
𝑆𝐶𝑇 = 𝑆𝐶𝐹 + 𝑆𝐶𝐸
(𝑦𝑖𝑗 − 𝑦)2 = (𝑦𝑖. − 𝑦)2 + (𝑦𝑖𝑗 − 𝑦𝑖. )2

𝑖 𝑗 𝑖 𝑗 𝑖 𝑗

TABLA ANOVA:
FUENTE SC GL MC F ratio
Factor SCF t-1 SCF / (t-1) MCF / MCE
Error SCE n-t SCE / (n-t)
Total SCT n-1
𝑆𝐶𝐹 = 𝑟(𝑦𝑖. − 𝑦)2

1
𝑆𝐶𝐸 = (𝑟 − 1)𝑆𝑖. 2
1
𝑡−1 𝐹
𝑆𝐶𝑇 = 𝑆𝐶𝐹 + 𝑆𝐶𝐸; 𝜂2 =
𝑡 − 1 𝐹 + (𝑛 − 𝑡)
𝑛 = 𝑟𝑡 (Diseño balanceado)
Para DCA no balanceado se tendría lo siguiente:
𝑡
𝑆𝐶𝐹 = 𝑟𝑖 (𝑦𝑖. − 𝑦)2

1
𝑆𝐶𝐸 = (𝑟𝑖 − 1)𝑆𝑖. 2

1
𝑛= 𝑟𝑖
1

Formulas alternativas:
(𝑦𝑖𝑗 − 𝑦)2 = (𝑦𝑖. − 𝑦)2 + (𝑦𝑖𝑗 − 𝑦𝑖. )2

𝑖 𝑗 𝑖 𝑗 𝑖 𝑗
1 2
𝐹𝐶 = 𝑦..
𝑛
𝑆𝐶𝑇 = 𝑦𝑖𝑗 2 − 𝐹𝐶
𝑖 𝑗
1 2
𝑆𝐶𝐹 = 𝑟 𝑖 𝑦𝑖. − 𝐹𝐶 (balanceado)
1 2
𝑆𝐶𝐹 = 𝑖 𝑟𝑖 𝑦𝑖. − 𝐹𝐶( no balanceado)

La técnica de análisis de varianza le permite al experimentador
probar la hipótesis global
Las hipótesis nulas son de la forma:
Ho: 𝜇𝑖 = 𝜇 para todo i; modelo Tipo I (k medias)
Parámetros a estimar Modelo I: 𝜎 2 , 𝜇, 𝜇𝑖 , 𝜏𝑖, 𝑒𝑖𝑗 , 𝐼𝐶
Ho: 𝜎𝐴2 = 0 ; modelo Tipo II (composición de varianzas)
Parámetros a estimar modelo II: 𝜇 , 𝜎𝐴2 , 𝜎 2

Estimaciones efectos fijos:
Y𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝑒𝑖𝑗 = 𝜇𝑖 + 𝑒𝑖𝑗 ; 𝜏i = 𝜇i - 𝜇
𝜎2 = MCE ; 𝜇 = 𝑌..; 𝜇i = 𝑌i;
𝜏𝑖 = 𝑌𝑖 − 𝑌 ; 𝑒𝑖𝑗 = 𝑌𝑖𝑗 − 𝑌𝑖 (error)

𝑀𝐶𝐸
Balanceados: 𝐼. 𝐶 (𝜇𝑖 ) = 𝑌𝑖 ± 𝑡𝛼/2,𝑣
𝑟
(𝑣 = n – t)
2𝑀𝐶𝐸
𝐼. 𝐶 𝜇𝑖 − 𝜇𝑗 = (𝑌𝑖 − 𝑌𝑗 ) ± 𝑡𝛼/2,𝑣
𝑟
𝑀𝐶𝐸
No balanceados: 𝐼. 𝐶 (𝜇𝑖 ) = 𝑌𝑖 ± 𝑡𝛼/2,𝑣 𝑟𝑖
1 1
𝐼. 𝐶 𝜇𝑖 − 𝜇𝑗 = (𝑌𝑖 − 𝑌𝑗 ) ± 𝑡𝛼/2,𝑣 𝑀𝐶𝐸( + )
𝑟𝑖 𝑟𝑗
1 𝑡
E (MCE) = 𝜎 2 ; E (MCF) = 𝜎 2 + 𝑖=1 𝑟𝑖 𝜏𝑖2
𝑡−1
Ejercicios 1-2 (EJEMPLO-UNI)

Cómo se presentan los resultados de una investigación experimental?
Presentar la tabla de ANOVA y las tablas de medias con sus errores

estándar. A través de los años se han llegado a establecer dos
costumbres:
• Si una relación F excede al punto de 95 % pero no excede al punto
de 99 por ciento, la relación F (o el cuadrado medio para el efecto
por probar) está marcado con un asterisco (*).
• Si una relación F excede el punto de 99 %, la relación F (o el
cuadrado medio para el efecto por probar) está marcado con doble
asterisco (**).
• Si el espacio es de importancia, únicamente se presenta un ANOVA
abreviado, cuando esto se haga, se acostumbra incluir únicamente
las columnas para fuentes de variación, grados de libertad y
cuadrados medios.
Cuando se utilice la convención del asterisco se deben definir los
símbolos al final de cada tabla de ANOVA mediante el uso de las
siguientes notas:
* significante a α = 0,05; ** significante a α = 0,01
*** significante a α = 0,001
Supuestos teóricos Modelo ANOVA
Se supone que cumple con los supuestos 𝑒𝑖𝑗 ~ 𝑁 ( 0 , 𝜎 2 ) independientes
1. Normalidad
Se puede probar a través de pruebas estadísticas como Kolgomorov-
Smirnov, Shapiro-Wilk, Anderson –Darling, gráfico probabilidad
normal de residuos.
2. Independencia:
La prueba de Durbin-Watson es la más comúnmente utilizada para
este propósito, gráfico x: orden de corrida, y: residuos.
3. Homoscedasticidad (o varianza constante):
Las pruebas de Bartlett, Hartlett, Levene, gráfico x: predicho, y:
residuos.
El incumplimiento de algunos de los supuestos invalidará los resultados

y conclusiones del experimento; dado el caso se debe intentar la
solución a través de transformaciones de las variables, tales como
logarítmica, de potencia o la transformación de Box-Cox.

Violaciones de los supuestos
Modelo de efectos fijos Modelo de efectos aleatorios
1. Es robusto respecto al 1. A diferencia del modelo
supuesto de Normalidad de efectos fijos es
afectado severamente
2. Para la homogeneidad 2. No es robusto a la
de las varianzas , es violación de este
robusto para diseños supuesto y el problema
balanceados, sin
embargo para diseños puede ser más grave si el
no balanceados puede diseño no es balanceado
ser un problema más
grave

Prueba de Rangos Múltiples (Post Hoc)
Cuando t > 2 y los resultados de la prueba ANOVA son estadísticamente
significativos, existe una prueba complementaria a dicha prueba, que es
necesario realizar para establecer entre que grupos de tratamiento existen
diferencias (DMS, Bonferroni, Scheffe, Tukey, Duncan, etc.) llamada Prueba de
Rangos Múltiples o Post Hoc
1 1
(𝑦𝑖 − 𝑦𝑗 ) ± 𝑀 𝐶𝑀𝐸( + )
𝑛𝑖 𝑛𝑗
Donde M es la constante que depende del proceso elegido

Para el método DMS se toma: 𝑀 = 𝑡𝛼,𝑛−𝑡
2
1 1
DMS =𝑡𝛼,𝑛−𝑡 𝐶𝑀𝐸(𝑛 + 𝑛 ) (deducir tamaño de r, pag. 89)
2 𝑖 𝑗
NOTA: El Modelo ANOVA asume que Y (o el residuo) esta distribuido Normalmente y hay Homogeneidad entre
los t niveles o grupos de tratamiento. Prueba alternativa de la ANOVA es KRUSKAL WALLIS, si las muestras
son independientes o no relacionadas, o en caso contrario se utiliza ANOVA de medidas repetidas y la
equivalente es la FRIEDMAN.
Si t=2 se aplica, alternativamente, la prueba t Student cuando se cumple la normalidad y la
Homocesdasticidad de los grupos o MANN WHITNEY cuando no se cumplen estos supuestos, si las
muestras son independientes o no relacionadas, o en caso contrario la prueba t student para muestras
relacionadas o la equivalente de WILCOXON
Prueba de Kruskal Wallis
Si no se cumple alguno de los supuestos de normalidad u
Homocedasticidad, aplicamos la prueba de KW
1 𝑅𝑖2 𝑛 𝑛 + 1 2
𝐻= 2 − ; 𝑛= 𝑟𝑖
𝑆 𝑟𝑖 4
𝑖 𝑖
Donde:
2 1 2 𝑛(𝑛+1)2
𝑆 = 𝑖 𝑗 𝑅𝑖𝑗 −
𝑛−1 4
𝑛(𝑛+1)
Si no hay empates, entonces: 𝑆 2 = 12
; y el estadístico queda:
12 𝑅𝑖2
𝐻= − 3(𝑛 + 1)
𝑛(𝑛 + 1) 𝑟𝑖
𝑖
2
𝐻 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝜒𝛼,𝑡−1 cuando 𝑟𝑖 ≥ 5
MODELO ESTADISTICO DE EFECTOS ALEATORIOS
Llamado también modelo de componentes de la

varianza, se presenta cuando de la población total de
niveles de factor (supuesta infinita o suficientemente
grande como para considerarla infinita), los niveles del
factor que se utilizan en el experimento se han elegido
aleatoriamente.
La formulación es equivalente, al modelo de efectos fijos

y se utiliza la tabla ANOVA para establecer si hay
diferencias significativas entre los tratamientos.

Modelo II Efectos aleatorios
Parámetros ( 𝜇, 𝜎𝐴2 , 𝜎 2 )
𝑌𝑖𝑗 = 𝜇 + A𝑖 + 𝑒𝑖𝑗 i = 1, 2,…, t; j = 1,…, 𝑟𝑖

A𝑖 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎
𝑌𝑖𝑗 : Respuesta; 𝜇: media global
A𝑖 : factor v.a.~ 𝑁 ( 0 , 𝜎A2 ) 𝜎A2 varianza de los v/rs. medios de
la Y para todos los niveles de 𝐴
𝑒𝑖𝑗 : error ~ 𝑁 ( 0 , 𝜎 2 )
A𝑖𝑗 y 𝑒𝑖𝑗 son independientes

La tabla ANOVA es similar a la efectos fijos se diferencia en las
medias cuadráticas esperadas:
𝐸(𝑀𝐶𝐸) = 𝜎 2 ,
𝐸 𝑀𝐶𝐹 = 𝜎 2 + 𝑛𝑜 𝜎A2 ,
MCF estima una c.l. de dos varianzas, la varianza del error

(𝜎 2 ) y la varianza entre las medias de todos los grupos
posibles del factor aleatorio (𝜎A2 )
Hipótesis:
Ho: 𝜎𝐴2 = 0 varianza entre todas las medias de todos los
niveles de A es cero (entre grupos)
H1: 𝜎𝐴2 > 0
Parámetros a estimar modelo II 𝜇 , 𝜎A2 , 𝜎 2
𝜇= 𝑌
𝐸(𝑀𝐶𝐸) = 𝜎 2 , entonces 𝜎 2 = 𝑀𝐶𝐸
𝐸 𝑀𝐶𝐹 = 𝜎 2 + 𝑛𝑜 𝜎A2 , entonces 𝑀𝐶𝐹 = 𝜎 2 + 𝑛𝑜 𝜎A2
𝑀𝐶𝐹 − 𝑀𝐶𝐸 1 Σ𝑟𝑖 2

𝜎A2 = ; 𝑛𝑜 = (𝑛− ) ; 𝑛= 𝑡
1 𝑟𝑖
𝑛𝑜 𝑡−1 𝑛
𝜎y2 = 𝜎 2 + 𝜎A2
2
𝜎A
𝑟1 = (Coeficiente de correlación intragrupos)
𝜎y2
Ejemplo 3 (EJEMPLOS-UNI) Msc. Arsenio Hidalgo Troya 62

Temática:
3. Diseño en Bloques al Azar (DBA)

3.1 Modelo DBCA
3.2 Modelo de Medidas Repetidas
3.3 Diseños de Cuadrado Latino
3.4 Diseños de Cuadrado Grecolatino
3.5 Tamaño de la Muestra modelos I y II

DISEÑOS DE BLOQUES AL AZAR
En los modelos anteriores se ha supuesto que las UE se asignen a
los niveles de los factores o tratamientos (o viceversa),
complementar al azar en la realización del experimento, dando
lugar así a DCA.
Lo idóneo es que existe un gran homogeneidad entre las unidades

experimentales (dos unidades experimentales sometidas a
distintos tratamientos presentan leves diferencias), pero cuando
las unidades experimentales no son homogéneas, se recomienda
utilizar el diseño de bloque al azar.
En este caso, los tratamientos se aplican a grupos homogéneos de

unidades experimentales (ya no hay una asignación aleatoria de las
unidades experimentales a los tratamientos, o viceversa).
MODELO EN BLOQUES ALEATORIZADOS (DBCA)
Un bloque homogéneo equivale a un grupo experimental
Los bloques equivalen a niveles de un factor, aunque el bloque no se
considera un factor a estudiar, es una forma de controlar la varianza
intra-grupo (error experimental).
La asignación de unidades experimental acada bloque se realiza de forma
aleatoria.
El DBCA es completo si todos los bloques tienen representación en todos
los tratamientos, en caso contrario es de bloques incompleto.
El DBCA completo corresponde a un modelo ANOVA de 2 factores fijos
sin interacciones en el que uno de los factores corresponde a los bloques
y el otro al factor de tratamiento.
El modelo con a tratamientos y b bloques puede formularse así:
Y𝑖𝑗 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + 𝑒𝑖𝑗 (i= 1,…..,a; j=1,…., b)
Ejemplo 4-5 (EJEMPLOS-UNI)

MODELO DE MEDIDAS REPETIDAS
Un DE de medidas repetidas (o diseño intrasujeto) es un caso
particular de diseño de bloques al azar. Consiste en que cada
bloque está formado por un solo individuo al que se le aplican
todos los tratamientos.
Puede presentar el efecto de superposición (carry-over effect), se
produce cuando se administra un tratamiento antes de que haya
terminado el efecto de un tratamiento anterior. Puede controlarse
aumentando el tiempo entre los tratamientos.
En este diseño puede darse también el efecto de aprendizaje, que
se produce cuando la simple repetición mejora la respuesta
independiente de ningún tratamiento.
También puede presentar el efecto latencia, que se produce
cuando un tratamiento activa el efecto de un tratamiento anterior
que permanecía en estado de latencia.

DISEÑO EN CUADRADO LATINO
El diseño en cuadrado latino(DCL) tiene en cuanta 3 factores con la
particularidad de que todos tienen el mismo número de niveles.
Dos de los factores operan como bloques con el fin de reducir los errores
experimentales. Su objetivo es determinar si el tercer factor (factor de
tratamiento) tiene o no una influencia significativa sobre la variable
dependiente.
En un DCL, hay una sola observación por casilla, por lo que en ningún
caso es posible tratar efectos de interacción. En el diseño de DCL existen
2 factores de bloque (filas y columnas), a diferencias del DBCA en el que
solo hay 1 factor de bloque.
Otra característica diferenciadora en DCL es que los 2 factores de bloque,
así como el factor de tratamiento tienen el mismo número de grupos o
niveles. Este modelo se puede expresar como:
Y𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + 𝜏𝑘 + 𝑒𝑖𝑗𝑘 (i, j, k= 1,…..,t)
Donde 𝛼 y 𝛽 representan los efectos fila y columna y 𝜏 representa el

efecto de factor de tratamiento.
Ejemplo 6 (EJEMPLOS-UNI)
DISEÑOS EN CUADRADO GRECOLATINO
El diseño en cuadrado grecolatino (DCG), tiene en cuenta 4 factores con
la particularidad de que todos tienen el mismo número de niveles, y 3 de
los factores operan como bloques con el fin de reducir los errores y
experimentales.
Su objetivo es determinar si en cuarto factor (factor de tratamiento)
tiene o no una influencia significativa sobre la variable respuesta. En un
DCG hay una sola observación por casilla, en ningún caso es posible tratar
efectos de interacción. En DCG existen 3 factores de bloque (fila,
columnas y letras griegas colocadas sobre las casillas del cuadrado), a
diferencia del DBCA, en el que solo hay un factor de bloque
Otra característica diferenciadora del DCG es que los 3 factores de
bloque, así como factor de tratamiento, tienen el mismo número de
grupos o niveles. Este modelo se puede expresar como:
Y𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + 𝜏𝑘 + 𝜔𝑙 + 𝑒𝑖𝑗𝑘 (i, j, k, l= 1,…..,t)
Donde 𝛼, 𝛽 y 𝜏 representan los efectos fila, columna y casilla y 𝜔

representa el efecto de factor de tratamiento.
DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA (Modelo I)
Prueba de hipótesis:
En los diferentes tipos de diseños se plantearan hipótesis o
conjeturas acerca de los factores de estudios. Estas reciben
los nombres de Hipótesis Nula e Hipótesis alterna.
ERROR TIPO I: Se comete cuando se rechaza la Hipótesis nula
siendo verdadera . La probabilidad de cometer este error es
α (nivel de significancia)
ERROR TIPO II: Se comete si no se rechaza la hipótesis nula
siendo esta falsa. La probabilidad de cometer el error tipo II
es β.
Se definen así para una prueba:

Significancia =1- α= P(Rechazar Ho / Ho es verdadera)
Potencia =1- β= P(Rechazar Ho / Ho es falsa)
CURVAS CARACTERÍSTICAS DE OPERACIÓN
(Receiver Operating Characteristic - ROC)
Es una gráfica de la probabilidad del error tipo II de una prueba

estadística para un tamaño de muestra particular contra un
parámetro que refleja la medida en que la hipótesis nula es falsa
Las curvas ROC se usan para guía en la selección del número de
replicas para que el diseño sea sensible a diferencias potenciales
importantes en los tratamientos.
Potencia=Sensibilidad
Significancia = 1- Especificidad

Se requiere conocer 𝑎, 𝜏𝑖 , 𝜎 2 , determinar Ф2, además fijar αy β,
haciendo 𝜐1 = 𝑎 − 1 ; 𝜐2 = 𝑛(𝑎 − 1) y obtener por tanteo en las
tablas ROC el valor mínimo de n que supere el valor fijado de 1- β
Ejemplo 8
Suponga que en un determinado experimento se está interesado en
rechazar la hipótesis nula con una probabilidad de al menos 0,80 si
las medias de los tratamientos estimados en una prueba piloto
fueron:
𝜇1 =8 𝜇2 =11 𝜇3 =15 𝜇4 =19 𝜇5 =22
Además se obtuvo una varianza estimada 𝜎 2 =CME=27.
Debido a que se tiene los valores de las medias de los tratamientos

la media global será el promedio de estos.
𝜇=15

Se dan valores de (n) desde 4 hasta 6 , Calculamos el valor de φ
y con los grados de libertad del error se encuentra el valor de
β, en las curvas, con α=0,01 (tabla pag. 648 Montgomery) .
n φ² φ a(n-1) β Potencia =1- β

4 3,85 1,96 15 0.35 0.65
5 4,81 2,19 20 0.30 0.70
6 5,78 2,40 25 0.18 0.82
Se necesitan entonces 6 repeticiones para obtener una

potencia de prueba igual a 0,82

Curva de operación característica para un modelo de efectos
fijos

Un enfoque alternativo es seleccionar un tamaño de muestra tal que el
investigador considere una diferencia mínima entre las medias poblaciones
más distantes desde un punto de vista práctico igual a Δ de tal manera que
𝑛Δ2
𝜏𝑖2 ≥ 𝛥 / 2 , entonces: Φ2 =
2𝑎𝜎2
Tomando 𝛥 = 16, se tienen casi los mismos resultados anteriores
n φ² φ a(n-1) β Potencia =1- β

4 3,8 1,9 15 0.40 0.65
5 4,7 2,2 20 0.23 0.77
6 5,7 2,4 25 0.10 0.90
Se necesitan entonces 6 repeticiones para obtener una

potencia de prueba igual a 0,82

Calculadora de Tamaño muestral GRANMO
http://www.imim.cat/ofertadeserveis/software-public/granmo/

DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA (Modelo II)
Al igual que en el modelo I se utilizan las curvas ROC para
determinar el número de réplicas, utilizando como parámetro de
centralidad:
2
𝑛𝜎 𝐴
𝜆2 = 1 + 2
𝜎
Se requiere conocer 𝜎𝐴2 , 𝜎 2 , determinar 𝜆 2, además fijar α y β,

haciendo 𝜐1 = 𝑎 − 1 ; 𝜐2 = 𝑛(𝑎 − 1) y obtener por tanteo en las tablas
ROC el valor mínimo de n que supere el valor fijado de 1-β (pag. 529
Montgomery)

DE Cap 1-3 PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

DE Cap 1-3 PDF

Uploaded by

Copyright:

Available Formats

Diseño de Experimentos Químicos

Arsenio Hidalgo Troya - Docente

2. Diseños Completamente Aleatorizados (DCA)

Msc. Arsenio Hidalgo Troya 2

3. Diseño en Bloques al Azar (DBA)

Msc. Arsenio Hidalgo Troya 3

El desarrollo del análisis de varianza (ANOVA) y de los métodos de

Quién en su trabajo en la Estación de Experimentación Agrícola de

El trabajo de Fisher fue continuado por F. Yates (1902 –1978). Yates

Msc. Arsenio Hidalgo Troya 4

En Estados Unidos W. G. Cochran (1909 – 1980) fundamenta

G. W. Snedecor (1881 – 1974) hace aportes muy

Msc. Arsenio Hidalgo Troya 5

Actualmente el DE se emplea en casi todas las áreas del

Msc. Arsenio Hidalgo Troya 6

Qué es diseñar un experimento?

Msc. Arsenio Hidalgo Troya 7

Es un estudio de investigación en el que se manipulan

Por ejemplo, en un proceso químico se pueden probar diferentes

Los objetivos de un DE son los siguientes:

1. Verificar si la diferencia entre los tratamientos es una diferencia

2. Establecer tendencias entre las variables y predicciones de

El DE es el procedimiento que se sigue para asignar los tratamientos a

Msc. Arsenio Hidalgo Troya 9

En un método aleatorio (asignación al azar), se asigna el tratamiento a

Ejemplo 1 . Efecto de la cloración sobre la resistencia a la abrasión de

Msc. Arsenio Hidalgo Troya 10

Msc. Arsenio Hidalgo Troya 11

Pieza, unidad o muestra que se utiliza para generar un valor que

Material al cual se le aplica un tratamiento.

Ejemplo 2. Del ejemplo 1, la pieza de caucho.

Msc. Arsenio Hidalgo Troya 12

Ejemplo 3: Cuando se aplica un tipo de alimento (tratamiento) a los peces en

En algunos casos las UE y las UO son iguales pero en otros no.

Msc. Arsenio Hidalgo Troya 13

Universo ----> UEs

Msc. Arsenio Hidalgo Troya 14

Un factor NO controlable puede llegar a ser controlable en

Covariables, factores de clasificación

Ejemplo 5: la temperatura ambiente, la humedad, el

Msc. Arsenio Hidalgo Troya 17

Diferentes valores que se asignan (fijan o seleccionan) a cada

Una combinación de niveles de todos los factores estudiados se

Msc. Arsenio Hidalgo Troya 18

Msc. Arsenio Hidalgo Troya 19

Msc. Arsenio Hidalgo Troya 20

Msc. Arsenio Hidalgo Troya 21

Consiste en hacer corridas experimentales en orden aleatorio

Aumenta la posibilidad de que el supuesto de independencia de los

Garantiza que la variabilidad ocasionada por los factores no

A cada unidad experimental se asigna de manera aleatoria el

Además, el orden en que cada UE será sometida al respectivo

Si no se cumple este principio no será posible estimar el error

A mayor cantidad de réplicas se obtendrán estimaciones más

Excepcionalmente existen algunos diseños que permiten

Se utiliza para mejorar la precisión de las comparaciones que se

Generalmente se utiliza para aislar la variabilidad transmitida por

Disminuye el valor estimado del error del modelo, haciendo más

Msc. Arsenio Hidalgo Troya 24

Msc. Arsenio Hidalgo Troya 25

De acuerdo a la forma como se consideren los tratamientos existen los

• Modelo Tipo I o de Efectos Fijos: En el cual los tratamientos son

• Modelo Tipo II o Aleatorio: En el cual los tratamientos son una