You are on page 1of 77

Diseño de Experimentos Químicos

Capítulos 1-3

Programa de Química
Departamento de Matemáticas y Estadística

Arsenio Hidalgo Troya - Docente


Temática:
1. Introducción al Diseño experimental (DE)
1.1 Introducción
1.2 Conceptos básicos
1.3 Principios básicos del DE
1.4 Etapas en el Diseño Experimental

2. Diseños Completamente Aleatorizados (DCA)


2.1 Características
2.2 Modelo estadístico de efectos fijos
2.3 Modelo estadístico de efectos aleatorios
2.4 Modelo ANOVA
2.5 Contrastes y comparaciones múltiples
2.5 Componentes de la varianza

Msc. Arsenio Hidalgo Troya 2


Temática:

3. Diseño en Bloques al Azar (DBA)


3.1 Características
3.2 Modelo estadístico
3.3 Diseño Bloque Completo al Azar
3.4 Diseños de Cuadrado Latino y Grecolatino

Msc. Arsenio Hidalgo Troya 3


INTRODUCCIÓN:

Orígenes de la Metodología

El desarrollo del análisis de varianza (ANOVA) y de los métodos de


diseño de experimentos (DE) se debe a Ronald A. Fisher (1880 –
1962).

Quién en su trabajo en la Estación de Experimentación Agrícola de


Rothamsted, Inglaterra desarrolló los principios de la
experimentación científica que se plasmaron en su influyente
libro Design of Experiments.

El trabajo de Fisher fue continuado por F. Yates (1902 –1978). Yates


estudió los diseños factoriales y desarrolló nuevos diseños.

Msc. Arsenio Hidalgo Troya 4


D. J. Finney que estudió las fracciones factoriales y en sus
estudios de ensayos biológicos introduce modelos de
regresión con variable de respuesta cualitativa, como los
modelos probit y logístico.

En Estados Unidos W. G. Cochran (1909 – 1980) fundamenta


matemáticamente el análisis de varianza y escribe con G. M.
Cox (1900 – 1978) un texto básico sobre diseños
experimentales.

G. W. Snedecor (1881 – 1974) hace aportes muy


importantes en cuanto al contraste de hipótesis en estos
modelos.

Msc. Arsenio Hidalgo Troya 5


La aplicación de los diseños experimentales en la industria
es debida en gran parte al trabajo de G. Box, quien
desarrolla la metodología de superficies de respuesta
(MSR); teniendo como base los trabajos presentados por
Deming y Taguchi.

Actualmente el DE se emplea en casi todas las áreas del


conocimiento, química, biología, ingeniería, ciencias
agrícolas, ciencias de la salud y del comportamiento
humano, educación, etc.

Msc. Arsenio Hidalgo Troya 6


CONCEPTOS BÁSICOS

Qué es un experimento?
Una prueba o serie de pruebas donde se introducen cambios
deliberados en las variables de entrada que forman un sistema o
proceso, con el objetivo de medir el efecto del cambio sobre una
o mas variables del producto o salida de dicho proceso.

Qué es diseñar un experimento?


Planear y realizar un conjunto de pruebas (tratamientos) con el
objetivo de generar datos que, al ser analizados
estadísticamente, proporcionen evidencias objetivas para
obtener conclusiones válidas sobre el sistema o proceso.

Msc. Arsenio Hidalgo Troya 7


DISEÑO EXPERIMENTAL (DE):

Es un estudio de investigación en el que se manipulan


deliberadamente una o más variables independientes (supuestas
causas) para analizar las consecuencias que la manipulación
tiene sobre una o más variables dependientes (supuestos
efectos), dentro de condiciones controladas por el investigador.

Por ejemplo, en un proceso químico se pueden probar diferentes


temperaturas y presiones, y medir el cambio observado en el
rendimiento del proceso. Al analizar los efectos (datos) se
obtiene conocimiento acerca del proceso químico, lo cual
permite mejorar su desempeño.
Msc. Arsenio Hidalgo Troya 8
DISEÑO EXPERIMENTAL (DE):

Los objetivos de un DE son los siguientes:

1. Verificar si la diferencia entre los tratamientos es una diferencia


verdadera (significación estadística) o se debe a un proceso casual o
por azar,

2. Establecer tendencias entre las variables y predicciones de


resultados a través de modelos estadísticos.

El DE es el procedimiento que se sigue para asignar los tratamientos a


las denominadas unidades experimentales (UE).

Msc. Arsenio Hidalgo Troya 9


DISEÑO EXPERIMENTAL (DE):

En un método aleatorio (asignación al azar), se asigna el tratamiento a


cada unidad experimental mediante un sorteo o por medio de una
tabla de números aleatorios

Ejemplo 1 . Efecto de la cloración sobre la resistencia a la abrasión de


un tipo particular de caucho. Se toman 10 piezas de caucho y se clora
la mitad al azar y otra mitad no se clora.

Msc. Arsenio Hidalgo Troya 10


DISEÑO EXPERIMENTAL (DE):

Msc. Arsenio Hidalgo Troya 11


UNIDAD EXPERIMENTAL (UE)

Pieza, unidad o muestra que se utiliza para generar un valor que


sea representativo del resultado de la prueba.

Material al cual se le aplica un tratamiento.

Ejemplo 2. Del ejemplo 1, la pieza de caucho.

Para el Químico la unidad puede ser una muestra de agua; para el Ingeniero Agrícola
la unidad experimental puede ser una matera, una parcela, una finca; para el
Veterinario un animal, 10 pollos de corral, día de la semana, etc.; para el Médico
puede ser un paciente, un consultorio, un hospital, en otros casos puede ser el hígado
o parte de la piel. Igualmente la UE puede ser un sitio en un río, una profundidad en
un lago, un cuadrante de un bosque , un árbol, una rama, una flor o fruto, etc.

Msc. Arsenio Hidalgo Troya 12


UNIDAD DE MUESTREO O UNIDAD OBSERVACIONAL (UO)
Es la fracción de la unidad experimental sobre la cual se mide el efecto
del tratamiento. El muestreo de observaciones no implica replicación.

Ejemplo 3: Cuando se aplica un tipo de alimento (tratamiento) a los peces en


una piscina, si en una misma piscina hay 100 peces que se les alimenta con la
misma ración, la UE es la piscina con los 100 peces. Se necesitan otras
piscinas de 100 peces antes de poder medir la variación entre unidades
tratadas en forma semejante. Sin embargo, las observaciones de aumento de
peso se hacen a cada pez (UO).

En algunos casos las UE y las UO son iguales pero en otros no.

Msc. Arsenio Hidalgo Troya 13


Dato
Es el resultado de las observaciones o mediciones hechas a cada
unidad experimental y un conjunto de ellos, conforman la base de
datos para hacer los cálculos y análisis estadísticos.

Población
Es el conjunto de todas las UEs que podrían recibir uno de los
tratamientos. El objeto de la investigación debe establecerse en
términos de esta población. Para el estadístico la población es el
conjunto de todos los datos que podrían obtenerse de todas las
UEs.

Universo ----> UEs


Población ----> Datos

Msc. Arsenio Hidalgo Troya 14


VARIABLE RESPUESTA (Dependiente)
Característica de interés para el investigador
Cada unidad experimental entrega un valor de la variable
respuesta. Se logrará tantos datos de la variable respuesta como
tantas unidades experimentales se hayan incluido
A través de esta(s) variable(s) se conoce el efecto o los resultados
de cada prueba experimental
FACTORES CONTROLABLES
Variables de entrada qué el investigador fija en un punto o nivel
de operación. Variables experimentales independientes
cualitativas o cuantitativas que influyen sobre la variable
respuesta y son el principal objetivo de la investigación
Ejemplo 4: Si un proceso trabaja con agua y existe algún
mecanismo que permita fijar la temperatura del agua en 60, 65 ó
70 grados Celsius, entonces decimos que la Temperatura es un
factor controlable. Msc. Arsenio Hidalgo Troya 15
FACTORES NO CONTROLABLES (Factores de ruido)
Generalmente son variables que pueden afectar nuestra
variable de respuesta y que NO se pueden controlar
durante el experimento o la operación normal del proceso.

Un factor NO controlable puede llegar a ser controlable en


la medida en que se desarrolle el mecanismos de control.

Covariables, factores de clasificación

Ejemplo 5: la temperatura ambiente, la humedad, el


estado de ánimo de los operadores, su edad, el pH del
agua, la cantidad de lluvia, etc. son factores que suelen ser
NO controlables.
Msc. Arsenio Hidalgo Troya 16
DISEÑO EXPERIMENTAL (DE):

Msc. Arsenio Hidalgo Troya 17


NIVELES Y TRATAMIENTOS

Diferentes valores que se asignan (fijan o seleccionan) a cada


factor estudiado en un DE.

Una combinación de niveles de todos los factores estudiados se


denomina tratamiento o punto de diseño.

Msc. Arsenio Hidalgo Troya 18


ERROR EXPERIMENTAL
Componente del error aleatorio que refleja los errores del
experimentador en la planeación y ejecución del experimento.

ERROR ALEATORIO
Variabilidad observada que no se puede explicar por los factores
estudiados; resulta del pequeño efecto de los factores no
estudiados y/o no conocidos y del error experimental.

Msc. Arsenio Hidalgo Troya 19


INTERACCIÓN
Se presenta cuando el efecto de un factor depende del nivel
en que se encuentra otro(s) factor(es).

MATRIZ DE DISEÑO
Es el arreglo formado por los tratamientos que serán
corridos, incluyendo las repeticiones.

Msc. Arsenio Hidalgo Troya 20


PRINCIPIOS BÁSICOS DEL DE

• Aleatorización
• Replicación
• Bloqueo

Msc. Arsenio Hidalgo Troya 21


PRINCIPIOS BÁSICOS DEL DE
Aleatorización (Random):

Consiste en hacer corridas experimentales en orden aleatorio

Aumenta la posibilidad de que el supuesto de independencia de los


errores se cumpla

Garantiza que la variabilidad ocasionada por los factores no


estudiados y/o no controlados se reparta de manera homogénea en
todos los tratamientos, sin favorecer o desfavorecer al alguno de
ellos.

A cada unidad experimental se asigna de manera aleatoria el


correspondiente tratamiento;

Además, el orden en que cada UE será sometida al respectivo


tratamiento también se asigna de manera aleatoria.
Msc. Arsenio Hidalgo Troya 22
Replicación:
Cada tratamiento se asigna a dos o más UEs.

Si no se cumple este principio no será posible estimar el error


del modelo y en consecuencia tampoco se pueden probar las
respectivas hipótesis de los efectos investigados.

A mayor cantidad de réplicas se obtendrán estimaciones más


precisas de los efectos estudiados.

Excepcionalmente existen algunos diseños que permiten


utilizar sólo una réplica en cada punto experimental sin perder
validez estadística en los análisis.
Msc. Arsenio Hidalgo Troya 23
Bloqueo:
Permite tomar en cuenta en forma adecuada todos los factores
que pueden afectar la respuesta observada.

Se utiliza para mejorar la precisión de las comparaciones que se


realizan entre los factores de interés.

Generalmente se utiliza para aislar la variabilidad transmitida por


factores perturbadores, es decir, factores que se piensa si influyen
sobre la variable de respuesta pero no son de interés directo para
el investigador.

Disminuye el valor estimado del error del modelo, haciendo más


probable la detección de los efectos que los factores estudiados
ejercen sobre la variable de respuesta.

Msc. Arsenio Hidalgo Troya 24


DISEÑO BALANCEADO
Cuando se utiliza el mismo número de replicas en cada
tratamiento.

DISEÑO NO BALANCEADO
Cuando el número de replicas en cada tratamiento no es el
mismo.

Msc. Arsenio Hidalgo Troya 25


MODELOS DE EFECTOS FIJOS Y MODELOS DE EFECTOS
ALEATORIOS

De acuerdo a la forma como se consideren los tratamientos existen los


siguientes tipos de modelos:

• Modelo Tipo I o de Efectos Fijos: En el cual los tratamientos son


seleccionados por el investigador porque tienen un interés
particular.

• Modelo Tipo II o Aleatorio: En el cual los tratamientos son una


muestra aleatoria de su población.

• Modelo Tipo III o Mixto: Se obtiene cuando en el experimento hay


factores con niveles fijos y factores con niveles aleatorios.

Msc. Arsenio Hidalgo Troya 26


Diferencias entre los tipos de modelo I y II

Para el modelo tipo I, una repetición del experimento se realiza sobre el mismo
conjunto de tratamientos; en tanto que para el modelo tipo II una repetición
producirá un nuevo conjunto de tratamientos.

En el modelo tipo I la inferencia se hace estrictamente sobre los parámetros


asociados con los tratamientos considerados. En el modelo Tipo II la inferencia
es respecto a la población de tratamientos.

En el modelo tipo I los parámetros son generalmente las medias de los


tratamientos y el objetivo es la comparación y estimación de éstos parámetros.
En el modelo tipo II los parámetros de interés son las varianzas y el objetivo
primordial es estimar sus magnitudes absolutas y relativas.

Las hipótesis nulas son de la forma:

H0: 𝜇𝑖 = 𝜇 para todo i; modelo Tipo I


H0: 𝜎𝐴2 = 0 ; modelo Tipo II
Msc. Arsenio Hidalgo Troya 27
Precisión y exactitud
La Precisión se refiere a la variabilidad de los datos muestrales con respecto a su
promedio (VARIANZA). La Exactitud tiene que ver con la cercanía de las mediciones con
el valor teórico esperado (SESGO).

Tiro al blanco hay precisión si todos sus tiros tienen puntos cercanos entre sí y
exactitud si los tiros dan en el blanco o muy cerca de él.

Datos sesgados (error sistemático) son datos inexactos aunque podrían ser precisos. La
estadística practica asume que los datos están libres de errores sistemáticos y que la
variabilidad restante son errores aleatorios que tratan de minimizarse.

Si el sesgo es grande, una medición puede ser de alta precisión pero baja exactitud. Las
repeticiones, las mediciones adicionales y el agrupamiento hábil del material actúan
sobre la precisión del experimento. Si el método de medición permanece sesgado,
estos procedimientos no afectan a ese sesgo.

Un refinamiento en la técnica consiste en minimizar el sesgo y aumentar la precisión.


Una varianza pequeña indica alta precisión
Msc. Arsenio Hidalgo Troya 28
ETAPAS EN EL DISEÑO EXPERIMENTAL

En un DE podemos distinguir las siguientes etapas:

1. Planeación y Realización:
• Delimitar el problema u objeto de estudio.
• Elegir la(s) variable(s) de respuesta.
• Determinar los factores a investigar, de acuerdo a la
supuesta influencia que tienen sobre la respuesta.
• Seleccionar los niveles de cada factor, el número de
repeticiones, así como el DE adecuado a los factores que
se tienen y al objetivo del experimento.
• Planear y organizar el trabajo experimental.
• Realizar el experimento.
Msc. Arsenio Hidalgo Troya 29
2. Análisis
Recurrir a métodos estadísticos inferenciales para ver si las
diferencias o efectos muestrales (experimentales) son lo
suficientemente grandes para que garanticen diferencias
poblacionales (o a nivel proceso).
La técnica estadística central en el análisis de los experimentos es
el llamado Análisis de Varianza ANOVA (acrónimo en inglés).

3. Interpretación
Analizar con detalle lo que ha pasado en el experimento, desde
contrastar las conjeturas iniciales con los resultados del
experimento, hasta observar los nuevos aprendizajes que sobre el
proceso se lograron, verificar supuestos y elegir el tratamiento
ganador u óptimo, siempre con apoyo de las pruebas estadísticas.

4. Control y conclusiones finales


Decidir qué medidas implementar para generalizar el resultado
del estudio y para garantizar que las mejoras se mantengan.
Msc. Arsenio Hidalgo Troya 30
Ver ejercicios de Gutierrez – De la Vara págs. 15-16
Taller 1

Msc. Arsenio Hidalgo Troya 31


Temática:

2. Diseños Completamente Aleatorizados (DCA)

2.1 Clasificación de los DE


2.1 Características del DCA
2.2 Modelo estadístico de efectos fijos
2.3 Modelo estadístico de efectos aleatorios
2.4 Modelo ANOVA
2.5 Contrastes y comparaciones múltiples
2.5 Componentes de la varianza

Msc. Arsenio Hidalgo Troya 32


CLASIFICACIÓN Y SELECCIÓN DE:

Existen muchos tipos de DE que permiten estudiar la gran diversidad de


problemas o situaciones que ocurren en la práctica. Es necesario saber
elegir el más adecuado para una situación dada y, por tanto saber cómo
se clasifican los diseños de acuerdo con su objetivo y su alcance.
Hay 5 aspectos que influyen mucho en la selección de un DE, en el
sentido de que cuando cambian por lo general nos llevan a cambiar de
diseño, son:
1. El objetivo del experimento.
2. El número de factores a estudiar.
3. El número de niveles que se prueban en cada factor.
4. Los efectos que interesa investigar (relación factores-respuesta).
5. El costo del experimento, tiempo y precisión deseada.

Msc. Arsenio Hidalgo Troya 33


CLASIFICACIÓN DE LOS D.E.:

El objetivo del experimento se utiliza como un criterio general de


clasificación de los diseños experimentales, mientras que los otros 4
aspectos son útiles para subclasificarlos. En este sentido, de acuerdo
con su objetivo y sin pretender ser exhaustivos, los diseños se pueden
clasificar como:

1. Diseños para comparar dos o más tratamientos (DCA, BLOQUES).


2. Diseños para estudiar el efecto de varios factores sobre la(s)
respuesta(s) (FACTORIALES)
3. Diseños para determinar el punto óptimo de operación del
proceso.(MSR)
4. Diseños para la optimización de una mezcla.(MEZCLA)
5. Diseños para hacer el producto o proceso insensible a factores no
controlables (ROBUSTOS-TAGUCHI).
Msc. Arsenio Hidalgo Troya 34
CLASIFICACIÓN DE LOS D.E. (G utierrez -De la Vara) :

Msc. Arsenio Hidalgo Troya 35


OTRA CLASIFICACIÓN DE LOS D.E.:

1. Según la cantidad de variables respuestas


• Univariantes
• Multivariantes

2. Según el número de factores en el diseño


• Unifactorial o de una vía
• Multifactorial o de varias Vías

3. Según el número de factores de control o agrupación


• Completamente al aleatorizados
• Con un bloque aleatorizado
• Cuadrado latino
• Cuadrado Grecolatino

4. Según el número de repeticiones por tratamiento


• Balanceado
• No balanceado
Msc. Arsenio Hidalgo Troya 36
CLASIFICACIÓN DE LOS D.E.:

5. Según la combinación de niveles de los factores


• Cruzados
• Anidados

6. Según la forma de selección de los niveles de cada factor


• Modelo I o de efectos fijos
• Modelo II o de efectos aleatorios
• Modelo III, de efectos fijos y aleatorios

Msc. Arsenio Hidalgo Troya 37


DISEÑO COMPLETAMENTE ALEATORIZADO (DCA):
Se tiene un material experimental bajo un DCA con igual número de
réplicas por tratamiento, lo que significa que debe realizar el siguiente
protocolo descrito por Hinkelman y Kempthorne (1994):

Suponga n=tr UE homogéneas; t niveles o tratamientos y r replicas.


Las n UE se dividen en t grupos de r UE.
Los t tratamientos se asignan al azar a los t grupos.
El i-ésimo tratamiento es aplicado a cada una de las r UE en el j-
ésimo grupo (i, j = 1, 2,….,t). Ver figura:

Se tiene un diseño aleatorizado, si y solo si hay una asignación aleatoria


de los tratamientos a las UE.
Msc. Arsenio Hidalgo Troya 38
Ventajas

• Flexibilidad: Cualquier número de tratamientos y de réplicas pueden


ser usadas, siempre y cuando se tengan suficientes UE homogéneas.

• Análisis Estadístico simple: ya sea cuando todos los tratamientos


tengan igual número de réplicas (balanceado), diferente número de
réplicas (desbalanceado) o con pérdida de datos, caso en el cual se
trata como un análisis desbalanceado.

• Máximo número de grados de libertad para el error: Puesto que el


diseño tiene solo 2 fuentes de variación que son los tratamientos y el
error. Los g.l. para este error están dados por la expresión t(r-1).

• Precisión: Teniendo en cuenta que se tienen UE homogéneas.


Msc. Arsenio Hidalgo Troya 39
Desventajas
Se puede obtener baja precisión cuando las unidades experimentales
no sean muy homogéneas y así ser ineficiente.

Usos
Es recomendado cuando es posible que gran parte de las UE no
respondan al tratamiento o puedan perderse durante el experimento.

Es útil en experimentos en los que el número de UE es limitado, ya que


provee el máximo número de grados de libertad del error.

Msc. Arsenio Hidalgo Troya 40


Aleatorización
La realización del protocolo descrito anteriormente requiere del
procedimiento llamado aleatorización, que permite: (i) la validación del
error experimental, (ii) evita sesgos y (iii) garantiza la independencia de
los errores.

La aleatorización puede realizarse por medio de muchos métodos:

1. Función Random en calculadora o Excel


2. Una bolsa con papeletas
3. Tabla de números aleatorios
4. En Statgraphics

Msc. Arsenio Hidalgo Troya 41


Presentación de datos
Al arreglar el material experimental de manera aleatoria utilizando un
procedimiento de aleatorización para el caso de un experimento con 15
UE y 3 tratamientos y 5 réplicas por tratamiento usted puede obtener
por ejemplo el siguiente arreglo

Tratamiento

2 1 3

01 08 15

05 06 02

09 07 04

11 12 10

14 03 13

Decidir cuál tratamiento se aplica primero y a que UEs. Se recomienda


al experimentador asegurar la independencia de los errores
aleatorizando la manera de aplicar los tratamientos a las UE
Msc. Arsenio Hidalgo Troya 42
Previo a la ejecución del experimento se supone que: ha estandarizado
la técnica de medición, ha calibrado el instrumento, el examinador ha
realizado su calibración inter-examinador (para determinar su exactitud
con respecto a un gold estándar) e intra-examinador (tomando varias
veces la misma para evaluar su precisión en la medida).

Las pruebas estadísticas utilizadas para validar la calibración del


examinador depende de la escala en que es medida la variable, si la
variable es categórica, de escala nominal u ordinal, se puede utilizar
entre otros el coeficiente de concordancia Kappa, si la variable es
contínua se utilizar entre otros, el coeficiente de variación, el
coeficiente de correlación concordancia de Lin.

La teoría estadística no arregla datos originados de mediciones erróneas


y la calibración de equipos y examinadores es una de las condiciones
para validar los resultados de su investigación.

Msc. Arsenio Hidalgo Troya 43


Luego de ejecutar el experimento se recomienda organizar los datos
como se presenta en la tabla 1.
Tabla 1 Arreglo de datos para un DCA

Tratamiento
1 2 3
25 14 30
22 16 32
20 18 30
24 13 31
25 15 30

Análisis de datos
Se procede a la depuración de los datos, verificando los resultados
obtenidos y registrados en la digitación para posteriormente iniciar el
análisis estadístico, por medio de la técnica de análisis de varianza
(ANOVA). Msc. Arsenio Hidalgo Troya 44
DISEÑO COMPLETAMENTE ALEATORIZADO (DCA):
Ejemplo 6
Los datos siguientes se refieren al porcentaje de cantidad disuelta de
una resina fenólica en alcohol, en un tiempo de 8 horas, mediante la
aplicación de 3 dispositivos de agitación.
Tratamiento
T1 T2 T3
47 50 62
52 54 65
50 56 74
51 48 50
47 50 62

T1: Dispositivo 1, T2: Dispositivo 2, T3: Dispositivo 3

Msc. Arsenio Hidalgo Troya 45


Modelo estadístico de efectos fijos (Modelo I)
Descripción

Consiste en escribir una ecuación matemática que permite determinar de


manera teórica el valor de la respuesta observada (peso final). Siempre en
un arreglo experimental bajo un DCA con un solo factor, la respuesta
observada se puede modelar como:

Y𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝑒𝑖𝑗

Donde en la situación de estudio se tiene que:


Yij= el peso final obtenido al aplicar el i-ésimo (i=1,2, .., t) tratamiento en la j-
ésima (j=1, 2, …, r) UE
μ = la media global en la variable respuesta sin importar el tratamiento
aplicado
τ i = es el verdadero aporte del i-ésimo tratamiento = μi – μ
ei j = error experimental de la observación Y i j
Msc. Arsenio Hidalgo Troya 46
Tratamiento 1 ……… j …………………r

T1 Y11…….Y1j…… Y1r

T2 Y21…….Y2j…… Y2r

… ……. …….

Ti Yi1…….Yij…… Yir

… …….. ……

Tt Yt1…….Ytj…… Ytr

1
𝑦.. = 𝑦𝑖𝑗 ; 𝑦= 𝑦
𝑛 ..
𝑖 𝑗
1 1
𝑦𝑖. = 𝑗 𝑦𝑖𝑗 ; 𝑦𝑖. = 𝑟 𝑦𝑖. (balanceado) 𝑦𝑖. = 𝑟 𝑦𝑖. (no balanceado)
𝑖

Msc. Arsenio Hidalgo Troya 47


Tabla ANOVA

𝑆𝐶𝑇 = 𝑆𝐶𝐹 + 𝑆𝐶𝐸

(𝑦𝑖𝑗 − 𝑦)2 = (𝑦𝑖. − 𝑦)2 + (𝑦𝑖𝑗 − 𝑦𝑖. )2


𝑖 𝑗 𝑖 𝑗 𝑖 𝑗

Msc. Arsenio Hidalgo Troya 48


TABLA ANOVA:

FUENTE SC GL MC F ratio

Factor SCF t-1 SCF / (t-1) MCF / MCE

Error SCE n-t SCE / (n-t)

Total SCT n-1

𝑆𝐶𝐹 = 𝑟(𝑦𝑖. − 𝑦)2


1

𝑆𝐶𝐸 = (𝑟 − 1)𝑆𝑖. 2
1

𝑡−1 𝐹
𝑆𝐶𝑇 = 𝑆𝐶𝐹 + 𝑆𝐶𝐸; 𝜂2 =
𝑡 − 1 𝐹 + (𝑛 − 𝑡)

𝑛 = 𝑟𝑡 (Diseño balanceado)
Msc. Arsenio Hidalgo Troya 49
Para DCA no balanceado se tendría lo siguiente:
𝑡

𝑆𝐶𝐹 = 𝑟𝑖 (𝑦𝑖. − 𝑦)2


1

𝑆𝐶𝐸 = (𝑟𝑖 − 1)𝑆𝑖. 2


1

𝑛= 𝑟𝑖
1

𝑆𝐶𝑇 = 𝑆𝐶𝐹 + 𝑆𝐶𝐸

Msc. Arsenio Hidalgo Troya 50


Formulas alternativas:

𝑆𝐶𝑇 = 𝑆𝐶𝐹 + 𝑆𝐶𝐸

(𝑦𝑖𝑗 − 𝑦)2 = (𝑦𝑖. − 𝑦)2 + (𝑦𝑖𝑗 − 𝑦𝑖. )2


𝑖 𝑗 𝑖 𝑗 𝑖 𝑗

1 2
𝐹𝐶 = 𝑦..
𝑛

𝑆𝐶𝑇 = 𝑦𝑖𝑗 2 − 𝐹𝐶
𝑖 𝑗

1 2
𝑆𝐶𝐹 = 𝑟 𝑖 𝑦𝑖. − 𝐹𝐶 (balanceado)

1 2
𝑆𝐶𝐹 = 𝑖 𝑟𝑖 𝑦𝑖. − 𝐹𝐶( no balanceado)

Msc. Arsenio Hidalgo Troya 51


La técnica de análisis de varianza le permite al experimentador
probar la hipótesis global

Las hipótesis nulas son de la forma:

Ho: 𝜇𝑖 = 𝜇 para todo i; modelo Tipo I (k medias)

Parámetros a estimar Modelo I: 𝜎 2 , 𝜇, 𝜇𝑖 , 𝜏𝑖, 𝑒𝑖𝑗 , 𝐼𝐶

Ho: 𝜎𝐴2 = 0 ; modelo Tipo II (composición de varianzas)

Parámetros a estimar modelo II: 𝜇 , 𝜎𝐴2 , 𝜎 2

Msc. Arsenio Hidalgo Troya 52


Estimaciones efectos fijos:
Y𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝑒𝑖𝑗 = 𝜇𝑖 + 𝑒𝑖𝑗 ; 𝜏i = 𝜇i - 𝜇

𝜎2 = MCE ; 𝜇 = 𝑌..; 𝜇i = 𝑌i;

𝜏𝑖 = 𝑌𝑖 − 𝑌 ; 𝑒𝑖𝑗 = 𝑌𝑖𝑗 − 𝑌𝑖 (error)


𝑀𝐶𝐸
Balanceados: 𝐼. 𝐶 (𝜇𝑖 ) = 𝑌𝑖 ± 𝑡𝛼/2,𝑣
𝑟
(𝑣 = n – t)

2𝑀𝐶𝐸
𝐼. 𝐶 𝜇𝑖 − 𝜇𝑗 = (𝑌𝑖 − 𝑌𝑗 ) ± 𝑡𝛼/2,𝑣
𝑟
𝑀𝐶𝐸
No balanceados: 𝐼. 𝐶 (𝜇𝑖 ) = 𝑌𝑖 ± 𝑡𝛼/2,𝑣 𝑟𝑖

1 1
𝐼. 𝐶 𝜇𝑖 − 𝜇𝑗 = (𝑌𝑖 − 𝑌𝑗 ) ± 𝑡𝛼/2,𝑣 𝑀𝐶𝐸( + )
𝑟𝑖 𝑟𝑗

1 𝑡
E (MCE) = 𝜎 2 ; E (MCF) = 𝜎 2 + 𝑖=1 𝑟𝑖 𝜏𝑖2
𝑡−1

Ejercicios 1-2 (EJEMPLO-UNI)


Msc. Arsenio Hidalgo Troya 53
Cómo se presentan los resultados de una investigación experimental?

Presentar la tabla de ANOVA y las tablas de medias con sus errores


estándar. A través de los años se han llegado a establecer dos
costumbres:
• Si una relación F excede al punto de 95 % pero no excede al punto
de 99 por ciento, la relación F (o el cuadrado medio para el efecto
por probar) está marcado con un asterisco (*).
• Si una relación F excede el punto de 99 %, la relación F (o el
cuadrado medio para el efecto por probar) está marcado con doble
asterisco (**).
• Si el espacio es de importancia, únicamente se presenta un ANOVA
abreviado, cuando esto se haga, se acostumbra incluir únicamente
las columnas para fuentes de variación, grados de libertad y
cuadrados medios.
Cuando se utilice la convención del asterisco se deben definir los
símbolos al final de cada tabla de ANOVA mediante el uso de las
siguientes notas:
* significante a α = 0,05; ** significante a α = 0,01
*** significante a α = 0,001
Msc. Arsenio Hidalgo Troya 54
Supuestos teóricos Modelo ANOVA

Se supone que cumple con los supuestos 𝑒𝑖𝑗 ~ 𝑁 ( 0 , 𝜎 2 ) independientes

1. Normalidad
Se puede probar a través de pruebas estadísticas como Kolgomorov-
Smirnov, Shapiro-Wilk, Anderson –Darling, gráfico probabilidad
normal de residuos.
2. Independencia:
La prueba de Durbin-Watson es la más comúnmente utilizada para
este propósito, gráfico x: orden de corrida, y: residuos.
3. Homoscedasticidad (o varianza constante):
Las pruebas de Bartlett, Hartlett, Levene, gráfico x: predicho, y:
residuos.

El incumplimiento de algunos de los supuestos invalidará los resultados


y conclusiones del experimento; dado el caso se debe intentar la
solución a través de transformaciones de las variables, tales como
logarítmica, de potencia o la transformación de Box-Cox.

Msc. Arsenio Hidalgo Troya 55


Violaciones de los supuestos
Modelo de efectos fijos Modelo de efectos aleatorios
1. Es robusto respecto al 1. A diferencia del modelo
supuesto de Normalidad de efectos fijos es
afectado severamente
2. Para la homogeneidad 2. No es robusto a la
de las varianzas , es violación de este
robusto para diseños supuesto y el problema
balanceados, sin
embargo para diseños puede ser más grave si el
no balanceados puede diseño no es balanceado
ser un problema más
grave

Msc. Arsenio Hidalgo Troya 56


Prueba de Rangos Múltiples (Post Hoc)
Cuando t > 2 y los resultados de la prueba ANOVA son estadísticamente
significativos, existe una prueba complementaria a dicha prueba, que es
necesario realizar para establecer entre que grupos de tratamiento existen
diferencias (DMS, Bonferroni, Scheffe, Tukey, Duncan, etc.) llamada Prueba de
Rangos Múltiples o Post Hoc
1 1
(𝑦𝑖 − 𝑦𝑗 ) ± 𝑀 𝐶𝑀𝐸( + )
𝑛𝑖 𝑛𝑗

Donde M es la constante que depende del proceso elegido


Para el método DMS se toma: 𝑀 = 𝑡𝛼,𝑛−𝑡
2

1 1
DMS =𝑡𝛼,𝑛−𝑡 𝐶𝑀𝐸(𝑛 + 𝑛 ) (deducir tamaño de r, pag. 89)
2 𝑖 𝑗

NOTA: El Modelo ANOVA asume que Y (o el residuo) esta distribuido Normalmente y hay Homogeneidad entre
los t niveles o grupos de tratamiento. Prueba alternativa de la ANOVA es KRUSKAL WALLIS, si las muestras
son independientes o no relacionadas, o en caso contrario se utiliza ANOVA de medidas repetidas y la
equivalente es la FRIEDMAN.
Si t=2 se aplica, alternativamente, la prueba t Student cuando se cumple la normalidad y la
Homocesdasticidad de los grupos o MANN WHITNEY cuando no se cumplen estos supuestos, si las
muestras son independientes o no relacionadas, o en caso contrario la prueba t student para muestras
relacionadas o la equivalente de WILCOXON
Msc. Arsenio Hidalgo Troya 57
Prueba de Kruskal Wallis
Si no se cumple alguno de los supuestos de normalidad u
Homocedasticidad, aplicamos la prueba de KW
1 𝑅𝑖2 𝑛 𝑛 + 1 2
𝐻= 2 − ; 𝑛= 𝑟𝑖
𝑆 𝑟𝑖 4
𝑖 𝑖

Donde:
2 1 2 𝑛(𝑛+1)2
𝑆 = 𝑖 𝑗 𝑅𝑖𝑗 −
𝑛−1 4

𝑛(𝑛+1)
Si no hay empates, entonces: 𝑆 2 = 12
; y el estadístico queda:

12 𝑅𝑖2
𝐻= − 3(𝑛 + 1)
𝑛(𝑛 + 1) 𝑟𝑖
𝑖
2
𝐻 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝜒𝛼,𝑡−1 cuando 𝑟𝑖 ≥ 5
Msc. Arsenio Hidalgo Troya 58
MODELO ESTADISTICO DE EFECTOS ALEATORIOS

Llamado también modelo de componentes de la


varianza, se presenta cuando de la población total de
niveles de factor (supuesta infinita o suficientemente
grande como para considerarla infinita), los niveles del
factor que se utilizan en el experimento se han elegido
aleatoriamente.

La formulación es equivalente, al modelo de efectos fijos


y se utiliza la tabla ANOVA para establecer si hay
diferencias significativas entre los tratamientos.

Msc. Arsenio Hidalgo Troya 59


Modelo II Efectos aleatorios

Parámetros ( 𝜇, 𝜎𝐴2 , 𝜎 2 )

𝑌𝑖𝑗 = 𝜇 + A𝑖 + 𝑒𝑖𝑗 i = 1, 2,…, t; j = 1,…, 𝑟𝑖


A𝑖 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎
𝑌𝑖𝑗 : Respuesta; 𝜇: media global
A𝑖 : factor v.a.~ 𝑁 ( 0 , 𝜎A2 ) 𝜎A2 varianza de los v/rs. medios de
la Y para todos los niveles de 𝐴
𝑒𝑖𝑗 : error ~ 𝑁 ( 0 , 𝜎 2 )
A𝑖𝑗 y 𝑒𝑖𝑗 son independientes

Msc. Arsenio Hidalgo Troya 60


La tabla ANOVA es similar a la efectos fijos se diferencia en las
medias cuadráticas esperadas:

𝐸(𝑀𝐶𝐸) = 𝜎 2 ,
𝐸 𝑀𝐶𝐹 = 𝜎 2 + 𝑛𝑜 𝜎A2 ,

MCF estima una c.l. de dos varianzas, la varianza del error


(𝜎 2 ) y la varianza entre las medias de todos los grupos
posibles del factor aleatorio (𝜎A2 )

Hipótesis:
Ho: 𝜎𝐴2 = 0 varianza entre todas las medias de todos los
niveles de A es cero (entre grupos)
H1: 𝜎𝐴2 > 0
Msc. Arsenio Hidalgo Troya 61
Parámetros a estimar modelo II 𝜇 , 𝜎A2 , 𝜎 2
𝜇= 𝑌

𝐸(𝑀𝐶𝐸) = 𝜎 2 , entonces 𝜎 2 = 𝑀𝐶𝐸

𝐸 𝑀𝐶𝐹 = 𝜎 2 + 𝑛𝑜 𝜎A2 , entonces 𝑀𝐶𝐹 = 𝜎 2 + 𝑛𝑜 𝜎A2

𝑀𝐶𝐹 − 𝑀𝐶𝐸 1 Σ𝑟𝑖 2


𝜎A2 = ; 𝑛𝑜 = (𝑛− ) ; 𝑛= 𝑡
1 𝑟𝑖
𝑛𝑜 𝑡−1 𝑛

𝜎y2 = 𝜎 2 + 𝜎A2
2
𝜎A
𝑟1 = (Coeficiente de correlación intragrupos)
𝜎y2

Ejemplo 3 (EJEMPLOS-UNI) Msc. Arsenio Hidalgo Troya 62


Temática:

3. Diseño en Bloques al Azar (DBA)


3.1 Modelo DBCA
3.2 Modelo de Medidas Repetidas
3.3 Diseños de Cuadrado Latino
3.4 Diseños de Cuadrado Grecolatino
3.5 Tamaño de la Muestra modelos I y II

Msc. Arsenio Hidalgo Troya 63


DISEÑOS DE BLOQUES AL AZAR
En los modelos anteriores se ha supuesto que las UE se asignen a
los niveles de los factores o tratamientos (o viceversa),
complementar al azar en la realización del experimento, dando
lugar así a DCA.

Lo idóneo es que existe un gran homogeneidad entre las unidades


experimentales (dos unidades experimentales sometidas a
distintos tratamientos presentan leves diferencias), pero cuando
las unidades experimentales no son homogéneas, se recomienda
utilizar el diseño de bloque al azar.

En este caso, los tratamientos se aplican a grupos homogéneos de


unidades experimentales (ya no hay una asignación aleatoria de las
unidades experimentales a los tratamientos, o viceversa).
Msc. Arsenio Hidalgo Troya 64
MODELO EN BLOQUES ALEATORIZADOS (DBCA)
Un bloque homogéneo equivale a un grupo experimental
Los bloques equivalen a niveles de un factor, aunque el bloque no se
considera un factor a estudiar, es una forma de controlar la varianza
intra-grupo (error experimental).
La asignación de unidades experimental acada bloque se realiza de forma
aleatoria.
El DBCA es completo si todos los bloques tienen representación en todos
los tratamientos, en caso contrario es de bloques incompleto.
El DBCA completo corresponde a un modelo ANOVA de 2 factores fijos
sin interacciones en el que uno de los factores corresponde a los bloques
y el otro al factor de tratamiento.
El modelo con a tratamientos y b bloques puede formularse así:
Y𝑖𝑗 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + 𝑒𝑖𝑗 (i= 1,…..,a; j=1,…., b)

Ejemplo 4-5 (EJEMPLOS-UNI)


Msc. Arsenio Hidalgo Troya 65
MODELO DE MEDIDAS REPETIDAS
Un DE de medidas repetidas (o diseño intrasujeto) es un caso
particular de diseño de bloques al azar. Consiste en que cada
bloque está formado por un solo individuo al que se le aplican
todos los tratamientos.
Puede presentar el efecto de superposición (carry-over effect), se
produce cuando se administra un tratamiento antes de que haya
terminado el efecto de un tratamiento anterior. Puede controlarse
aumentando el tiempo entre los tratamientos.
En este diseño puede darse también el efecto de aprendizaje, que
se produce cuando la simple repetición mejora la respuesta
independiente de ningún tratamiento.
También puede presentar el efecto latencia, que se produce
cuando un tratamiento activa el efecto de un tratamiento anterior
que permanecía en estado de latencia.

Msc. Arsenio Hidalgo Troya 66


DISEÑO EN CUADRADO LATINO
El diseño en cuadrado latino(DCL) tiene en cuanta 3 factores con la
particularidad de que todos tienen el mismo número de niveles.
Dos de los factores operan como bloques con el fin de reducir los errores
experimentales. Su objetivo es determinar si el tercer factor (factor de
tratamiento) tiene o no una influencia significativa sobre la variable
dependiente.
En un DCL, hay una sola observación por casilla, por lo que en ningún
caso es posible tratar efectos de interacción. En el diseño de DCL existen
2 factores de bloque (filas y columnas), a diferencias del DBCA en el que
solo hay 1 factor de bloque.
Otra característica diferenciadora en DCL es que los 2 factores de bloque,
así como el factor de tratamiento tienen el mismo número de grupos o
niveles. Este modelo se puede expresar como:

Y𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + 𝜏𝑘 + 𝑒𝑖𝑗𝑘 (i, j, k= 1,…..,t)

Donde 𝛼 y 𝛽 representan los efectos fila y columna y 𝜏 representa el


efecto de factor de tratamiento.

Ejemplo 6 (EJEMPLOS-UNI)
Msc. Arsenio Hidalgo Troya 67
DISEÑOS EN CUADRADO GRECOLATINO
El diseño en cuadrado grecolatino (DCG), tiene en cuenta 4 factores con
la particularidad de que todos tienen el mismo número de niveles, y 3 de
los factores operan como bloques con el fin de reducir los errores y
experimentales.
Su objetivo es determinar si en cuarto factor (factor de tratamiento)
tiene o no una influencia significativa sobre la variable respuesta. En un
DCG hay una sola observación por casilla, en ningún caso es posible tratar
efectos de interacción. En DCG existen 3 factores de bloque (fila,
columnas y letras griegas colocadas sobre las casillas del cuadrado), a
diferencia del DBCA, en el que solo hay un factor de bloque
Otra característica diferenciadora del DCG es que los 3 factores de
bloque, así como factor de tratamiento, tienen el mismo número de
grupos o niveles. Este modelo se puede expresar como:

Y𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + 𝜏𝑘 + 𝜔𝑙 + 𝑒𝑖𝑗𝑘 (i, j, k, l= 1,…..,t)

Donde 𝛼, 𝛽 y 𝜏 representan los efectos fila, columna y casilla y 𝜔


representa el efecto de factor de tratamiento.
Msc. Arsenio Hidalgo Troya 68
DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA (Modelo I)

Prueba de hipótesis:
En los diferentes tipos de diseños se plantearan hipótesis o
conjeturas acerca de los factores de estudios. Estas reciben
los nombres de Hipótesis Nula e Hipótesis alterna.
ERROR TIPO I: Se comete cuando se rechaza la Hipótesis nula
siendo verdadera . La probabilidad de cometer este error es
α (nivel de significancia)
ERROR TIPO II: Se comete si no se rechaza la hipótesis nula
siendo esta falsa. La probabilidad de cometer el error tipo II
es β.

Se definen así para una prueba:


Significancia =1- α= P(Rechazar Ho / Ho es verdadera)
Potencia =1- β= P(Rechazar Ho / Ho es falsa)
Msc. Arsenio Hidalgo Troya 69
CURVAS CARACTERÍSTICAS DE OPERACIÓN
(Receiver Operating Characteristic - ROC)

Es una gráfica de la probabilidad del error tipo II de una prueba


estadística para un tamaño de muestra particular contra un
parámetro que refleja la medida en que la hipótesis nula es falsa
Las curvas ROC se usan para guía en la selección del número de
replicas para que el diseño sea sensible a diferencias potenciales
importantes en los tratamientos.

Potencia=Sensibilidad
Significancia = 1- Especificidad

Msc. Arsenio Hidalgo Troya 70


Msc. Arsenio Hidalgo Troya 71
Se requiere conocer 𝑎, 𝜏𝑖 , 𝜎 2 , determinar Ф2, además fijar αy β,
haciendo 𝜐1 = 𝑎 − 1 ; 𝜐2 = 𝑛(𝑎 − 1) y obtener por tanteo en las
tablas ROC el valor mínimo de n que supere el valor fijado de 1- β

Ejemplo 8
Suponga que en un determinado experimento se está interesado en
rechazar la hipótesis nula con una probabilidad de al menos 0,80 si
las medias de los tratamientos estimados en una prueba piloto
fueron:
𝜇1 =8 𝜇2 =11 𝜇3 =15 𝜇4 =19 𝜇5 =22

Además se obtuvo una varianza estimada 𝜎 2 =CME=27.

Debido a que se tiene los valores de las medias de los tratamientos


la media global será el promedio de estos.
𝜇=15

Msc. Arsenio Hidalgo Troya 72


Se dan valores de (n) desde 4 hasta 6 , Calculamos el valor de φ
y con los grados de libertad del error se encuentra el valor de
β, en las curvas, con α=0,01 (tabla pag. 648 Montgomery) .

n φ² φ a(n-1) β Potencia =1- β


4 3,85 1,96 15 0.35 0.65
5 4,81 2,19 20 0.30 0.70
6 5,78 2,40 25 0.18 0.82

Se necesitan entonces 6 repeticiones para obtener una


potencia de prueba igual a 0,82

Msc. Arsenio Hidalgo Troya 73


Curva de operación característica para un modelo de efectos
fijos

Msc. Arsenio Hidalgo Troya 74


Un enfoque alternativo es seleccionar un tamaño de muestra tal que el
investigador considere una diferencia mínima entre las medias poblaciones
más distantes desde un punto de vista práctico igual a Δ de tal manera que
𝑛Δ2
𝜏𝑖2 ≥ 𝛥 / 2 , entonces: Φ2 =
2𝑎𝜎2

Tomando 𝛥 = 16, se tienen casi los mismos resultados anteriores

n φ² φ a(n-1) β Potencia =1- β


4 3,8 1,9 15 0.40 0.65
5 4,7 2,2 20 0.23 0.77
6 5,7 2,4 25 0.10 0.90

Se necesitan entonces 6 repeticiones para obtener una


potencia de prueba igual a 0,82

Msc. Arsenio Hidalgo Troya 75


Calculadora de Tamaño muestral GRANMO
http://www.imim.cat/ofertadeserveis/software-public/granmo/

Msc. Arsenio Hidalgo Troya 76


DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA (Modelo II)
Al igual que en el modelo I se utilizan las curvas ROC para
determinar el número de réplicas, utilizando como parámetro de
centralidad:

2
𝑛𝜎 𝐴
𝜆2 = 1 + 2
𝜎

Se requiere conocer 𝜎𝐴2 , 𝜎 2 , determinar 𝜆 2, además fijar α y β,


haciendo 𝜐1 = 𝑎 − 1 ; 𝜐2 = 𝑛(𝑎 − 1) y obtener por tanteo en las tablas
ROC el valor mínimo de n que supere el valor fijado de 1-β (pag. 529
Montgomery)

Msc. Arsenio Hidalgo Troya 77

You might also like