Professional Documents
Culture Documents
Capítulos 1-3
Programa de Química
Departamento de Matemáticas y Estadística
Orígenes de la Metodología
Qué es un experimento?
Una prueba o serie de pruebas donde se introducen cambios
deliberados en las variables de entrada que forman un sistema o
proceso, con el objetivo de medir el efecto del cambio sobre una
o mas variables del producto o salida de dicho proceso.
Para el Químico la unidad puede ser una muestra de agua; para el Ingeniero Agrícola
la unidad experimental puede ser una matera, una parcela, una finca; para el
Veterinario un animal, 10 pollos de corral, día de la semana, etc.; para el Médico
puede ser un paciente, un consultorio, un hospital, en otros casos puede ser el hígado
o parte de la piel. Igualmente la UE puede ser un sitio en un río, una profundidad en
un lago, un cuadrante de un bosque , un árbol, una rama, una flor o fruto, etc.
Población
Es el conjunto de todas las UEs que podrían recibir uno de los
tratamientos. El objeto de la investigación debe establecerse en
términos de esta población. Para el estadístico la población es el
conjunto de todos los datos que podrían obtenerse de todas las
UEs.
ERROR ALEATORIO
Variabilidad observada que no se puede explicar por los factores
estudiados; resulta del pequeño efecto de los factores no
estudiados y/o no conocidos y del error experimental.
MATRIZ DE DISEÑO
Es el arreglo formado por los tratamientos que serán
corridos, incluyendo las repeticiones.
• Aleatorización
• Replicación
• Bloqueo
DISEÑO NO BALANCEADO
Cuando el número de replicas en cada tratamiento no es el
mismo.
Para el modelo tipo I, una repetición del experimento se realiza sobre el mismo
conjunto de tratamientos; en tanto que para el modelo tipo II una repetición
producirá un nuevo conjunto de tratamientos.
Tiro al blanco hay precisión si todos sus tiros tienen puntos cercanos entre sí y
exactitud si los tiros dan en el blanco o muy cerca de él.
Datos sesgados (error sistemático) son datos inexactos aunque podrían ser precisos. La
estadística practica asume que los datos están libres de errores sistemáticos y que la
variabilidad restante son errores aleatorios que tratan de minimizarse.
Si el sesgo es grande, una medición puede ser de alta precisión pero baja exactitud. Las
repeticiones, las mediciones adicionales y el agrupamiento hábil del material actúan
sobre la precisión del experimento. Si el método de medición permanece sesgado,
estos procedimientos no afectan a ese sesgo.
1. Planeación y Realización:
• Delimitar el problema u objeto de estudio.
• Elegir la(s) variable(s) de respuesta.
• Determinar los factores a investigar, de acuerdo a la
supuesta influencia que tienen sobre la respuesta.
• Seleccionar los niveles de cada factor, el número de
repeticiones, así como el DE adecuado a los factores que
se tienen y al objetivo del experimento.
• Planear y organizar el trabajo experimental.
• Realizar el experimento.
Msc. Arsenio Hidalgo Troya 29
2. Análisis
Recurrir a métodos estadísticos inferenciales para ver si las
diferencias o efectos muestrales (experimentales) son lo
suficientemente grandes para que garanticen diferencias
poblacionales (o a nivel proceso).
La técnica estadística central en el análisis de los experimentos es
el llamado Análisis de Varianza ANOVA (acrónimo en inglés).
3. Interpretación
Analizar con detalle lo que ha pasado en el experimento, desde
contrastar las conjeturas iniciales con los resultados del
experimento, hasta observar los nuevos aprendizajes que sobre el
proceso se lograron, verificar supuestos y elegir el tratamiento
ganador u óptimo, siempre con apoyo de las pruebas estadísticas.
Usos
Es recomendado cuando es posible que gran parte de las UE no
respondan al tratamiento o puedan perderse durante el experimento.
Tratamiento
2 1 3
01 08 15
05 06 02
09 07 04
11 12 10
14 03 13
Tratamiento
1 2 3
25 14 30
22 16 32
20 18 30
24 13 31
25 15 30
Análisis de datos
Se procede a la depuración de los datos, verificando los resultados
obtenidos y registrados en la digitación para posteriormente iniciar el
análisis estadístico, por medio de la técnica de análisis de varianza
(ANOVA). Msc. Arsenio Hidalgo Troya 44
DISEÑO COMPLETAMENTE ALEATORIZADO (DCA):
Ejemplo 6
Los datos siguientes se refieren al porcentaje de cantidad disuelta de
una resina fenólica en alcohol, en un tiempo de 8 horas, mediante la
aplicación de 3 dispositivos de agitación.
Tratamiento
T1 T2 T3
47 50 62
52 54 65
50 56 74
51 48 50
47 50 62
Y𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝑒𝑖𝑗
T1 Y11…….Y1j…… Y1r
T2 Y21…….Y2j…… Y2r
… ……. …….
Ti Yi1…….Yij…… Yir
… …….. ……
Tt Yt1…….Ytj…… Ytr
1
𝑦.. = 𝑦𝑖𝑗 ; 𝑦= 𝑦
𝑛 ..
𝑖 𝑗
1 1
𝑦𝑖. = 𝑗 𝑦𝑖𝑗 ; 𝑦𝑖. = 𝑟 𝑦𝑖. (balanceado) 𝑦𝑖. = 𝑟 𝑦𝑖. (no balanceado)
𝑖
FUENTE SC GL MC F ratio
𝑆𝐶𝐸 = (𝑟 − 1)𝑆𝑖. 2
1
𝑡−1 𝐹
𝑆𝐶𝑇 = 𝑆𝐶𝐹 + 𝑆𝐶𝐸; 𝜂2 =
𝑡 − 1 𝐹 + (𝑛 − 𝑡)
𝑛 = 𝑟𝑡 (Diseño balanceado)
Msc. Arsenio Hidalgo Troya 49
Para DCA no balanceado se tendría lo siguiente:
𝑡
𝑛= 𝑟𝑖
1
1 2
𝐹𝐶 = 𝑦..
𝑛
𝑆𝐶𝑇 = 𝑦𝑖𝑗 2 − 𝐹𝐶
𝑖 𝑗
1 2
𝑆𝐶𝐹 = 𝑟 𝑖 𝑦𝑖. − 𝐹𝐶 (balanceado)
1 2
𝑆𝐶𝐹 = 𝑖 𝑟𝑖 𝑦𝑖. − 𝐹𝐶( no balanceado)
2𝑀𝐶𝐸
𝐼. 𝐶 𝜇𝑖 − 𝜇𝑗 = (𝑌𝑖 − 𝑌𝑗 ) ± 𝑡𝛼/2,𝑣
𝑟
𝑀𝐶𝐸
No balanceados: 𝐼. 𝐶 (𝜇𝑖 ) = 𝑌𝑖 ± 𝑡𝛼/2,𝑣 𝑟𝑖
1 1
𝐼. 𝐶 𝜇𝑖 − 𝜇𝑗 = (𝑌𝑖 − 𝑌𝑗 ) ± 𝑡𝛼/2,𝑣 𝑀𝐶𝐸( + )
𝑟𝑖 𝑟𝑗
1 𝑡
E (MCE) = 𝜎 2 ; E (MCF) = 𝜎 2 + 𝑖=1 𝑟𝑖 𝜏𝑖2
𝑡−1
1. Normalidad
Se puede probar a través de pruebas estadísticas como Kolgomorov-
Smirnov, Shapiro-Wilk, Anderson –Darling, gráfico probabilidad
normal de residuos.
2. Independencia:
La prueba de Durbin-Watson es la más comúnmente utilizada para
este propósito, gráfico x: orden de corrida, y: residuos.
3. Homoscedasticidad (o varianza constante):
Las pruebas de Bartlett, Hartlett, Levene, gráfico x: predicho, y:
residuos.
1 1
DMS =𝑡𝛼,𝑛−𝑡 𝐶𝑀𝐸(𝑛 + 𝑛 ) (deducir tamaño de r, pag. 89)
2 𝑖 𝑗
NOTA: El Modelo ANOVA asume que Y (o el residuo) esta distribuido Normalmente y hay Homogeneidad entre
los t niveles o grupos de tratamiento. Prueba alternativa de la ANOVA es KRUSKAL WALLIS, si las muestras
son independientes o no relacionadas, o en caso contrario se utiliza ANOVA de medidas repetidas y la
equivalente es la FRIEDMAN.
Si t=2 se aplica, alternativamente, la prueba t Student cuando se cumple la normalidad y la
Homocesdasticidad de los grupos o MANN WHITNEY cuando no se cumplen estos supuestos, si las
muestras son independientes o no relacionadas, o en caso contrario la prueba t student para muestras
relacionadas o la equivalente de WILCOXON
Msc. Arsenio Hidalgo Troya 57
Prueba de Kruskal Wallis
Si no se cumple alguno de los supuestos de normalidad u
Homocedasticidad, aplicamos la prueba de KW
1 𝑅𝑖2 𝑛 𝑛 + 1 2
𝐻= 2 − ; 𝑛= 𝑟𝑖
𝑆 𝑟𝑖 4
𝑖 𝑖
Donde:
2 1 2 𝑛(𝑛+1)2
𝑆 = 𝑖 𝑗 𝑅𝑖𝑗 −
𝑛−1 4
𝑛(𝑛+1)
Si no hay empates, entonces: 𝑆 2 = 12
; y el estadístico queda:
12 𝑅𝑖2
𝐻= − 3(𝑛 + 1)
𝑛(𝑛 + 1) 𝑟𝑖
𝑖
2
𝐻 𝑠𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑦𝑒 𝜒𝛼,𝑡−1 cuando 𝑟𝑖 ≥ 5
Msc. Arsenio Hidalgo Troya 58
MODELO ESTADISTICO DE EFECTOS ALEATORIOS
Parámetros ( 𝜇, 𝜎𝐴2 , 𝜎 2 )
𝐸(𝑀𝐶𝐸) = 𝜎 2 ,
𝐸 𝑀𝐶𝐹 = 𝜎 2 + 𝑛𝑜 𝜎A2 ,
Hipótesis:
Ho: 𝜎𝐴2 = 0 varianza entre todas las medias de todos los
niveles de A es cero (entre grupos)
H1: 𝜎𝐴2 > 0
Msc. Arsenio Hidalgo Troya 61
Parámetros a estimar modelo II 𝜇 , 𝜎A2 , 𝜎 2
𝜇= 𝑌
𝜎y2 = 𝜎 2 + 𝜎A2
2
𝜎A
𝑟1 = (Coeficiente de correlación intragrupos)
𝜎y2
Ejemplo 6 (EJEMPLOS-UNI)
Msc. Arsenio Hidalgo Troya 67
DISEÑOS EN CUADRADO GRECOLATINO
El diseño en cuadrado grecolatino (DCG), tiene en cuenta 4 factores con
la particularidad de que todos tienen el mismo número de niveles, y 3 de
los factores operan como bloques con el fin de reducir los errores y
experimentales.
Su objetivo es determinar si en cuarto factor (factor de tratamiento)
tiene o no una influencia significativa sobre la variable respuesta. En un
DCG hay una sola observación por casilla, en ningún caso es posible tratar
efectos de interacción. En DCG existen 3 factores de bloque (fila,
columnas y letras griegas colocadas sobre las casillas del cuadrado), a
diferencia del DBCA, en el que solo hay un factor de bloque
Otra característica diferenciadora del DCG es que los 3 factores de
bloque, así como factor de tratamiento, tienen el mismo número de
grupos o niveles. Este modelo se puede expresar como:
Prueba de hipótesis:
En los diferentes tipos de diseños se plantearan hipótesis o
conjeturas acerca de los factores de estudios. Estas reciben
los nombres de Hipótesis Nula e Hipótesis alterna.
ERROR TIPO I: Se comete cuando se rechaza la Hipótesis nula
siendo verdadera . La probabilidad de cometer este error es
α (nivel de significancia)
ERROR TIPO II: Se comete si no se rechaza la hipótesis nula
siendo esta falsa. La probabilidad de cometer el error tipo II
es β.
Potencia=Sensibilidad
Significancia = 1- Especificidad
Ejemplo 8
Suponga que en un determinado experimento se está interesado en
rechazar la hipótesis nula con una probabilidad de al menos 0,80 si
las medias de los tratamientos estimados en una prueba piloto
fueron:
𝜇1 =8 𝜇2 =11 𝜇3 =15 𝜇4 =19 𝜇5 =22
2
𝑛𝜎 𝐴
𝜆2 = 1 + 2
𝜎