You are on page 1of 145

1

MAESTRIA EN CIENCIAS QUIMICAS

DISEÑO DE EXPERIMENTOS
(DOE)

Dr. Fernando Hernández Blanco

1
2

EVALUACION
EXPOSICION DE TEMAS Y ARTICULOS 25%
EXAMEN 45%
PROYECTO PRACTICO 30%

COMO RESULTADO DEL PROYECTO DEBE SALIR UN


RESUMEN PARA UN CONGRESO INTERNACIONAL EN
JUNIO.

EL EXAMEN ES UNICO Y SE REALIZARA EN LA


SEMANA DE EXAMENES FINALES.
3

CONGRESOS
4
5
6

TEMATICA
7

INTRODUCCION
Todas nuestras actividades asociadas con planear y
realizar estudios de Investigación tienen implicaciones
estadísticas (Kuehl, ppios estadísticos del DOE)

1. Desarrolló y consolidó los principios básicos


de diseño y análisis que hasta la fecha son
prácticas necesarias para llegar a
resultados de investigación válidos.
2. Desarrolló el análisis de varianza y unificó
sus ideas básicas sobre los principios del
diseño de experimentos.
3. The Arrangement of Field Experiments"
(Fisher, 1926);

sir Ronald A. Fisher 7


8

INTRODUCCION
Tres componentes fundamentales de los experimentos en el área de
pruebas agrícolas:

Control local de las condiciones de campo para reducir el error


experimental,
Replicación como un medio para estimar la varianza del error experimental
Aleatorización para obtener una estimación válida de esa varianza.

8
9

PLANEACION DE LA INVESTIGACION
METODO CIENTIFICO
• Observación
• Planteamiento del problema
• Hipótesis
• Experimentación
• Registro de datos
• Análisis e interpretación
• Reformulación
9
10

DISEÑO DE UNA INVESTIGACION


El diseño de un estudio es la estrategia o plan utilizado para
responder una pregunta, y es la base de la calidad de la
investigación

La 1ºra etapa investigación: “la pregunta” De acuerdo a la


pregunta se selecciona el diseño de investigación apropiado
para dar la respuesta mas confiable.

Recolectar la información necesaria para responder a las


preguntas de investigación (sea cualitativa o cuantitativa) es
el objetivo y para ello, el investigador selecciona un diseño
de investigación

10
11

TIPOS DE INVESTIGACION
Exploratoria
Los estudios exploratorios "Se efectúan, normalmente, cuando el
objetivo es examinar un tema o problema de investigación poco
estudiado o que no ha sido abordado antes"

Descriptiva
La investigación de tipo descriptiva mide o evalúa, con la mayor precisión
posible, diversos aspectos, dimensiones o componentes del fenómeno a
investigar
Explicativa
Este tipo de investigaciones tienen como objetivo llegar al conocimiento
de las causas que lleven a explicar el fenómeno

Cualitativa
Estudian la realidad en su contexto natural, tal y como sucede, intentando
sacar sentido de, o interpretar los fenómenos de acuerdo con los
significados que tienen para las personas implicadas
11
12

Criterios de clasificación de
investigaciones
Según su finalidad Investigación básica y aplicada
Según el propósito son Descriptivos o Comparativos,
experimental y ex post facto.
Según la evolución son Transversales o Longitudinales
Según la fuente de información son Prospectivos o
Retrospectivos
Registro de datos que Los hechos se registran
Ocurrieron en el pasado A medida que ocurren

RETROSPECTIVO Período Actual PROSPECTIVO


12 Diseño del estudio
13

PROSPECTIVO
CAUSA EFECTO

RETROSPECTIVO
CAUSA EFECTO

TRANSVERSAL

MEDICION

LONGITUDINAL

MEDICIONES

13
14

Según el periodo y secuencia del estudio:

Transversal

Tiempo

Longitudinal Longitudinal

14
15

DEFINICIONES
1. Qué es un experimento?
2. Qué es diseñar un experimento?
3. Qué es unidad experimental?
4. Qué es la variable de respuesta?
5. Qué son factores y niveles de un factor?
6. Qué son factores controlables y NO controlables?
7. Qué son Factores estudiados?
8. Qué son tratamientos?
9. Qué es error experimental?
10.Qué es error aleatorio?
11.Qué es interacción entre factores?
15
16

¿Qué es un experimento?
Un experimento es un procedimiento mediante el cual
se trata de comprobar (confirmar o verificar) una o
varias hipótesis relacionadas con un determinado
fenómeno, mediante la manipulación y el estudio de las
correlaciones de las variables que presumiblemente
son su causa

Son objetivos de un experimento


 Determinar las causas de variación en la
respuesta.
 Comparar las respuestas en diferentes
niveles de observación de variables
controladas.
 Obtener un modelo estadístico-matemático
que permita hacer predicciones de
respuestas futuras.
17

¿Qué es diseñar un experimento?


Diseñar un experimento significa planear un experimento de modo que
reúna la información pertinente al problema bajo investigación.

El diseño de un experimento es la secuencia completa de pasos tomados


de antemano para asegurar que los datos apropiados se obtendrán de
modo que permitan un análisis objetivo.

UN DISEÑO DE EXPERIMENTO SURGE DE LA NECESIDAD DE


RESPONDER A PREGUNTAS COMO:

¿Cómo se va a medir el efecto?, ¿Cuáles son las características a


analizar? ¿Qué factores afectan las características que se van a analizar?
¿Cuáles son los factores que se estudiaran en esta investigación?
¿Cuántas veces deberá ejecutarse el experimento?
¿Cuál será la forma de análisis?
17 ¿A partir de que valores se considera importante el efecto?
18

Qué es unidad experimental?

Cada elemento que será sometido a determinadas condiciones del experimento y que
brindará una respuesta (medición o dato estadístico).

Qué es la variable de respuesta?


Aquella característica de interés para el investigador, aquella que se quiere mejorar
mediante el experimento.

Qué es un factor?
Variable independiente, afecta los resultados del experimento. Un factor en estudio es
aquel cuyos valores son controlados y cuyo efecto será evaluado en los resultados del
experimento.
Niveles del factor:
Son los distintos valores estudiados.
Qué son factores controlables Variables de entrada (ó de proceso) qué el investigador puede fijar
en un punto o nivel de operación y NO controlables Se pueden llamar también Factores de
ruido, y casi siempre son la mayoría de variables que pueden afectar nuestra variable de
respuesta; son variables que NO se pueden controlar
18
18
19

Qué son Factores estudiados?


Variables que se investigan en el experimento, en cuanto a cómo influyen ó afectan la
variable de respuesta
Qué son tratamientos?
Una combinación de niveles de todos los factores estudiados se denomina tratamiento o
punto de diseño

Qué es error experimental?


Representa la porción de variabilidad de la variable de respuesta, que no resulta ser
explicada por los factores estudiados a causa de errores cometidos por el investigador en
las etapas de planeación y ejecución del experimento.
Qué es error aleatorio?
Representa la porción de variabilidad de la variable de respuesta, que no resulta ser
explicada por los factores estudiados debido a causas comunes o aleatorias que generan
la variabilidad natural del proceso.
Qué es interacción entre factores?
Se presenta cuando el efecto de un factor depende del nivel en que se encuentra el otro
factor
20

Aunque la aplicación o uso del diseño experimental se da en cualquier


área del conocimiento, este debe cumplir las siguientes fases
• Caracterización de un proceso. En esta fase, se busca determinar los rangos
de las variables o factores controlables de mayor influencia en las variables
respuesta que a la vez minimizan el efecto de las variables no controlables
(factores o covariables).

• Depuración y optimización de un proceso ya caracterizado. En esta fase se


hallan los niveles de los factores estudiados que proporcionan la respuesta
óptima a la solución del proceso caracterizado en la fase anterior
(C) Variables Constantes

(X) (Y)
Variables Nombre el Respuesta
clave del (Output)
Proceso
proceso a las variables

(N) Variables no controladas (ruido)


21

CARACTERÍSTICAS DEL DISEÑO EXPERIMENTAL


• Debe poder comprobar las hipótesis objeto de estudio, no dejándose confundir por
variables insospechadas (=ruido), como errores de medida desproporcionados, etc.

• Debe poder revelar la existencia de cualquier causa importante de variación, aunque


no haya sido adelantada como hipótesis.

• Debe mantener los costos de experimentación a un nivel razonable, en comparación


con el problema objeto de estudio.

• Debe tener un alto grado de seguridad en las respuestas.

• Si el Experimento se realiza en un laboratorio, éste ha de ser, respecto a las variables


estudiadas, un buen indicador de las pruebas que se obtendrían en el taller o "in situ".

• Si el Experimento se realiza durante el desarrollo normal del proceso en estudio, se


tendrá además cuidado de interferir lo menos posible en el trabajo normal y protegerse
de las interferencias no autorizadas o involuntarias en la prueba por parte del personal
adepto.
21
21
22

• Nos propondremos a hacer cambios en los factores (inputs) para poder


observar los cambios correspondientes a las respuestas (outputs).

• La información obtenida de un buen diseño experimental puede ser


utilizado para desarrollar las características de mejora, así como construir
modelos matemáticos que se aproximan a la realidad entre los factores y el
resultado.

INPUTS OUTPUTS
Gente
Respuestas relacionadas
Proceso a mejorar un servicio
Material
Equipo
Respuestas relacionadas
Politicas Mezcla de a producir un producto
aspectos que
Procedimientos generan
Métodos respuestas Respuestas relacionadas
a completar una tarea
Equipo

22
23

DISEÑO EXPERIMENTAL TRADICIONAL

Los inconvenientes del método tradicional


La estrategia experimental VUFCV presenta inconvenientes importantes cuando
existe interacción entre factores
24

CLASIFICACIONE DE LAS VARIABLES


Un PROCESO tiene cuatro categorías de VARIABLES

Variables de respuesta .- (outputs) Son medidas para evaluar el


desempeño de un proceso y/o producto.

Variables controladas y constantes.- Mediante el SOP


(procedimiento estándar de la operación)

Variables no controladas ( Ruido ).- Estas variables no pueden


mantenerse constantes ni durante la producción ni cuando es un
producto terminado. Esto hace un producto robusto.

Variables Clave en el Proceso.- Son las variables que intentaremos


variar durante el experimento para lograr la respuesta de mejora en el
producto.

24
25

Un DISEÑO EXPERIMENTAL además tiene otras categorías de VARIABLES

Variable independiente.
Es el factor (causa) que suponemos influye sobre la característica que medimos
(defecto, error, etc).

Variable dependiente.
Es aquella variable que se mide en cada observación del Experimento, para
establecer si la variable independiente efectivamente influye sobre sus valores.

Variables extrañas.
Son todas aquellas que el investigador no puede manipular, pero influyen en la
variable dependiente.

Variable de bloqueo.
Es una variable que sabemos puede intervenir en los niveles de la variable
dependiente y decidimos eliminar su influencia mediante el control de la
misma, creando bloques de observaciones, en los que esta variable, asume
respectivamente un valor constante
26
ETAPAS DE UN DISEÑO DE EXPERIMENTOS

PLANEACION Y REALIZACION
Definir los
sujetos sobre
Decidir el los que se va a
número de realizar la
repeticiones medida.
Establecer los para cada
tratamientos tratamiento

Identificar la
variable
independiente

Definir
claramente la Realización del
hipótesis a Experimento
comprobar
Asegurarse de la
aptitud del Diseño
del Experimento
para contestar la
Identificar
pregunta inicial
posibles factores
de "ruido" y/o
variables de
bloqueo
Explicitar el
procedimiento
de
aleatorización

Determinar
la variable
dependiente.

26
27

Paso 1: Definir claramente la hipótesis a comprobar

Es de importancia fundamental identificar de forma muy


específica el objetivo del Experimento, es decir, la
pregunta exacta que se quiere contestar o la hipótesis que
se necesita contrastar.

¿Qué es una hipótesis?


Características de una Hipótesis

Tipos de hipótesis

27
27
28

Paso 2. Definir los objetivos del diseño


• 1. Comparar a dos o más materiales con el fin de elegir al que mejor cumple
• los requerimientos.
• 2. Comparar varios instrumentos de medición para verificar si trabajan con la
• misma precisión y exactitud.
• 3. Determinar los factores (las x vitales) de un proceso que tienen impacto
• sobre una o más características del producto final.
• 4. Encontrar las condiciones de operación (temperatura, velocidad, humedad,
• por ejemplo) donde se reduzcan los defectos o se logre un mejor desempeño
• del proceso.
• 5. Reducir el tiempo de ciclo del proceso.
• 6. Hacer el proceso insensible o robusto a oscilaciones de variables
ambientales.
• 7. Apoyar el diseño o rediseño de nuevos productos o procesos.
• 8. Ayudar a conocer y caracterizar nuevos materiales
29

Paso 3. Determinar cuáles factores deben


estudiarse o investigarse, de acuerdo
a la supuesta influencia que tienen sobre la
respuesta.
No se trata de que el experimentador tenga que saber a priori
cuáles factores influyen, puesto que precisamente para eso es
el experimento, pero sí de que utilice toda la información
disponible para incluir aquellos que se considera que tienen un
mayor efecto.
Paso 4: Identificar la variable
independiente
La variable independiente representa la característica que,
suponemos, influye sobre los valores de la variable
dependiente.
29
29 .
30

Paso 5: Establecer los tratamientos

En base a la naturaleza de la variable,


las condiciones reales del proceso o
situación y la pregunta específica que
se quiere contestar, se identificarán los
valores o el recorrido de valores de la
variable independiente, relevantes para
el Experimento y se establecerán los
tratamientos a efectuar.
30
30
31

Paso 6: Decidir el número de


repeticiones para cada tratamiento

Es absolutamente aconsejable realizar


varias observaciones para cada nivel
de tratamiento (condición
experimental), para que los errores de
medida e influencias no controladas de
variables extrañas puedan
contrarrestarse entre sí.
31
31
32

Paso 7: Definir los sujetos sobre los


que se va a realizar la medida.
Determinar cuales son los sujetos a
medir o evaluar. (¿van a ser
agrupados?)

32
32
33

Paso 8: Determinar la variable


dependiente.
• Sólo puede existir una única variable
dependiente. Esta deberá tener,
necesariamente, un nivel de medida
continuo, o lo más próximo a ese extremo
que sea posible.
• Cuantas más posibilidades de apreciar
diferencias entre distintas observaciones
ofrezca la variable dependiente, más se
favorecerá la sensibilidad de la misma a
los distintos tratamientos.
33
33
34

Paso 9: Explicitar el procedimiento


de aleatorización
Esta es una parte muy importante del
Diseño, ya que asegurará que las
diferencias que se encuentren entre los
tratamientos son debidas a ellos
mismos y no a efectos laterales no
deseados.
TIPOS DE MUESTREO

34
34
35

Paso 10: Identificar posibles


factores de "ruido" y/o variables de
bloqueo
• Analizar la futura situación
experimental e identificar los factores
que puedan, además de la variable
independiente, influir sobre los valores
de la variable dependiente.

35
35
36

Paso 11: Asegurarse de la aptitud


del Diseño del Experimento para
contestar la pregunta inicial
Comprobar que el tipo de resultados
que obtendremos del Experimento tal y
como lo hemos planificado, nos
proporcionará efectivamente la
información que necesitamos.
El resultado de este paso será el
Diseño, propiamente dicho, del
Experimento.
36
36
37

Paso 12: Realización del Experimento


Se crearán las condiciones experimentales
(tratamientos) y se efectuarán las
observaciones según el plan establecido,
teniendo un cuidado particular en evitar
posibles influencias extrañas sobre los
valores de la variable dependiente.

Se registrarán los resultados del


Experimento, anotando además toda la
información posiblemente relevante sobre las
circunstancias prácticas de cada observación.
(Persona que realiza la medición, hora,
temperatura, etc...).
37
37
38

TIPOS DE EXPERIMENTOS
• El experimento absoluto en el cual el interés principal es
la estimación y las propiedades físicas de la población a
ser estudiada

• El experimento comparativo. Frecuentemente cuando se


estudia un grupo de tratamientos, los resultados
absolutos varían erráticamente mientras que los
resultados relativos permanecen razonablemente
estables
39

PROPIEDADES DEL DISEÑO


EXPERIMENTAL
1. El experimento comparativo comienza con un
planteamiento exacto del problema a ser resuelto.
2. Como lo fundamental en la decisión sobre las hipótesis
1. Simplicidad
2. Grado de precisión
3. Ausencia de error sistemático
4. Rango de validez de las conclusiones
5. Calculo del grado de incertidumbre
3. Aleatorización
4. Réplicas
5. Bloqueo
40

Consideraciones prácticas sobre el Uso de


métodos estadísticos
El conocimiento no estadístico es vital. Se requiere que el experimentador
tenga un buen nivel de conocimiento técnico y práctico sobre el fenómeno o
proceso que estudia.

Reconocer la diferencia entre significancia estadística e importancia práctica.


En ocasiones, un experimentador puede concluir que dos tratamientos son
diferentes estadísticamente, pero que tales diferencias, aunque sean significativas,
no necesariamente representan una diferencia que en la práctica sea importante

Apostarle más a la experimentación secuencial que a un experimento único


y definitivo. En una sola fase de experimentación no es posible contestar todas
sus interrogantes sobre un proceso o fenómeno en particular.

40
41

Clasificación y selección de los diseños


experimentales
Los cinco aspectos que más influyen en la selección de un diseño experimental,
en el sentido de que cuando cambian por lo general nos llevan a cambiar de
diseño, son:
1. El objetivo del experimento.
2. El número de factores a estudiar.
3. El número de niveles que se prueban en cada factor.
4. Los efectos que interesa investigar (relación factores-respuesta).
5. El costo del experimento, tiempo y precisión deseada
El objetivo del experimento

1. Diseños para comparar dos o más tratamientos.


2. Diseños para estudiar el efecto de varios factores sobre la(s) respuesta(s).
3. Diseños para determinar el punto óptimo de operación del proceso.
4. Diseños para la optimización de una mezcla.
5. Diseños para hacer el producto o proceso insensible a factores no
controlables.
41
42

42
43

PREGUNTAS
Se tiene un experimento en el que los factores a estudiar y sus niveles
son los siguientes: temperatura (10, 20 y 30°C); tiempo (60 y 90 minutos).
Elabore una lista de todos los posibles tratamientos de este diseño

Se quiere comparar el desgaste de dos marcas de llantas A y B, para lo


cual se eligen al azar 10 conductores particulares de cierta ciudad. A cinco
de ellos, seleccionados al azar, se les instalan gratis las llantas marca A y
a los cinco restantes la marca B, con el compromiso por escrito de permitir
la verificación del desgaste cada seis meses.
a) ¿Cree que este experimento permita una comparación justa del
desgaste de las dos marcas de llantas?
b) ¿Qué consideraciones se debieron hacer para lograr una comparación
más justa?
c) Proponga al menos un cambio al experimento que usted considera que
mejoraría la comparación.

43
44

Una compañía farmacéutica realizó un experimento para


comprobar los tiempos promedio (en días), que son
necesarios para que una persona se recupere de los efectos y
las complicaciones que siguen a un resfriado común. En este
experimento se compararon a personas que tomaron distintas
dosis diarias de vitamina C. Para hacer el experimento se
contactó a un número determinado de personas, que en
cuanto les daba el resfriado empezaban a recibir algún tipo de
dosis. Si la edad de las personas es una posible fuente de
variabilidad, explique con detalle cómo aplicaría la idea de
bloqueo para controlar tal fuente de variabilidad.

44
45

Un grupo de investigadores trabaja para industrializar la mermelada de


tuna; para ello, realizan mermeladas considerando los siguientes factores:
a) variedad de tuna: tres tipos, b) con cáscara o sin cáscara, c) completa
o la pura pulpa. Por lo tanto, se tienen 12 posibles formas (tratamientos)
de producir mermelada.
La pregunta central que se plantean es si influyen en el sabor los factores
considerados, y quisieran encontrar cuál es la mejor combinación de
mermelada (tratamiento ganador). Para responder hicieron las 12
combinaciones y pusieron cada una en un recipiente numerado.
Enseguida se trasladaban a lugares concurridos donde acomodaban los
recipientes ordenados del 1 al 12, y a personas del público les entregaban
una hoja de registro y la invitaban a que en el orden dado probaran en
pequeñas porciones las mermeladas y anotaran qué tan buena les
parecía la mermelada (en una calificación entre 0 a 10). Al final se tuvo la
respuesta de 420 personas, donde cada una daba 12 calificaciones (una
para cada mermelada). ¿Hay algo que desde su punto de vista invalide
los resultados obtenidos?

45
46

Estadística
47

ANALISIS

En esta etapa no se debe perder de vista que los resultados experimentales son
observaciones muestrales, no poblacionales. Por ello, se debe recurrir a métodos
estadísticos inferenciales para ver si las diferencias o efectos muestrales
(experimentales) son lo suficientemente grandes para que garanticen diferencias
poblacionales (o a nivel proceso).
ANOVA
En el ANOVA se comparan siempre las medias de varias poblaciones y se hace
a través de un contraste de hipótesis

Un factor en ANOVA es una variable cualitativa que genera o que contempla una
serie de poblaciones a comparar.

Un factor puede ser fijo o aleatorio. Fijo es cuando los niveles que se estudian
son los únicos niveles que interesan. Aleatorio es cuando los niveles que se
estudian es una muestra de niveles.

Cuando tenemos dos o más factores éstos pueden estar, entre sí, dos a dos,
cruzados o anidados. Dos factores están cruzados cuando todos los niveles de
47un factor se cruzan, se combinan, con todos los niveles del otro factor.
48

Dos factores están anidados (uno dentro de otro) cuando los niveles de uno se
combinan, jerárquicamente, entre los niveles del otro.

En ANOVA, como técnica de comparación que es, el objetivo es contrastar la


Hipótesis nula de igualdad de niveles de un factor versus la Hipótesis
alternativa de no igualdad de esos niveles

El análisis de la varianza permite contrastar la hipótesis nula de que las medias


de K poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por
lo menos una de las poblaciones difiere de las demás en cuanto a su valor
esperado.

Este contraste es fundamental en el análisis


de resultados experimentales, en los que
interesa comparar los resultados de K
'tratamientos' o 'factores' con respecto a la
variable dependiente o de interés.
49

INTERPRETACION

Aquí, con el respaldo del análisis estadístico formal, se debe analizar con detalle lo
que ha pasado en el experimento, desde contrastar las conjeturas iniciales con los
resultados del experimento, hasta observar los nuevos aprendizajes que sobre el
proceso se lograron, verificar supuestos y elegir el tratamiento ganador, siempre
con apoyo de las pruebas estadísticas

CONTROL Y CONCLUSIONES FINALES

Para concluir el estudio experimental se recomienda decidir qué medidas


implementar para generalizar el resultado del estudio y para garantizar que las
mejoras se mantengan.

49
50

Elementos de inferencia estadística:


experimentos con uno y dos tratamientos
Población finita
Es aquella en la que se pueden medir todos los individuos para tener un conocimiento exacto de sus
características.

Parámetros
Características que, mediante su valor numérico, describen a un conjunto de elementos o individuos.

Población infinita
Es aquella en la que la población es grande y es imposible e incosteable medir a todos los individuos.

Muestra representativa
Es una parte de una población, seleccionada adecuadamente, que conserva los aspectos clave de la
población.

Inferencia estadística
Son las afirmaciones válidas acerca de la población o proceso basadas en la información contenida en la
muestra.

Estadístico
Cualquier función de los datos muestrales que no contiene parámetros desconocidos

50
51
52

Planteamiento de una hipótesis estadística


Hipótesis estadística
Es una afirmación sobre los valores de los parámetros de una población o proceso,
que puede probarse a partir de la información contenida en una muestra

Por ejemplo,
En un proceso se establece la afirmación “este proceso produce menos de 8% de
defectuosos” se puede plantear estadísticamente, en términos de la proporción p
desconocida de artículos defectuosos que genera el proceso, como se hace a
continuación.

Ho : p = 0.08 (la proporción de defectuosos es 0.08)


HA1 : p < 0.08 (la proporción es menor a 0.08)

A la expresión Ho : p = 0.08 se le conoce como hipótesis nula y HA : p < 0.08


se le llama hipótesis alternativa.
53

HA1 se conoce como hipótesis alternativa de un solo lado (unilateral), ya


que la única manera de rechazar H0 es teniendo valores de la proporción
muestral p significativamente más pequeños que 0.08. Asimismo

HA2 se llama hipótesis alternativa de dos lados (bilateral), ya que la


evidencia en contra de H0 se obtiene con valores pequeños o grandes de la
proporción muestral p
54
Estadístico de prueba
Número calculado a partir de los datos y de H0, cuya magnitud permite discernir
si se rechaza o no la hipótesis nula.

Región de rechazo
Es el conjunto de posibles valores del estadístico de prueba que llevan a
rechazar la hipótesis nula.

Región de aceptación
Son los posibles valores del estadístico de prueba donde no se rechaza la
hipótesis nula
Prueba para la proporción

Por ejemplo, supongamos que se toma una muestra de n = 150 piezas y de ellas
x = 20 son defectuosas
55
56
57

Error tipo I Es cuando se rechaza una H0 que es verdadera.


Error tipo II Es cuando se acepta una H0 que es falsa.
GRÁFICOS PRUEBAS DE UNA Y DOS
COLAS

Prueba de cola inferior Prueba de cola superior Prueba de 2 colas

Nivel de significación 0.05 0.01


Valores críticos de z para ensayos de una cola
Valores críticos de z para ensayos de dos colas
59

Anova de un factor
• ANOVA de un factor (también llamada ANOVA unifactorial
o one-way ANOVA en inglés) es una técnica estadística
que señala si dos variables (una independiente y otra
dependiente) están relacionadas en base a si las medias
de la variable dependiente son diferentes en las
categorías o grupos de la variable independiente

• ANOVA de un factor compara las medias de la variable


dependiente entre los grupos o categorías de la variable
independiente
60

Anova de dos factores


• Usaremos el análisis doble de la varianza para estudiar
los posibles efectos causados por diferentes niveles de
dos factores sobre la variable dependiente
• Modelo sin interacción
(Variación total en los datos) = (Variación debida al primer
factor) + (Variación debida al segundo factor) + (Variación
debida al error aleatorio)
• Modelo con interaccion
• (Variación total en los datos) = (Variación debida al primer
factor) + (Variación debida al segundo factor) + (Variación
debida a la interacción entre factores) + (Variación debida
al error aleatorio)
61

Prueba para la media

Prueba para la media con varianza desconocida

Sea X una variable aleatoria con distribución normal con media m y varianza s2,
ambas desconocidas. Se quiere probar la hipótesis de que la media es igual a cierto
valor µ0. Es decir, la hipótesis a probar es

Para probar esta hipótesis se toma una muestra aleatoria de tamaño n de los
posibles valores de la variable X y se calcula el estadístico de prueba:
donde S es la desviación estándar de los
datos. Bajo el supuesto de que H0 es
verdadera, este estadístico se distribuye T
de Student con n – 1 grados de libertad.

Se rechaza H0 si el valor absoluto del


estadístico de prueba es mayor que el
valor crítico de la distribución, es decir, se
rechaza H0 si |t0 | > ta/2
62

Peso de costales. Un fabricante de dulces compra costales de azúcar a cierto


ingenio. Según los vendedores, los costales tienen un peso medio de 50.1 kg, con
una varianza de (s2 = 0.5). El comprador sospecha que el peso medio es menor.
Para confirmar su sospecha decide contrastar las hipótesis

con un nivel de significancia de 5% (a = 0.05). Para ello, selecciona de manera


aleatoria tres bultos de cada uno de los siguientes cinco pedidos. Pesa los 15
bultos y obtiene que X=49.4 y S2 = 1.2. De esta manera, el estadístico de prueba
calculado de acuerdo con la expresión está dado por

De las tablas de la distribución T de Student con n – 1 = 14 grados de libertad, para


a = 0.05, se lee el valor crítico t0.05, 14 = 1.76. Como t0 = –2.47 < –1.76 = –t0.05, 14, se
rechaza la hipótesis H0
63

Prueba para la varianza

Del ejercicio anterior se puede ver a simple vista que la varianza s2 = 0.5, declarada
por el vendedor, es bastante diferente que la varianza muestral S2 = 1.2, lo cual
lleva a sospechar que su afirmación sobre la varianza del proceso es falsa.

Sin embargo el hecho de que los dos números sean distintos no significa que
sean estadísticamente diferentes, de aquí la necesidad de contrastar o probar
las hipótesis:

Ho : s2 = 0.5
HA2 : s2 > 0.5
Para probar esta hipótesis y bajo el supuesto de distribución normal, se utiliza el
siguiente estadístico de prueba
64
65

Si aplicamos lo anterior al caso de la varianza del peso de los costales,


obtenemos que
EJEMPLOS DE ENSAYOS CON MEDIAS Y PROPORCIONES

• Ejemplo No. 1 Se estima que el peso medio de los alumnos de la


unicauca es de 145 libras. La desviación estándar es de 12 libras. Para
probar esa hipótesis se obtuvo una muestra de 40 alumnos del total que
asisten a la Escuela, determinándose un peso promedio de 139.5 Lbs.
Probar dicha hipótesis con un nivel de significancia α = 0.05

• Formulación:
• Paso 1: Parámetro de interés 𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
• Paso 2: Plantear la Hipótesis nula 𝐻0 y alterna 𝐻1 :
• 𝐻0 : 𝜇 = 𝜇0 = 145 (Peso medio verdadero poblacional)
• 𝐻1 : 𝜇 ≠ 𝜇0 ≠ 145 (Peso de la prueba).
• Paso 3: Establecer Nivel de significancia y criterios de prueba α = 0.05
(Los valores críticos de x pueden obtenerse de la tabla de áreas bajo la
curva normal tipificada; y en este caso, la hipótesis alterna sugiere una
región crítica de 2 colas, con α/2= 0.25 de área por cada lado. (Ver fig. 4)
Los valores críticos + 1.96 y – 1.96 se obtienen de la tabla de áreas
𝜎
bajo la curva normal tipificada z, con (1 - 𝛼) = 0.95: 𝜇0 ± 𝑍𝛼 = 0.475
𝑛
para cada lado, y arroja el punto 1.96 a la derecha de 𝜇0 ; y por simetría, -
1.96 en la parte izquierda de la misma. (Ver tabla 1 fig. 3)
• Paso 4. Determinar el valor estadístico de prueba. Se trata de un
estadístico z con σ desconocido, con un tamaño muestral grande decir, n
≥ 30 𝜇 𝑦 𝑠 𝑐𝑜𝑛𝑐𝑜𝑐𝑖𝑑𝑜𝑠 (aplica el T.C.L.). Caso 2b
𝒙ഥ −𝝁𝟎
• z= ~ N(0, 1) ഥ = 139.5, μ = 𝝁𝟎 = 145, 𝒔 = 12 lbs y n =
𝒙
𝒔/ 𝒏
40
𝟏𝟑𝟗.𝟓 −𝟏𝟒𝟓
• z= = - 2.89 ; y por simetría, + 2.89 ; z ±𝟐. 𝟖𝟗
𝟏𝟐/ 𝟒𝟎

• Paso 5. Se toma la decisión. Se rechaza 𝐻0 porque el valor crítico o 𝒁𝜶


del estadístico queda dentro de la región de rechazo (𝑧1 < 𝑧𝛼 < -1.96 y
𝑧2 > 𝑧𝛼 > +1.96).
• Paso 6. Conclusión: Se rechaza la hipótesis nula porque los resultados
experimentales de la media muestral observados contradicen la
suposición de la media poblacional planteada, y no es significativa en el
valor pedido de 0.05; ni siquiera para el valor 0.01 porque sus valores
críticos se manejan entre ± 2.58 (Ver Tabla 3, Áreas bajo la curva
normal tipificada.
• Ejemplo No. 3. Un fabricante afirma que al menos el 95% de los
equipos que suministra a una factoría cumple con las
especificaciones requeridas. Un examen sobre una muestra de
200 de tales equipos reveló que 18 eran defectuosos. Probar esa
afirmación del fabricante al nivel de significación del 0.05

• Formulación:
• Paso 1. Determinar parámetro de interés: p
• Paso 2. Expresar la hipótesis nula y alterna en términos del
parámetro de interés: 𝐻0 : 𝑝 = 𝑝0 ≥ 0.95 ; 𝑝0 = 0.95 calidad
aceptable
• 𝐻1 : 𝑝 = 𝑝1 < 0.95; 𝑝1 = 0.94 calidad no aceptable
• Paso 3. Establecer Nivel de significancia y criterios de prueba α =
0.05 (Los valores críticos de x pueden obtenerse de la tabla de
áreas bajo la curva normal tipificada; y en este caso, el signo de
la hipótesis alterna sugiere una región crítica del lado izquierdo -
1.645 (Prueba de cola inferior).

El valor crítico - 1.64, y con mayor exactitud -1.645, se obtiene de la
𝜎
tabla de áreas bajo la curva normal tipificada z que va de 𝜇0 ±𝑧𝑎 =
𝑛
0.45 + 0.5 = 0.95, por ser ensayo unilateral o de cola inferior = (1 –
α).
• Paso 4. Determinar el valor estadístico de prueba. Se trata de un
estadístico con P y p conocidos, con un tamaño muestral grande n ≥
30 (Aplica el T.C.L.). Caso 4
• 𝑷𝒔 = X/n = 82Τ200 = 0.41
𝑷𝒔 −𝒑 0.41 −0.95
• Valor Estadístico z = 𝒑𝒒Τ = = - 2.27
𝒏 .95 (.05)ൗ
200
• Paso 5. Se toma la decisión. Se rechaza 𝐻0 para este nivel de
significancia porque 𝒁𝜶= 1.645 del estadístico queda dentro de la
región de rechazo en este ensayo unilateral o de cola inferior (z < 𝑧𝛼 ,
• - 2.27 < -1.645).
• Paso 6. Conclusión: Se rechaza la hipótesis nula porque los
resultados experimentales observados contradicen la afirmación del
fabricante , y no es significativa en el valor pedido de 0.05; ni siquiera
para el valor 0.01 porque sus valores críticos se manejan entre +2.33
y – 2.33 (Ver Tabla 1 Fig. 3 Valores 𝒛𝜶 para niveles 0.05 y 0.01, una y
dos colas).
72

• Problemas propuestos
• 1. Se sabe que las calificaciones obtenidas en un cierto examen
se distribuyen normalmente, con una media aritmética de 7.57. Un
profesor afirma que si el examinador adopta una actitud agresiva
ante los alumnos, el promedio de calificaciones será diferente al
establecido. Para probar los anterior, aplicó el examen con una
actitud agresiva a 40 alumnos elegidos aleatoriamente y encontró
una media aritmética de 7.1 y una desviación estándar de 0.09.
Vamos a probar con 𝛼 = 0.01 la hipótesis del profesor.

• 2. El director de una escuela informa que el promedio de minutos


empleados a estudiar por todos los alumnos, es de 50 minutos.
Sin embargo un profesor considera que el tiempo promedio
dedicado a estudiar por todos los alumnos es menor, y escoge una
muestra aleatoria de 25 alumnos obteniendo una media aritmética
de 42 minutos y una desviación estándar de 7 minutos.
¿Proporciona esta información evidencia suficiente para la
consideración del profesor? Use 𝛼 = 0.05
73

• 3. El fabricante de una patente médica sostiene que la misma


tiene un 90% de efectividad en el alivio de una alergia, por un
periodo de 8 horas. En una muestra de 200 individuos que tenían
la alergia, la medicina suministrada alivió a 160 personas.
Determinar si la aseveración del fabricante es cierta al nivel de
significación de 0.01
• 4. Supóngase que se desea evaluar el aserto de un fabricante
que establece que sus llantas radiales tiene un promedio de vida
de, por lo menos 40 000 millas. Para probar esta hipótesis se
toma una muestra de n = 49, con un valor medio muestral de
38000 millas. Si se sabe que el recorrido de los neumáticos de la
población tiene una desviación estándar de 3500 millas, probar la
afirmación con un 𝛼 = 0.05
• 5. Una muestra aleatoria de 100 muertes registradas en los EE
UU durante el año pasado mostró una vida promedio de 71.8
años. Suponiendo una desviación estándar poblacional de 8.9
años, ¿parecería esto indicar que la vida promedio hoy en día es
mayor que 70 años?. Use 𝛼 = 0.05
74
Intervalo de confianza media
Rango donde se estima que está el valor de un parámetro
poblacional.
se trata de encontrar dos números L y U, tales que el parámetro m se
encuentre entre ellos con una probabilidad de 1 – a

P(L ≤ m ≤ U) = 1 – a
𝑠 𝑠
𝐿 = 𝑋ത + 𝑡𝛼/2 𝐿 = 𝑋ത − 𝑡𝛼/2
𝑛 𝑛
Intervalo para la varianza
De manera similar a como se obtiene el intervalo para la media, es posible deducir
intervalos de confianza para cualquier parámetro. En particular, para construir un
intervalo de confianza para la varianza s2

(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
≤ 𝜎 ≤ 2
 𝛼,𝑛−1
2  1−𝛼,𝑛−1
2 2
75

En el proceso de fabricación de discos para computadoras,


una de las variables críticas es el rendimiento de formato.
Se toma una muestra aleatoria de n = 10 discos de la
producción del turno de la mañana. Se formatean y se
reporta el rendimiento de cada disco. Los datos obtenidos
son: 96.11, 91.06, 93.38, 88.52, 89.57, 92.63, 85.20, 91.41,
89.79, 92.62. Con base en estos datos interesa estimar
puntualmente y por intervalo la media y la desviación
estándar para la población de discos de dicho turno.

Los estimadores puntuales para la media y la desviación estándar resultan


ser
76
77
78

Suponiendo distribución normal, el intervalo al 95% de confianza para la


media m está dado por

donde el valor del punto crítico ta/2 = t0.025 = 2.26

El correspondiente intervalo para la desviación estándar s se obtiene sacando la


raíz cuadrada al intervalo para la varianza s2
79

Tres criterios de rechazo o aceptación equivalentes


Existen tres criterios equivalentes para decidir cuándo rechazar la hipótesis
nula y, en consecuencia, aceptar la hipótesis alternativa. La equivalencia es
en el sentido de que los tres llevan invariablemente a la misma decisión en
términos de rechazar o no a H0. Sin embargo, algunos de estos métodos
proporcionan información adicional sobre la decisión que se está tomando

Estadístico de prueba frente a valor crítico


Este método consiste en rechazar H0 si el estadístico de prueba cae en la
región de rechazo que está delimitada por el valor crítico.

Significancia observada frente a significancia predefinida


Significancia predefinida
Es el riesgo máximo que el experimentador está dispuesto a correr con
respecto al error tipo I.
Significancia observada
Es el área bajo la distribución de referencia más allá del valor del
estadístico de prueba. Se conoce como valor-p.
80

De lo anterior se desprende que H0 se rechaza si la


significancia observada es menor que la significancia
dada, o sea, si valor-p < a.
Intervalo de confianza
En este método se rechaza H0 si el valor del parámetro declarado en la
hipótesis nula se encuentra fuera del intervalo de confianza para el mismo
parámetro
Hipótesis para dos medias: comparación de dos
tratamientos

Un problema frecuente que se presenta es comparar la media de dos


procesos o dos tratamientos. Por ejemplo, comparar dos proveedores, dos
materiales, dos máquinas o dos métodos de trabajo.
81

Suposición de varianzas desconocidas. Sean dos procesos o


tratamientos con medias mx y my y varianzas s2x y s2y,
respectivamente.
Interesa investigar si las medias de dichos procesos pueden
considerarse estadísticamente iguales. Para ello se plantean las
siguientes hipótesis

Para probar H0 se toman dos muestras aleatorias, como en


el ejemplo de las máquinas antes descritas, de tamaño nx la
del proceso X, y de tamaño ny la del proceso Y; en general,
es recomendable que nx = ny = n, pero también puede
trabajarse con nx ≠ ny si no pudieran tomarse iguales
82

el cual sigue una distribución T de Student con


nx + ny – 2 grados de libertad

S2p es un estimador de la varianza muestral común,


suponiendo que dichas varianzas desconocidas sean
iguales, y se calcula como

Se rechaza H0 si |t0| > ta/2, donde ta/2 es


el punto a/2 de la cola derecha de la
distribución T de Student con nx + ny – 2
grados de libertad

En ocasiones las varianzas no son iguales, o no existen datos


históricos sobre los dos tratamientos que permitan suponer algo
pertinente sobre las varianzas.
Por ejemplo, al comparar dos proveedores del mismo material puede no
haber razones para suponer de antemano que las varianzas de cada uno
de ellos sean iguales o parecidas
83

Comparación de dos centrifugadoras. La calidad de la pintura látex


depende, entre otras cosas, del tamaño de la partícula. Para medir esta
característica se utilizan dos centrifugadoras, y se sospecha que éstas
reportan mediciones distintas para la misma pintura. Se decide hacer un
estudio que permita comparar las medias y las varianzas reportadas por
los dos equipos; para lo cual, de un mismo lote de pintura se tomaron 13
lecturas con cada centrifugadora. Los resultados son los siguientes:
84

cuyos grados de libertad v (nu) se calculan mediante la


relación

Prueba para la igualdad de varianzas

sigue una distribución F con nx – 1


grados de libertad en el numerador y ny – 1
grados de libertad en el denominador.
85

En la elaboración de envases de plástico es necesario garantizar que


cierto tipo de botella en posición vertical tenga una resistencia mínima de
50 kg de fuerza. Para garantizar esto, en el pasado se realizaba una
prueba del tipo pasa-no-pasa, donde se aplicaba la fuerza de 50 kg y se
veía si la botella resistía o no. En la actualidad se realiza una prueba
exacta, en la que mediante un equipo se aplica fuerza a la botella hasta
que ésta cede, y el equipo registra la resistencia que alcanzó la botella.

a) ¿Qué ventajas y desventajas tiene cada método de prueba?


b) Para evaluar la resistencia media de los envases se toma una muestra
ത 55.2 y S =
aleatoria de n = 20 piezas. De los resultados se obtiene que 𝑋=
3. Estime con una confianza de 95%, ¿cuál es la resistencia promedio de
los envases?
c) Antes del estudio se suponía que m = 52. Dada la evidencia de los
datos, ¿tal supuesto es correcto?
d ) Con los datos anteriores, estime con una confianza de 95%, ¿cuál es
la desviación estándar poblacional (del proceso)?
86

Para evaluar el contenido de nicotina en cierto tipo de cigarros elaborados


por un proceso, se toma un muestra aleatoria de 40 cigarrillos y se
ത 18.1 mg y S = 1.7.
obtiene que 𝑋=

a) Estime con una confianza de 95%, ¿cuál es la cantidad de nicotina


promedio por cigarro?

b) Antes del estudio se suponía que m = 17.5. Dada la evidencia de los


datos, ¿se puede rechazar tal supuesto?

c) Con los datos anteriores, estime con una confianza de 95%, ¿cuál es la
desviación estándar poblacional (del proceso)?

d) ¿Qué puede decir sobre la cantidad mínima y máxima de nicotina por


cigarro? Es posible garantizar con suficiente confianza que los cigarros
tienen menos de 20 mg de nicotina.
87

Es un prueba basada en el análisis de varianza, en donde la


varianza total se descompone en la “varianza de los
tratamientos” y la “varianza del error”. El objetivo es
determinar si existe un diferencia significativa entre los
tratamientos, para lo cual se compara si la “varianza del
tratamiento” contra la “varianza del error” y se determina si la
primera es lo suficientemente alta según la distribución F.
88

La homogeneidad de las unidades experimentales es fundamental puede


lograrse ejerciendo un control local apropiado (seleccionando sujetos o
plantas de una misma edad, raza, variedad o especie).

Este diseño en su estructura no se ve afectado


por el numero igual o desigual de observaciones
por tratamiento

Se definen los t tratamientos que se van a aplicar a las n


unidades experimentales, de tal forma que a r unidades
experimentales les va a corresponder un tipo de
tratamiento. Las unidades experimentales se sortean
para la asignación a cada tratamiento. Se define la
variable a medir.
89

Modelo aditivo lineal


Es una expresión algebraica que condensa todos los factores presentes
en la investigación. Resulta útil para sintetizar que factores son
independientes o dependientes, cuales son fijos o aleatorios, cuales
cruzados o anidados
90

¿Qué es un factor cruzado?

Dos factores están cruzados cuando


cada nivel de un factor ocurre en
combinación con cada nivel del otro
factor.

¿Qué es un factor anidado?


Dos factores están anidados cuando los
niveles de un factor son similares pero
no idénticos, y cada uno ocurre en
combinación con diferentes niveles del
otro factor.
91
92

En ANOVA, los factores son fijos o aleatorios.

Por lo general, si el investigador controla los niveles de un


factor, el factor es fijo.

Por el contrario, si el investigador toma una muestra


aleatoria de los niveles de un factor de una población, el
factor es aleatorio.
93

Supongamos que usted tiene un factor denominado


"operador" y que éste tiene tres niveles.

Si usted selecciona intencionalmente estos tres


operadores y desea que los resultados se apliquen
únicamente a estos operadores, el factor es fijo.

Sin embargo, si toma una muestra aleatoria de tres


operadores en un número más grande de
operadores y desea que sus resultados se apliquen
a todos los operadores, el factor es aleatorio
94

Suponga que tenemos 4 dietas diferentes que queremos comparar. Las


dietas están etiquetadas como A, B, C y D. Estamos interesados en
estudiar si las dietas afectan la tasa de coagulación en conejos. La tasa de
coagulación es el tiempo en segundos que tarda una cortada en dejar de
sangrar. Se tienen 16 conejos para el experimento por lo que se usaran 4
en cada dieta. Los conejos están en una jaula grande hasta que inicie el
experimento, momento en que se transfieren a otras jaulas.

Como asignamos los conejos a los cuatro grupos?


95

Modelo 1

Los conejos se atrapan «al azar». Se atrapan cuatro conejos y se les asigna
la dieta A. Se atrapan otros cuatro y se les asigna la dieta B y así
sucesivamente.

Modelo 2

Atrapar todos los conejos y etiquetarlos del 1 al 16, seleccionar cuatro


números aleatorios (sin reposición) y se ponen los conejos con esta etiqueta
Modelo 3
en una jaula A, los siguientes cuatro en la jaula B y así sucesivamente.
Atrape a todos los conejos y márquelos del 1 al 16. Ponga 16 pedazos de
papel en una urna con las letras A, B, C y D, repetidas 4 veces, ponga otros
16 pedazos de papel numerados del 1 al 16 en otra urna, tomar un papel de
cada urna el conejo con el numero seleccionado es adicionado a la dieta
asignada, las jaulas se acomodan de la siguiente forma

A A A A
B B B B
C C C C
D D D D
96

Modelo 4

Marque las jaulas del 1 al 16. En otra urna ponga 16 pedazos de papel,
marcados con las letras A, B, C y D. Atrape un conejo. Seleccione un número
y una letra de cada urna. Ponga el conejo en la jaula indicada por el número
escogido y asígnelo a la dieta indicada por la letra.

1 5 9 13
2 6 10 14
3 7 11 15
4 8 12 16

1C 5A 9B 13 D
2D 6B 10 D 14 C
3C 7B 11 A 15 D
4A 8A 12 C 16 B
97

Hipótesis de un diseño completamente al azar

En un diseño completamente al azar,

La hipótesis nula es que los efectos de tratamientos (β) son todos iguales,
lo que se expresa por: H0: β1 = β2 = β2 .. . . . .

La hipótesis alterna es que hay al menos un efecto de tratamiento que es


diferente a los demás.

Para probar la hipótesis, en la tabla ANOVA se comparan los cuadrados


medios de tratamientos respecto a los cuadrados medios del error, los
primeros deben ser suficiente mayores que los segundos..

Se realiza la comparación por la prueba F o por la probabilidad, si Fc es


mayor que Ft se rechaza H0 y por probabilidad cuando la p<0.05 se
rechaza H0
98

ANOVA
Repeticiones Yi.
Trat 1 2 3 4 Rep

1 Y11 Y12 Y12 . . . Y1j Y1 .


2 Y21 Y22 Y23 . . . Y2j Y2 .
3 Y31 Y32 Y33 . . . Y3j Y3 .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
i Yi1 Yi2 Yi3 . . . Yij Y ..
99

Ejemplo:

Se realizó un experimento para probar el efecto de cinco fuentes de energía


utilizadas en dietas para engorde de conejos (T1. Testigo, T2. Melaza, T3.
Cebo, T4.Maíz, T5. Sorgo) en las cuales se midió la ganancia de peso (GP)
durante el período de engorde. Se consideraron 5 repeticiones por
tratamientos (25 animales) y se planteó la hipótesis de igualdad de medias
de tratamientos

T1 T2 T3 T4 T5
REP 1 980 1200 1300 1400 1350
REP 2 1050 1230 1180 1350 1420
REP 3 1100 1150 1200 1380 1550
REP 4 1000 1390 1170 1420 1600
REP 5 1120 1250 1050 1500 1490
100

𝑌.. 2
𝐹. 𝐶 = =
σ𝑡𝑖=1 𝑛𝑖
101

FUENTE DE GRADOS SUMA DE CUADRADO Fo F


VARIACION LIBERTAD CUADRADOS MEDIO CALC TEOR
σ𝑡𝑖=1 𝑛1 𝑌ത𝑖. − 𝑌ത.. 2 𝑆. 𝐶. 𝑡 𝑎𝑡 𝐶. . 𝑡 𝑎𝑡
TRATAMIENOS t-1
𝑡−1 𝐶. . 𝑒 𝑜
𝑡

ERROR 𝑛𝑖 − 𝑡 σ𝑡𝑖=1 σ𝑛𝑖 𝑌𝑖 − 𝑌ത𝑖. 2 𝑆. 𝐶. 𝑒 𝑜


𝑖=1
𝑖=1 σ𝑡𝑖=1 𝑛𝑖 − 𝑡
𝑡

TOTAL 𝑛𝑖 − 1 σ𝑡𝑖=1 σ𝑛𝑖


𝑖=1 𝑌𝑖 − 𝑌ത.. 2
𝑖=1
102

𝑡
𝑛𝑖
5 5 5 5 5 25 𝑛𝑖
𝑖=1
𝑌𝑖. 5250 6220 5900 7050 7410 31830 𝑌..
𝑌ത𝑖. 𝑌
1050 1244 1180 1410 1482 1273.2 𝑌ത.. = ..ൗ 𝑡
𝑌𝑖. 2ൗ 𝑌𝑖 2ൗ
𝑛𝑖
𝑛𝑖
𝑛𝑖 5512500 7737680 6962000 9940500 10981620 41134300 𝑖=1
𝑡 𝑛
𝑌𝑖 2
𝑌𝑖 2
=1 5527300 7770000 6993800 9953300 11021500 41265900
=1 =1
𝑛𝑖
𝑌ത𝑖 2 𝑡 𝑛 𝑡
𝑌𝑖 2
14800 32320 31800 12800 39880 131600 𝑌𝑖 2 −
𝑌𝑖 2
ൗ𝑛
𝑛𝑖 𝑖
=1 𝑖=1
=1 =1

𝑌𝑖. − ഥ
𝑛𝑖 ഥ 𝑌.. 2 249091.2 4263.2 43431.2 93571.2 217987.2

σ𝑛𝑖
𝑖=1 𝑌𝑖 − ഥ
𝑌𝑖. 2
14800 32320 31800 12800 39880

σ𝑛𝑖
𝑖=1 𝑌𝑖 − ഥ
𝑌.. 2
263891.2 36583.2 75231.2 106371.2 257867.2
103

Paso 1. Determinar el factor de corrección


𝑌.. 2 31380 2
𝐹. 𝐶 = = = 40525956
σ𝑡𝑖=1 𝑛𝑖 25

41134300 − 40525956 = 608244

41265900 − 40525956
= 739944

Al menos un efecto de tratamiento que


es diferente a los demás.
105

En algunas ocasiones es necesario trabajar con unidades


experimentales muy grandes, una hacienda con una
producción de 10000 conejos, o realizar determinaciones
muy tediosas para realizarlas en toda la unidad
experimental

Se hace necesario extraer subunidades de cada unidad


experimental y esto genera un submuestreo de
observaciones por unidad experimental, lo que da origen a
muestras anidadas, dentro de otras.
106

Supongamos que en un centro de formación profesional se


estudia el porcentaje de aprobados en una materia, en los
grupos de mañana y de tarde. Por la mañana imparten la
asignatura dos personas y por la tarde tres. Cada persona da
clase a tres grupos y se supone que estos son réplicas (no
son fuente de variación).

Se dice que el factor


B está anidado en el
factor A, es decir
B ⊂A
107

Un experimentador puede estar interesado en probar ciertas raciones (R1, R2, …, Rk)
en n animales, pero para cada animal se realizaron dos determinaciones (nij=2) de los
porcentajes de grasa de la leche

En este caso en particular existen dos fuentes de variabilidad que contribuyen a formar
la varianza para las comparaciones entre los promedios:
1. El error debido al muestreo que es la variación entre las subunidades de una misma
unidad experimental y su valor se estima a través del cuadrado medio del error del
muestreo.
2. El error experimental que es la variación entre unidades experimentales sometidas a
un mismo tratamiento
108

Modelo aditivo lineal


Debe ser reformulado
109
110
111
112

Ventajas del diseño completamente al azar


1. Su flexibilidad, ya que permite una total libertad en el dispositivo
experimental, por un lado se puede probar cualquier numero de tratamiento
y por otro lado, el numero de observaciones por tratamiento puede ser igual
o desigual.
2. Maximiza los grados de libertad para estimar el error experimental
3. No se dificulta el análisis estadístico
4. Fácil de usar

Desventajas del diseño completamente al azar


1. Es apropiado para un numero pequeño de tratamientos.
2. Es apropiado solo en caso de disponer de material experimental homogéneo
3. Es tal vez el método menos sensible y tiene un poder analítico débil
113

Nace por la necesidad que tiene el investigador de ejercer un control local


de la variación debido a la existencia de un material experimental
heterogéneo.

Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un


factor, es deseable que las posibles diferencias se deban principalmente al
factor de interés y a no a otros factores que no se consideran en el estudio.
Cuando esto no ocurre y existen otros factores que no se controlan o
nulifican a la hora de hacer la comparación, las conclusiones podrían ser
afectadas sensiblemente.

El diseño en bloques completos al azar se aplica cuando el efecto de un


tratamiento a comparar depende de otros factores que pueden influir en el
resultado de experimento y que deben de tomarse en cuenta para anular
su posible efecto y evitar sesgo al comparar los factores de interés
114

Para evitar este sesgo se deben incluir estos factores adicionales en la


experimentación y probarlos con cada uno de los factores de interés de
manera tal que puedan presentarse todas las combinaciones posible entre
ambos para obtener resultados en la comparación que sean validos, esta
forma de nulificar su efecto se llama bloqueo.
115

Se utiliza cuando se sospecha o se tiene la certeza de que


existe un factor de confusión que puede alterar los resultados
de un experimento.
Los tratamientos se colocan en unidades compactas
denominadas bloques

HORARIO OPERADOR

CONDICIONES
LUGAR ATMOSFERICAS

FACTORES DE BLOQUEO
116

FACTORES DE BLOQUEO

Son variables adicionales al factor de interés


que se incorporan de manera explícita en un
experimento comparativo.

Factores de bloque que aparecen en la práctica


son: Turno, lote, día (tiempo), tipo de material,
línea de producción, operador, máquina,
método, etc.
117

El análisis de la varianza de un criterio (ANOVA) es una metodología para analizar la


variación entre muestras y la variación al interior de las mismas mediante la
determinación de varianzas. Es llamado de un criterio porque analiza un variable
independiente o Factor ej: Velocidad. Como tal, es un método estadístico útil para
comparar dos o más medias poblacionales. El ANOVA de un criterio nos permite poner
a prueba hipótesis tales como:
H 0  m1  m 2  m3  ....  m k
H1 : Al menos dos medias poblacionales son diferentes.
118

En este caso las fórmulas son parecidas a la del ANOVA de


una vía pero ahora agregando el cálculo por renglones
adicional al de columnas donde se incluye la variable de
bloqueo.
119
120

En muchos problemas de experimentos, es necesario hacer un diseño


de tal manera que la variabilidad proveniente de fuentes conocidas
pueda ser sistemáticamente controlada

Se pretende reducir el efecto de la variabilidad proveniente de causas


propias del experimento pero independiente del efecto que se desea
estudiar

Para los fines del análisis de varianza el bloqueo introduce un efecto


adicional ficticio, cuyo objetivo es separar del error experimental,
alguna fuente de variabilidad conocida
121

El Diseño en Bloque Completo al Azar es un plan en el


cual las unidades experimentales se asignan a grupos
homogéneos, llamados bloques, y los tratamientos son,
luego, asignados al azar dentro de los bloques

Objetivo del agrupamiento: lograr que las unidades


dentro de un bloque sean lo más uniformes posible con
respecto a la variable dependiente, de modo que las
diferencias observadas se deban realmente a los
tratamientos. Al controlar la variación dentro de los
bloques reducimos la variabilidad del error experimental

Completo: todos los tratamientos están


incluidos en cada bloque
122

a) Forma los bloques de unidades experimentales homogéneos


fundamentándose para ello en algún criterio de bloqueo o
agrupamiento. Estos criterios pueden ser: Raza, época, edad, sexo,
zona, país, numero de parto, corrales o establos, potreros, métodos
variedades, entre otros.

b) Luego de formados los bloques, se asignan al azar los tratamientos a


las unidades experimentales de cada bloque.

Modelo aditivo lineal


123

Bloque o repetición

Trat 1… 2… j… r total Media


blq

1 Y11 Y12 Y1j Y1r Y1. Ῡ1 .


2 Y21 Y22 Y2j Y2r Y2. Ῡ2 .
3 Y31 Y32 Y3j Y3r Y3. Ῡ3 .
t Yt1 Yt2 Ytj Ytr
i Yi1 Yi2 Yij Yir Yi.
Total Y.1 Y.2 Y.j Y.T Y..
Media Trat Ῡ.1 Ῡ.2 Ῡ.j Ῡ.t Ῡ..
124

𝑌 2
..
𝐹𝐶 = 𝑺𝑪𝒆𝒓𝒓𝒐𝒓 = 𝑺𝑪𝒕𝒐𝒕 − (𝑺𝑪𝒕𝒓𝒂𝒕 + 𝑺𝑪𝒃𝒍𝒐𝒒 )
𝑡
𝑟 𝑡 𝑟 𝑡

𝑆𝐶𝑡𝑜𝑡 = 𝑌𝑖 − 𝑌ത.. 2 = 𝑌𝑖 2 − 𝐹𝐶
𝑖=1 =1 𝑖=1 =1

𝑡 𝑡
𝑌. 2
𝑆𝐶𝑡𝑟𝑎𝑡 = 𝑡 (𝑌ത. − 𝑌ത.. ) 2 = − 𝐹𝐶
𝑡
𝑖=1 =1

𝑟 𝑟
𝑌𝑖. 2
𝑆𝐶𝑏𝑙𝑜𝑞 = (𝑌ത𝑖. − 𝑌ത.. ) 2 = − 𝐹𝐶
𝑖=1 =1
125
126

MANCHA
DETERGENTE 1 2 3
DET 1 45 43 51
DET 2 47 46 52
DET 3 48 50 55
DET 4 42 37 49
127

FUENTE DE GRADOS SUMA DE CUADRADO Fo F


VARIACION LIBERTAD CUADRADOSMEDIO CALC TEOR
TRATAMIENOS 2 135.16667 67.6 21.5 5.14
BLOQUES 3 110.91667 37.0 11.8 4.76

ERROR 6 18.833333 3.1


TOTAL 11 264.91667
128
129
130
131
132

Son diseños que utilizan más de una variable de bloque para


reducir el error experimental., es un diseño de bloques
incompleto.

Los diseños en cuadrados latinos son apropiados cuando es


necesario controlar dos fuentes de variabilidad. En dichos
diseños el número de niveles del factor principal tiene que
coincidir con el número de niveles de las dos variables de
bloque o factores secundarios y además hay que suponer que
no existe interacción entre ninguna pareja de factores
133

Un cuadrado latino es una matriz de n×n elementos


en la que cada casilla está ocupada por uno de los
n símbolos de tal modo que cada uno de ellos
aparece exactamente una vez en cada columna y
en cada fila.

Agrupamiento de las unidades experimentales en


dos direcciones (filas y columnas) y la asignación de
los tratamientos al azar en unidades, de tal forma
que en cada fila y en cada columna se encuentran
los tratamientos.
134

Conjunto de formas geométricas


con dos sentidos, forma y color

Bloqueo según la forma (primer


bloqueo)

Bloqueo según el color (segundo


bloqueo)
135

Cada tratamiento aparece solo una vez por fila y columna lo que permite
que cada tratamiento sea probado por igual según las dos fuentes de
variacion consideradas.

Supongamos que se tiene un experimento agrícola donde las unidades


experimentales son parcelas, pero estas parcelas están ubicadas en
diferentes tipos de suelo y además tienen diferentes valores de pH, uno
podría pensar en realizar un diseño de bloques al azar usando cualquiera
de estas dos características: realizando bloques de acuerdo a los
diferentes valores de pH o bloques que consideren los diferentes tipos de
suelo.

La más adecuada, es hacer un “doble bloqueo”, o sea bloques en dos


direcciones, que consideren las dos fuentes de variación, a este tipo de
diseño se le denomina Cuadrado Latino, donde se tiene un conjunto de “t”
tratamientos y “t 2 ” unidades experimentales, que son agrupadas por dos
factores.
136
137

cuadrado latino estándar


138

Un experimento en el que se quiere estudiar el efecto de


distintos tipos de semilla en el rendimiento del trigo y se
considera que en dicho rendimiento también pueden influir los
tipos de abonos e insecticidas empleados. Se tienen para
evaluar 4 niveles de tipo de abono, 4 niveles de insecticida y 4
niveles de tipo de semillas
Si se emplea un diseño completo en bloques aleatorizados, donde el factor
principal es el tipo de semilla y las variables de bloque los tipos de abono e
insecticida se necesitarían 4 × 4 ×4 = 48 unidades experimentales y en el
cuadrado latino 16
139
140
141

Suma total de cuadrados

Suma de cuadrados debida a la fila

Suma de cuadrados debida a la columna

Suma de cuadrados debida a la letra latina


142
143
144
145
146

You might also like