You are on page 1of 7

6 TRATAMIENTO E INFERENCIA SOBRE PARES DE MEDIAS.

Suponga que realiza el procedimiento ANOVA y toma la decisión de rechazar la


hipótesis nula. Esto permite concluir que no todas las medias de tratamiento son
iguales. Algunas veces esta conclusión sería satisfactoria, pero otras se desea conocer
cuáles medias de tratamiento difieren.
En esta sección se proporcionan los detalles de prueba para saber cuáles medias de
tratamiento difieren. Recuerde que en el ejemplo de Brunner Research respecto de las
calificaciones que aplicaron los pasajeros de aerolíneas, había una diferencia entre las
medias de tratamiento. Es decir, se rechazó la hipótesis nula y se aceptó la hipótesis
alternativa. Si las calificaciones de los pasajeros no difieren, la pregunta es: ¿entre qué
grupos difieren las medias de tratamiento?
Se dispone de varios procedimientos para responder esta pregunta. El más simple es
emplear intervalos de confianza, es decir, la formula., observe que la calificación media
Muestral de los pasajeros del servicio de la aerolínea Norten es 87.25, mientras la
media muestral de los que califican el servicio de la aerolínea Branson es 69.00. ¿Existe
suficiente disparidad para justificar la conclusión de que hay una diferencia significativa
entre las calificaciones de satisfacción medias de las dos aerolíneas?
La distribución t, descrita en los capítulos anteriores, sirve como base de esta prueba.
Recuerde que una de las suposiciones de ANOVA es que las varianzas poblacionales de
todos los tratamientos son las mismas. Este valor común de la población es el error
medio cuadrático, o MSE, y se determina mediante SSE/(n – k). Un intervalo de
confianza de la diferencia entre dos poblaciones se obtiene mediante:
INTERVALO DE CONFIANZA DE LA DIFERENCIA ENTRE LAS MEDIAS DE TRATAMIENTO

√ 1 1
( )
(−X 1− −X 2 )  ±t M S E n + n
1 2

Donde:
−X 1 Es la media de la primera muestra.

X 2   Es la media de la segunda muestra.

t se obtiene del apéndice B.2. Los grados de libertad son iguales a n – k.


MSE es el error medio cuadrático que se obtuvo de la tabla ANOVA [SSE/(n – k)].
n1 es el número de observaciones en la primera muestra.
n2 es el número de observaciones en la segunda muestra.
¿Cómo se decide si hay una diferencia entre las medias de tratamiento? Si el intervalo
de confianza incluye cero, no existe diferencia entre ellas. Por ejemplo, si el punto
extremo izquierdo del intervalo de confianza tiene signo negativo y el punto extremo
derecho tiene signo positivo, el intervalo incluye cero, y las dos medias no difieren. Por
lo tanto, si se desarrolla un intervalo de confianza a partir de la fórmula y se tiene que
la diferencia entre las medias muéstrales fue 5.00, es decir. Si
√ 1 1
(−X 1− −X 2 ) =5   y   t M S E n + n
1
( )
2
= 12 el intervalo de confianza variará de 7.00

hasta 17.00. Expresado en símbolos:

√ 1 1
1
(
2
)
(−X 1− −X 2 )  ±t M S E n + n =5  ±12= −7.00   h a st a   17.00

Observe que en este intervalo se incluye el cero. Por ello, se concluye que no hay una
diferencia significativa entre las medias de tratamiento seleccionadas.
Por otro lado, si los puntos extremos del intervalo de confianza tienen el mismo signo,
esto indica que las medias de tratamiento difieren. Por ejemplo, si


1 1
(
(−X 1− −X 2 ) = −0.35   y   t M S E n + n =0.25
1 2
) el intervalo de confianza variará

de - 0.60 hasta -0.10. Como - 0.60 y - 0.10 tienen el mismo signo, ambos negativos,
cero no se encuentra en el intervalo y se concluye que estas medias de tratamiento
difieren.
Use el ejemplo anterior sobre las aerolíneas para calcular el intervalo de confianza de
la diferencia entre las calificaciones medias de los pasajeros de las aerolíneas Norte y
Branson. Con un nivel de confianza de 95%, los puntos extremos del intervalo de
confianza son 10.46 y 26.04.

√ 1 1
( ) √
1 1
( )
(−X A − −X U S )  ±t M S E n + n =  ( 87.25−69.00 )  ±2.101 33.0 4 +  6 =18.25  ±7.79
A US

Donde:
−X A   Es 87.25.

X U S   Es 69.00

t es 2.101: del apéndice B.2 con (n – k) = 22 – 4 = 18 grados de libertad.


MSE es 33.0: de la tabla ANOVA con SSE/(n – k) = 594.4/18.
nA es 4.
nUS es 6.
El intervalo de confianza de 95% varía de 10.46 hasta 26.04. Los dos puntos extremos
son positivos; de aquí se puede concluir que estas medias de tratamiento difieren de
manera significativa. Es decir, los pasajeros de Norte calificaron el servicio en gran
medida diferente de los de Branson Airlines.
7 ANÁLISIS DE LA VARIANZA DE DOS VÍAS.
En el ejemplo de las calificaciones de los pasajeros de aerolíneas, la variación total se
dividió en dos categorías: la variación entre los tratamientos y la variación dentro de
los tratamientos. También se denominó la variación dentro de los tratamientos como
error o variación aleatoria. En otras palabras, sólo se consideraron dos fuentes de
variación, la debida a los tratamientos y a las diferencias aleatorias. En el ejemplo de
las calificaciones de los pasajeros de aerolíneas puede haber otras causas de variación.
Estos factores pueden incluir, por ejemplo, la estación del año, el aeropuerto o el
número de pasajeros en el vuelo.
El beneficio al considerar otros factores es que se reduce la varianza del error. Es decir,
si se reduce el denominador del estadístico F (al reducir la varianza del error o, de
manera más directa, el término SSE), el valor de F será mayor, lo que ocasionará el
rechazo de la hipótesis del tratamiento de medias iguales. En otras palabras, si se
puede explicar más la variación, habrá menos “error”. Un ejemplo aclarará la reducción
de la varianza del error.
Ejemplo.
El director de WARTA, Warren Área Transito Autorizado, considera ampliar el servicio
de autobuses del suburbio de Star al distrito comercial central de Warren. Se
consideran cuatro rutas de Star al centro de Warren:
1) por la carretera 6,
2) por el West, Tan
3) por Hacker Street Bridge,
4) por la ruta 59.
El director realizó varias pruebas para determinar si había una diferencia entre los
tiempos de recorrido medios por las cuatro rutas. Como habrá muchos conductores
distintos, la prueba se diseñó para que cada conductor manejara a lo largo de todas
ellas. A continuación se presenta el tiempo del recorrido, en minutos, de cada
combinación conductor-ruta.
Tiempo de recorrido de Star a Warren (minutos)
Conductor Carretera 6 West Tan Hacker Street Ruta 59
Dante 18 17 21 22
Zubia 16 23 23 22
Carlos 21 21 26 22
Salas 23 22 29 25
Fidel 25 24 28 28

A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los tiempos de


recorrido medios a lo largo de las cuatro rutas? Si elimina el efecto de los conductores,
¿hay alguna diferencia entre los tiempos de recorrido medios?
Solución:
Para iniciar, realice una prueba de hipótesis con ANOVA de una vía. Es decir, sólo
considere las cuatro rutas. Con esta condición, la variación entre los tiempos del
recorrido se debe a los tratamientos o es aleatoria. La hipótesis nula y la alternativa
para comparar los tiempos de recorrido medios por las cuatro rutas son:
H 0 :   μ 1=  μ2=  μ3=  μ 4

H 1 : N o   t o d a s   la s   m e d i a s   d e   t r a t a m ie n t o   s o n   i g u al e s .  

Hay cuatro rutas, por lo cual los grados de libertad del numerador son k - 1 = 4 - 1 = 3.
Hay 20 observaciones. Por consiguiente, los grados de libertad del denominador son n -
k = 20 - 4 = 16. Del apéndice B.4, con el nivel de significancia de 0.05, el valor crítico de
F es 3.24. La regla de decisión es rechazar la hipótesis nula si el valor calculado de F es
mayor que 3.24.
Para realizar los cálculos emplee Excel. El valor calculado de F es 2.482, por lo que la
decisión es no rechazar la hipótesis nula. Concluye que no hay una diferencia entre los
tiempos de recorrido medios a lo largo de las cuatro rutas. No hay una razón para
seleccionar una de las rutas como más rápida que las demás.
De la captura de pantalla de Excel anterior, los tiempos de recorrido medios a lo largo
de las rutas fueron: 20.6 minutos por la carretera 6, 21.4 minutos por la West Tan, 25.4
minutos por Hacker Street y 23.8 minutos por la ruta 59. Se concluye que es razonable
atribuir estas diferencias a la casualidad. De la tabla ANOVA se observa que: SST es
72.8, SSE es 156.4 y SS total es 229.2.
En el ejemplo anterior se consideró la variación debida a los tratamientos (rutas) y se
tomó toda variación restante como aleatoria. Si se pudiera considerar el efecto de los
diversos conductores, se podría reducir el término SSE, lo cual generaría un valor
mayor de F. A la segunda variable de tratamiento, en este caso los conductores, se le
conoce como variable de bloqueo.
VARIABLE DE BLOQUEO Una segunda variable de tratamiento que, cuando se incluye
en el análisis ANOVA, tendrá el efecto de reducir el término SSE.
En este caso, los conductores son la variable de bloqueo, y al eliminar el efecto de los
conductores del término SSE cambiará la razón F de la variable de tratamiento.
Primero, es necesario determinar la suma de los cuadrados debida a los bloques.
En una ANOVA de dos vías, la suma de los cuadrados debida a los bloques se determina
mediante la siguiente fórmula.
S S B=k ∑ (−X b− −X G )
2

Donde:
k Es el número de tratamientos.
b Es el número de bloqueos.
−X b   E s la media muestral del bloque b.

−X G   E s la media global o total.

A partir de los siguientes cálculos, las medias de los conductores respectivos son 19.5
minutos, 21 minutos, 22.5 minutos, 24.75 minutos y 26.25 minutos. La media global es
22.8 minutos, determinada por la suma del tiempo de recorrido de los 20 conductores
(456 minutos) y su división entre 20.
Se utiliza el mismo formato en la tabla ANOVA de dos vías, como en el caso de una vía,
excepto que hay una fila adicional para la variable de bloqueo. SS total y SST se
calculan como se hizo antes, y SSB se determina con la fórmula (12-6). El término SSE
se calcula mediante una resta.
SUMA DE ERRORES CUADRÁTICOS, DOS VÍAS:
S S T =S S t o t a l−S S E−S S B
Los valores de los varios componentes de la tabla ANOVA se calculan como sigue.

SSE se obtiene con la fórmula


S S E=229.2−72.8−119.7=36.7

En este punto hay un desacuerdo. Si el objetivo de la variable de bloqueo (los


conductores en este ejemplo) fue sólo reducir la variación del error, no se debe realizar
una prueba de hipótesis de las diferencias entre las medias de los bloques. Es decir, si
el objetivo era reducir el término MSE, no se debe probar una hipótesis respecto de la
variable de bloqueo. Por otro lado, quizá se desee dar a los bloques la misma condición
que a los tratamientos y realizar una prueba de hipótesis. Este último caso, cuando los
bloques son lo bastante importantes para considerarse un segundo factor, se conoce
como un experimento de dos factores. En muchos casos, la decisión no es clara. En este
ejemplo lo importante es la diferencia entre los tiempos de recorrido de los diversos
conductores, por lo que se realizará la prueba de hipótesis. Los dos conjuntos de
hipótesis son:
1.- H o : La s   m e d i a s   d e   t r a t a m i e n t o s   s o n   i g u a l e s   ( μ1=  μ 2=  μ3 =  μ4 )
H 1 : L a s   m e d i a s   d e   t r a t a mi e n t o s   n o   so n   i g u a l e s  

2.- H o : La s   m e d i a s   d e   l o s   b l o q u e s   s o n   i g u a l e s   ( μ1=  μ2 =  μ3=  μ 4=  μ 5 )


H1: L a s   m e d i a s   d e   l o s   b l o q u e s   n o   s o n   i g u a l e s  

Primero se pondrá a prueba la hipótesis respecto de las medias de tratamiento. Hay k –


1 = 4 – 1 = 3 grados de libertad en el numerador y (b – 1)(k – 1) = (5 – 1)(4 – 1) = 12
grados de libertad en el denominador. Con el nivel de significancia de 0.05, el valor
crítico de F es 3.49. La hipótesis nula de que los tiempos medios para las cuatro rutas
son iguales se rechaza si la razón F es mayor que 3.49.
M ST 24.27
F=  =  =7.93
M SE 3.06

La hipótesis nula se rechaza y se acepta la hipótesis alternativa. Se concluye que el


tiempo de recorrido medio no es el mismo para todas las rutas. Sería recomendable
que WARTA realizara algunas pruebas para determinar cuáles medias de tratamiento
difieren.
En seguida se prueba si el tiempo de recorrido es el mismo para los diversos
conductores. Los grados de libertad en el numerador para los bloques son b - 1 = 5 - 1 =
4. Los grados de libertad para el denominador son los mismos que antes: (b - 1)(k - 1) =
(5 - 1)(4 - 1) = 12. La hipótesis nula de que las medias de los bloques son iguales se
rechaza si la razón F es mayor que 3.26.
M ST 29.93
F=  =  =9.78
M SE 3.06

Se rechaza la hipótesis nula y se acepta la hipótesis alternativa. El tiempo medio no es


el mismo para los conductores. Así, la gerencia de WARTA puede concluir, con base en
los resultados de la muestra, que hay una diferencia en las rutas y en los conductores

You might also like