You are on page 1of 37

Prueba de hipótesis

Muestras pequeñas
Introducción
• Para emplear la distribución z es necesario conocer la
desviación estándar de la población y tener una muestra
grande (>30).
• Si no conoce la desviación estándar de la población y el
número de observaciones de la muestra es menor que
30, entonces es posible utilizar la desviación estándar de
la muestra como una estimación de la desviación
estándar de la población; pero no es posible utilizar la
distribución normal, el estadístico adecuado es t.
Características de una
distribución t
• William S. Gossett desarrolló la distribución t de Student.

1. Al igual que la distribución z, es una distribución continua.


2. Al igual que z, tiene forma de campana y es simétrica.
3. Al igual que z, no hay una distribución t, sino una “familia”
de distribuciones. Todas con la misma media (0); pero con
distinta desviación estándar, de acuerdo al tamaño de la
muestra.
4. La distribución t es más ancha y más plana que la
distribución z. A medida que la muestra es más grande, se
asemeja más a la distribución z.
Prueba para la media de la
población
¿Población
normal?
No Si

¿Conoce la
n => 30
Desv. Est.?
No No
Si Si

Prueba no
Use z Use t Use z
paramétrica
Recuerde: ¿Cómo
comprobar una hipótesis?

1.Plantear las hipótesis nula y alternativa(s).


2.Seleccionar un nivel de significancia.
3.Calcular el estadístico de prueba.
4.Formular la regla de decisión.
5.Tomar una decisión.
• El costo promedio de resolver una queja en la
empresa es de $60.00.
• Se adoptaron medidas para reducir los costos.
• Se analizaron los costos de 26 quejas y se calculó un
promedio de $57.00 y una desviación estándar de
$10.00.
• Con un nivel de significancia de 0.01, ¿se puede
concluir que las medidas adoptadas reducen los
costos?
Paso 1: Establecer
hipótesis nula y
alternativa
H0: Promedio >= $60.00
Ha: Promedio < $60.00
Paso 2: Seleccionar nivel
de significancia
• Siendo un problema de calidad, se selecciona 0.01 (la
tabla de distribución t, incluye también 0.005 y
0.0005.
Paso 3: Resuelva el
estadístico de prueba
• De acuerdo al diagrama en la dispositiva 4, se utiliza
el estadístico de prueba t.
• Sustituyendo, t=-1.530
 
t
s
n
Paso 4: Formar regla de
decisión
• Utilice la tabla: Distribución t para encontrar el valor
crítico.
• En la columna del lado izquierdo de la tabla,
encontrará los grados de libertad (gl). Los grados de
libertad son igual al número de observaciones en la
muestra, menos el número de muestras (1).
• En segundo lugar, se debe determinar si se trata de
una prueba de una o dos colas.
• En este caso., 2.485
Paso 5: Se toma una
decisión
• Como se trata de una prueba con una cola, y la
región de rechazo está en la cola izquierda, el valor
crítico es negativo.
• La regla de decisión señala que se debe rechazar la
H0, si t pasa el valor crítico de -2.485.
• Como -1.530 está a la derecha del valor crítico, no se
rechaza la hipótesis nula.
Ejercicio para el
estudiante
• La vida promedio de una batería en un reloj digital es
de 305 días. Las duraciones de las baterías tienen
una distribución normal.
• La batería se modificó y se tomó una muestra de 20
baterías. La vida promedio fue de 311 días con una
desviación estándar de 12 días.
• A un nivel de significancia de .05, ¿La modificación
incrementó la vida de la batería?
Valor p
• La mayoría de los paquetes de programas estadisticos es
la salida del valor p.
• El valor p representa la probabilidad de encontrar un
valor t tan extremo como el calculado, dado que la
hipótesis nula es verdadera.
• Así, si la hipotesis nula fue rechazada, señala si ésta
estubo cerca de ser rechazada, apenas fue rechazada y
así sucesivamente.
• Si p es mayor que el nivel de significancia, no se rechaza
la hipótesis nula.
Comparación de dos medias
independientes
• Antes se respondía
¿Es probable que la muestra venga de una población
con la media propuesta?
• En este caso, se responde a la pregunta:
¿Son las dos medias iguales?
• O dicho de otra manera,
¿Pueden las dos medias de muestras provenir de
poblaciones idénticas?
Suposiciones
1. Las poblaciones muestreadas tienen una
distribucion normal.
2. Las dos muestras son independietes.
3. Las desviaciones estandar de ambas poblaciones
son iguales.
Varianza combinada

La prueba de medias para dos muestras pequeñas es igual


a la prueba para dos muestras grandes, con excepción de
un cálculo adicional:

(n1  1)(s )  (n2  1)(s )


2 2
s 
2 1 2
n1  n2  2
p
Prueba de dos medias de
muestras pequeñas

x1  x 2
t
1 1
s   
2
p
 n1 n2 
Ejemplo
• Una fábrica de podadoras desarrolló dos procesos
para ensamblarlas.
• Cinco empleados emplearon el procedimiento A.
• Seis empleados el procedimiento B.
• A continuación, se presentan los tiempos de
ensamblaje en minutos.
• Utilizando un nivel de significancia de 0.1, ¿Existe
alguna diferencia en el tiempo para ensamblarlas?
Procedimiento A Procedimiento B
2 3
4 7
9 5
3 8
2 4
3
Solución
• Suposiciones:
a) Las observaciones son independientes entre sí.
b) Ambas poblaciones son normales.
c) Las dos poblaciones tienen desviaciones
estándar iguales.
Hipótesis nula y
alternativa
• H0: µ1 = µ2
• Ha: µ1 ≠ µ2
Nivel de significancia
• El nivel de significancia es 0.1.
• Los grados de libertad son igual al número de
elementos muestreados, menos el número de
muestras; en este caso, n1+n2 -2. (Entonces, gl=9)
• Como la hipótesis nula no tiene dirección, es un
problema de dos colas. Buscamos el valor crítico para
t en dos colas, y es 1.833 (-1.833).
Resolver el estadístico de
prueba
• Primero, calcule la
x1  x 2 combinación de
t
varianzas de las
1 1
s   
2
p
muestras.
 n1 n2  • Sustituyendo, t= 0.662
Decisión
• No se rechaza la hipótesis nula (porque el estadístico
de prueba t está dentro del área entre -1.833 y
1.833).
• Se concluye que no hay diferencia entre los tiempos
medios para montar el motor sobre la estructura
entre ambos métodos.
Ejercicio
• El supervisor de una fábrica de sillas de ruedas desea
comparar el número de sillas de ruedas defectuosas
producidas por el turno diurno con los del turno
nocturno.
• Una muestra de la producción de seis turnos diurnos
y ocho nocturnos mostró la siguiente información:
Turno diurno Turno nocturno
5 8
8 10
7 7
6 11
9 9
7 12
14
9
• En un nivel de significancia de 0.05 ¿existe alguna
diferencia en el número medio de sillas defectuosas
por turno?
• Estime el valor de p.
Prueba de hipótesis con
muestras dependientes
• Las muestras no sin independientes, sino que están
relacionadas o son dependientes.
• Se conoce también como muestra en pares (paired
samples).
• El interés recae sobre la distribución de las
diferencias en el valor calculado. En otras palabras,
se está investigando si la media de la distribución de
las diferencias entre los valores calculados es 0.
• Hay dos tipos de muestras dependientes:
A. Antes y después de un tratamiento.
B. Muestras en pares como las del ejemplo siguiente.
Prueba t de Student para
muestras en pares

d
t
sd
n
La desviación estándar de
las diferencias

( d ) 2
d  2

sd  n
n 1
Ejemplo
• Se le pide a dos Propiedad Compañía 1 Compañía 2
1 135 128
compañías valuadoras
2 110 105
que calculen el valor de 3 131 119
diez propiedades con 4 142 140
los siguientes 5 105 98
resultados 6 130 123
7 131 127
8 110 115
9 125 122
10 149 145
Solución
• H0: µd = 0
• Ha: µd ≠ 0
Nivel de significancia
• Es un problema de dos colas.
• Los grados de libertad son 9 (es sólo una muestra la
que evalúan dos grupos).
• El resultado es 2.262 (-2.262).
Resolver el estadístico de
prueba
• Crear la distribución de
las diferencias.
d
t
• Primero, resuelva la
desviación estándar de
la distribución de las
diferencias. sd
• Sustituyendo valores en
la fórmula siguiente, el
resultado es 3.305
n
Decisión
• Se rechaza la hipótesis nula.
• La distribución de las diferencias no tiene una media
de 0.
• La mayor diferencia está en la propiedad 3, quizá
esta sería un lugar adecuado para iniciar una revisión
más detallada.
Valor p
• Buscando en la tabla de valores de la distribución t
de Student, los valores más cercanos al resultado de
t, en el apartado para dos colas, a la altura de 9
grados de libertad son 3.250 y 4.781; que
corresponden a 0.01 y 0.001, respectivamente.
• Por lo tanto, el valor p es menor que 0.01 y mayor
que 0.001.
• Existe una firme evidencia de que la Hipótesis nula es
rechazada.

You might also like