Professional Documents
Culture Documents
Muestras pequeñas
Introducción
• Para emplear la distribución z es necesario conocer la
desviación estándar de la población y tener una muestra
grande (>30).
• Si no conoce la desviación estándar de la población y el
número de observaciones de la muestra es menor que
30, entonces es posible utilizar la desviación estándar de
la muestra como una estimación de la desviación
estándar de la población; pero no es posible utilizar la
distribución normal, el estadístico adecuado es t.
Características de una
distribución t
• William S. Gossett desarrolló la distribución t de Student.
¿Conoce la
n => 30
Desv. Est.?
No No
Si Si
Prueba no
Use z Use t Use z
paramétrica
Recuerde: ¿Cómo
comprobar una hipótesis?
x1 x 2
t
1 1
s
2
p
n1 n2
Ejemplo
• Una fábrica de podadoras desarrolló dos procesos
para ensamblarlas.
• Cinco empleados emplearon el procedimiento A.
• Seis empleados el procedimiento B.
• A continuación, se presentan los tiempos de
ensamblaje en minutos.
• Utilizando un nivel de significancia de 0.1, ¿Existe
alguna diferencia en el tiempo para ensamblarlas?
Procedimiento A Procedimiento B
2 3
4 7
9 5
3 8
2 4
3
Solución
• Suposiciones:
a) Las observaciones son independientes entre sí.
b) Ambas poblaciones son normales.
c) Las dos poblaciones tienen desviaciones
estándar iguales.
Hipótesis nula y
alternativa
• H0: µ1 = µ2
• Ha: µ1 ≠ µ2
Nivel de significancia
• El nivel de significancia es 0.1.
• Los grados de libertad son igual al número de
elementos muestreados, menos el número de
muestras; en este caso, n1+n2 -2. (Entonces, gl=9)
• Como la hipótesis nula no tiene dirección, es un
problema de dos colas. Buscamos el valor crítico para
t en dos colas, y es 1.833 (-1.833).
Resolver el estadístico de
prueba
• Primero, calcule la
x1 x 2 combinación de
t
varianzas de las
1 1
s
2
p
muestras.
n1 n2 • Sustituyendo, t= 0.662
Decisión
• No se rechaza la hipótesis nula (porque el estadístico
de prueba t está dentro del área entre -1.833 y
1.833).
• Se concluye que no hay diferencia entre los tiempos
medios para montar el motor sobre la estructura
entre ambos métodos.
Ejercicio
• El supervisor de una fábrica de sillas de ruedas desea
comparar el número de sillas de ruedas defectuosas
producidas por el turno diurno con los del turno
nocturno.
• Una muestra de la producción de seis turnos diurnos
y ocho nocturnos mostró la siguiente información:
Turno diurno Turno nocturno
5 8
8 10
7 7
6 11
9 9
7 12
14
9
• En un nivel de significancia de 0.05 ¿existe alguna
diferencia en el número medio de sillas defectuosas
por turno?
• Estime el valor de p.
Prueba de hipótesis con
muestras dependientes
• Las muestras no sin independientes, sino que están
relacionadas o son dependientes.
• Se conoce también como muestra en pares (paired
samples).
• El interés recae sobre la distribución de las
diferencias en el valor calculado. En otras palabras,
se está investigando si la media de la distribución de
las diferencias entre los valores calculados es 0.
• Hay dos tipos de muestras dependientes:
A. Antes y después de un tratamiento.
B. Muestras en pares como las del ejemplo siguiente.
Prueba t de Student para
muestras en pares
d
t
sd
n
La desviación estándar de
las diferencias
( d ) 2
d 2
sd n
n 1
Ejemplo
• Se le pide a dos Propiedad Compañía 1 Compañía 2
1 135 128
compañías valuadoras
2 110 105
que calculen el valor de 3 131 119
diez propiedades con 4 142 140
los siguientes 5 105 98
resultados 6 130 123
7 131 127
8 110 115
9 125 122
10 149 145
Solución
• H0: µd = 0
• Ha: µd ≠ 0
Nivel de significancia
• Es un problema de dos colas.
• Los grados de libertad son 9 (es sólo una muestra la
que evalúan dos grupos).
• El resultado es 2.262 (-2.262).
Resolver el estadístico de
prueba
• Crear la distribución de
las diferencias.
d
t
• Primero, resuelva la
desviación estándar de
la distribución de las
diferencias. sd
• Sustituyendo valores en
la fórmula siguiente, el
resultado es 3.305
n
Decisión
• Se rechaza la hipótesis nula.
• La distribución de las diferencias no tiene una media
de 0.
• La mayor diferencia está en la propiedad 3, quizá
esta sería un lugar adecuado para iniciar una revisión
más detallada.
Valor p
• Buscando en la tabla de valores de la distribución t
de Student, los valores más cercanos al resultado de
t, en el apartado para dos colas, a la altura de 9
grados de libertad son 3.250 y 4.781; que
corresponden a 0.01 y 0.001, respectivamente.
• Por lo tanto, el valor p es menor que 0.01 y mayor
que 0.001.
• Existe una firme evidencia de que la Hipótesis nula es
rechazada.