Professional Documents
Culture Documents
Introduccin
La experiencia sobre el comportamiento de algn ndice de un proceso,
o la exigencia del cumplimiento de alguna norma nos lleva a realizar
proposiciones sobre el valor de algn parmetro estadstico.
UMSNH - FIE
Pruebas de Hiptesis
Introduccin
Una hiptesis Estadstica es un proposicin sobre los parmetros de una
poblacin o sobre la distribucin de probabilidad de una variable
aleatoria
Ejemplo: Se tiene inters en la rapidez de combustin de un agente propulsor para los
sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable
aleatoria con alguna distribucin de probabilidad). Especialmente interesa la rapidez
de combustin promedio (que es un parmetro (m) de dicha distribucin). De manera
ms especfica, interesa decidir si esta rapidez promedio es o no 50 cm/seg.
El planteamiento formal de la situacin se realiza en trminos de una Hiptesis Nula
(que es la proposicin que se quiere poner a prueba) y una Hiptesis Alternativa, la
cual se aceptar si se rechaza la hiptesis nula:
Hiptesis Nula: H0: m = 50 cm/seg
Hiptesis Alternativa: H1: m 50 cm/seg
UMSNH - FIE
Pruebas de Hiptesis
Introduccin
Ejemplo: Consideremos el ejemplo anterior de la rapidez de combustin.
Aqu se tena: H0: m = 50 cm/seg
H1: m 50 cm/seg
_
Aceptacin de H0.- Un valor de la media muestral x muy cercano a 50
cm/seg es una evidencia que apoya a la hiptesis nula, sin embargo es
necesario introducir un criterio para decidir que tanto
_ es muy cercano,
para el ejemplo este criterio pudiera ser: 48.5 x 51.5, si esto ocurre
se acepta H0 _ _
De lo contrario, es decir, si x < 48.5 o x >51.5, se acepta H1
48.5 50 51.5
Valores Crticos
UMSNH - FIE
Pruebas de Hiptesis
Errores Tipo I y Tipo II
El procedimiento anterior puede llevarnos a una de dos conclusiones
errneas:
Error Tipo I.- Se rechaza H0 cuando sta es verdadera
Error Tipo II.- Se acepta H0 cuando sta es falsa
_
En el ejemplo se cometer un error de tipo I cuando m=50, pero x para
la muestra considerada cae en la regin crtica _
Y se cometer un error de tipo II cuando m 50 pero x para la muestra
considerada cae en la regin de aceptacin
Condicin real
H0 verdadera H0 falsa
Decisin
Rechazar H0 Error Tipo I ok
Aceptar H0 ok Error Tipo II
UMSNH - FIE
Pruebas de Hiptesis
Error Tipo I
A la probabilidad de cometer un error de Tipo I se denota por a, y se le
llama el nivel o tamao de significancia de la prueba es decir
a = P(error Tipo I)= P(rechazar H0 | H0 es verdadera)
Ejemplo: Calcular a para el ejemplo de la rapidez de combustin para una muestra de
N=10 datos, suponiendo que la desviacin estndar de la rapidez de combustin es
s=2.5 cm/seg.
_
Solucin: en este caso a = P( x_ caiga en la regin
_ crtica | m=50), es decir:
a = P( x < 48.5)
_ + P( x > 51.5)
Recordando que La distribucin de x es Normal con media m=50 y desviacin
estndar s/N =0.79, por lo tanto, usando Matlab:
a = normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79))
= 0.288+ 0.288 = 0.0576
Ejemplo: recalcular a del ejemplo anterior para a) los nuevos lmites de la regin de
aceptacin 48 y 52. b) Para N=16 con los lmites originales c) con ambas
modificaciones
Solucin:
a) a = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) = 0.0114
b) a = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) = 0.0164
c) a = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = 0.0014
UMSNH - FIE
Pruebas de Hiptesis
Error tipo II
Para evaluar un experimento de prueba de hiptesis tambin se requiere
calcular la probabilidad del error de Tipo II, denotada por b, es decir
b = P(error Tipo II) = P(aceptar H0 | H0 es falsa)
UMSNH - FIE
Pruebas de Hiptesis
Error tipo II
0.7
0.6
0.3
0.2
0.1
0
45 46 47 48 49 50 51 52 53 54 55
_
De acuerdo a la figura: b = P(48.5 x 51.5 | m=52)
Usando Matlab:
b = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.2643
UMSNH - FIE
Pruebas de Hiptesis
Error tipo II
Usando Matlab:
b = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = 0.8923
Como uno puede elegir los valores crticos del intervalo de aceptacin
uno controla el valor de a. Uno puede entonces controlar la
probabilidad de rechazar de manera errnea H0.
UMSNH - FIE
Pruebas de Hiptesis
Hiptesis Unilaterales
Ejemplo: Un embotellador de refresco desea estar seguro de que las
botellas que usa tienen en promedio un valor que supera el mnimo de
prsin de estallamiento de 200 psi. El embotellador puede formular
una prueba de hiptesis de dos maneras:
(1) H0: m=200 psi (2) H0: m=200 psi
H1: m>200 psi H1: m<200 psi
Con el planteamiento (1) Como el rechazo de H0 es una conclusin
fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que
las botellas soportan mayor presin que 200 psi
Con el planteamiento (2) si se rechaza H0 se concluye que las botellas
no soportan los 200 psi, es decir, se concluye que las botellas son
satisfactorias a menos que halla evidencia fuerte en sentido contrario
cul planteamiento es el correcto?
UMSNH - FIE
Pruebas de Hiptesis
Hiptesis Unilaterales
UMSNH - FIE
Pruebas de Hiptesis
Procedimiento general para la prueba de
Hiptesis
UMSNH - FIE
Pruebas de Hiptesis
Prueba de hiptesis sobre la media, varianza
conocida
UMSNH - FIE
Pruebas de Hiptesis
Prueba de hiptesis sobre la media, varianza
conocida
Entonces, para una a dada podemos establecer las siguientes regiones
de aceptacin y crtica:
a/2 a/2
-za/2 za/2 Z
Conclusiones:
Rechazar H0 si: z < -za/2 o z > za/2
No rechazar H0 si: - za/2 z za/2
UMSNH - FIE
Pruebas de Hiptesis
Prueba de hiptesis sobre la media, varianza
conocida
Ejemplo: Se ilustrarn los 8 pasos del procedimiento general para el
ejemplo del combustible slido para sistemas de escape de aeronaves.
En este caso se conoce s=2 cm/seg, se desea probar si la media m es
de 50 cm/seg.
_ Se selecciona una muestra aleatoria de tamao N=25,
obteniendo x=51.3 cm/seg. Se especifica un nivel de sginificancia
a=0.05 A qu conclusiones se debe llegar?
UMSNH - FIE
Pruebas de Hiptesis
Prueba de hiptesis sobre la media, varianza
conocida
__
0
5) La estadstica de prueba es Z= X
/ N
UMSNH - FIE
Pruebas de Hiptesis
Valores P
En el caso de la distribucin normal para la pureba sobre la media es
fcil calcular el valor P. Si z0 fue el valor calculado del estadstico de
prueba, entonces:
2 [ 1- F(|z0|) ] Prueba de dos colas: H0:m=m0, H1:m m0
P= 1- F(z0) Prueba de cola superior: H0:m=m0, H1:m > m0
F(z0) Prueba de cola inferior: H0:m=m0, H1:m < m0
N
Es decir, Si H1 es verdadera Z tiene distribucin Normal con media
y varianza 1.
(z /2 z )
Y si definimos b = F(-zb), obtenemos N
UMSNH - FIE
Pruebas de Hiptesis
Error Tipo II y tamao de la muestra
Para el ejemplo del combustible slido. Si al analista le interesa disear
la prueba de hiptesis de manera que si el valor verdadero de m es 51
cm/seg se rechace H0 con una probabilidad alta (por ejemplo 90%) y con
el mismo valor anterior de a=0.05
En este caso d=1, s=2, a=0.05 por lo tanto, mediante Matlab:
N= 4*(norminv(0.025) + norminv(0.1))^2 42
UMSNH - FIE
Pruebas de Hiptesis
Identificacin Causa - Efecto
UMSNH - FIE
Pruebas de Hiptesis
Otras pruebas de Hiptesis
En forma similar a como se describi el caso de la media y la diferencia
de medias, se pueden realizar diferentes pruebas de hiptesis para
estos mismos u otros parmetros, lo nico que cambia en cada caso es:
UMSNH - FIE
Pruebas de Hiptesis
Otras pruebas paramtricas de Hiptesis
Estadstico
Prueba sobre Hiptesis Nula Suposiciones
de Prueba
m = m0 s2 conocida Normal
La media
m = m0 s2 desconocida T
m1 = m2 s12 = s22 conocidas Normal
Igualdad de
m1 = m2 s12 = s22 desconocidas T
medias
m1 = m2 s12 s22 conocidas T
s2 = s0 2 dist. Normal, N pequea Ji2
La varianza
s2 = s0 2 N grande Normal
Igualdad de dos
s1 2 = s2 2 F
varianzas
Una proporcin p = p0 Normal
Igualdad de dos
p1 = p2 Normal
proporciones
UMSNH - FIE
Pruebas de Hiptesis
Pruebas de Hiptesis No Paramtricas
UMSNH - FIE
Pruebas de Hiptesis
Prueba Ji2 de la Bondad del Ajuste
i =1 Ei
0 1 2 3 4 5 6 7 8 9
Oi 94 93 112 101 104 95 100 99 108 94
Ei 100 100 100 100 100 100 100 100 100 100
UMSNH - FIE
Pruebas de Hiptesis
Prueba Ji2 de la Bondad del Ajuste
1) Variable de inters: distribucin de los nmeros pseudoaleatorios
2) H0: La distribucin es uniforme en el intervalo de 0 a 9
3) H1: La distribucin No es uniforme en ese intervalo
4) a = 0.05 k
(O i E i ) 2
=
2
5) El estadstico de prueba es i =1 Ei
6) Se rechazar H0 si c2> c2 0.05,9=16.92
7) Clculos
c2= 0.01*( (94-100)2+(93-100)2+...+(94-100)2 )=3.72
8) Conclusiones: como 3.72 < 16.92 No es posible rechazar la
hiptesis. Por lo tanto parece ser que el generador de nmeros
aleatorios trabaja bien.
UMSNH - FIE
Pruebas de Hiptesis
Prueba Ji2 de la Bondad del Ajuste
Ejemplo 2.- Se propone que el nmero de defectos en tarjetas de
circuito impreso sigue una distribucin de Poisson. Se obtiene una
muestra de 60 tarjetas y se observa el nmero de defectos, con los
siguientes resultados:
defectos 0 1 2 3 4 o ms
Oi 32 15 9 4 0
x 0 1 2 o ms
Ei 28.32 21.24 10.44
Oi 32 15 13
UMSNH - FIE
Pruebas de Hiptesis
Prueba Ji2 de la Bondad del Ajuste
1) Variable de inters: La forma de distribucin de los defectos en
tarjetas de circuito impreso
2) H0: La distribucin es de Poisson
3) H1: La distribucin No es Poisson
4) a = 0.05 =
2
k
(O i E i ) 2
5) El estadstico de prueba es i =1 Ei , el cual tiene una
distribucin c2 con k-p-1=3-1-1=1 grado de libertad
6) Se rechazar H0 si c2> c2 0.05,1=3.84
7) Clculos
c2= (94-100)2/28.32+(93-100)2/21.24+(94-100)2/10.44 = 2.94
8) Conclusiones: como 2.94 < 3.84. No es posible rechazar la
hiptesis. Por lo tanto parece ser que la distribucin de defectos en
las placas de circuito impreso es Poisson
El valor P de la prueba es P=0.9861
UMSNH - FIE
Pruebas de Hiptesis
Prueba Ji2 de la Bondad del Ajuste
UMSNH - FIE
Pruebas de Hiptesis
Prueba Ji2 de la Bondad del Ajuste
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0-4 -3 -2 -1 0 1 2 3 4
UMSNH - FIE
Pruebas de Hiptesis
Prueba Ji2 de la Bondad del Ajuste
1) La variable de inters es el tipo de distribucin del voltaje dado por
una fuente de alimentacin
2) H0: El tipo de distribucin es Normal
3) H1: El tipo de distribucin no es Normal
4) a = 0.05 k
(O i E i ) 2
=
2
5) El estadstico de prueba es i =1 Ei
6) Para determinar los intervalos de clase se requiri estimar m y s, por
lo tanto los grados de libertad son k-p-1=8-2-1=5, por lo tanto se
rechazar H0 si c2 > c20.05,5 = 11.07
7) Clculos:
c2 = ( 1/12.5 )[(12-12.5)2+(14-12.5)2+...+(14-12.5)2] = 0.64
8) Conclusiones: como 0.64<11.07, no es posible rechazar H0, por lo
tanto no hay evidencia fuerte de que la distribucin no sea Normal.
El valor P de la prueba (para c2 = 0.64) es P=0.9861.
UMSNH - FIE
Pruebas de Hiptesis
Grfica de Probabilidad
La grfica de probabilidad es un mtodo grfico que permite determinar
si una muestra de datos se ajusta a una distribucin propuesta en base
a una anlisis visual subjetivo.
i 1 2 3 4 5 6 7 8 9 10
xi 176 183 185 190 191 192 201 205 214 220
(i-0.5)/10 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95
UMSNH - FIE
Pruebas de Hiptesis
Grfica de Probabilidad
Grfica de Probabilidad Normal
1.0
0.95
Frecuencia acumulada (i-0.5)/N
0.90
0.84
0.75
0.50
s16
0.25
m195
0.10
0.05
0.0
175 180 185 190 195 200 205 210 215 220
Datos (Xi)
UMSNH - FIE
Pruebas de Hiptesis
Grfica de Probabilidad
Observaciones:
Al analizar la grfica debe recordarse que el eje vertical est
graduado en percentiles, por ello la media se encuentra en el
percentil 50.
Los puntos ms confiables son los que estn entre el percentil 25 y
el 75, de hecho, la linea trazada debe unir estos percentiles
Se puede obtener una grfica sobre papel normal ajustando la
escala vertical de acuerdo a zi, donde F(zi) = (i-0.5)/N, para el
ejemplo:
i 1 2 3 4 5 6 7 8 9 10
(i-0.5)/10 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95
zi -1.64 -1.04 -0.67 -0.39 -0.13 0.13 0.39 0.67 1.04 1.64
UMSNH - FIE
Pruebas de Hiptesis
Tablas de Contingencia
Procedimiento:
Se forma una tabla de frecuencias observadas Oij, donde:
i=No. de rengln= nivel de clasificacin i del criterio 1 (i=1,2,,3,...,r)
j=No. de columna= nivel de clasificacin j del Criterio 2 (j=1,2,3,...,c)
Criterio2
Nivel 1 Nivel 2 ... Nivel c
Criterio1
Nivel 1 O11 O12 O1c
Nivel 2 O21 O22 O2c
... ...
Nivel r Or1 Or1 ... Orc
UMSNH - FIE
Pruebas de Hiptesis
Tablas de Contingencia
Consideraciones: Si los criterios son independientes (Hiptesis
Nula): La probabilidad de que un elemento elegido al azar caiga
en la ij-sima celda es pij=ui vj,
donde ui= probabilidad de que caiga en el rengln i
uj= probabilidad de que caiga en la columna j
c r
UMSNH - FIE
Pruebas de Hiptesis
Tablas de Contingencia
Para N grande el siguiente estadstico
c r (O ij E ij ) 2
2 =
j=1 i =1 E ij
UMSNH - FIE
Pruebas de Hiptesis
Tablas de Contingencia
Ejemplo: Los empleados de una compaa eligen uno de tres
posibles planes de pensin. La gerencia desea saber con a=0.05 si
la preferencia en la eleccin es independiente de la clasificacin
del contrato (asalariados y por horas). De una muestra aleatoria de
500 empleados se obtiene la siguiente tabla de contingencia
UMSNH - FIE
Pruebas de Hiptesis
Tablas de Contingencia
Solucin: Necesitaremos las frecuencias esperadas, para ello
calculamos estimados de ui, vj para i=1,2, j=1,2,3:
u1=0.68, u2=0.32,
v1=0.4, v2=0.4, v3=0.2
UMSNH - FIE
Pruebas de Hiptesis
Tablas de Contingencia
UMSNH - FIE