You are on page 1of 45

Pruebas de hiptesis

lvaro Jos Flrez


1 Escuela de Ingeniera Industrial y Estadstica
Facultad de Ingenieras

Febrero - Junio 2012


Prueba de hiptesis

Uno de los objetivos de la estadstica es hacer inferencias acerca de


parmetros desconocidos de una poblacin con base en informacin
obtenida en una muestra aleatoria. Estas inferencias pueden hacerse
de dos forma: por medio de estimaciones de los parmetros o por
medio de pruebas de hiptesis para verificar si una cierta afirmacin
acerca del parmetro puede considerarse como vlida basndose en
los resultados de una muestra.

Una prueba de hiptesis es muy til en situaciones donde no es de


mucho inters el valor (estimado) del parmetro, sino la validez de
la afirmacin en cuestin (Gutierrez and Zhang, 2010).
Prueba de hiptesis

Para el propsito de importacin de cierto tipo de motocicletas, la


entidad ambiental del pas importador necesita verificar que el nivel
de contaminantes producidos por estas motocicletas cumple con las
normas del pas. En particular la emisin de monxido de carbono
(CO), representadas por el promedio (), no deben superar 5,5g/Km

En este caso slo se est interesado en verificar si la afirmacin


5,5g/Km puede considerarse como vlida, mientras que la
estimacin de no es de gran inters.
Prueba de hiptesis

Definicin:
Procedimiento estadstico que, a travs del estudio de una muestra
aleatoria, permite determinar el cumplimiento de una hiptesis
planteada sobre alguna caracterstica de la poblacin.

En forma general, la hiptesis planteada involucra ya sea algn


parmetro (por ejemplo o 2 ) o alguna forma funcional no conocida
de distribucin de inters a partir de la cual se obtiene una muestra
aleatoria.

La decisin acerca de si los datos muestrales apoyan estadsticamente


la afirmacin se toma en base en la probabilidad y si est es mnima,
entonces la hiptesis sera rechazada.
Planteamiento de una prueba de hiptesis

Pasos para realizar una prueba de hiptesis:

1 Planteamiento de las hiptesis estadsticas.


2 Seleccionar un nivel de significancia.
3 Calculo del estadstico de prueba.
4 Formular la regla de decisin.
5 A partir de una muestra aleatoria tomar una decisin.
Planteamiento de una hiptesis

Una hiptesis estadstica es una afirmacin sobre la poblacin, por


lo tanto se expresa en trminos de los parmetro poblacionales

En el ejemplo anterior se pueden plantear las siguientes hiptesis:

H0 : = 5,5 H1 : > 5,5

La hiptesis que se desea contrastar se denomina Hiptesis nula


(H0 ), mientras que la hiptesis que se acepta cuando la evidencia
muestral est claramente en contra de sta se denomina Hiptesis
Alternativa (H1 ) (Hiptesis de investigacin o de inters)
Planteamiento de una hiptesis

Una hiptesis estadstica es una afirmacin sobre la poblacin, por


lo tanto se expresa en trminos de los parmetro poblacionales

En el ejemplo anterior se pueden plantear las siguientes hiptesis:

H0 : = 5,5 H1 : > 5,5

Debe tenerse en cuenta que el no rechazo de la Hiptesis Nula


no supone ninguna garanta de la certeza de sta, sino la falta de
evidencia en la muestra en contra de su veracidad
Planteamiento de una hiptesis
Segn la estructura de las hiptesis se distinguen dos tipos de
pruebas:

Pruebas bilaterales: En ellos se propone un valor puntual para el


parmetro bajo estudio, de forma que se rechazar bien porque la
evidencia muestral lleve a decidir que el valor es mayor o menor al
propuesto.
H0 : = 0 H1 : 6= 0
Pruebas unilaterales: En ellos se propone que el valor del parmetro
se encuentre por debajo del propuesto o en otros casos, por encima
de ese valor.
H0 : = 0 H1 : > 0
H0 : = 0 H1 : < 0
H0 siempre se debe plantear en trminos de igualdad, esto debido a
como se realiza la prueba.
Posibilidades en una prueba de hiptesis

La siguiente tabla resume las diferentes decisiones que se pueden tomar


cuando se realiza una prueba de hiptesis

Decisin Estadstica
No rechazar H0 Rechazar H0
Estado H0 es cierta Correcta Error Tipo I
Real H0 es falsa Error Tipo II Correcta
Posibilidades en una prueba de hiptesis

La siguiente tabla resume las diferentes decisiones que se pueden tomar


cuando se realiza una prueba de hiptesis

Decisin Estadstica
No rechazar H0 Rechazar H0
Estado H0 es cierta Correcta Error Tipo I
Real H0 es falsa Error Tipo II Correcta

En trminos de probabilidades:

P (Rechazar H0 |H0 cierta) = (Nivel de significancia)


P (No rechazar H0 |H0 cierta) = 1 (Nivel de confianza)
P (Rechazar H0 |H0 falsa) = 1 (Potencia de la prueba)
P (No rechazar H0 |H0 falsa) = (probabilidad del error tipo II)
Posibilidades en una prueba de hiptesis

La siguiente tabla resume las diferentes decisiones que se pueden tomar


cuando se realiza una prueba de hiptesis

Decisin Estadstica
No rechazar H0 Rechazar H0
Estado H0 es cierta Correcta Error Tipo I
Real H0 es falsa Error Tipo II Correcta

Lo ideal es que y sean lo ms pequeo posible, sin embargo esto no


es posible de manera simultanea (sin aumentar n). Dado que solo se tiene
control sobre el error tipo I, una solucin es plantear las hiptesis de tal
forma que el error tipo I sea ms grave que el error tipo II, y garantizar
que sea pequeo (entre 0.1 y 0.01).
Planteamiento de las hiptesis
Si se considera que la emisin de CO de cierto tipo de motocicletas no
debe superar a 5.5g/Km. La entidad ambiental responsable selecciona una
muestra de motocicletas para efectuar las pruebas correspondientes. Si el
sistema de hiptesis que se plantea es:

H0 : = 5,5 H1 : > 5,5

Que implica cada error?


Planteamiento de las hiptesis
Si se considera que la emisin de CO de cierto tipo de motocicletas no
debe superar a 5.5g/Km. La entidad ambiental responsable selecciona una
muestra de motocicletas para efectuar las pruebas correspondientes. Si el
sistema de hiptesis que se plantea es:

H0 : = 5,5 H1 : > 5,5

Que implica cada error?

Error tipo I: Rechazar = 5,5 cuando realmente 5,5, esto es,


las motocicletas que estn emitiendo una cantidad permitida de CO
no pasan la prueba y no pueden ser importadas (perdida
econmica).
Error tipo II: No rechazar = 5,5 cuando realmente 5,5, esto
implica que las motocicletas que emiten gran cantidad de CO pasan
la prueba y pueden ser importadas (contaminacin ambiental).
Estadstico de prueba

Hiptesis sobre :
Sea x1 , . . . , xn una muestra aleatoria de una poblacin normal con
media desconocida y varianza 2 conocida. Si se tiene que H0 : =
0 Entonces el estadstico de prueba queda definido como:
x 0
zc = Normal(0, 1)
/ n
En caso que se desconozca la varianza y tenga que ser estimada:
x 0
tc = t(n1)
S/ n
Estadstico de prueba

Hiptesis sobre 2 :
Sea x1 , . . . , xn una muestra aleatoria de una poblacin normal con
media y varianza desconocida. Si se tiene que H0 : 2 = 02 Entonces
el estadstico de prueba queda definido como:

(n 1)S 2
2c = (n1)
2
Hiptesis sobre P :
En el caso que H0 : P = P0 y el tamao de muestra sea
suficientemente grande:

p p0
zc = q Normal(0, 1)
p0 (1p0 )
n
Regin de rechazo
Un concepto importante en una prueba de hiptesis es la regin
de rechazo asociada a una regla de decisin, y se define como el
conjunto conformado por todos lo valores de la estadstica prueba
que conducen a la decisin de rechazar H0 . Segn el tipo de hiptesis
que se tenga, el estadstico de prueba y en nivel de significancia, se
puede obtener una regin de rechazo.
Regin de rechazo
Un concepto importante en una prueba de hiptesis es la regin
de rechazo asociada a una regla de decisin, y se define como el
conjunto conformado por todos lo valores de la estadstica prueba
que conducen a la decisin de rechazar H0 . Segn el tipo de hiptesis
que se tenga, el estadstico de prueba y en nivel de significancia, se
puede obtener una regin de rechazo.

Para el ejemplo del nivel de contaminacin por CO se plantea la


siguiente hiptesis:

H0 : = 5,5 H1 : < 5,5

Si luego de tomar una muestra se observa que luego de tomar una


muestra de 20 motocicletas se encuentra que x = 5,3, podemos
determinar que las motocicletas cumplen con la reglamentacin
ambiental? y si encuentra que x = 3 ?
Regin de rechazo

x
Si H0 : = 0 H1 : < 0 entonces z =
/ n
N (0, 1).

z , llamado valor crtico,


es el punto de divisin
Regin de rechazo Regin de no rechazo
entre la regin en que se
rechaza H0 y la regin
donde no se rechaza
(P (z < z ) = )

Z 0

z
Regin de rechazo

x
Si H0 : = 0 H1 : > 0 entonces z =
/ n
N (0, 1).

Regin de no rechazo Regin de rechazo


z1 es el valor crtico
(P (z > z1 ) = )

0 Z1

z
Regin de rechazo

x
Si H0 : = 0 H1 : 6= 0 entonces z =
/ n
N (0, 1).

los valores z/2 y z1/2


son los valores crticos
Regin de rechazo Regin de no rechazo Regin de rechazo
(P (z < z/2 o P (z >
z1/2 ) = )

Z 2 0 Z1 2

z
Ejemplo
Un cientfico est probando el efecto de una droga en el tiempo de respuesta
para 100 ratas inyectadas con una unidad de dosis de la droga, luego cada
una de las ratas es estimulada y se registra el tiempo de respuesta. El
cientfico sabe que el tiempo de respuesta medio para las ratas, sin ser
inyectadas, es de 1.2 segundos. El tiempo de respuesta promedio para las
ratas inyectadas fue de 1.05. Si se sabe que la desviacin estndar es de
0.5 segundos. Hay evidencia suficiente para determinar que la droga tuvo
un efecto en el tiempo de respuesta?
Ejemplo
Un cientfico est probando el efecto de una droga en el tiempo de respuesta
para 100 ratas inyectadas con una unidad de dosis de la droga, luego cada
una de las ratas es estimulada y se registra el tiempo de respuesta. El
cientfico sabe que el tiempo de respuesta medio para las ratas, sin ser
inyectadas, es de 1.2 segundos. El tiempo de respuesta promedio para las
ratas inyectadas fue de 1.05. Si se sabe que la desviacin estndar es de
0.5 segundos. Hay evidencia suficiente para determinar que la droga tuvo
un efecto en el tiempo de respuesta?

H0 : = 1,2 La droga no tuvo efecto


H1 : 6= 1,2 La droga tuvo efecto
Estadstico de prueba:
x
zc =
/ n
Regla de decisin:

Rechazo H0 si zc < z/2 o zc > z1/2


Ejemplo
Un cientfico est probando el efecto de una droga en el tiempo de respuesta
para 50 ratas inyectadas con una unidad de dosis de la droga, luego cada
una de las ratas es estimulada y se registra el tiempo de respuesta. El
cientfico sabe que el tiempo de respuesta medio para las ratas, sin ser
inyectadas, es de 1.2 segundos. El tiempo de respuesta promedio para las
ratas inyectadas fue de 1.05. Si se sabe que la desviacin estndar es de
0.5 segundos. Hay evidencia suficiente para determinar que la droga tuvo
un efecto en el tiempo de respuesta?

H0 : = 1,2 H1 : 6= 1,2
Estadstico de prueba:
1,05 1,2
zc = = 2,12
0,5/ 50
Regla de decisin (con un = 0,05):
Dado que |zc | = 2,12 < z/2 = 1,96 Se rechaza H0 . Con un nivel de
confianza del 95 %, hay evidencia suficiente para determinar que la media
de las ratas inyectadas es diferente de 1.2 segundos.
Ejemplo

De acuerdo a la afirmacin de un fabricante de una marca de


cigarrillos, el contenido medio de nicotina de cada cigarrillo es igual
a 3.5mg. Un organismo de control est interesado en determinar si el
contenido de nicotina de esos cigarrillos no excede lo que el fabricante
afirma. De acuerdo a esto, Cul debera ser el sistema de hiptesis?
Ejemplo

De acuerdo a la afirmacin de un fabricante de una marca de


cigarrillos, el contenido medio de nicotina de cada cigarrillo es igual
a 3.5mg. Un organismo de control est interesado en determinar si el
contenido de nicotina de esos cigarrillos no excede lo que el fabricante
afirma. De acuerdo a esto, Cul debera ser el sistema de hiptesis?

H0 = 3,5 H1 > 3,5

para esto toma una muestra de 15 cigarrillos y encuentra los


siguientes resultados:

x = 4,2mg S = 1,4mg

De acuerdo con estos resultados muestrales, Est de acuerdo con


la afirmacin del fabricante?
Ejemplo

De acuerdo a la afirmacin de un fabricante de una marca de


cigarrillos, el contenido medio de nicotina de sus cigarrillos es igual a
3.5mg. Un organismo de control est interesado en determinar si el
contenido de nicotina de esos cigarrillos no excede lo que el fabricante
afirma. De acuerdo a esto, Cul debera ser el sistema de hiptesis?

H0 = 3,5 H1 > 3,5

4,2 3,5
tc = = 1,936
1,4/ 15
Dado que 1,936 > t0,95,14 = 1,76, se puede concluir que, con un nivel
de significancia del 5 %, hay evidencia suficiente para determinar que
el contenido medio de nicotina de los cigarrillos es superior a 3.5mg.
valor p

Una forma de informar los resultados es mediante y la decisin


tomada sobre H0 (rechazo o no rechazo). Si es pequeo la decisin
de rechazar H0 es muy convinciente, pero si es grande le resta
fuerza a la prueba si la decisin adoptada es la de rechazar H0 . Por
otro lado, para muy pequeo, el hecho de no rechazar H0 no se
interpretar como un apoyo indiscutible a esta hiptesis.
valor p

Una forma de informar los resultados es mediante y la decisin


tomada sobre H0 (rechazo o no rechazo). Si es pequeo la decisin
de rechazar H0 es muy convinciente, pero si es grande le resta
fuerza a la prueba si la decisin adoptada es la de rechazar H0 . Por
otro lado, para muy pequeo, el hecho de no rechazar H0 no se
interpretar como un apoyo indiscutible a esta hiptesis.

Una forma alternativa de presentar resultados es por medio del


valor p, definido como el mayor de los valores para los cules
se rechazara la hiptesis nula si sta se contrasta a nivel . Este
valor depende de los datos muestrales.

A partir del valor p se puede tomar la decisin de rechazar H0 si este


valor es pequeo.
valor p

Probabilidad, calculada suponiendo que H0 sea cierta, de que el


resultado tom un valor al menos tan extremo como el observado.

Para el ejemplo del


contenido de cigarrillo:

P (x > 4,2| = 3,5)

P (t > tc )

0 tc

t
valor p

En el ejemplo de la respuesta de las ratas donde las hiptesis son:

H0 : = 1,2 H1 : 6= 1,2

y se encontr que x = 1,05 y = 0,05. zc = 2,12

Como se determina el valor p?


valor p

En el ejemplo de la respuesta de las ratas donde las hiptesis son:

H0 : = 1,2 H1 : 6= 1,2

y se encontr que x = 1,05 y = 0,05. zc = 2,12

Como se determina el valor p?

P (z > 2,12 o z < 2,12) = 2P (z < 2,12)

2P (z < 2,12) = 0,033 = Valor p


valor p

En el ejemplo de la respuesta de las ratas donde las hiptesis son:

H0 : = 1,2 H1 : 6= 1,2

y se encontr que x = 1,05 y = 0,05. zc = 2,12

Como se determina el valor p?

P (z > 2,12 o z < 2,12) = 2P (z < 2,12)

2P (z < 2,12) = 0,033 = Valor p


Si el valor p es menor o igual que el nivel de significancia, entonces
se rechaza la hiptesis nula. Si por el contrario es mayor que el nivel
de significancia, la hiptesis nula no se rechaza
Prueba de hiptesis para la varianza
Si H0 : 2 = 02 H1 : 2 < 02 entonces

(n 1)S 2
2 = 2(n1)
02

Rechazo No rechazo Rechazo si 2c < 2(n1,)

2
Prueba de hiptesis para la varianza
Si H0 : 2 = 02 H1 : 2 > 02 entonces

(n 1)S 2
2 = 2(n1)
02

Rechazo si
No Rechazo Rechazo
2c > 2(n1,1)

21

2
Prueba de hiptesis para la varianza
Si H0 : 2 = 02 H1 : 2 6= 02 entonces

(n 1)S 2
2 = 2(n1)
02

Rechazo si
Rechazo No Rechazo Rechazo 2c< 2(n1,/2) o
2c> 2(n1,1/2)

2 2 21 2

2
Ejemplo
Una maquina de llenado de botellas debe estar programada para efectuar
un llenado con una desviacin estndar no superior a 5ml. Para probar
que esto se est cumpliendo eso se extrajeron aleatoriamente 20 botellas
de llenado y se encontr que S = 6,2. Se supone que los datos estn
normalmente distribuidos. Si se desea evaluar la calidad de la mquina de
llenado, cul debera ser el sistema de hiptesis a probar?
Ejemplo
Una maquina de llenado de botellas debe estar programada para efectuar
un llenado con una desviacin estndar no superior a 5ml. Para probar
que esto se est cumpliendo eso se extrajeron aleatoriamente 20 botellas
de llenado y se encontr que S = 6,2. Se supone que los datos estn
normalmente distribuidos. Si se desea evaluar la calidad de la mquina de
llenado, cul debera ser el sistema de hiptesis a probar?

H0 : 2 = 25 H1 : 2 25
Estadstico de prueba:
(n 1)S 2
2c =
02
Regla de decisin:

Rechazo H0 si 2c < 21
Prueba de hiptesis para una proporcin
Si H0 : P = P0 H1 : P < P0 Si n es grande, entonces
P P0
z=q N (0, 1)
P0 (1P0 )
n
.

Regin de rechazo Regin de no rechazo


Rechazo si z < z

Z 0

z
Prueba de hiptesis para una proporcin
Si H0 : P = P0 H1 : P > P0 Si n es grande, entonces
P P0
z=q N (0, 1)
P0 (1P0 )
n
.

Regin de no rechazo Regin de rechazo Rechazo si z > z1

0 Z1

z
Prueba de hiptesis para una proporcin
Si H0 : P = P0 H1 : P 6= P0 Si n es grande, entonces
P P0
z=q N (0, 1)
P0 (1P0 )
n
.

Rechazo si
Regin de rechazo Regin de no rechazo Regin de rechazo
z < z/2 o z > z1/2

Z 2 0 Z1 2

z
Ejemplo
El gerente de una empresa de produccin asegura que su proceso genera
una proporcin de unidades defectuosas de mximo 5 %, al tomar una
muestra de su producto se obtiene que de 200 unidades revisadas, un total
de 15 unidades fueron defectuosas. Realizar una prueba de hiptesis del
90 % Los datos corroboran la afirmacin del productor?
Ejemplo
El gerente de una empresa de produccin asegura que su proceso genera
una proporcin de unidades defectuosas de mximo 5 %, al tomar una
muestra de su producto se obtiene que de 200 unidades revisadas, un total
de 15 unidades fueron defectuosas. Realizar una prueba de hiptesis del
90 % Los datos corroboran la afirmacin del productor?

H0 : P = 0,05 H1 : P 0,05
Estadstico de prueba:
p P0
zc = q
P0 (1P0 )
n

Regla de decisin:

Rechazo H0 si zc > z1
Ejercicio

Una central lechera compra leche a varios proveedores. La centra sospecha


que algunos ganaderos aaden agua a la leche para aumentar sus
beneficios. El exceso de agua se puede detectar midiendo el punto de
congelacin de la leche. La temperatura de congelacin de la leche natural
varia normalmente, con una media de -0.545 C y una desviacin estndar
de 0.008 C. La adiccin de agua aumenta la temperatura de congelacin
y la acerca a 0 C (punto de congelacin del agua).

El director del laboratorio de la central lechera determina la temperatura


de congelacin de 15 lotes consecutivos de leche procedentes de un mismo
proveedor y encuentra que x = 0,538o C.

hay evidencia de que el proveedor est aadiendo agua a la leche?


Ejercicio

Una compaa de seguros asegura que el 90 % de sus reclamos son resueltos


en menos de 30 das. Un grupo de clientes duda de esa afirmacin y para
probarla toman una muestra aleatoria de 75 reclamos hechos a la compaa.
El grupo encontr que 55 de los reclamos fue resuelto en menos de 30 das.

El grupo de clientes tiene evidencia suficiente para determinar que lo


dicho por la compaa es falso?
Bibliografa

Devore, J. L. (2008). Probabilidad y estadstica para ingeniera y


ciencias. Thomson Paraninfo, Mxico, vol. 7 edition.
Gutierrez, A. and Zhang, H. (2010). Teora Estadstica: Aplicaciones
y Mtodos. Universidad Santo Toms, Bogot,Colombia, vol. 1
edition.
Montgomery, D. and Runger, G. (2004). Probabilidad y estadstica
aplicadas la ingeniera. Limusa-Wiley, Mxico, 2 edition.
Moore, D. S. (2005). Estadstica aplicada bsica. Antoni Bosch
Editor, Barcelona, Espaa, vol. 2 edition.

You might also like