You are on page 1of 15

PRUEBA DE HIPOTESIS Y PLANTEAMINETO DE LA HIPOTESIS

PRUEBA DE HIPOTESIS
Las secciones anteriores han mostrado cmo puede estimarse un parmetro a partir de los datos
contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador puntual) o un
intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos problemas de
ingeniera, ciencia, y administracin, requieren que se tome una decisin entre aceptar o
rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el nombre de
hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que muchos
tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniera,
pueden formularse como problemas de prueba de hiptesis.
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una o ms
poblaciones.
Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido
utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters se
centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae en decir
si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de manera formal
como
Ho;
H1;
La proposicin Ho;
H1;

= 50 cm/s
50 cm/s

= 50 cm/s, se conoce como hiptesis nula, mientras que la proposicin

50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la hiptesis alternativa

especifica valores de

que pueden ser mayores o menores que 50 cm/s, tambin se conoce

como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una
hiptesis alternativa unilateral, como en
Ho;

= 50 cm/s Ho;

= 50 cm/s H1;

< 50 cm/s H1;

> 50 cm/s

Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres maneras
diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces
el objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor
del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo
estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o
modelo.

3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las
especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el
nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del empleo
de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta
informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si
esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse
hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con
certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible
en muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de prueba
de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin equivocada.
La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms caractersticas de
poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a Ho, y sta es la
hiptesis del investigador.
La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia muestral
sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se contina creyendo
en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis por
prueba de hiptesis son rechazar Ho o no rechazar Ho.
Prueba de una Hiptesis Estadstica
Para ilustrar los conceptos generales, considere el problema de la rapidez de combustin del
agente propulsor presentado con anterioridad. La hiptesis nula es que la rapidez promedio de
combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es igual a 50 cm/s.
Esto es, se desea probar:
Ho;
H1;

= 50 cm/s
50 cm/s

Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se observa
cual es la rapidez de combustin promedio muestral. La media muestral es un estimador de la
media verdadera de la poblacin. Un valor de la media muestral
hipottico

que este prximo al valor

= 50 cm/s es una evidencia de que el verdadero valor de la media

es realmente

50 cm/s; esto es, tal evidencia apoya la hiptesis nula H o. Por otra parte, una media muestral
muy diferente de 50 cm/s constituye una evidencia que apoya la hiptesis alternativa H 1. Por
tanto, en este caso, la media muestral es el estadstico de prueba.

La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5
entonces no se rechaza la hiptesis nula H o;
se acepta la hiptesis alternativa H1;
Los valores de

= 50 cm/s, y que si

<48.5

51.5,

>51.5, entonces

50 cm/s.

que son menores que 48.5 o mayores que 51.5 constituyen la regin crtica de

la prueba, mientras que todos los valores que estn en el intervalo 48.5

51.5 forman la

regin de aceptacin. Las fronteras entre las regiones crticas y de aceptacin reciben el nombre
de valores crticos. La costumbre es establecer conclusiones con respecto a la hiptesis nula H o.
Por tanto, se rechaza H o en favor de H1 si el estadstico de prueba cae en la regin crtica, de lo
contrario, no se rechaza Ho.
Este procedimiento de decisin puede conducir a una de dos conclusiones errneas. Por
ejemplo, es posible que el valor verdadero de la rapidez promedio de combustin del agente
propulsor sea igual a 50 cm/s. Sin embargo, para todos los especmenes bajo prueba, bien puede
observarse un valor del estadstico de prueba

que cae en la regin crtica. En este caso, la

hiptesis nula Ho ser rechazada en favor de la alternativa H 1cuando, de hecho, Ho en realidad es


verdadero. Este tipo de conclusin equivocada se conoce como error tipo I.
El error tipo I se define como el rechazo de la hiptesis nula H o cuando sta es verdadera.
Tambin es conocido como

nivel de significancia.

Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del 5%.
Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia sera
del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50 cm/s,
aunque la media muestral

caiga dentro de la regin de aceptacin. En este caso se acepta H o

cuando sta es falsa. Este tipo de conclusin recibe el nombre de error tipo II.
El error tipo II error

se define como la aceptacin de la hiptesis nula cuando sta es falsa.

Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones diferentes que
determinan si la decisin final es correcta o errnea.
Decisin

Ho es verdadera

Ho es falsa

Aceptar Ho

No hay error

Error tipo II

Rechazar Ho

Error tipo I

No hay error

1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de


uno por lo general tiene como resultado un aumento en la probabilidad del otro.
2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I,
siempre se puede reducir al ajustar el o los valores crticos.

3. Un aumento en el tamao muestral n reducir


4. Si la hiptesis nula es falsa,

de forma simultnea.

es un mximo cuando el valor real del parmetro se

aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor
hipottico, ser menor
PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS
Independientemente de la distribucin que se este tratando
1. Interpretar correctamente hacia que distribucin muestral se ajustan los datos del
enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los parmetros de los
estadsticos. As mismo se debe determinar en este punto informacin implcita como el
tipo de muestreo y si la poblacin es finita o infinita.
3. Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del
problema. El ensayo de hiptesis est en funcin de parmetros ya que se quiere
evaluar el universo de donde proviene la muestra. En este punto se determina el tipo de
ensayo (unilateral o bilateral).
4. Establecer la regla de decisin. Esta se puede establecer en funcin del valor crtico, el
cual se obtiene dependiendo del valor de

(Error tipo I o nivel de significancia) o en

funcin del estadstico lmite de la distribucin muestral. Cada una de las hiptesis
deber ser argumentada correctamente para tomar la decisin, la cual estar en funcin
de la hiptesis nula o Ho.
5. Calcular el estadstico real, y situarlo para tomar la decisin.
6. Justificar la toma de decisin y concluir.

PRUEBAS UNILATERALES Y BILATERALES


Una prueba es de una cola cuando la hiptesis alterna, H 1, establece una direccin.
Ejemplo 7:
H0: el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres.
H1: el ingreso medio de las mujeres es mayor que el de los hombres.
Para este caso la distribucin de muestreo para el valor estadstico z, prueba de una cola, nivel
de significancia de .05 se establece como indica la siguiente Fig.

Una prueba es de dos colas cuando no se establece una direccin especfica de la hiptesis
alterna H1
Ejemplo 8:
H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres.
H1: el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.
En este caso la distribucin de muestreo para el valor estadstico z, prueba de dos colas, nivel de
significancia de 0.05 se estable como se indica en la siguiente fig.

PRUEBA DE HIPOTESIS PARA UNA DISTRIBUCIN MUESTRAL DE


DIFERENCIAS DE MEDIAS
Suponga que los parmetros para dos poblaciones son: 1, 2, 1, 2
Para muestras grandes el estadstico de prueba es:
Cuando 1 y 2 no se conocen pero el tamao de muestra n1 y n2 es mayor o igual que 30, el

estadstico de prueba es z

Ejemplo 9:

X1 X 2
s12 s 22

n1 n 2

Se realiz un estudio para comparar los aos promedio de servicio de quienes se retiraron en
1979 con los que se retiraron el ao anterior en Delong Manufacturing Co. Con un nivel de
significancia de .01 podemos concluir que los trabajadores que se retiraron el ao pasado
trabajaron ms aos segn la siguiente muestra? Nota: sea poblacin #1= ao anterior.

Paso 1:
H0: 2 1
Paso 2
Rechace H0 si z > 2.33
Paso 3:

Paso 4:
Como z = 6.80 > 2.33, H0 se rechaza.
Conclusin.- Los que se retiraron el ao anterior tenan ms aos de servicio.

MUESTREO PEQUEO T STUDENT, PRUEBA DE HIPOTESIS SOBRE LA


MEDIA POBLACIONAL, PRUEBA DE HIPOTESIS PARA LA DIFERENCIA ENTRE
DOS MEDIAS
En las actividades anteriores se manej el uso de la distribucin z, la cual se poda utilizar
siempre y cuando los tamaos de las muestras fueran mayores o iguales a 30 en muestras ms
pequeas si la distribucin o las distribuciones de donde proviene la muestra o las muestras son
normales.
En esta actividad y la siguiente se podrn utilizar muestras pequeas siempre y cuando la
distribucin de donde proviene la muestra tenga un comportamiento normal. Esta es una
condicin para utilizar las dos distribuciones que se manejarn en estas actividades; t de student,
2 ji-cuadrada
DISTRIBUCION "t DE STUDENT"
Supngase que se toma una muestra de una poblacin normal con media

y varianza

Si

es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribucin

es una distribucin normal estndar. Supngase que la varianza de la poblacin

es desconocida. Qu sucede con la distribucin de esta estadstica si se reemplaza

por s? La

distribucin t proporciona la respuesta a esta pregunta.


La media y la varianza de la distribucin t son

para

>2, respectivamente.

La siguiente figura presenta la grfica de varias distribuciones t. La apariencia general de la


distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas y
unimodales, y el valor mximo de la ordenada se alcanza en la media

Sin embargo, la

distribucin t tiene colas ms amplias que la normal; esto es, la probabilidad de las colas es
mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a
infinito, la forma lmite de la distribucin t es la distribucin normal estndar.

Propiedades de las distribuciones t


1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, est ms dispersa que la curva normal estndar z.
3. A medida que
4. A medida que

aumenta, la dispersin de la curva t correspondiente disminuye.


, la secuencia de curvas t se aproxima a la curva normal estndar,

por lo que la curva z recibe a veces el nombre de curva t con gl =


La distribucin de la variable aleatoria t est dada por:

Esta se conoce como la distribucin t con

grados de libertad.

Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media

desviacin estndar

. Entonces la variable aleatoria

tiene una distribucin t con

n-1 grados de libertad.


La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la muestra y
siempre es mayor a uno. nicamente cuando el tamao de la muestra tiende a infinito las dos
distribuciones sern las mismas.
Se acostumbra representar con

el valor t por arriba del cual se encuentra un rea igual a

Como la distribucin t es simtrica alrededor de una media de cero, tenemos


el valor t que deja un rea de

a la derecha y por tanto un rea de

al valor t negativo que deja un rea de

; es decir,

a la izquierda, es igual

en la cola derecha de la distribucin. Esto es, t 0.95 =

-t0.05, t0.99=-t0.01, etc.


Para encontrar los valores de t se utilizar la tabla de valores crticos de la distribucin t del
libro Probabilidad y Estadstica para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo 11:
El valor t con

= 14 grados de libertad que deja un rea de 0.025 a la izquierda, y por tanto un

rea de 0.975 a la derecha, es


t0.975=-t0.025 = -2.145

Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se
tiene que hacer la resta de

. La manera de encontrar el valor de t es buscar el valor de

en

el primer rengln de la tabla y luego buscar los grados de libertad en la primer columna y donde
se intercepten

se obtendr el valor de t.

Ejemplo 12:
Encuentre la probabilidad de t0.025 < t < t0.05.
Solucin:

Como t0.05 deja un rea de 0.05 a la derecha, y t 0.025 deja un rea de 0.025 a la izquierda,
encontramos un rea total de 1-0.05-0.025 = 0.925.
P( t0.025 < t < t0.05) = 0.925
Ejemplo 13:
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamao 15 que se
selecciona de una distribucin normal.
Solucin:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a
este valor le corresponde un rea de 0.05 a la izquierda, por ser negativo el valor. Entonces si se
resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a

Luego se busca el valor de 0.005

en el primer rengln con 14 grados de libertad y se obtiene un valor de t = 2.977, pero como el
valor de

est en el extremo izquierdo de la curva entonces la respuesta es t = -2.977 por lo

tanto:
P(-2.977 < t < -1.761) = 0.045

PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION


NORMAL, VARIANZA DESCONOCIDA
Ciertamente sospechamos que las pruebas sobre una media poblacional

con

desconocida,

debe incluir el uso de la distribucin t de Student. La estructura de la prueba es idntica a la del


caso de

conocida, con la excepcin de que el valor

en la estadstica de prueba se reemplaza

por la estimacin de s calculada y la distribucin normal estndar se reemplaza con una


distribucin t.
Ejemplo 14:

El Instituto Elctrico Edison publica cifras del nmero anual de Kilowatt-hora que gastan varios
aparatos elctrodomsticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatthora al ao. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica
que las aspiradoras gastan un promedio de 42 kilowatt-hora al ao con una desviacin estndar
de11.9 kilowatt-hora, esto sugiere con un nivel de significancia de 0.05 que las aspiradoras
gastan, en promedio, menos de 46 kilowatt-hora anualmente? Suponga que la poblacin de
kilowatt-hora es normal.
Solucin:
Datos:
= 46 kilowatt-hora
s = 11.9 kilowatt-hora
= 42 kilowatt-hora
n = 12
= 0.05
Paso 1
Ho;

= 46 kilowatt-hora

H1;

< 46 kilowatt-hora

Paso 2
Si tR

-1.796 No se rechaza Ho

Si tR < -1.796 Se rechaza Ho


Paso 3

Paso 4.- Justificacin y decisin:


Como 1.16 > -1.796, por lo tanto no se rechaza H o y se concluye con un nivel de significancia
del 0.05 que el nmero promedio de kilowwatt-hora que gastan al ao las aspiradoras no es
significativamente menor que 46.
Solucin por el otro mtodo:

Regla de decisin:
Si
Si

39.83 No se Rechaza Ho
< 39.83 Se rechaza Ho

Como la

= 42 y este valor no es menor que 39.83 por lo tanto no se rechaza H o.

Se puede aprovechar este ejemplo para calcular el valor de P , como el valor de t calculada es de
1.16, se busca en la tabla y se ve que el area a la izquierda de este valor es de 0.135 con 11
grados de libertad, por lo tanto no se rechaza H o., ya que sera un valor alto para un nivel de
significancia.

EJERCICIO 1
Un artculo publicado en la revista Materials Engineering describe los resultados de pruebas de
resistencia a la adhesin de 22 especmenes de aleacin U-700. La carga para la que cada
especmen falla es la siguiente en MPa:
19.8

18.5

17.6

16.7

15.8

15.4

14.1

13.6

11.9

11.4

11.4

8.8

7.5

15.4

15.4

19.5

14.9

12.7

11.9

11.4

10.1

7.9

Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supngase que la
carga donde se presenta la falla tiene una distribucin normal, y utilicese

= 0.05. Calcule el

valor de P.
EJERCICIO 2
Los pesos en libras de una muestra aleatoria de bebs de seis meses son: 14.6, 12.5, 15.3, 16.1,
14.4, 12.9, 13.7 y 14.9. Haga una prueba con nivel de 5% de significancia para determinar si el
peso promedio de todos los bebs de seis meses es distinto a 14 libras, suponga que sus pesos se
distribuyen normalmente y calcule el valor de P.

4.5

MUESTREO

PEQUEO:

DISTRIBUCIN

JI

CUADRADA,

CUADROS DE CONTINGENCIA LIMITACIONES DE LA PRUEBA DE JI


CUADRADA
En realidad la distribucin ji-cuadrada es la distribucin muestral de s 2. O sea que si se extraen
todas las muestras posibles de una poblacin normal y a cada muestra se le calcula su varianza,
se obtendr la distribucin muestral de varianzas.
Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el estadstico
X2. Si se elige una muestra de tamao n de una poblacin normal con varianza

estadstico:

, el

tiene una distribucin muestral que es una distribucin ji-cuadrada con

gl=n-1 grados de libertad y se denota 2 ( es la minscula de la letra griega ji). El estadstico ji-

donde n es el tamao de la muestra, s2 la varianza

cuadrada esta dado por:


muestral y

la varianza de la poblacin de donde se extrajo la muestra. El estadstico ji-

cuadrada tambin se puede dar con la siguiente expresin:


Propiedades de las distribuciones ji-cuadrada
1. Los valores de 2 son mayores o iguales que 0.
2. La forma de una distribucin 2 depende del gl=n-1. En consecuencia, hay un nmero
infinito de distribuciones 2.
3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.

4. Las distribuciones 2 no son simtricas. Tienen colas estrechas que se extienden a la


derecha; esto es, estn sesgadas a la derecha.
5. Cuando n>2, la media de una distribucin 2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribucin 2 se da en el valor (n-3).
La siguiente figura ilustra tres distribuciones 2
Note que el valor modal aparece en el valor (n-3) = (gl-2).

La funcin de densidad de la distribucin 2 esta dada por:

para x>0
La tabla que se utilizar para estos apuntes es la del libro de probabilidad y estadstica de
Walpole, la cual da valores crticos

(gl) para veinte valores especiales de

. Para denotar

el valor crtico de una distribucin X 2 con gl grados de libertad se usa el smbolo


valor crtico determina a su derecha un rea de

(gl); este

bajo la curva X2 y sobre el eje horizontal. Por

ejemplo para encontrar 2 0.05(6) en la tabla se localiza 6 gl en el lado izquierdo y

ao

largo del lado superior de la misma tabla.

Ensayo de Hiptesis para la Varianza de una Poblacin Normal


En la mayora de los casos se tiene el problema de desconocer la varianza o desviacin estndar
de la poblacin, en donde las distribuciones son normales. Si se desea probar una hiptesis

acerca de la varianza se puede hacer utilizando las medidas estadsticas con las que se construy
el intervalo de confianza

, esto es con la distribucin Ji- cuadrada.

Ejemplo 15:
1. Una compaa que produce una parte maquinada para un motor, afirma que tiene una
varianza de dimetro no mayor a 0.0002 pulgadas. Una muestra aleatoria de 10 de
dichas partes dio una varianza de muestra s2 = 0.0003. Si se supone que las medidas del
dimetro se distribuyen en forma normal, hay evidencia para refutar lo que afirma el
proveedor? Use

= 0.05.

Solucin:
Como en todos los ensayos de hiptesis que se han realizado anteriormente el
procedimiento es el mismo. Despus de que se identifican los datos, se plantea la
hiptesis para determinar el tipo de ensayo.
Datos:
= 0.0002
n = 10
s2 = 0.0003
= 0.05
Ensayo de hiptesis:
Ho;

= 0.0002

H1;

> 0.0002

Regla de decisin:
Si X2R

16.919 no se rechaza Ho.

Si X2R>16.919 se rechaza Ho.


Clculos:

Justificacin y decisin:

Como 13.5 no es mayor que 16.919 por lo tanto no se rechaza Ho y se concluye con un
nivel de significancia de 0.05 que no se puede refutar la afirmacin del proveedor.
Este ejercicio se puede aprovechar para calcular el valor de P. En la tabla se busca el
valor de 13.5 en el rengln de 9 grados de libertad. Interpolando entre 0.10 y 0.20 se
obtiene un valor de P de 0.1484.

EJERCICIO 3
El contenido de azcar del almbar de los duraznos enlatados tiene una distribucin normal,
donde se cree que la varianza es

= 18 mg2. Se toma una muestra de 10 latas dieron una

desviacin estndar de 4.8 mg. Muestran estos datos suficiente evidencia para decir que la
varianza ha cambiado? Use un

= 0.05 y calcule el valor de P.


EJERCICIO 4

Experiencia anterior indica que el tiempo que se requiere para que los estudiantes de ltimo ao
de preparatoria completen una prueba estandarizada es una variable aletoria normal con una
desviacin estndar de seis minutos. Se toma una muestra aleatoria de 20 estudiantes de ltimo
ao de preparatoria y se obtiene una desviacin estndar de 4.51. Muestran estos datos
suficiente evidencia para decir que la desviacin estndar disminuy?. Utilice el valor de P para
su decisin.

You might also like