Professional Documents
Culture Documents
PRUEBA DE HIPOTESIS
Las secciones anteriores han mostrado cmo puede estimarse un parmetro a partir de los datos
contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador puntual) o un
intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos problemas de
ingeniera, ciencia, y administracin, requieren que se tome una decisin entre aceptar o
rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el nombre de
hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que muchos
tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniera,
pueden formularse como problemas de prueba de hiptesis.
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una o ms
poblaciones.
Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido
utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters se
centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae en decir
si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de manera formal
como
Ho;
H1;
La proposicin Ho;
H1;
= 50 cm/s
50 cm/s
especifica valores de
como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una
hiptesis alternativa unilateral, como en
Ho;
= 50 cm/s Ho;
= 50 cm/s H1;
> 50 cm/s
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres maneras
diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces
el objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor
del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo
estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o
modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las
especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el
nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del empleo
de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta
informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si
esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse
hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con
certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible
en muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de prueba
de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin equivocada.
La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms caractersticas de
poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a Ho, y sta es la
hiptesis del investigador.
La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia muestral
sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se contina creyendo
en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis por
prueba de hiptesis son rechazar Ho o no rechazar Ho.
Prueba de una Hiptesis Estadstica
Para ilustrar los conceptos generales, considere el problema de la rapidez de combustin del
agente propulsor presentado con anterioridad. La hiptesis nula es que la rapidez promedio de
combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es igual a 50 cm/s.
Esto es, se desea probar:
Ho;
H1;
= 50 cm/s
50 cm/s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se observa
cual es la rapidez de combustin promedio muestral. La media muestral es un estimador de la
media verdadera de la poblacin. Un valor de la media muestral
hipottico
es realmente
50 cm/s; esto es, tal evidencia apoya la hiptesis nula H o. Por otra parte, una media muestral
muy diferente de 50 cm/s constituye una evidencia que apoya la hiptesis alternativa H 1. Por
tanto, en este caso, la media muestral es el estadstico de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5
entonces no se rechaza la hiptesis nula H o;
se acepta la hiptesis alternativa H1;
Los valores de
= 50 cm/s, y que si
<48.5
51.5,
>51.5, entonces
50 cm/s.
que son menores que 48.5 o mayores que 51.5 constituyen la regin crtica de
la prueba, mientras que todos los valores que estn en el intervalo 48.5
51.5 forman la
regin de aceptacin. Las fronteras entre las regiones crticas y de aceptacin reciben el nombre
de valores crticos. La costumbre es establecer conclusiones con respecto a la hiptesis nula H o.
Por tanto, se rechaza H o en favor de H1 si el estadstico de prueba cae en la regin crtica, de lo
contrario, no se rechaza Ho.
Este procedimiento de decisin puede conducir a una de dos conclusiones errneas. Por
ejemplo, es posible que el valor verdadero de la rapidez promedio de combustin del agente
propulsor sea igual a 50 cm/s. Sin embargo, para todos los especmenes bajo prueba, bien puede
observarse un valor del estadstico de prueba
nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del 5%.
Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia sera
del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50 cm/s,
aunque la media muestral
cuando sta es falsa. Este tipo de conclusin recibe el nombre de error tipo II.
El error tipo II error
Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones diferentes que
determinan si la decisin final es correcta o errnea.
Decisin
Ho es verdadera
Ho es falsa
Aceptar Ho
No hay error
Error tipo II
Rechazar Ho
Error tipo I
No hay error
de forma simultnea.
aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor
hipottico, ser menor
PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS
Independientemente de la distribucin que se este tratando
1. Interpretar correctamente hacia que distribucin muestral se ajustan los datos del
enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los parmetros de los
estadsticos. As mismo se debe determinar en este punto informacin implcita como el
tipo de muestreo y si la poblacin es finita o infinita.
3. Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del
problema. El ensayo de hiptesis est en funcin de parmetros ya que se quiere
evaluar el universo de donde proviene la muestra. En este punto se determina el tipo de
ensayo (unilateral o bilateral).
4. Establecer la regla de decisin. Esta se puede establecer en funcin del valor crtico, el
cual se obtiene dependiendo del valor de
funcin del estadstico lmite de la distribucin muestral. Cada una de las hiptesis
deber ser argumentada correctamente para tomar la decisin, la cual estar en funcin
de la hiptesis nula o Ho.
5. Calcular el estadstico real, y situarlo para tomar la decisin.
6. Justificar la toma de decisin y concluir.
Una prueba es de dos colas cuando no se establece una direccin especfica de la hiptesis
alterna H1
Ejemplo 8:
H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres.
H1: el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.
En este caso la distribucin de muestreo para el valor estadstico z, prueba de dos colas, nivel de
significancia de 0.05 se estable como se indica en la siguiente fig.
estadstico de prueba es z
Ejemplo 9:
X1 X 2
s12 s 22
n1 n 2
Se realiz un estudio para comparar los aos promedio de servicio de quienes se retiraron en
1979 con los que se retiraron el ao anterior en Delong Manufacturing Co. Con un nivel de
significancia de .01 podemos concluir que los trabajadores que se retiraron el ao pasado
trabajaron ms aos segn la siguiente muestra? Nota: sea poblacin #1= ao anterior.
Paso 1:
H0: 2 1
Paso 2
Rechace H0 si z > 2.33
Paso 3:
Paso 4:
Como z = 6.80 > 2.33, H0 se rechaza.
Conclusin.- Los que se retiraron el ao anterior tenan ms aos de servicio.
y varianza
Si
por s? La
para
>2, respectivamente.
Sin embargo, la
distribucin t tiene colas ms amplias que la normal; esto es, la probabilidad de las colas es
mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a
infinito, la forma lmite de la distribucin t es la distribucin normal estndar.
grados de libertad.
Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media
desviacin estndar
; es decir,
a la izquierda, es igual
Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se
tiene que hacer la resta de
en
el primer rengln de la tabla y luego buscar los grados de libertad en la primer columna y donde
se intercepten
se obtendr el valor de t.
Ejemplo 12:
Encuentre la probabilidad de t0.025 < t < t0.05.
Solucin:
Como t0.05 deja un rea de 0.05 a la derecha, y t 0.025 deja un rea de 0.025 a la izquierda,
encontramos un rea total de 1-0.05-0.025 = 0.925.
P( t0.025 < t < t0.05) = 0.925
Ejemplo 13:
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamao 15 que se
selecciona de una distribucin normal.
Solucin:
Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a
este valor le corresponde un rea de 0.05 a la izquierda, por ser negativo el valor. Entonces si se
resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a
en el primer rengln con 14 grados de libertad y se obtiene un valor de t = 2.977, pero como el
valor de
tanto:
P(-2.977 < t < -1.761) = 0.045
con
desconocida,
El Instituto Elctrico Edison publica cifras del nmero anual de Kilowatt-hora que gastan varios
aparatos elctrodomsticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatthora al ao. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica
que las aspiradoras gastan un promedio de 42 kilowatt-hora al ao con una desviacin estndar
de11.9 kilowatt-hora, esto sugiere con un nivel de significancia de 0.05 que las aspiradoras
gastan, en promedio, menos de 46 kilowatt-hora anualmente? Suponga que la poblacin de
kilowatt-hora es normal.
Solucin:
Datos:
= 46 kilowatt-hora
s = 11.9 kilowatt-hora
= 42 kilowatt-hora
n = 12
= 0.05
Paso 1
Ho;
= 46 kilowatt-hora
H1;
< 46 kilowatt-hora
Paso 2
Si tR
-1.796 No se rechaza Ho
Regla de decisin:
Si
Si
39.83 No se Rechaza Ho
< 39.83 Se rechaza Ho
Como la
Se puede aprovechar este ejemplo para calcular el valor de P , como el valor de t calculada es de
1.16, se busca en la tabla y se ve que el area a la izquierda de este valor es de 0.135 con 11
grados de libertad, por lo tanto no se rechaza H o., ya que sera un valor alto para un nivel de
significancia.
EJERCICIO 1
Un artculo publicado en la revista Materials Engineering describe los resultados de pruebas de
resistencia a la adhesin de 22 especmenes de aleacin U-700. La carga para la que cada
especmen falla es la siguiente en MPa:
19.8
18.5
17.6
16.7
15.8
15.4
14.1
13.6
11.9
11.4
11.4
8.8
7.5
15.4
15.4
19.5
14.9
12.7
11.9
11.4
10.1
7.9
Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supngase que la
carga donde se presenta la falla tiene una distribucin normal, y utilicese
= 0.05. Calcule el
valor de P.
EJERCICIO 2
Los pesos en libras de una muestra aleatoria de bebs de seis meses son: 14.6, 12.5, 15.3, 16.1,
14.4, 12.9, 13.7 y 14.9. Haga una prueba con nivel de 5% de significancia para determinar si el
peso promedio de todos los bebs de seis meses es distinto a 14 libras, suponga que sus pesos se
distribuyen normalmente y calcule el valor de P.
4.5
MUESTREO
PEQUEO:
DISTRIBUCIN
JI
CUADRADA,
estadstico:
, el
gl=n-1 grados de libertad y se denota 2 ( es la minscula de la letra griega ji). El estadstico ji-
para x>0
La tabla que se utilizar para estos apuntes es la del libro de probabilidad y estadstica de
Walpole, la cual da valores crticos
. Para denotar
(gl); este
ao
acerca de la varianza se puede hacer utilizando las medidas estadsticas con las que se construy
el intervalo de confianza
Ejemplo 15:
1. Una compaa que produce una parte maquinada para un motor, afirma que tiene una
varianza de dimetro no mayor a 0.0002 pulgadas. Una muestra aleatoria de 10 de
dichas partes dio una varianza de muestra s2 = 0.0003. Si se supone que las medidas del
dimetro se distribuyen en forma normal, hay evidencia para refutar lo que afirma el
proveedor? Use
= 0.05.
Solucin:
Como en todos los ensayos de hiptesis que se han realizado anteriormente el
procedimiento es el mismo. Despus de que se identifican los datos, se plantea la
hiptesis para determinar el tipo de ensayo.
Datos:
= 0.0002
n = 10
s2 = 0.0003
= 0.05
Ensayo de hiptesis:
Ho;
= 0.0002
H1;
> 0.0002
Regla de decisin:
Si X2R
Justificacin y decisin:
Como 13.5 no es mayor que 16.919 por lo tanto no se rechaza Ho y se concluye con un
nivel de significancia de 0.05 que no se puede refutar la afirmacin del proveedor.
Este ejercicio se puede aprovechar para calcular el valor de P. En la tabla se busca el
valor de 13.5 en el rengln de 9 grados de libertad. Interpolando entre 0.10 y 0.20 se
obtiene un valor de P de 0.1484.
EJERCICIO 3
El contenido de azcar del almbar de los duraznos enlatados tiene una distribucin normal,
donde se cree que la varianza es
desviacin estndar de 4.8 mg. Muestran estos datos suficiente evidencia para decir que la
varianza ha cambiado? Use un
Experiencia anterior indica que el tiempo que se requiere para que los estudiantes de ltimo ao
de preparatoria completen una prueba estandarizada es una variable aletoria normal con una
desviacin estndar de seis minutos. Se toma una muestra aleatoria de 20 estudiantes de ltimo
ao de preparatoria y se obtiene una desviacin estndar de 4.51. Muestran estos datos
suficiente evidencia para decir que la desviacin estndar disminuy?. Utilice el valor de P para
su decisin.