Estadistica I. Metodos Estadisticos I FACYT - UC

ndice general
1. Introduccin a la estadstica
1.1. Introduccin . . . . . . . . . . . . . . . . . . .
1.2. Medidas numricas descriptivas . . . . . . . .
1.2.1. Medidas de localizacin . . . . . . . . .
1.2.2. Medidas de variabilidad . . . . . . . .
1.3. Tabla y grficas para datos numricos . . . . .
1.3.1. Distribucin de frecuencias . . . . . . .
1.3.2. Grficos . . . . . . . . . . . . . . . . .
1.4. Medidas numricas para datos agrupados . . .
1.5. Puntos de posicin para datos de una tabla de
1.6. Ejercicios propuestos . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
frecuencia
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2. Distribucin en el muestreo
2.1. Principales estadsticos. . . . . . . . . . . . . . . . . . . . . . .
2.1.1. Media muestral X . . . . . . . . . . . . . . . . . . . .
2.1.2. Varianza muestral V 2 . . . . . . . . . . . . . . . . . . .
2.1.3. Proporcin muestral P . . . . . . . . . . . . . . . . . .
2.1.4. Estadstico de orden . . . . . . . . . . . . . . . . . . .
2.2. Distribuciones lmites . . . . . . . . . . . . . . . . . . . . . . .
2.2.1. Desigualdad de chebyshev . . . . . . . . . . . . . . . .
2.2.2. Ley de los grandes nmeros . . . . . . . . . . . . . . .
2.3. Distribuciones muestrales de algunos estadsticos importantes .
2.3.1. Distribucin muestral de X . . . . . . . . . . . . . . .
2.4. Distribuciones muestrales relacionadas con la distribucin normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.1. Distribucin chi-cuadrado de Pearson . . . . . . . . . .
2.4.2. Distribucin t de Student . . . . . . . . . . . . . . . .
i
1
1
8
9
13
18
18
23
29
34
36
45
49
49
51
54
54
61
61
65
68
70
76
77
85
NDICE GENERAL
ii
2.5. Distribucin de la diferencia de medias muestrales . . . . . . . 91

2.5.1. Distribucin de la diferencia de medias cuando se conocen las varianzas . . . . . . . . . . . . . . . . . . . . 91
2.5.2. Distribucin de la diferencia de medias cuando las varianzas son desconocidas pero iguales . . . . . . . . . . 94
2.5.3. Distribucin de la diferencia de medias cuando las varianzas son desconocidas y distintas . . . . . . . . . . . 97
2.5.4. Distribucin de la diferencia de medias cuando las varianzas son desconocidas y tamaos de muestras grandes 99
2.6. Distribucin F de Snedeer . . . . . . . . . . . . . . . . . . . . 99
2.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . 102
2.8. Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
2.8.1. Momentos y funcin generadora de momentos de una
variable aleatoria . . . . . . . . . . . . . . . . . . . . . 109
2.8.2. Funcin generadora de momentos de una variable aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
2.8.3. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . 123
3. Estimacin puntual
3.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1. Estimacin puntual . . . . . . . . . . . . . . . . .
3.2. Mtodos para construir estimadores . . . . . . . . . . . .
3.2.1. Mtodo por mxima verosimilitud . . . . . . . . .
3.2.2. Mtodo de los Momentos . . . . . . . . . . . . . .
3.3. Propiedades de los estimadores puntuales . . . . . . . . .
3.3.1. Estimadores insesgados . . . . . . . . . . . . . . .
3.3.2. Estimadores insesgados de varianza mnima . . .
3.3.3. Estimadores consistentes . . . . . . . . . . . . . .
3.3.4. Estimadores suficientes . . . . . . . . . . . . . . .
3.4. Propiedades de los estimadores de mxima verosimilitud
3.5. Estimacin puntual bayesiana . . . . . . . . . . . . . . .
3.6. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
127
127
128
129
129
136
141
147
151
157
161
167
168
173
4. Estimacin por intervalos

185
4.1. Interpretacin de un intervalo de confianza . . . . . . . . . . . 185
4.2. Construcin de un intervalo de confianza: Mtodo del pivote . 187
4.3. Intervalo de confianza para la media de una distribucin normal188
4.3.1. Caso en el que la varianza de la poblacin es conocida . 188
FaCyT-Matemticas
NDICE GENERAL
iii
4.4.
4.5.
4.6.
4.7.
4.8.
4.9.
4.3.2. Caso en el que la varianza de la poblacin es desconocida194

Intervalo de confianza para la diferencia de medias de dos poblaciones normales independientes . . . . . . . . . . . . . . . . 196
4.4.1. Caso de ambos varianzas conocidas . . . . . . . . . . . 196
4.4.2. Caso en que las varianzas son desconocidas pero iguales 200
4.4.3. Caso en que las varianzas son desconocidas y distintas 204
Intervalo de confianza para la varianza de una distribucin
normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
Intervalo de confianza para el cociente de las varianzas de dos
distribuciones normales . . . . . . . . . . . . . . . . . . . . . . 209
Intervalo de confianza para el parmetro p cuando se muestra
una distribucin binomial . . . . . . . . . . . . . . . . . . . . 212
4.7.1. Seleccin de la muestra . . . . . . . . . . . . . . . . . . 214
Intervalo de confianza para la diferencias de proporciones . . . 215
Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . 218
5. Prueba de hiptesis sobre los parmetros

5.1. Elementos de una prueba de hiptesis . . . . . . . . . . . . .
5.2. Pruebas para muestras grandes . . . . . . . . . . . . . . . .
5.3. Clculo de probabilidades de error tipo II . . . . . . . . . . .
5.4. Determinacin del tamao muestral para la prueba Z . . . .
5.5. Nivel de significancia alcanzado o valor p . . . . . . . . . . .
5.6. Pruebas de hiptesis sobre la media de una distribucin normal, varianza desconocida . . . . . . . . . . . . . . . . . . .
5.7. Pruebas de hiptesis sobre las medias de dos distribuciones
normales, varianzas desconocidas . . . . . . . . . . . . . . .
5.7.1. Caso 1: x2 = y2 = 2 . . . . . . . . . . . . . . . . . .
5.7.2. Caso 2: x2 6= y2 . . . . . . . . . . . . . . . . . . . . .
5.8. Pruebas de hiptesis sobre la varianza de una distribucin normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.9. Pruebas de hiptesis sobre la varianzas de dos distribuciones
normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.10. Potencia de las pruebas . . . . . . . . . . . . . . . . . . . . .
5.11. Lema de Neyman-Pearson . . . . . . . . . . . . . . . . . . .
5.12. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . .
Universidad de Carabobo
225
. 225
. 233
. 243
. 245
. 247
. 250
. 253
. 253
. 256
. 258
.
.
.
.
263
267
275
280
NDICE GENERAL
iv
FaCyT-Matemticas
Captulo 1
Introduccin a la estadstica
1.1.
Introduccin
La estadstica es una rama de las matemticas que se ocupa de los mtodos

y procedimientos para la recopilacin, clasificacin, presentacin y anlisis
de datos, siempre y cuando la variabilidad e incertidumbre sea una causa
intrnseca de los mismos; con la idea de ayudar en la toma de decisiones y
formular predicciones.
Se puede clasificar la estadstica en:
Descriptiva
Describe, analiza y representa a
los datos con mtodos numricos
y grficas para resumir la informacin contenida en los mismos.
Inferencial
Efecta estimaciones, toma decisiones, predicciones u otras generalizaciones a partir de un conjunto de datos.
El aspecto ms importante de la estadstica es la obtencin de conclusiones

basadas en datos experimentales, este proceso se llama inferencia estadstica;
que no es ms, que la coleccin de tcnicas que permiten formular inferencias
inductivas y que proporcionan una medida del riesgo de stas.
La diferencia entre probabilidad e inferencia estadstica es que dentro del
clculo de probabilidades se pretende calcular la probabilidad de ciertos sucesos a partir de probabilidades calculadas de otros sucesos ms simples. As,
si se supone que un determinado experimento aleatorio se puede modelizar
mediante una variable aleatoria de Bernoulli de parmetro p conocido, la
1
Sec 1.1. Introduccin
probabilidad de que el suceso xito se presente en dos repeticiones consecutivas del experimento es p2 .
En esta lnea, se dice que el clculo de probabilidades utiliza un razonamiento deductivo. As, tras modelizar la incertidumbre mediante la probabilidad,
es posible utilizar dicho razonamiento para llegar a obtener probabilidades
de sucesos ms complicados a partir de las probabilidades de sucesos ms
simples.
En cambio, se puede decir que la inferencia estadstica pretende, dados unos
datos sujetos a incertidumbre, obtener el conocimiento de los parmetros,
en un sentido amplio, del modelo de clculo de probabilidades que aceptablemente se ajuste a dichos datos. En este sentido, la inferencia estadstica
utiliza un razonamiento de tipo inductivo.
Ejemplo 1.1. En un proceso de fabricacin a lo largo del tiempo, puede producir a veces algn elemento defectuoso. Si se denota con p la probabilidad de
que un elemento fabricado sea defectuoso, la cul es desconocida, y supongase
que se extraen de toda la produccin n elementos, entonces con la informacin contenida en la muestra se trata de inferir o estimar el verdadero valor
del parmetro p.

Por lo que se puede decir que, la probabilidad trabaja desde la poblacin
hacia la muestra, mientras la inferencia estadstica trabaja desde la muestra
hacia la poblacin.
Para comprender la naturaleza de la inferencia estadstica, es necesario entender las nociones de poblacin y muestra.
FaCyT-Matemticas
Cap 1. Introduccin a la estadstica
Poblacin: Es un conjunto finito o infinito de individuos u objetos que poseen una caracterstica comn observable. La poblacin representa el estado
de la naturaleza o las formas de las cosas con respecto a un fenmeno aleatorio en particular, mismo que puede identificarse a travs de una caracterstica
medible X.
Una poblacin es un conjunto de elementos que presentan una caracterstica comn. Cadenas (1974)
Ejemplo 1.2. De poblacin

1. Nmero de personas que llegan a la
emergencia de un hospital durante un
da (finita).
2. Nmero de estudiantes de la Universidad de Carabobo (finita).
3. Todos los adultos de Venezuela (finita).
Una poblacin es
un conjunto de todos los elementos
que se est estudiando, acerca de
los cules se intenta sacar conclusiones. Levin & Rubin (1996)

A menudo es imposible o poco prctico observar la totalidad de la poblacin,
sobre todos si esta es muy grande. En lugar de examinar el grupo entero llamado poblacin, se examina una pequea parte del grupo llamada muestra.
Muestra: Uno o mas elementos que son tomados de la poblacin con el
objeto de obtener informacin que ayude de base para tomar una decisin
acerca de una caracterstica de la poblacin.
Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla. Murria R. Spiegel
(1991)
Ejemplo 1.3. De muestra

El estudio realizado a 50 estudiantes de la
Universidad de Carabobo.

Una muestra es
una coleccin de algunos elementos de
la poblacin, pero
no de todos. Levin
& Rubin (1996)
Una muestra representativa de la poblacin contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal
poblacin.
Una buena inferencia estadstica se basa en la escogencia de una buena
muestra. Una manera de realizar esto resulta cuando el proceso de obtencin
de la muestra proporciona igual oportunidad a cada elemento de la poblacin
de ser incluido en est.
Si la poblacin es de tamao N y se toma una muestra de tamao n, el proceso
de muestreo
debe asegurar que todas las posibles muestras de tamao n, es
decir, Nn tienen la misma posibilidad de ser seleccionadas. Esto se conoce
como muestreo aleatorio simple.
Ejemplo 1.4. Muestreo aleatorio simple
Supongamos que se tienen 50 hojas de un tamao conveniente y que en las
mismas se escriben 50 nombres (distintos), despus de escribir los nombres se
doblan las hojas de una forma para ser introducidos en una bolsa. Se selecciona a una persona que tenga los ojos vendados y la misma procede a sacar 10
hojas dobladas que posteriormente sern premiadas. Aqu la poblacin consta
de N = 50 elementos y cada elemento de la muestra de tamao n = 10, se
selecciona
aleatoriamente uno por uno. En este muestreo se pueden seleccio50
nar 10 = muestras de tamao 10 cada una con la misma probabilidad de
ser seleccionada.

Variable estadstica:
Una variable es una caracteristica observable que vara entre los diferentes
individuos o unidades experimentales de una poblacin. La informacin que
se dispone de cada individuo o unidades experimentales es resumida en variables.
FaCyT-Matemticas
Los datos u observaciones:

Los datos son nmeros o denominaciones que se le puede asignar a un individuo o unidades experimentales de la poblacin.
Ejemplo 1.5. Son ejemplos de variables y datos:
1. El nmero de hijos de una persona.
{0, 1, 2, 3, . . .}
2. La respuesta a la pregunta Usted fuma?
{Si, N o}
3. El tipo de sangre.
{A, B, AB, O}
4. La estatura de un trabajador.
{1 62, 1 74, . . .}

Parmetros:
Un parmetro es cualquier caracterstica medible de una poblacin.
Ejemplo 1.6. El ingreso promedio de todos los trabajadores de una determinada empresa es un ejemplo de parmetro, si todos los trabajadores se
consideran como una poblacin.

Estadstico:
Un estadstico es cualquier caracterstica medible de una muestra.
Ejemplo 1.7. La estatura media (x) de los estudiantes de la escuela de ingenieria industrial de la Universidad de Carabobo, es un ejemplo de estadstico.
Son una muestra representativa si se considera la poblacin como todos los
estudiantes de la Universidad de Carabobo?

Si X alguna caracterstica de inters de poblacin, entonces X es una variable aleatoria que sigue cierta funcin de densidad f (x; ).
Supongas que se tiene un proceso de manufactura y se define la variable aleatoria X como el nmero de artculos defectuosos en una muestra de tamao
n = 45. Bajo ciertas hiptesis que idealizan el experimento (independencia
entre eventos, eventos de Bernoulli,. . .), X tiene una distribucin Binomial
con parmetros n = 45 y p (desconocido).
Si se tiene particular inters, por ejemplo, en calcular la probabilidad de que
X sea menor que 5 u otras caracteristicas asociadas con la distribucin de
probabilidad tales como la media, la varianza,. . ., la respuesta depender del
parmetro p. Tambin se puede tener inters en conocer (estimar, inferir) el
verdadero porcentaje de artculos producidos por el proceso de manutactura,
entre otros. Ests son algunas de las respuesta que nos ofrece la ciencia de
las estadstica en donde cierto nmero de realizaciones (observaciones) de la
variable aleatoria X
x1 , x2 , . . . , xn
es la materia prima para obtener informacin acerca del valor del parmetro
p.
Tipos de variables aleatorias:
Los tipos de variables que comnmente se consideran son:
1. Variables cualitativas o atributos: no toman valores numricos y describen cualidades.
Ejemplo 1.8. En un proceso de manufactura. Una variable aleatoria
X de inters puede ser clasificar una pieza como aceptable o defectuosa.

2. Variables cuantitativas discretas: toman slo valores enteros, en muchos
casos se limita a contar el nmero de veces que ocurre un suceso.
Ejemplo 1.9. En un proceso de manufactura. Una variable aleatoria
X de inters puede ser contar el nmero de piezas clasificadas como
defectuosas en una muestra dada. Entonces X es una variable aleatoria discreta que puede tomar los valores 0, 1, 2, . . . , n en donde n es el
tamao de la muestra.
FaCyT-Matemticas

3. Variables cuantitativas continuas: toman valores en un intervalo, corresponde a medir magnitudes continuas.
Ejemplo 1.10. Sea X una variable aleatoria que representa el tiempo entre llamadas a una oficina de atencin al cliente, entonces X es
una variable aleatoria continua que puede tomar cualquier valor en el
intervalo (0, ).

Existen varias maneras de realizar un muestreo de una poblacin; por ejemplo, se disea un experimento aleatorio y se lleva a cabo para extraer una
muestra de tamao n midiendo una caracterstica X de la poblacin de estudio.
1. Despus de mezclar adecuadamente los elementos de la poblacin, se
extrae uno, se observa la caracterstica, X1 es esta observacin. Se repone el elemento a la poblacin, y esta se vuelve a mezclar y se extrae
un segundo elemento y se anota la segunda observacin, X2 y as sucesivamente se repite el proceso hasta obtener una muestra de tamao
n
X1 , X2 , . . . , Xn
Este proceso de tomar la muestra se llama muestreo con reemplazo.
2. Despus de mezclar adecuadamente los elementos de la poblacin se
seleccionan n elementos, uno despus del otro sin reemplazo.
X1 , X2 , . . . , Xn
Este proceso de tomar la muestra se llama muestreo sin reemplazo.
Ejemplo 1.11. De muestreo sin reemplazo
Si se extrae una muestra de una poblacin de bombillas para estimar
la vida media de las bombillas que la integran, no ser posible medir
ms que una vez la bombilla seleccionada.
Sec 1.2. Medidas numricas descriptivas
8

Muestreo con reemplazo

X1 , X2 , . . . , Xn son variables aleatorios cuya funcin de densidad es
igual a la funcin de densidad de
la poblacin.
X1 , X2 , . . . , Xn son variables aleatorias independientes e idnticamente distribuidas porque por el
reemplazo ningn valor se ve afectado por otro.
Muestreo sin reemplazo

X1 , X2 , . . . , Xn son variables aleatorias cuyas distribuciones marginales son iguales a la de la poblacin.
X1 , X2 , . . . , Xn son variables aleatorias dependientes.
Muestreo estratificado:
Se usa cuando se conoce de antemano que la poblacin est dividida en estratos, que son equivalentes a categoras y los cules por lo general no son de
igual tamao. Luego, de cada estrato se saca una muestra aleatoria, usualmente proporcional al tamao del estrato.
Nuestreo por conglomerado (Clusters):
En este caso la poblacin se divide en grupos llamados conglomerados. Luego
se elige al azar un cierto nmero de ellos y todos los elementos de los conglomerados elegidos forman la muestra.
Muestreo sistemtico:
Se usa cuando los datos de la poblacin estn ordenados en forma numrica.
La primera observacin es elegida al azar de entre los primeros elementos de
la poblacin y las siguientes observaciones son elegidas guardando la misma
distancia entre si.
1.2.
Medidas numricas descriptivas
En est seccin se definen algunas medidas numricas que se emplean comnmente para describir conjuntos de datos. Algunas de ests medidas son
utilizadas como base para hacer inferencias sobre los parmetros de una poblacin. Existen dos medidas de inters importantes para cualquier conjunto
de datos:
FaCyT-Matemticas
1. La localizacin de su centro, y
2. La variabilidad
La tendencia central de un conjunto de datos es la disposicin de stos para
agruparse ya sea alrededor del centro o de ciertos valores numricos. La variabilidad de un conjunto de datos es la dispersin de las observaciones en el
conjunto.
1.2.1.
Medidas de localizacin
Existen principalmente tres medidas de tendencia central: la media, la mediana y la moda. Para ejemplificar las definiciones se considera el siguiente
ejemplo:
Ejemplo 1.12. Un ingeniero Industrial desea conocer el comportamiento de

una mquina automtica que deposita un lquido en vasos, para ello seleccion
una muestra aleatoria de 50 de ellos. Al medir el contenido, en onzas, se
obtuvo los siguientes resultados:
8.05
7.97
7.85
8.09
8.21
7.86
7.98
8.05
8.10
7.96
8.10
7.99
8.06
8.10
8.22
8.09
7.99
8.06
7.87
8.24
7.88
8.17
8.06
8.11
8.05
8.07
8.03
7.89
8.11
8.04
7.92
8.03
8.07
8.12
7.94
8.04
8.07
8.16
7.95
8.26
8.08
8.16
8.21
8.05
8.09
8.01
7.97
8.05
7.87
8.19
Se desea obtener informacin relevante a partir de la informacin contenida

en los datos que ayude al ingeniero industrial a mejorar el proceso de llenado.
Por ejemplo, clculo de algunas medidas numricas descriptivas (estadstica
descriptiva) como primera etapa del anlisis de datos y luego hacer uso de alguna metodologa que ayude al ingeniero industrial a tomar decisiones acerca
del proceso de llenado (inferencia estadstica).
10
Definicin 1.1. (MEDIA MUESTRAL)

Sea X1 , X2 , . . . , Xn una muestra de tamao n. La media de las realizaciones de las variables aleatorias x1 , x2 , . . . , xn es el promedio aritmtico de stas y se denotar por
n
P
x=
xi
i=1
(1.1)
Ejemplo 1.13. Clculo de la media muestral

Consider los resultados obtenidos en el ejemplo (1.12). Entonces la media
muestral para estos datos viene dada por:
x=
8 05 + 7 86 + 8 10 + + 8 05 + 8 04
= 8 0498
50

La media es una medida apropiada de tendencia central para muchos conjunto de datos. Sin embargo, dado que cualquier observacin en el conjunto
se emplea para su clculo, el valor de la media puede afectarse de manera desproporcionada por la existencia de algunos valores extremos o datos
atpicos1 . Por este motivo se recurre a definir otras medidas de localizacin
que sean ms robustas, es decir menos vulnerables a la presencia de algunos
valores extremos.
Definicin 1.2. (MEDIANA MUESTRAL)

Sea X1 , X2 , . . . , Xn una muestra de tamao n. La mediana de las
realizaciones de las variables aleatorias x1 , x2 , . . . , xn , denotada por
Med, es el valor para el cul, cuando las realizaciones se ordenan de
manera creciente, la mitad de stas es menor que este valor y la otra
mitad mayor.
1
es una observacin que es numricamente distante del resto de los datos.
FaCyT-Matemticas
11
Si el tamao de la muestra aleatoria es impar, la mediana es el valor de la

realizacin de la variable aleatoria que se encuentra a la mitad del conjunto
ordenado. Si es par se considera la mediana como el promedio aritmtico de
las dos realizaciones que se encuentren a la mitad del conjunto ordenado.
Esto es,
si n es impar
x( n+1 ) ,
2
(1.2)
M ed =
x(n/2) +x(1+n/2) , si n es par

2
donde x(1) x(n) es la muestra ordenada.
Ejemplo 1.14. Clculo de la mediana
Consider los datos del ejemplo (1.12). Primero se ordenan las realizaciones
de manera creciente
7.85
7.97
8.05
8.09
8.19
7.86
7.98
8.05
8.09
8.21
7.87
7.99
8.05
8.10
8.21
7.87
7.99
8.06
8.10
8.22
7.88
8.01
8.06
8.10
8.24
7.89
8.03
8.06
8.11
8.26
7.92
8.03
8.07
8.11
7.94
8.04
8.07
8.12
7.95
8.04
8.07
8.16
7.96
8.05
8.08
8.16
7.97
8.05
8.09
8.17
Como el tamao de la muestra (n = 50) es par, la mediana muestral esta

dada por:
x(25) + x(26)
8 05 + 8 06
M ed =
=
= 8 055
2
2

Alternativamente, la mediana puede determinarse a partir de la distribucin
acumulativa, es decir, la mediana es el cuantil de orden 0 50. Esto es:
P (X < M ed) 0 50 y P (X M ed) 0 50
Puesto que la mediana es un valor que se basa en la secuencia ordenada de las
realizaciones de las variables aleatorias, es necesario saber que la existencia
de algunos valores extremos no afectar su valor. Por tanto, si el conjunto de
las realizaciones de las variables aleatorias contiene algunos valores extremos
y el tamao de la muestra aleatoria es muy alto, la mediana puede ser una
medida de tendencia central mucho ms deseable que la media muestral.
12
Definicin 1.3. (MEDIA TRUNCADA)

Para una coleccin de realizaciones de variables aleatorias se llama
media truncada de orden con 0 < < 0 5, a la media x de las
realizaciones que quedan de quitar 100 % ms bajo y el 100 % ms
alto de las mismas. Formalmente
x =

1
x([n]+1) + + x(n[n])
n 2 [n]
(1.3)
Las medias truncadas ms usadas son x0 1 y x0 2 . Por [m] se entiende

la parte entera de m.
Ejemplo 1.15. Clculo de la media truncada

Para la coleccin de datos del ejemplo (1.12), la media truncada correspondiente a = 0 2 es
30
x0 2
241 56
1 X
1
x(11) + + x(40) =
= 8 052
=
x(i) =
30 i=11
30
30
y para = 0 1 la media truncada es

45
x0 1 =
322 02
1 X
1
x(6) + + x(45) =
= 8 0505
x(i) =
40 i=5
40
40

Definicin 1.4. (MODA)

Sea X1 , X2 , . . . , Xn una muestra de tamao n. La moda de las realizaciones de las variables aleatorias x1 , x2 , . . . , xn , denotada por Mod,
es el valor de la realizacin que ocurre con mayor frecuencia en el
conjunto.
La moda muestra hacia que valor tienden las realizaciones a agruparse. En

tamaos de muestras relativamente pequeos, puede que no exista un par
FaCyT-Matemticas
13
de realizaciones cuyo valor sea el mismo. En esta situacin no es clara la

definicin de moda y se dice que no hay moda. Tambin puede suceder que
la frecuencia ms alta se encuentre compartida por dos realizaciones. En estos
casos, la moda tiene una utilidad limitada como tendencia central y se dice
que la distribucin es bimodal.
Ejemplo 1.16. Clculo de la moda
Consider los datos del ejemplo (1.12). La moda de este conjunto de realizaciones es
M od = 8 05
que se repite 5 veces.

1.2.2.
Medidas de variabilidad
Una medida de localizacin proporciona informacin acerca de ciertos valores

numricos donde tienden agruparse los datos pero no proporciona ninguna
idea de la variabilidad de los datos en dicho conjunto. Por ejemplo, consider
los dos siguientes conjuntos de datos, cada uno de los cuales consiste de
cuatro realizaciones de las variables aleatorias X y Y, respectivamente.
Primer conjunto
0, 25, 75, 100
Segundo conjunto
48, 49, 51, 52
En ambos conjuntos, x = y = M edx = M edy = 50. Estos dos conjuntos son

muy diferentes entre s, esto es, las realizaciones en el primero se encuentra
mucho ms dispersas que las del segundo. Una de las medidas ms tiles
de dispersin o variacin en un conjunto de datos es la varianza muestral.
Esta medida de variabilidad es una de las ms importantes que se debe
tener en cuenta a la hora de utilizar un estadstico2 como estimador de algn
parmetro desconocido de la poblacin, como se ver ms adelante en los
captulos siguientes.
2
ver definicin (2.2)
14
Definicin 1.5. (VARIANZA MUESTRAL)

Sea X1 , X2 , . . . , Xn una muestra de tamao n. La varianza del conjunto de realizaciones x1 , x2 , . . . , xn de las variables aleatorias, es el
promedio del cuadrado de las diferencias entre cada observacin y la
media muestral del conjunto de realizaciones. La varianza se denota
por
n
P
(xi x)2
v 2 = i=1
(1.4)
n
Cuando la varianza de la poblacin es desconocida y se usa la expresin (1.4)

para estimarla, V 2 tiende a subestimar el verdadero valor de 2 , por est
razn se prefiere utilizar la varianza muestral corregida definida por
Definicin 1.6. (VARIANZA MUESTRAL CORREGIDA)

n
P
s2 =
(xi x)2
i=1
n1
(1.5)
La varianza es una medida razonablemente buena de la variabilidad debido a

que si muchas de la diferencias son grandes (o pequeas) entonces el valor de
la varianza s2 ser grande (o pequeo). El valor de la varianza puede sufrir
un cambio muy desproporcionado, an ms que la media, por la existencia
de algunos valores extremos o datos atpicos.
Definicin 1.7. (DESVIACIN ESTANDAR MUESTRAL)

la raz cuadrada positiva de s2 recibe el nombre de desviacin estndar
y se denota por
v
uP
u n
u (xi x)2
t
s = i=1
(1.6)
n1
FaCyT-Matemticas
15
A menudo se utiliza la desviacin estndar en relacin con la varianza como

medida de variabilidad, porque est se expresa en las mismas unidades fsicas
de las realizaciones.
Ejemplo 1.17. Clculo de la varianza y desviacin estndar corregida

Con un poco de lgebra, se puede demostrar la siguiente frmula para el
clculo de la varianza corregida:

n
P
s2 =
x2i
n
P
2
xi
i=1
i=1
(1.7)
n1
A continuacin se ilustran los pasos que se deben seguir para el clculo de la

varianza y desviacin estndar corregida, para los datos del ejemplo (1.12).
50
X
i=1
50
X
xi =8 05 + 7 86 + 8 10 + + 8 05 + 8 04 = 402 49
x2i =8 052 + 7 862 + 8 102 + + 8 052 + 8 042 = 3240 479
i=1
se usa la ecuacin (1.7), para obtener la varianza corregida

3240 479
s =
49
2
(402 49)2
50
= 0 0105
y de la ecuacin (1.6) se sigue que la desviacin estndar es

s=
0 0105 = 0 1025

16
Definicin 1.8. (DESVIACIN MEDIA)

Sea X1 , X2 , . . . , Xn una muestra de tamao n. La desviacin media
del conjunto de realizaciones x1 , x2 , . . . , xn de las variables aleatorias,
es el promedio de los valores absolutos de las diferencias entre cada
observacin y la media muestral de las observaciones. La desviacin
media est dada por:
n
P
|xi x|
i=1
(1.8)
Dx =
n
Puede verse entonces que, cuanto mayor sea la dispersin existente entre las
observaciones, tanto mayor tender a ser el promedio del valor absoluto de
las diferencias de los datos, respecto de la media muestral.
Ejemplo 1.18. Clculo de la desviacin media
Para los datos del ejemplo (1.12), la desviacin media se calcula a partir de
50
X
|xi x| = |8 05 8 0498| + |7 86 8 0498| + |8 10 8 0498| + + |8 04 8 0498|
i=1
= 3 912
de aqu que:
Dx =
3 912
= 0 0782
50

Definicin 1.9. (DESVIACIN MEDIANA)

Sea X1 , X2 , . . . , Xn una muestra de tamao n. La desviacin mediana
del conjunto de realizaciones x1 , x2 , . . . , xn de las variables aleatorias,
es el promedio de los valores absolutos de las diferencias entre cada
observacin y la mediana de las observaciones. La desviacin mediana
est dada por:
n
P
|xi M ed|
i=1
DM ed =
(1.9)
n
donde M ed representa la mediana de los datos.
FaCyT-Matemticas
17
Ejemplo 1.19. Clculo de la desviacin mediana

Para los datos del ejemplo (1.12), la desviacin media se calcula a partir de
50
X
|xi M ed| = |8 05 8 055| + |7 86 8 055| + |8 10 8 055| + + |8 04 8 055|
i=1
= 3 91
de aqu que:
DM ed =
3 91
= 0 0782
50

Cuando la mediana se emplea como medida de tendencia central con el propsito de disminuir los efectos de la existencia de algunos valores extremos
en el conjunto de observaciones, la desviacin mediana debe preferirse en vez
de la desviacin media como medida de dispersin por la misma razn.
Definicin 1.10. (COEFICIENTE DE VARIACIN)
Es una medida de variabilidad de los datos que se expresa en porcentaje en la cual se compara la desviacin estndar con el respectivo
valor de la media muestral de los datos:

s
CV =
100
(1.10)
|x|
Grado de variabilidad de los datos
Coeficiente de variacin
Con variabilidad baja

Con variabilidad moderada
Con alta variabilidad
Menos de 10 %
De 10 % a 30 %
Ms de 30 %
Sec 1.3. Tabla y grficas para datos numricos
18
Ejemplo 1.20. Clculo del coeficiente de variacin

Para el ejemplo (1.12), el coeficiente de variacin es:
s
CV =
100
x

0 1025
=
100
8 0498
= 1 27 %
por tanto, los datos tienen poca dispersin.

1.3.
1.3.1.
Tabla y grficas para datos numricos

Distribucin de frecuencias
La distribucin de frecuencias nos ayuda a obtener conclusiones de un conjuntos grandes de datos. Al construir una distribucin de frecuencias, se debe
tener especial atencin en seleccionar el nmero apropiado de agrupaciones
o clases para la tabla de distribucin de frecuencias (tabla que permite organizar los datos de tal manera que sirvan para la toma de decisiones), determinando una amplitud conveniente de las clases y estableciendo los limites
de cada una para evitar que se superpongan entre si.
A la hora de construir una tabla de distribucin de frecuencias se puede seguir el siguiente procedimiento:
Calcular el rango (R)

El rango se define como la diferencia entre el valor mximo y el valor mnimo
de los datos, es decir:
R = Mx(x1 , x2 , . . . , xn ) Mn(x1 , x2 , . . . , xn )
para los datos del ejemplo (1.12), el rango de estos datos es:
R = 8 26 7 85 = 0 41
FaCyT-Matemticas
19
Calcular el nmero de clases o agrupaciones (K)

Para definir el nmero de clases se puede aplicar cualquiera de los mtodos
que se enumeran a continuacin:
1. Fijar K mediante la frmula
K
Ln(n)
Ln(2)
donde Ln() es el logaritmo neperiano y n es el nmero de datos por

agrupar. Para el ejemplo (1.12), el nmero de clase que se utilizara
sera:
Ln(50)
= 5 644 6
K
Ln(2)
2. Definir K mediante la frmula
K 1 + 3 322Log(n)
donde n es el nmero de datos. En este caso el nmero de clases sera:
K 1 + 3 322Log(50) = 6 644 7
3. Seleccionar K, dependiendo del nmero de observaciones en la muestra
Tamao de la muestra
16-31
32-63
64-127
128-255
256-511
Nmero de clases
5
6
7
8
9
Para el ejemplo (1.12), el nmero de datos es n = 50, entonces se puede

tomar a K = 6 como el nmero de clases.
Calcular la Amplitud de Intervalo (A)
La amplitud de la clase esta definida como:
A=
R
K
20
usando la primera frmula, la amplitud de cada clase para los datos del
ejemplo (1.12) es:
0 41
A=
= 0 0683 0 07
6
Construir los lmites de las clases [Li Ls )
Primer intervalo:
El lmite inferior del primer intervalo es Li = 7 85. Primer valor de los
datos ordenados.
EL lmite superior de primer intervalo es Ls = Li + A = 7 92 .
Segundo intervalo:
El lmite inferior del segundo intervalo es Li = 7 92.
El lmite superior del segundo intervalo Ls = Li + A = 7 99.
y as sucesivamente, hasta que se hallan formado las 6 clases.
Lmites de la clase
[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]
Lmites reales de las clases [LRi LRs )

Los lmites reales inferior y superior de la primera clase se obtienen restando y
sumando media unidad a los lmites inferiores y superiores, respectivamente.
FaCyT-Matemticas
21
La unidad apropiada se selecciona con el uso de la siguiente tabla:

Datos presentados a
Unidad
la unidad mas cercana
Media unidad
Entero
Dcimas
Centesimas
Milesimas
Diezmilesima
0.5
0.05
0.005
0.0005
0.00005
1
0.1
0.01
0.001
0.0001
para el ejemplo (1.12), la unidad correspondiente es 0 005, entonces los lmites

reales inferiores y superiores para la primera clase vienen dado por:
LRi = Li 0 005 = 7 845
y
LRs = Ls + 0 005 = 7 855
respectivamente. Los lmites reales superiores de las otras cinco clases se
obtienen sumando 0 005 a los lmites superiores.
Lmites reales de la clase
[7 845, 7 925)
[7 925, 7 995)
[7 995, 8 065)
[8 065, 8 135)
[8 135, 8 205)
[8 205, 8 275]
Calcular las Marcas de clase o Puntos Medios de clase (ci )
Las marcas de clase o puntos medios se define como la suma del lmite inferior
ms el lmite superior dividido entre 2. En forma de expresin algebraica es:
Li + Ls
2
por ejemplo, para el primer intervalo de clase, la marca de este es:
ci =
c1 =
7 85 + 7 92
= 7 885
2

Lmites de la clase
Marca de la clase
[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]
7 885
7 955
8 025
8 095
8 165
8 235
22
Frecuencia de la clase
La frecuencia de la clase es simplemente el nmero de observaciones que hay
en est.
Lmites de la clase
Marca de la clase
[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]
7 885
7 955
8 025
8 095
8 165
8 235
6
7
12
16
4
5
Distribucin de frecuencias relativas y distribucin de porcentajes

La distribucin de frecuencia relativa se obtiene al dividir las frecuencias de
cada clase de la distribucin de frecuencia por el nmero total de datos. Se
crea una distribucin de porcentajes al multiplicar cada frecuencia relativa
por 100 %. Para los datos del ejemplo (1.12)
Lmites de
la clase
Marca de
la clase
Frecuencia de
la clase
Frecuencia
relativa
Porcentaje
[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]
7 885
7 955
8 025
8 095
8 165
8 235
6
7
12
16
4
5
0 12
0 14
0 24
0 32
0 08
0 1
12
14
24
32
8
10
FaCyT-Matemticas
23
1.3.2.
Grficos
Intuitivamente un grfico es una representacin visual de los datos de una

tabla. Es un complemento importante porque permite leer visualmente las
tendencias, magnitudes y variaciones que pueden presentar los datos.
Histogramas de frecuencias
Los histogramas son grficos que muestran la distribucin de una serie de
observaciones. Para ello, el rango completo de las observaciones se divide en
subrangos menores denominados intervalos de clases de forma que el histograma muestra cuantas observaciones han en cada intervalo. El histograma
es un grfico de barras verticales en el cul el ancho de cada barra se corresponde con la amplitud del intervalo de clase, y la altura de la barra se
corresponde con el nmero de observaciones dentro del intervalo de clases.
En la Figura (1.1) se presenta el histograma de frecuencias para el ejemplo
(1.12) dividiendo el rango completos de las observaciones en seis clase.
Figura 1.1: Histograma de frecuencias

24
Polgonos
Al igual que con los histogramas de frecuencias, al graficar polgonos el fenmeno de inters se despliega a lo largo del eje horizontal y el eje vertical
representa el nmero, proporcin o porcentaje de observaciones por intervalo
de clases. El polgono de porcentaje se forma permitiendo que el punto medio
de cada clase represente las observaciones de ese intervalo de clase y luego
conectando la sucesin de puntos medios con sus respectivos porcentajes de
clases. En la Figura (1.2) se muestra el histograma y polgono de frecuencias
para el ejemplo (1.12)
Figura 1.2: Histograma y polgono de frecuencias

Distribucin acumulativa
La frecuencia relativa acumulativa es la proporcin de observaciones cuyos
valores son menores o iguales al lmite superior de la clase o, en forma equivalente, menores que el lmite inferior de la siguiente clase. La distribucin
acumulativa u ojiva se obtiene graficando, en el eje vertical, la frecuencia relativa acumulativa de una clase contra el lmite inferior de la siguiente sobre
el eje horizontal y uniendo con segmentos todos los puntos consecutivos. La
FaCyT-Matemticas
25
siguiente tabla muestra las frecuencias relativas acumuladas para el ejemplo

(1.12)
Lmites de
la clase
Frecuencia de
la clase
Frecuencia
relativa
Frecuencia relativa
acumulativa
[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]
6
7
12
16
4
5
0 12
0 14
0 24
0 32
0 08
0 1
0 12
0 26
0 50
0 82
0 90
1
La distribucin de frecuencia relativa acumulativa para el ejemplo (1.12) se

muestra en la Figura (1.3).
Figura 1.3: Distribucin de frecuencia acumulativa para el ejemplo (1.12)

Grfico de caja(box-plot)
Fundamentalmente el grfico de caja es la forma grfica de cinco nmeros: Valor mximo(Mx), Tercer cuartil (Q3 ), Mediana(Med), Primer cuartil
(Q1 ),Valor mnimo(Mn). Es un grfico simple, ya que se realiza bsicamente
con estos cinco nmeros. Se observa de una forma clara la distribucin de los
datos y sus principales caractersticas. Permite comparar diversos conjuntos
de datos simultneamente. Como herramienta visual se puede utilizar para
26
ilustrar los datos, para estudiar simetra, para estudiar las colas, y supuestos sobre la distribucin, tambin se puede usar para comparar diferentes
poblaciones. Este grfico contiene un rectngulo, usualmente orientado con
el sistema de coordenadas tal que el eje vertical tiene la misma escala del
conjunto de datos. La parte superior y la inferior del rectngulo coinciden
con el tercer cuartl (percentil 75) y el primer cuartl (percentil 25) de los
datos. Esta caja se divide con una lnea horizontal a nivel de la mediana. En
la siguiente Figura se detalla la forma del grfico de caja junto a los cinco
nmeros.
Figura 1.4: Detalles de un diagrama de cajas
FaCyT-Matemticas
27
La siguiente Figura muestra el diagrama de caja para el ejemplo (1.12)
Grfico de tallo y hoja

Este grfico ayuda a mirar de una forma rpida la distribucin de los datos una vez obtenidos los mismos. Tiene como ventaja que es muy fcil de
realizar y puede hacerse a mano, y como desventaja que no permite comparar claramente diferentes poblaciones. Adems, el grfico de tallo y hoja nos
muestra:
1. El centro de la distribucin de los datos.
28
2. La forma general de la distribucin:

Simtrica: Si las porciones a cada lado del centro son imgenes
espejos de las otras.
Sesgada a la izquierda: Si la cola izquierda (los valores menores)
es mucho ms larga que los de la derecha (los valores mayores)
Sesgada a la derecha: Opuesto a la sesgada a la izquierda
3. Desviaciones marcadas de la forma global de la distribucin.
Outliers: Observaciones individuales que caen muy por fuera del
patrn general de los datos.
Gaps: Huecos en la distribucin de los datos.
A continuacin se presenta el grfico de tallo y hoja para el ejemplo (1.12)
78
79
79
80
80
81
81
82
82
|
|
|
|
|
|
|
|
|
567789
24
5677899
13344
555556667778999
000112
6679
1124
6
Los nmeros que se muestran a la izquierda del carcter | son los dgitos
mas significativos. El punto decimal est ubicado a un dgito a la derecha
del carcter |, en otras palabras la primera lnea 78|567789 se lee como el
primer valor 7 85 (por el 78|5), luego hay 7 86, un 7 87, otro 7 87, un 7 88 y
finalmente un 7 89.
FaCyT-Matemticas
29
1.4.
Medidas numricas para datos agrupados
Definicin 1.11. (MEDIA PARA DATOS AGRUPADOS)

Para calcular la media con base en los datos agrupados, sea K el
nmero de clases y ci el punto medio de la i-sima clase. Entonces el
valor aproximado de la media muestral es
K
P
x=
f i ci
i=1
en donde fi es la frecuencia de la i-sima clase y n =
K
P
fi .
i=1
Ejemplo 1.21. Considrese los datos del ejemplo (1.12) que se presentan
agrupados en K = 6 clases en la siguiente tabla
Lmites de la clase
Marca de la clase ci
Frecuencia de la clase fi
ci fi
[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]
7 885
7 955
8 025
8 095
8 165
8 235
6
7
12
16
4
5
47 31
55 685
96 30
129 52
32 66
41 175
n=
6
P
fi = 50
i=1
6
P
fi ci = 402 65
i=1
por lo tanto, el valor aproximado de la media muestral es:

6
P
x=
f i ci
i=1
50
402 65
= 8 053
50

Sec 1.4. Medidas numricas para datos agrupados
30
Definicin 1.12. (MEDIANA PARA DATOS AGRUPADOS)

La mediana para datos agrupados se puede calcular aplicando la siguiente frmula

j
M ed = Lmed + c
fmed
donde:
Lmed es el lmite inferior de la clase donde se encuentra la mediana.
fmed es la frecuencia de esa clase.
c es la amplitud de esa clase.
j es el nmero de observaciones es esta clase, necesarias para completar
un total de n/2.
Ejemplo 1.22. Para el ejemplo (1.12)
Lmites de
la clase
Frecuencia de
la clase
Frecuencia
relativa
Frecuencia relativa
acumulativa
[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]
6
7
12
16
4
5
0 12
0 14
0 24
0 32
0 08
0 1
0 12
0 26
0 50
0 82
0 90
1
La mediana es:

M ed = 7 99 + 0 07
12
12

= 8 06

FaCyT-Matemticas
31
Definicin 1.13. (MODA PARA DATOS AGRUPADOS)

La clase que contiene al mayor nmero de datos se le denomina clase
modal. La moda para datos agrupados se puede estimar aplicando la
siguiente frmula

d1
M = Li + c
d1 + d2
donde: d1 = (fi fi1 ), d2 = (fi fi+1 ) y fi es el valor de la clase con mayor

frecuencia.
Ejemplo 1.23. Para el ejemplo (1.12)
Lmites de
la clase
Frecuencia de
la clase
Frecuencia
relativa
Frecuencia relativa
acumulativa
[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]
6
7
12
16
4
5
0 12
0 14
0 24
0 32
0 08
0 1
0 12
0 26
0 50
0 82
0 90
1
Para este caso d1 = 16 12 = 4, d2 = 16 4 = 12 y c = 0 07, entonces la

moda estimada utilizando las observaciones agrupadas es:

d1
4
M = Li + c
= 8 03 + 0 07
= 8 03 + 0 0175 = 8 0475
d1 + d2
4 + 12

Definicin 1.14. (RANGO MEDIO PARA DATOS AGRUPADOS)
Para datos agrupados en una tabla de frecuencias, el rango medio es
aproximadamente el promedio del lmite inferior de la primera clase
y el lmite superior de la ltima clase.
Sec 1.4. Medidas numricas para datos agrupados
32
Ejemplo 1.24. El rango medio aproximado para el ejemplo (1.12) es:

Rango medio =
7 85 + 8 27
= 8 06
2

Definicin 1.15. (VARIANZA PARA DATOS AGRUPADOS)

Para calcular la varianza con base en los datos agrupados, sea K el
nmero de clases y ci el punto medio de la i-sima clase. Entonces el
valor aproximado de la varianza muestral es
K
P
s2 =
fi (ci x)2
i=1
n1
o
K
P
s2 =
K
P
fi c2i
!2
fi c i
i=1
i=1
n1
en donde fi es la frecuencia de la i-sima clase y n =
K
P
fi .
i=1
Ejemplo 1.25. Consider los datos del ejemplo (1.12) que se encuentran
agrupados en K = 6 clases.
ci
fi
c2i
fi c2i
7 885
7 955
8 025
8 095
8 165
8 235
6
7
12
16
4
5
62 173
63 282
64 401
65 529
66 667
67 815
373 038
442 974
772 812
1048 464
266 668
339 075
Total
50
389 867
3243 031
FaCyT-Matemticas
33
Los valores aproximados de la varianza y la desviacin estndar vienen dado

por:
K
P
s2 =
K
P
fi c2i
i=1
!2
fi c i
i=1
n1
2
3243 031 (40250 65)
=
49
3243 031 3242 54
=
49
= 0 01002

Definicin 1.16. (DESVIACIN MEDIA PARA DATOS

AGRUPADOS)
El valor de la desviacin media usando datos agrupados se aproxima
por:
K
P
fi |ci x|
i=1
(1.11)
Dx =
K
P
fi
i=1
en donde fi es la frecuencia de la i-sima clase.

Ejemplo 1.26. El valor aproximado de la desviacin media para los datos
agrupados del ejemplo (1.12) se calcula con la ayuda de la siguiente tabla:
ci
fi
|ci x|
fi |ci x|
7 885
7 955
8 025
8 095
8 165
8 235
6
7
12
16
4
5
|7 885 8 053|
|7 955 8 053|
|8 025 8 053|
|8 095 8 053|
|8 165 8 053|
|8 235 8 053|
1 008
0 686
0 336
0 672
0 448
0 91
Total
6
P
fi = 50
i=1
6
P
i=1
fi |ci x| = 4 06
Sec 1.5. Puntos de posicin para datos de una tabla de frecuencia

34
de esta manera, la desviacin media para los datos agrupados del ejemplo
(1.12) es:
K
P
Dx =
fi |ci x|
i=1
K
P
=
fi
4 06
= 0 0812
50
i=1

Definicin 1.17. (DESVIACIN MEDIANA PARA DATOS
AGRUPADOS)
El valor de la desviacin mediana usando datos agrupados se aproxima por:
K
P
fi |ci M ed|
i=1
(1.12)
DM ed =
K
P
fi
i=1
en donde fi es la frecuencia de la i-sima clase.

Ejemplo 1.27. De manera similar (al clculo del valor aproximado de la
desviacin media para datos agrupados), el valor aproximado de la desviacin
mediana para los datos agrupados del ejemplo (1.12) tiene un valor igual al
valor aproximado de la desviacin media de 0 0812.

1.5.
Puntos de posicin para datos de una tabla

de frecuencia
Definicin 1.18. (CLASE DE p-SIMO PUNTO PERCENTIL)

La clase del p-simo punto percentil es la mnima clase cuya frecuencia acumulada es mayor o igual a p %n, siendo n el nmero total de
datos.
FaCyT-Matemticas
35
Definicin 1.19. (p-SIMO PUNTO PERCENTIL)

El p-simo punto percentil puede determinarse como:

p %n F
qp = L p + c
fp
donde:
Lp es el lmite inferior de la clase del p-simo punto percentil.
fp es la frecuencia de esa clase del p-simo punto percentil.
c es la amplitud de la clase del p-simo punto percentil.
F es la frecuencia acumulada de la clase que antecede a la clase del
p-simo punto percentil.
Ejemplo 1.28. El percentil q0 6 es el valor bajo el cul se encuentra el 60 %
de los valores y se estima de la siguiente forma:

60 %50 F
q0 6 = L0 6 + c
f0 6
para este caso es la frecuencia acumulada correspondiente a la tercera clase,
es decir, F = 25
Lmites de
la clase
Frecuencia de
la clase
Frecuencia
acumulada
[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]
6
7
12
16
4
5
6
13
25
41
45
50
por lo tanto

q0 6 = 8 06 + 0 07
30 25
16

= 8 08
Sec 1.6. Ejercicios propuestos
36
El percentil q0 3 es el valor bajo el cul se encuentra el 30 % de los valores y

se estima por

15 13
q0 30 = 7 99 + 0 07
= 8 00
12

1.6.
Ejercicios propuestos
1. Los siguientes datos indican el nmero de trabajadores que faltan a una

fbrica en 50 das de trabajo:
13
8
3
11
29
5 13 37 10 16 2 11 6 12
19 21 12 11 7 7 9 16 28
11 19 6 15 10 14 10 7 24
3 6 10 4 6 32 9 12 7
12 9 10 8 20 15 5 17 10
Utilice las seis clases: 0 4, 5 9, 10 14, 15 19, 20 24, 25 o mayor

para construir una tabla de frecuencias absolutas y relativas. Dibujar
el histograma. Construir la tabla de frecuencias acumuladas. Encontrar
media muestral, desviacin estndar, moda, mediana y cuartiles.
2. Los siguientes datos son lo nmeros de torsiones requeridas para doce
barras cierta aleacin:
33 24 39 48 26 35 38 54 23 34 29 37
Calcule:
a. Media
b. La varianza corregida, s2
c. La mediana
d. La moda
e. Los cuartiles
FaCyT-Matemticas
37
3. Los siguientes datos son los lapsos, en minutos, necesarios para que 50
clientes de un banco comercial, lleven a cabo una transaccin bancaria:
2.3
3.3
7.8
2.4
4.2
0.2
9.7
6.8
4.6
1.2
2.9
2.5
0.9
3.8
0.5
0.4
5.6
0.4
1.5
6.8
2.8
9.5
1.3
2.7
5.2
2.4
1.8
3.1
0.4
6.3
4.4
4.7
3.7
1.3
7.6
5.8
0.7
7.2
1.1
1.4
2.8
6.2
1.6
5.5
0.5
3.3
1.2
1.9
3.4
1.4
a. Construir una distribucin de frecuencia relativa.

b. Construir una distribucin de frecuencia relativa acumulada.
c. Dibuja el diagrama de barra y el polgono de frecuencias.
d. Con los resultados de la parte b., determine los recorridos intercuantil e interdecil.
e. Con los datos agrupados, calcule la media, mediana, moda, desviacin estndar.
f. Verificar los resultados de la parte e. calculando las mismas medidas para los datos no agrupados.
4. La demanda diaria, en unidades de un producto, durante 30 das de
trabajo es:
38
67
28
49
47
35
63
25
78
66
76
33
36
48
58
58
69
32
42
44
48
53
61
72
44
59
51
57
52
56

38
5. Los siguientes datos se refieren al dimetro en pulgadas de un engranaje.
6.75
6.50
6.50
6.25
7.25
7.00
6.50
6.50
6.50
6.70
7.00
7.15
6.50
6.65
6.00
6.75
7.00
6.25
7.00
6.75
6.00
6.75
6.75
7.10
7.00
6.70
6.50
6.75
6.25
6.65
6.75
7.10
7.25
6.75
6.25
6.25
7.00
6.75
7.00
7.15

g. Construir el grfico de tallo y hoja, qu puede decir acerca de la
forma de la distribucin?
6. Demuestre que
n
X
(xi x) = 0
i=1
para una muestra x1 , x2 , . . . , xn .

7. Si los datos se codifican de tal manera que xi = cui + a, demuestre que:
x = cu + a,
sx = csu
para una muestra pareada x1 , x2 , . . . , xn ; u1 , u2 , . . . , un .

FaCyT-Matemticas
39
8. Despus de observar el tiempo de vida de 70 motores, se obtuvieron los

siguientes datos:
Intervalos de aos de funcionamiento
Nmero de motores
[0,1)
[1,2)
[2,3)
[3,4)
4 aos ms
30
23
6
5
6
a. Haga un histograma de frecuencias relativas.

b. En base al histograma de la parte a., qu distribucin sospecha
usted que podra tener la variable aleatoria T = tiempo de vida
de un motor del tipo considerado?
c. Calcule aproximadamente, la media, desviacin y mediana de estos
datos.
9. La evidencia directa de la ley de gravitacin universal de Newton la
obtuvo Henry Cavendish (1731-1810). En el experimento se obtuvo la
densidad (en el tiempo) de la tierra y se construy la siguiente tabla:
5.36
5.44
5.63
5.29
5.34
5.34
5.58
5.79
5.46
5.65
5.10
5.30
5.57
5.27
5.75
5.53 5.62
5.39 5.42
5.68 5.85
5.29
5.47
a. Calcular la media, la media truncada para = 0 1 y = 0 2, y la

desviacin estndar.
b. Calcular los cuartiles, graficar densidad contra tiempo.
c. Hay alguna tendencia obvia?
d. Construir el grfico de tallo y hoja, qu puede decir acerca de la
forma de la distribucin?
10. con los datos del Ejercicio (4), sea xi la demanda del i -simo da para
i = 1, 2, . . . , 30. Transformar los datos por medio de la relacin
ui =
xi 51 5
14 17
40
a. Construir una distribucin de frecuencia relativa para los datos

transformados. Ha ocurrido algn cambio en la naturaleza de
la distribucin de frecuencia cuando sta se compara con la del
ejercicio (4)?.
b. Con los datos transformados ui , calcular la media y la desviacin
estndar; mostrar que son iguales a cero y uno, respectivamente.
11. Las calificaciones obtenidas en una prueba de un examen de seleccin,
por los 1140 candidatos que han acudido a la misma, son los siguientes:
Calificacin
Porcentaje de candidatos
0.5-1.9
2.0-3.4
3.5-4.9
5.0-6.4
6.5-7.9
8.0-9.4
1.754
8.77
33.33
45.61
9.649
0.877
Calcular:
a. Nota media, nota ms frecuente y nota que es superior a la obtenida por la mitad de los candidatos e inferior a la obtenidad por
la otra mitad.
b. Si prescindimos de los 400 candidatos que peor calificacin han
obtenido a partir de que calificacin estar el grupo de seleccionados?
c. En una segunda prueba de seleccin a la que presentaron los 1140
candidatos anteriores, la calificacin media obtenida fue de 3 93
con una varianza de 8 06. Comparar las calificaciones obtenidas
en una y otra prueba e interpretar el significado de las mismas.
d. Si se hubiese exigido una calificacin mnima de 6 para aprobar
cul hubiera sido el nmero de seleccionados?
12. Durante diez das elegidos al azar, se ha observado el nmero de piezas
diarias producidas en tres fbricas A, B y C, obtenindose los siguientes
FaCyT-Matemticas
41
resultados:
Das
10
A
B
C
103
115
92
106
112
97
105
99
103
102
98
89
108
107
106
109
113
108
101
108
116
110
114
87
105
96
128
107
94
130
Si se necesita atender un pedido de 2111 piezas en un plazo de 20 das

cul de las tres fbricas ofrecer mayores garantas de poder responder
a dichos pedidos?
13. Los siguientes datos presentan los porcentajes de rentabilidad de las
acciones de 25 empresas:
30.8
25.6
24.6
20.3
30.8
32.3
24.0
32.9
30.7
29.6
30.3
20.3
19.4
39.5
24.7
38.0 24.5
13.3 28.0
18.7 36.8
21.5
19.9
31.2
Construya un diagrama de tallo y hojas, una tabla de frecuancias agrupadas y con ayuda de esta tabla responda las siguientes preguntas que
se formulan en los siguientes incisos:
a. Qu porcentaje de empresas tienen el porcentaje de rentabilidad
de las acciones mayor que 34 25 %?
b. Cuntas empresas tienen el porcentaje de rentabilidad de las acciones menor que 27 25 % o mayor que 41 25 %?
14. Una empresa de informtica dedicada al anlisis de virus en ordenadores, contabiliza los virus detectados con su producto en 20 ordenadores
de domicilios particulares. Los resultados obtenidos son los siguientes:
46, 29, 35, 61, 54, 37, 53, 57, 52, 51, 43, 67, 66, 31, 53, 51, 48, 59, 55, 47
a. Construir una tabla con las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas del conjunto de datos.
b. Dibujar un histograma del nmero de virus.
c. Obtener la media, mediana, moda, cuartiles, desviacin tpica,
coeficiente de variacin, percentil del 40 %, el rango.
42
15. Si s es la desviacin estndar de una muestra, se puede demostrar que

r
n
R
R
s
2(n 1)
2
n1
donde n es el tamao de la muestra y R es el rango. Los siguientes datos
representan los niveles de colesterol en la sangre para una muestra de
ocho personas:
239, 218, 227, 357, 161, 286, 310, 245
a. Encuentre las cotas inferiores y superiores para s.
b. Estime s usando el punto medio del intervalo determinado por el
resultado anterior.
c. Calcule el valor de s y compare el resultado con el valor estimado
del inciso b.
16. Si el histograma es claramente bimodal. Donde se esperara que se
encuentre la media? Dibuje un histograma que justifique su respuesta.
17. Dos tornos se usan para fabricar el mismo tipo de arandelas. El error
para 50 lecturas se muestran en la siguiente tabla para cada mquina.
Use la desviacin estndar corregida s para determinar cul torno es
ms efectivo si la tolerancia permitida es de x 1s .
Errores
(mm)
N o de lecturas
Torno 1
N o de lecturas
Torno 2
0.5-1.0
1.0-1.5
1.5-2.0
2.0-2.5
2.5-3.0
3.0-3.5
3.5-4.0
10
15
12
8
5
0
0
8
10
8
10
5
6
3
18. Consider la cantidad

dad es mnima?
Pn
i=1
(xi a)2 , para que valor de a esta canti-
FaCyT-Matemticas
43
19. Consider la muestra X1 , X2 , . . . , Xn con una media muestral X y una

desviacin estndar muestral S. Sea Zi = (Xi X )/S, i = 1, 2, . . . , n.
Cuals son los valores de la media y la desviacin estndar muestral
de las Zi ?
44
FaCyT-Matemticas
Captulo 2
Distribucin en el muestreo
La Estadstica inferencial comprende los mtodos y procedimientos para deducir propiedades (hacer inferencias) de una poblacin, a partir de una pequea parte de la misma (muestra) que es la materia prima para hacer las
inferencias pertinentes acerca de la poblacin en estudio. Estas inferencias
acerca de la poblacin pueden tomar la forma de respuestas a preguntas si/no
(prueba de hiptesis), estimaciones de caractersticas numricas (estimacin),
pronsticos de futuras observaciones, descripcin de asociacin (correlacin)
o modelamiento de relaciones entre variables (anlisis de regresin).
Por ejemplo, supongase el caso de un fabricante de un cierto producto que
quiere ensayar un nuevo mtodo de produccin que se supone es una importante inversin econmica para su industria. Considera que dicho mtodo
es interesante para la industria si mejora el tiempo medio de produccin en
un cierto nmero de minutos. Para ello, tiene la posibilidad de experimentar
con una muestra de 35 productos elaborados previamente utilizando el nuevo
mtodo.
El inters del fabricante, en un principio, esta en hacer una estimacin del
tiempo medio de produccin de todos los productos que vaya a producir con
el nuevo mtodo, a partir del resultado que le proporcionarn los 35 productos de que dispone.
Adems, al fabricante le gustara tener una idea ms precisa de la proximidad entre el valor estimado y el valor real de la media de la poblacin; est
interesado en obtener un intervalo pequeo, que incluya el valor del tiempo
medio real de fabricacin de los productos con el nuevo mtodo con una probabilidad alta.
45
46
Suponiendo que la muestra le proporciona una duracin media de fabricacin

menor con el nuevo mtodo que con el ya existente, sera muy interesante
saber si la ganancia en minutos obtenidas le permite concluir que los nuevos
productos forman parte de una poblacin cuya tiempo medio de fabricacin
es menor al tiempo medio de la poblacin actual.
Estos objetivos del fabricante se corresponden con las tres categoras de problemas que oborda la Estadstica inferencial :
1. La estimacin de los valores de los parmetros de la poblacin.
2. La determinacin de un conjunto de valores con una confianza alta,
dada, de contener el verdadero valor del parmetro, y
3. La evaluacin de ciertos resultados cuando se cumplen determinados
valores de los parmetros de una poblacin.
El conjunto de mtodos utilizados para la estimacin de un parmetro de
la poblacin a partir de la informacin contenida en los datos de la muestra
constituye la estimacin puntual. La estimacin por intervalos da respuesta
al segundo objetivo planteado. Estos mtodos son el objeto de la estadstica inferencial inductiva, que desarrolla tcnicas para la estimacin de los
parmetros de la poblacin: a partir de los datos dados (mtodos clsicos
de estimacin) o combinando los datos de la muestra con una informacin
previa (mtodos bayesianos).
La respuesta al tercer objetivo del fabricante la proporciona la Estadstica
inferencial hipottico-deductiva, que facilita procedimientos para aceptar o
rechazar una hiptesis sobre los parmetros de una poblacin o sobre la forma funcional de la misma, dando una medida del posible error cometido.
El principal objetivo de este capitulo es deducir las distribuciones muestrales
de ciertas estadsticas que ayudaran a tomar decisiones sobre la poblacin,
con base en la informacin contenida en una muestra aleatoria.
Se comenzar dando unos de los conceptos ms importante de la inferencia
estadstica como es el de muestra aleatoria, y que se define de la siguiente
manera:
FaCyT-Matemticas
Cap 2. Distribucin en el muestreo
47
Definicin 2.1. (MUESTRA ALEATORIA)

Si las variables aleatorias X1 , X2 , . . . , Xn tienen
1. la misma funcin (densidad) de probabilidad que la de la distribucin de la poblacin, y
2. su funcin (distribucin) conjunta de probabilidad es igual al
producto de las marginales
entonces X1 , X2 , . . . , Xn forman un conjunto de n variables aleatorias independientes e idnticamente distribuidas (IID) que constituyen una muestra aleatoria.
Siempre que se hable de inferencia estadstica se supondr la existencia de
una muestra aleatoria. Como ejemplo, supongase que se tienen los siguientes
problemas:
1. En la poblacin de personas en el registro electoral.
(parmetro) = verdadero porcentaje de votantes a favor del candidato
A (caracterstica).
2. En un proceso de produccin de botellas de vidrio para un determinado
refresco.
(parmetro) = porcentaje de botellas defectuosas que da una lnea
de produccin (caracterstica).
3. En una linea de armado de una cierta unidad.
(parmetro) = tiempo promedio necesario para terminar una unidad
(caracterstica).
En cada uno de estos ejemplos se mide una variable aleatoria X cuya forma
funcional f (x; ) es conocida, salvo por el valor de uno o varios parmetros de
su distribucin; por ejemplo, para el inciso 1., sea X la variable aleatoria que
representa el nmero de personas que apoyan al candidato A inscritas en el
registro electoral, entonces X sigue una distribucin binomial con parmetros
n (nmero total de personas en el registro electoral) y p (probabilidad de que
una persona vote por el candidato A), esto es:
X B(n, p)
48
aqu lo desconocido es p. Entonces para obtener informacin sobre la caracterstica de inters de la poblacin se toma una muestra aleatoria de la
poblacin y con base a est se toma una decisin acerca de la caractersticas
de inters de la poblacin.
Cuando se obtiene una muestra aleatoria X1 , X2 , . . . , Xn se puede calcular
alguna medida que resuma la informacin contenida en la muestra aleatoria,
esta medida se llama estadstico.
Definicin 2.2. (ESTADSTICO)
Sea X1 , X2 , . . . , Xn una muestra aleatoria. Un estadstico es cualquier
funcin de las variables aleatorias que se observan en la muestra aleatoria de manera que esta funcin no contenga ningunas cantidades
desconocidas. Esto es:
T : (X1 , X2 , . . . , Xn ) En T (X1 , X2 , . . . , Xn ) R
Ejemplo 2.1. Estadsticos

Sea X1 , X2 , . . . , Xn una muestra aleatoria tomada de una poblacin. Entonces
las siguientes funciones de variables aleatorias son ejemplos de estadsticos
n
P
T = T (X1 , X2 , . . . , Xn ) =
i=1
T = T (X1 , X2 , . . . , Xn ) =
i=1
Xi
n
n
P
Xi2
=X
n
T = T (X1 , X2 , . . . , Xn ) = Mx(X1 , X2 , . . . , Xn ) Mn(X1 , X2 , . . . , Xn )
T = T (X1 , X2 , . . . , Xn ) = X1 + X2

Todas ests funciones son ejemplos de estadsticos porque se determinan
de manera completa por las variables aleatorias que contiene la muestra
aleatoria. Si X1 , X2 , . . . , Xn son variables aleatorias, entonces el estadstico T = T (X1 , X2 , . . . , Xn ) tambin es una variable aleatoria, y su funcin de
FaCyT-Matemticas
49
distribucin depende tanto de la poblacin como del tamao de la muestra

aleatoria n y est se le llama distribucin de muestreo de T.
Definicin 2.3. (DISTRIBUCIN DE MUESTREO DE UN

ESTADSTICO T)
La distribucin de muestreo de un estadstico T es la distribucin de
probabilidad de T que puede obtenerse como resultado de un nmero
infinito de muestras aleatorias independientes, cada una de tamao
n, provenientes de la misma poblacin.
2.1.
2.1.1.
Principales estadsticos.
Media muestral X
Uno de los estadsticos ms importantes es la media de un conjunto de n

variables aleatorias independientes e idnticamente distribuidas. Este estadstico tiene un papel muy importante en problemas de toma de decisiones
para medias poblacionales desconocidas.
Definicin 2.4. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una

poblacin con funcin (densidad) de probabilidad f (x; ), se define la
media muestral o media emprica como:
n
P
X=
Xi
i=1
(2.1)
Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con E [X] = y

V [X] = 2 , entonces:
E [Xi ] = y
V [Xi ] = 2 ,
i = 1, 2, . . . , n
Sec 2.1. Principales estadsticos.
50
y
n
P
i=1 Xi
E[ X ] = E
n =
n
P
n
=
n
=
E [Xi ]
i=1
n
P
E [X]
i=1
n
P
i=1
por lo tanto,
E[ X ] =
(2.2)
esto significa que el valor esperado de la media X de las variables aleatorias

X1 , X2 , . . . , Xn o de una muestra de medias X 1 , X 2 , . . . , X n coincide con la
media de la poblacin.
Para una la realizacin x1 , x2 , . . . , xn de una muestra aleatoria X1 , X2 , . . . , Xn
dada, el valor de x puede estar por encima o por debajo del verdadero valor
de la media poblacional debido a las fluctuaciones del muestreo. Estas
fluctuaciones vienen medidas por la varianza muestral de X, la cual viene
dada por:
n
n
P
P
X
i
i=1 i=1 V [Xi ]
V[ X ] = V
n =
n2
n
P
n
P
V [X]
i=1
n2
i=1
n2
n
n2
2
=
n
es decir,
2
V X =
n
(2.3)
FaCyT-Matemticas
51
de la ecuacin (2.3) se puede notar que a medida que el tamao de la muestra

aumenta, la variabilidad de X alrededor de disminuye, lo cul implica
que el estadstico X es ms exacto al usarlo como estimador del parmetro
desconocido , cuando aumenta el tamao muestral.
2.1.2.
Varianza muestral V 2
Otro estadstico importante es la varianza muestral, empleado para formular

inferencias con respecto a las varianzas de la poblacin. Este estadstico es
una medida de la variabilidad e indica la dispersin entre las observaciones.
Definicin 2.5. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con E [X] = y V [X] = 2 , se define la varianza muestral
o emprica como la dispersin promedio de los valores muestrales
con respecto a la media muestral.
V2 =
n
2
1X
Xi X
n i=1
La expresin (2.4) se puede reescribir como:

n

1 X 2
2
Xi 2Xi X + X
V =
n i=1
n
P
Xi
2
n
1X 2
nX
i=1
=
Xi 2X
+
n i=1
n
n
2
1X 2
2
2
=
Xi 2X + X
n i=1
n
1X 2
2
=
Xi X
n i=1
(2.4)
52
Definicin 2.6. La raiz cuadrada positiva de la varianza muestral,

se conoce desviacin estndar muestral, esto es:
v
u n
u1 X
2
V =t
(2.5)
Xi X
n i=1
El valor esperado de V 2 viene dado por:

"
E V

2
#
n
1X 2
2
=E
X X
n i=1 i
" n
#
h 2i
1X 2
=E
Xi E X
n i=1
n
P
E [Xi2 ]
h 2i
= i=1
E X
n
n
P
E [X 2 ]
h 2i
= i=1
E X
n
como

E X 2 = V [X] + (E [X])2
= 2 + 2
y usando las ecuaciones (2.2) y (2.3), se tiene que:
h 2i
2
E X = V[ X ] + E[ X ]
=
2
+ 2
n
FaCyT-Matemticas
53
por tanto,
n
P
E V

2
( 2 + 2 )
i=1
2
2
n
n
n( + 2 ) 2
=
2
n
n
2
= 2 + 2
2
n
(n 1) 2
=
n
2
en consecuencia
(n 1) 2
E V2 =
n
De este modo, cuando la varianza de la poblacin es desconocida y se usa la
expresin (2.4) para estimarla, V 2 tiende a subestimar el verdadero valor de
2 , por est razn se prefiere utilizar la varianza muestral corregida definida
por:

poblacin con E [X] = y V [X] = 2 , se define la varianza muestral corregida como
n
P
S2 =
Xi X
2
i=1
n1
Con un procedimiento anlogo al anterior se puede demostrar que:

E S 2 = 2
(2.6)
2.1.3.
54
Proporcin muestral P

distribucin cuya funcin de probabilidad es
(
px (1 p)1x x = 0, 1
p(x; p) =
0
otro caso
es decir, de una poblacin con distribucin de Bernoulli. Entonces,
se define la proporcin muestral como
n
P
P =
Xi
i=1
(2.7)
Notese que el estadstico

Y =
n
X
Xi
i=1
representa el nmero de xitos en n ensayos de Bernoulli, por lo tanto, la

variable aleatoria Y siguen un modelo Binomial con parmetros n y p, esto
es, Y B (n, p), y de aqu se tiene que:
" n
#
X
1
np
E [P ] = E
Xi =
=p
n
n
i=1
y
" n
#
X
1
np(1 p)
p(1 p)
V [P ] = 2 V
Xi =
=
2
n
n
n
i=1
2.1.4.
Estadstico de orden
Sea X1 , X2 , . . . , Xn variables aleatorias continuas e independientes, con funcin de distribucin F (x) y funcin densidad de probabilidad f (x) y supongamos que la muestra se ordena de menor a mayor. Sea X(1) , X(2) , . . . , X(n)
FaCyT-Matemticas
55
las variables aleatorias ordenadas Xi , donde

X(1) X(2) X(n)
Aunque X1 , X2 , . . . , Xn son independientes, X(1) , X(2) , . . . , X(n) no son independientes. En particular nos interesa
X(1) = M in (X1 , X2 , . . . , Xn )
y
X(n) = M ax (X1 , X2 , . . . , Xn )
donde X(1) y X(n) denota la mnima y mxima de las variables aleatorias Xi ,
respectivamente.
Las funciones (densidad) de probabilidad para X(1) y X(n) se pueden determinar usando el mtodo de las funciones de distribucin. La funcin de
distribucin de X(1) viene dada por:

F(1) (x) = P X(1) x

= 1 P X(1) > x
= 1 P (X1 > x, X2 > x, . . . , Xn > x)
= 1 [P (X1 > x) P (X2 > x) P (Xn > x)]
= 1 [1 F (x)]n
(2.8)
En consecuencia, si f(1) (x) denota la funcin densidad de probabilidad de
X(1) , al derivar en ambos lados de la expresin (2.8) se tiene que:
f(1) (x) = n [1 F (x)]n1 f (x)
La funcin densidad de probabilidad de X(n) se puede hallar de una manera
similar. La funcin de distribucin de X(n) es

F(n) (x) = P X(n) x
= P (X1 x, X2 x, . . . , Xn x)
= [P (X1 x) P (X2 x) P (Xn x)]
= [F (x)]n
(2.9)
56
Si con f(n) (x) se denota la funcin densidad de probabilidad de X(n) , entonces

est se puede obtener derivando en ambos de la ecuacin (2.9), esto es
f(n) (x) = n [F (x)]n1 f (x)
La funcin de densidad del estadstico de k -simo orden se dan en el siguiente
Teorema.
Teorema 2.1. Sean X1 , X2 , . . . , Xn una muestra aleatoria de una
poblacin continua con funcin de distribucin F (x) y funcin de
densidad f (x). Si X(k) denota el estadstico de orden k-simo, entonces la funcin de densidad de X(k) est dada por
f(k) (x) =
n!
[F (x)]k1 [1 F (x)]nk f (x), < x <
(k 1)!(n k)!
(2.10)
Demostracin. Considrese el evento:

x < X(k) x + h
donde h es una constante positiva. Si nicamente una variable aleatoria pertenece al intervalo (x, x + h], se tiene que:
Xi x para k 1 de las variables alatorias Xi
x < Xi x + h para una de las variables alatorias Xi
Xi > x + h para n k de las variables alatorias Xi
El nmero de formas en que las n variables aleatorias pueden ser divididas
en tres de tales clases es:
n!
(k 1)!1!(n k)!
y cada una de las clases tiene probabilidades,
P (Xi x) = F (x)
P (x < Xi x + h) = F (x + h) F (x)
P (Xi > x + h) = 1 F (x + h)
FaCyT-Matemticas
57
Por lo tanto,
P x < X(k) x + h =
n!
[F (x)]k1 [F (x + h) F (x)] [1 F (x + h)]nk
(k 1)!1!(n k)!
n!
=
(k 1)!(n k)!
Z
k1 "Z
x+h
f (x)dx
# Z
f (x)dx
nk
f (x)dx
x+h
Por el Teorema del valor medio para integrales, la integral:

Z x+h
f (x)dx = f ()h, donde x x + h
x
Adems, como:

P x < X(k) x + h = F(k) (x + h) F(k) (x)
entonces:

P x < X(k) x + h
F(k) (x + h) F(k) (x)
lm
= lm
h
h
h
h
= f(k) (x)
de esta manera

P x < X(k) x + h
f(k) (x) = lm
h
h
ink
i hR
ik1 hR
hR
x+h
x
n!
f (x)dx
f (x)dx
f (x)dx
(k1)!(nk)!
x+h
x
= lm
h
h
hR
ik1
hR
ink
x
n!
f
(x)dx
f
()h
f
(x)dx
(k1)!(nk)!
x+h
= lm
h
h
nk
Z x
k1
Z
n!
= lm
f (x)dx
f ()
f (x)dx
h (k 1)!(n k)!
x+h
Z x
k1
Z
nk
n!
= lm
f (x)dx
f ()
f (x)dx
h (k 1)!(n k)!
x+h
n!
=
[F (x)]k1 [1 F (x)]nk f (x)
(k 1)!(n k)!
Por tanto:
f(k) (x) =
n!
[F (x)]k1 [1 F (x)]nk f (x)
(k 1)!(n k)!
58
Teorema 2.2. Sean X1 , X2 , . . . , Xn una muestra aleatoria de una

poblacin continua con funcin de distribucin F (x) y funcin de
densidad f (x). Si j y k son dos enteros tales que 1 j < k n, la
densidad conjunta de X(j) y X(k) est dada por
f(j)(k) (xj , xk ) =
n!
j1
k1j
[F (xj )]
[F (xk ) F (xj )]
(j 1)!(k 1 j)!(n k)!
nk
[1 F (xk )]
f (xj )f (xk )
< xj < xk <
(2.11)
Ejemplo 2.2. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin

uniforme definida en el intervalo [0,1]. Es decir,
(
1, 0 x 1
f (x) =
0, otro caso
Encuentre la funcin de densidad para el estadstico X(k) . Adems, obtenga
la funcin de densidad conjunta para los estadsticos X(j) y X(k) .
Solucin:
Considre la estadstica de orden
0 < X(1) < X(2) < < X(n) < 1
la funcin de distribucin F (x) de X es
( 0, x < 0
F (x) = x, 0 x 1
1, x > 1
Despus de sustituir las expresiones de la densidad y la distribucin de X en
(2.10), se obtiene la funcin de densidad fk de X(k) :
f(k) (x) =
n!
xk1 (1 x)nk ,
(k 1)!(n k)!
0x1
(2.12)
Utilizando la igualdad:
(r, s) =
(r)(s)
,
(r + s)
para r, s > 0
FaCyT-Matemticas
59
donde las funciones y estn definidas por:

Z
tr1 exp{t}dt, r > 0
(r) =
0
y
Z
(r, s) =
tr1 (1 t)s1 dt
Adems, como
(r) = (r 1)(r 1)
entonces, se puede dedcucir que:
(k 1)!(n k)!
(k)(n k + 1)
=
= (k, n k + 1)
n!
(n + 1)
de donde se obtiene:
f(k) (x) =
xk1 (1 x)nk
,
(k, n k + 1)
0x1
(2.13)
que es la densidad de la distribucin Beta de parmetros k y (n k + 1).

En particular, la distribucin de muestreo de X(1) , el valor ms pequeo en
la muestra aleaoria de tamao n, es:
f(1) (x) =
(1 x)n1
= n(1 x)n1 ,
(1, n)
0x1
mientras que la distribucin de muestreo de X(n) , el valor ms grande en una

muestra aleatoria de tamao n, es:
f(n) (x) =
xn1
= nxn1 ,
(1, n)
0x1
La densidad conjunta para los estadsticos X(j) y X(k) se obtiene usando la

expresin (2.11)
f(j)(k) (xj , xk ) =
n!
[F (xj )]j1 [F (xk ) F (xj )]k1j
(j 1)!(k 1 j)!(n k)!
[1 F (xk )]nk f (xj )f (xk )

< xj < xk <
(
n!xj (xk xj )(1 xk ), 0 xj < xk 1
=
0,
otro caso
60

Ejemplo 2.3. Considre el ejemplo (2.2), calcular el r-simo momento alrededor del cero de X(k) .
Solucin:
Por definicin1 , el r-simo momento alrededor del cero de X(k) , viene dado
por:
Z 1 r k1
r
x x (1 x)nk
E X(k) =
(k, n k + 1)
0
Z 1 r+k1
x
(1 x)nk
=
(k, n k + 1)
0
(r + k, n k + 1)
=
(k, n k + 1)
(r + k)(n + 1)
=
(k)(n + r + 1)
En particular

(k + 1)(n + 1)
k
E X(k) =
=
(k)(n + 2)
n+1
y
2 (k + 2)(n + 1)
k(k + 1)
E X(k)
=
=
(k)(n + 3)
(n + 1)(n + 2)
por lo tanto

2

2
V X(k) = E X(k)
E X(k)

2
k
k(k + 1)
=
(n + 1)(n + 2)
n+1

k
k+1
k
=
n+1 n+2 n+1

k
1
k
1
=
n+1 n+2
n+1

1
ver definicin (2.12)
FaCyT-Matemticas
61
2.2.
Distribuciones lmites
2.2.1.
Desigualdad de chebyshev
Teorema 2.3. Sea X una variable aleatoria con E [X] = y V [X] =

2 finitas. Sea cualquier nmero positivo, entonces:
P (|X | < ) 1
2
2
(2.14)
Una forma equivalente de la desigualdad (2.14) es:

P (|X | )
2
2
En muchas aplicaciones, el valor de se expresa como mltiplo de la desviacin estndar, esto es, = k, de esta forma se tiene que 2 = k 2 2
y
1
2
=
k2
2
lo cual implica que la desigualdad (2.14) se puede expresar como:
P (|X | k)
1
k2
o
P (|X | < k) 1
1
k2
Demostracin. (Caso Discreto)

V [X] =
(X )2 pX (x)
x
M ax(X)<k
(X )2 pX (x) +
+k
X
k
(X )2 pX (x) +
X
M in(X)>+k
(X )2 pX (x)
Sec 2.2. Distribuciones lmites
62
La primera suma termina en el valor mximo de X que sea menor que k,

entonces para los X que son menores que k se tiene:
X M ax(X) < k
X < k
X > k
(X )2 > k 2 2
La tercera suma comienza en el valor mnimo de X que sea mayor que +k,
entonces para los X que son menores que k se tiene:
X M in(X) > + k
X > + k
X > k
(X )2 > k 2 2
y el segundo trmino contiene los elementos restantes. En consecuencia,
X
V [X] = 2 =
(X )2 pX (x)
x
M ax(X)<k
(X )2 pX (x) +
(X )2 pX (x)
M in(X)>+k
M ax(X)<k
k 2 2 pX (x) +
k 2 2 pX (x)
M in(X)>+k
M ax(X)<k
= k22
pX (x) +
pX (x)
M in(X)>+k
2 2
= k (P (| X |> k))
La ltima igualdad viene del hecho que:
k
X
x
pX (x) +
pX (x) = P (X < k) + P (X > + k)
+k
= P (X < k) + P (X > k)
= P (|X | > k)
FaCyT-Matemticas
63
por lo tanto,
1
k2
con lo cul queda demostrado el Teorema para el caso cuando X sea una
variable aleatoria discreta. Para el caso continuo, la prueba es similar.
P (|X | k)
Ejemplo 2.4. El costo diario por usar una determinada herramienta tiene
una media de 20 bs y una varianza de 4 bs. Qu se puede decir acerca de la
probabilidad de que el costo sea mayor que 16 pero menor que 24?
Solucin:
Sea X la variable aleatoria que representa el costo por usar una determinada
herramienta. Entonces
E [X] = 20
V [X] = 4
Se necesita calcular P (16 < X < 24). Usando la expresin equivalente al

Teorema (2.3), se sabe que para cualquier k 0,
P (|X | < k) 1
1
k2
entonces
P (16 < X < 24) = P
=P
=P
=P
(16 < X < 24 )

(16 20 < X < 24 20)
(4 < X < 4)
(|X | < 4)
como k = 4 y = 2, entonces k = 2. Luego, de acuerdo a la desigualdad,

se tiene que:
P (16 < X < 24) = P (|X | < 4) 1
3
1
=
2
2
4
el costo por usar una determinada herramienta ser entre 16 y 24 con una
probabilidad al menos de 3/4.

64
Ejemplo 2.5. Se tiene un lote grande de artculos y se desea estimar la fraccin defectuosa usando muestreo aleatorio simple. Usando la desigualdad de
Chebyshev se quiere encontrar el tamao de la muestra tal que la probabilidad
sea al menos del 95 % de que la fraccin defectuosa difiera de la verdadera
fraccin defectuosa en no ms de 0 10.
Solucin:
Sea X la variable aleatoria que cuenta el nmero de artculos defectuosos en n
pruebas independientes. Entonces X sigue un modelo binomial con parmetros
n y p. La fraccin defectuosa viene dada por:
P =
X
n
y
p(1 p)
n
se quiere encontrar el tamao de la muestra tal que:
E [P ] = p
V [P ] =
P (|P p| < 0 1) 0 95
usando la desigualdad de Chebyshev
P (|X | < ) 1
2
2
se tiene que:
p(1 p)
n2
puede demostrarse que para 0 p 1, p(1 p) alcanza un mximo cuando
p = 1/2. De esta manera
P (|P p| < ) 1
P (|P p| < ) 1
1
4n2
para el problema = 0 1, y
1
1
= 0 95
4n(0 1)2
al resolver para n, se tiene

n=
1
= 500
4(0 05)(0 1)2
FaCyT-Matemticas
65
por lo tanto, se requiere tomar una muestra de n=500 artculos para que
la probabilidad de que la fraccin defectuosa difiera de la verdadera fraccin
defectuosa en no ms de 0 10 sea al menos del 95 %.
2.2.2.
Ley de los grandes nmeros
Suponga que X1 , X2 , . . . , Xn es una secuencia arbitraria de variables aleatorias con valores esperadas E [X1 ] , E [X2 ] , . . . , E [Xn ] y supongamos adems
n
P
que para la variable aleatoria Y =
Xi , existe la varianza para cada n
i=1
entero.
n
P
Xi
Teorema 2.4. Si V i=1n 0 y es un nmero positivo,

n
entonces:
P

!
n
1 X

(Xi E [Xi ]) 0

n
n

i=1

!
n
1 X

(Xi E [Xi ]) < 1

n
n

i=1
Demostracin. Para realizar la demostracin de este Teorema se utilizar la

66
desigualdad de Chebyshev presentada en el Teorema (2.3)

!
!
n
n
n

1 X
1 X
X
1

(Xi E [Xi ]) = P
Xi
E [Xi ]
P

n
n
n
i=1
i=1
i=1
= P (|Y E [Y ]| )
V [Y ]
2
n

P
Xi
i=1
V n
=
2
n

P
V
Xi
i=1
=
0
n
n 2 2
con lo que se demuestra el Teorema.
Definicin 2.9 (Convergencia en Probabilidad o en Distribucin). Una secuencia Xn de variables aleatorias converge en probabilidad, en distribucin o en ley a una constante a, si para cada
>0
P (|Xn a| ) 0
n
a
y se denota por Xn
Corolario 2.1. Si E [Xi ] = y V [Xi ] = 2 y si > 0, entonces:

P | X | 0
n
o

P | X | < 1
n
X
n
FaCyT-Matemticas
67
Demostracin. Como E [Xi ]) = , i = 1, 2, . . . , n, entonces

n
!

1 X

P
(Xi E [Xi ])) = P X

n
i=1

y como V X =
n n
0, entonces por el Teorema (2.4), se tiene que:

P | X | 0
n
X
n
El Corolario anterior es conocido como la ley de los grandes nmeros. Este

nos dice que si se aumenta el tamao de la muestra, aumenta la probabilidad
de que X est cerca de .
Ejemplo 2.6. Considere el proceso de seleccin de una muestra aleatoria
de alguna distribucin que tiene una varianza conocida de 2 = 10 pero con
una media desconocida. Cul debe ser el tamao de la muestra para que
la media Xn se encuentre dentro de un intervalo igual a dos unidades de la
media poblacional, con una probabilidad de por lo menos 0 9?
Solucin:
Se quiere encontrar el tamao de la muestra para el cul

P X n < 2 0 9
Dado que X n es una variable aleatoria, tal que

2
V Xn =
n
se deduce del Teorema de Chebyshev que

1

P
Xn < k
1 2
k
n
Sea
= k/ n (mximo error admisible entre X n y ), entonces k =
n/, y

2
P X n < 1 2
n

E Xn =
Sec 2.3. Distribuciones muestrales de algunos estadsticos

importantes
68
para el problema = 2 y 2 = 10, entonces

1
10
= 0 9
n(2)2
resolviendo para n, se tiene que:

n=
10
= 25
4(0 1)
Por lo tanto, se requiere tomar una muestra de por lo menos n = 25 unidades

de la distribucin para que la probabilidad de que el valor de la media muestral
X n difiera del verdadero valor de la media poblacional a lo sumo en 2
unidades sea por lo menos de 0 9.

2.3.
Distribuciones muestrales de algunos estadsticos importantes
Se denomina distribucin muestral a la funcin (densidad) de probabilidad

de un estadstico, la cual puede depender o no de parmetros desconocidos.
Definicin 2.10. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n de una poblacin con funcin de densidad de probabilidad
f (x; ) donde es un parmetro desconocido o un vector de parmetros desconocidos. La funcin de densidad conjunta de las variables
aleatorias X1 , X2 , . . . , Xn est dada por:
g (x1 , x2 , . . . , xn ; ) =
n
Y
f (xi ; )
i=1
donde L (x1 , x2 , . . . , xn ; ) = g (x1 , x2 , . . . , xn ; ) se le denomina funcin de verosimilitud de la muestra.
FaCyT-Matemticas
69
Ejemplo 2.7. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin

que sigue una distribucin de Bernoulli con parmetro p. Calcular su funcin
de verosimilitud.
Solucin:
Como X se distribuye Bernoulli, la funcin de probabilidad es:
(
px (1 p)1x x = 0, 1
f (x; p) =
0
en cualquier otro caso
entonces, la funcin de verosimilitud es:
L (x1 , x2 , . . . , xn ; p) =
=
n
Y
i=1
n
Y
i=1
n
P
f (xi ; p) =
n
Y
P (X = xi )
i=1
pxi (1 p)1xi I{xi =0,1}

xi
= pi=1 (1 p)
n
P
i=1
xi
I{xi =0,1}


con funcin de densidad de probabilidad

(x )2
1
< , x <
2
exp
,
f x; , =
2
2
>0
2
2
Calcular su funcin de verosimilitud.
Solucin:
L x1 , x2 , . . . , xn ; ,
n
Y
f xi ; , 2
i=1

= f x1 ; , 2 f x2 ; , 2 f xn ; , 2

1
(x1 )2
1
(xn )2
=
exp

exp
2 2
2 2
2 2
2 2
(
)
n
1
1 X
2
=
exp
(xi )
n/2
n/2
2
2
2
(2) ( )
i=1

importantes
70

La principal utilidad de la funcin de verosimilitud se ver ms adelante

cuando se use est para estimar los parmetros desconocidos de una poblacin.
2.3.1.
Distribucin muestral de X
La estadstica X tiene un papel muy importante en problemas de toma de

decisiones para medias poblacionales desconocidas. Para determinar la distribucin muestral de la estadstica X si la muestra aleatoria proviene de
una distribucin normal se utiliza la propiedad reproductiva que tiene la
distribucin normal y se anuncia en el siguiente Teorema
Teorema 2.5. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin
normal con media y varianza 2 . Entonces la distribucin de la media
muestral X es normal con media y varianza 2 .
Demostracin. Como X1 , X2 , . . . , Xn es una muestra aleatoria de una distribucin normal con media y varianza 2 , entonces las variables aleatorias Xi
(i = 1, 2, . . . , n) siguen una distribucin normal con E [Xi ] = y V [Xi ] = 2 .
Entonces para cada Xi de la muestra aleatoria, la funcin generadora de momentos es:

t2 2
MXi (t) = exp t +
2
por consiguiente, la funcin generadora de momentos de la media muestral
X es:

t
t
t
MX (t) = MX1
MX2
MXn
n
n
n

t t2 2
t t2 2
t t2 2
exp
exp
= exp
+
+
+
n
2n2
n
2n2
n
2n2

t2 2
= exp t +
,
2n
que es la funcin generadora de momentos de una distribucin normal con
media y varianza 2 /n. Por lo tanto, la distribucin de la media muestral
2
X es normal con media X = y varianza X
= 2 /n, es decir, X
2
N (, /n).
FaCyT-Matemticas
71
Para determinar la distribucin muestral del estadstico X sin importar la

distribucin original de las variables aleatorias X1 , X2 , . . . , Xn se usa el Teorema central del lmite, el cul nos permite usar la distribucin normal como
la distribucin de la media muestral X cuando n es suficientemente grande.
Teorema 2.6 (Teorema central del lmite). Sea X1 , X2 , . . . , Xn
una muestra aleatoria de tamao n tomada de una poblacin con
media y varianza 2 , entonces la variable aleatoria:
Z=
X P
N (0, 1)
/ n n
Demostracin. Una manera de probar el Teorema central del lmite es encontrando la funcin generadora de momentos de
Z=
/ n
y demostrar que est tiende a la funcin generadora de momentos de una

distribucin normal estndar conforme n . Sean
Zi =
Xi
i = 1, 2, . . . , n,
y
Y =
/ n
entonces
n
P
Xi
X
1
i=1
=
Y =

n
/ n
/ n
1
n n
1
=
n
n
X
i=1
n
X
!
Xi n
Zi
i=1
1
=
n
n
X
Xi
i=1

importantes
de esta manera
1
Y =
n
n
X
72
!
Zi
i=1
Debido a que las Xi son variables independientes e idnticamente distribuidas, Zi , i = 1, 2, . . . , n, son independientes e idnticamente distribuidas con
E [Zi ] = 0 y V [Zi ] = 1. Entonces
n
MP
Zi
(t) = MZ1 (t)MZ2 (t) MZ2 (t)
i=1
= [MZi (t)]n
y

n
MY (t) = M P
i=1
donde
Zi

= MZi
n

tZi
t
= E exp
MZi
n
n
al expandir la expresin (2.15) en una serie de taylor:

t3
tZi
t2 2
t
Zi3 +
exp
Zi + Zi +
=1+
3/2
2n
3!n
n
n

(2.15)
(2.16)
tomando valores esperados a ambos lados de la ecuacin (2.16), se tiene que:

t3
t
tZi
t2 2
3
E exp
Z +
= E 1 + Zi + Zi +
2n
3!n3/2 i
n
n
3
t
t3
t2 2
=1+
E
Zi +
E [Zi ] + E Zi +
2n
3!n3/2
n
3
t2
t3
Zi +
=1+
+
E
2n 3!n3/2
por tanto,

n
3
t2
t3
MY (t) = 1 +
+
E Zi +
2n 3!n3/2

n

3
1 t2
t3
= 1+
+ E Zi +
n 2
3! n

n
bn
= 1+
n
FaCyT-Matemticas
73
donde

t3
t2
bn = + E Zi3 +
2
3! n
Recuerde que si

lm bn = b entonces
lm
bn
1+
n
n
= exp{b}
de esta manera

n
bn
lm MY (t) = lm 1 +
n
n
n
2
t
= exp
2
(2.17)
(2.18)
ya que todos los trminos en bn , excepto el primero, tienden a cero cuando

n , debido a que todos los trminos tienen potencias positivas de n en sus
denominadores. La expresin (2.17) es la funcin generadora de momentos
para una variable aleatoria normal estndar. Por lo tanto, la distribucin
lmite de
X
Y =
/ n
es la normal estndar para valores grandes de n.
El Teorema central del lmite dice que la media muestral X de una muestra
aleatoria tiende a seguir una distribucin normal, cuando n es suficientemente
grande. En general, el tamao de n depende de la distribucin original de
la variable aleatoria X; para n 30, se aplica la aproximacin normal sin
importar cual sea la distribucin original de X. Para n < 30 la aproximacin
es vlida segn la forma de la distribucin original, esto es, si el modelo de
probabilidad de la poblacin es semejante a la distribucin normal.
Ejemplo 2.9. Una mquina vendedora est programada para que la cantidad
de refrescos que sirve sea una variable aleatoria con media 200 ml y desviacin estndar 15 ml. Cul es la probabilidad de que la media muestral X de
una muestra aleatoria de 36 refrescos sea mayor que 196 ml pero menor que
204 ml?
(a) Realice los clculos usando la desigualdad de Chebyshev y el Teorema
central del lmite.

importantes
74
(b) Cul es el error mximo que se est dispuesto a aceptar en la estimacin de la media poblacional si se especifica una probabilidad de 0 95?
(c) Cul debe ser el tamao de la muestra de tal forma que el error mximo que se cometa en la estimacin de la media sea de 4 ml con una
probabilidad de por lo menos 0 95?
Solucin:
Sea X la variable aleatoria que representa la cantidad de refresco que sirve
la mquina, entonces
E [X] = 200 ml
V [X] = 225 ml2
Si X es la media de la muestra aleatoria de 36 refrescos, por la expresiones

(2.2) y (2.3), se tiene que:

E X = 200 ml
225
V X =
ml2
36
(a) Usando la desigualdad de chebyshev:

P 196 X 204 = P 196 200 X 204 200

= P 4 X 4

= P X 4
como kX = 4 y X = 5/2, entonces k = 8/5, de esta manera

P 196 X 204 = P X 4
1
64
1 2 =1
k
25
39
=
64
= 0 6094
Usando el Teorema central del lmite:

225
X N 200,
36
FaCyT-Matemticas
75
entonces:

P 196 X 204 = P 196 200 X 204 200

= P 4 X 4

6
6
= P 4 Z 4
15
15
= P (1 6 Z 1 6)
= 1 2P (Z 1 6)
= 0 8904
Con la desigualdad de Chebyshev donde no se hace ninguna suposicin
sobre la distribucin de X, la probabilidad es al menos de 0 6094 y
usando el Teorema central del lmite se tiene que la probabilidad es
aproximadamente 0 8904.
b) Se quiere determinar el error tal que:

P X = 0 95
entonces

P X = P X

6
6
=P Z
15
15

6
= 1 2P Z
= 0 95
15
esto implica que:

P
6
Z
15

= 0 025
por lo tanto:
y de aqu, = 4 9 ml.
6
= 1 96
15
Sec 2.4. Distribuciones muestrales relacionadas con la distribucin

normal
76

c) P X < 4 0 95

P X < 4 = P 4 < X < 4

4
4
<Z<
=P
15/ n
15/ n

4
0 95
= 1 2P Z <
15/ n
y esto implica que:

P Z<
15/ n

0 025
y tomando 0 025 como la probabilidad mxima, se tiene que:

4
= 1 96
15/ n
y despejando a n de la ltima expresin se tiene que n 54. De esta
manera, si selecciona una muestra que contenga por lo menos 54 observaciones de la distribucin, el valor de la media muestral se encontrar
dentro de un intervalo con longitud de 4 ml con respecto a la media
poblacional con una probabilidad no menor de 0 95.
2.4.
Distribuciones muestrales relacionadas con

la distribucin normal
En esta seccin se estudiarn algunos modelos probabilsticos, que si bien no

aparecen en la realidad de una forma emprica, surgen asociados a ciertos
estadsticos importantes.
FaCyT-Matemticas
77
2.4.1.
Distribucin chi-cuadrado de Pearson
Definicin 2.11. Una variable aleatoria X se dice que se distribuye

chi-cuadrado con grados de libertad, lo cual se denota por X 2 ,
si su funcin de densidad de probabilidad est dada por:
(
1
x/21 exp {x/2} x > 0
/2
f (x; ) = 2 (/2)
0
x0
Esta distribucin es un caso particular de la distribucin Gamma con = /2

y = 2. La distribucin se encuentra caracterizada por slo un parmetro,
, conocido como los grados de libertad. La distribucin chi-cuadrada juega
un papel importante en la inferencia estadstica para hacer inferencias con
respecto a la varianza poblacional. En la Figura (2.4.1) se muestran distintas
grficas de la funcin de densidad de una variable aleatoria chi-cuadrada para
distintos valores de .
Figura 2.1: Grfica de la distribucin chi-cuadrado

Si X 2 , entonces
E [X] =
V [X] = 2
3 (X) = 4/ 2

4
4 (X) = 3 1 +
y la funcin generadora de momentos viene dada por:

MX (t) = (1 2t)/2 ,
0 t < 1/2

normal
78
2
Aproximacin: Si la variable aleatoria X sigue una
distribucin , y es
suficientemente grande, entonces la variable
Y = 2X, sigue aproximadamente una distribucin normal con media 2 1 y varianza 1.
Teorema 2.7. Sea Z una variable normal estndar, entonces la distribucin de la variables aleatoria Y = Z 2 es una distribucin chicuadrado con un grado de libertad, esto es, Y = Z 2 21 .
Demostracin. La funcin generadora de momentos de Y viene dada por:

MY (t) = E [exp {tY }] = E exp tZ 2
Z

exp tZ 2 f (z)dz
=

Z
2 1
Z2
dz
exp tZ exp
=
2
2

Z
1
1
exp
=
t
Z 2 dz
2
2

Z
1
1
2
exp (2t + 1) Z dz
=
2
2
)
(
Z
Z2
1
dz
exp
=
1
2 12t
2
la ltima integral representa el kernel de una distribucin normal con media
cero y varianza (1 2t)1 . Para hacer el integrando igual a una distribucin
normal con media cero y varianza (1 2t)1 , se multiplica tanto numerador
como el denominador por la desviacin estndar (1 2t)1/2 , esto es:
(
)
Z
(1 2t)1/2 1
Z2
dz
MY (t) =
exp
1
(1 2t)1/2 2
2 12t
(
)
Z
1
1
Z2
dz
=
exp
1
(1 2t)1/2 2(1 2t)1/2
2 12t
|
{z
}
= (1 2t)1/2
de esta manera,
MY (t) = (1 2t)1/2 ,
0 t < 1/2
FaCyT-Matemticas
79
La funcin generadora de momentos de Y = Z 2 es idntica a la de la distribucin chi-cuadrado con = 1 grados de libertad. En consecuencia, si
Z N (0, 1) entonces Y = Z 2 21 .
Teorema 2.8. Si Z1 , Z2 , . . . , Zn son variables aleatorias independientes e idnticamente distribuidas normal estndar, entonces la variable
aleatoria
Y = Z12 + Z22 + + Zn2
sigue una distribucin chi-cuadrado con n grados de libertad.
Demostracin. Del Teorema anterior Zi2 definen n variables aleatorias independientes chi-cuadrada con un grado de libertad para toda i = 1, 2, . . . , n,
entonces
MY (t) = E [exp {tY }]

= E exp t Z12 + Z22 + + Zn2

= E exp tZ12 + tZ22 + + tZn2

= E exp tZ12 exp tZ22 exp tZn2

= E exp tZ12 E exp tZ22 E exp tZn2
= (1 2t)1/2 (1 2t)1/2 (1 2t)1/2
= (1 2t)n/2
de esta forma se tiene que:
MY (Y ) = (1 2t)n/2 ,
0 t < 1/2
que es la funcin generadora de momento de una variable aleatoria chicuadrado con n grados de libertad. Por tanto,
Y = Z12 + Z22 + + Zn2 2n

normal
80
Teorema 2.9. Si X1 , X2 , . . . , Xk son k variables aleatorias independientes y cada una tiene una distribucin chi-cuadrado con
1 , 2 , . . . , n grados de libertad, respectivamente, entonces la variable
aleatoria
Y = X1 + X 2 + + X k
sigue una distribucin chi-cuadrado con = 1 + 2 + + n grados
de libertad.
Demostracin.
= E [exp {t (X1 + X2 + + Xn )}]
= E [exp {tX1 + tX2 + + tXn }]
= E [exp {tX1 } exp {tX2 } exp {tXn }]
= E [exp {tX1 }] E [exp {tX2 }] E [exp {tXn }]
= (1 2t)1 /2 (1 2t)2 /2 (1 2t)n /2
= (1 2t)(1 +2 ++n )/2 ,
0 t < 1/2
que es la funcin generadora de momentos de una variable aleatoria chicuadrado con = 1 + 2 + + n grados de libertad. De esta manera,
Y = X1 + X2 + + Xk 2
donde: = 1 + 2 + + n .
Teorema 2.10. Si X1 y X2 son variables aleatorias, donde X1 sigue

una distribucin chi-cuadrado con 1 grados de libertad y es independiente de Y = X1 + X2 cuya distribucin de Y es chi-cuadrado con
grados de libertad tal que > 1 , entonces X2 tambin sigue una
distribucin chi-cuadrado con 1 grados de libertad.
Demostracin. Sea Y = X1 + X2 , entonces la funcin generadora de momenFaCyT-Matemticas
81
tos de Y viene dada:

= E [exp {t (X1 + X2 )}]
= E [exp {tX1 + tX2 }]
= E [exp {tX1 }] E [exp {tX2 }]
= MX1 (t) MX2 (t)
donde
MY (t) = (1 2t)/2
MX1 (t) = (1 2t)1 /2
Por lo tanto
(1 2t)/2 = (1 2t)1 /2 MX2 (t)
(2.19)
multiplicando ambos lados de la ecuacin (2.19) por (1 2t)1 /2 , se tiene que:

(1 2t)/2 (1 2t)1 /2 = MX2 (t)
de esta forma la funcin generadora de momentos de X2 es:
MX2 (t) = (1 2t)(1 )/2
La funcin generadora de momentos de X2 es idntica a la de una distribucin
chi-cuadrado con 1 grados de libertad. Por lo tanto, X2 tambin sigue
una distribucin chi-cuadrado con 1 grados de libertad.
Teorema 2.11. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n tomada de una poblacin normal con media y varianza 2 ,
entonces la estadstica
2
n
2
X
X
X
(n
1)S
i
2 =
=
2
2
i=1
tiene una distribucin chi-cuadrado con = n 1 grados de libertad.

normal
82
Demostracin.
n
n
X
X

2
2
(Xi ) =
Xi X + X
i=1
i=1
n
X
Xi X
2
2
+2 X
i=1
i=1
n
X
n
X
Xi X
2
n
X
Xi X
2
i=1
+n X
2
i=1
al dividir cada trmino de la igualdad entre 2 y sustituir (n 1)S 2 por

n
2
P
Xi X , se obtiene que:
i=1
n
P
(Xi )2
2
(n 1)S 2 n X
=
+
(2.20)
2
2
2
La expresin del lado izquierdo de la ecuacin (2.20), es una variable aleatoria
chi-cuadrado con n grados de libertad, ya que es la suma de n variables
aleatoria independientes normal estndar al cuadrado, esto es:
i=1
n
P
(Xi )2
i=1
=
=
2
n
X
Xi
i=1
n
X
Zi2 2n
i=1
el segundo trmino del lado derecho de la ecuacin (2.20) es el cuadrado de

una variable normal estndar, ya que X es una variable normal con media
y varianza 2 /n, esto es
2
2
n X
X
=
2
/ n
= Z 2 21
Adems se puede demostrar que las dos variables chi-cuadrado
n
P
(Xi )2
i=1
n X
2
2
FaCyT-Matemticas
83
son independientes. Por el Teorema (2.10), la variable aleatoria

(n 1)S 2
2
tambin es una variable aleatoria chi-cuadrado con n 1 grados de libertad.
Ejemplo 2.10. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n tomada de una poblacin normal con media y varianza 2 . Encontrar la
varianza de
n
2
1 X
2
S =
Xi X
n 1 i=1
Solucin:
2
, entonces por el Teorema (2.11), Y sigue una distribucin
Sea Y = (n1)S
2
chi-cuadrada con n 1 grados de libertad, de esta manera, se tiene que:
2
2
Y
V S =V
n1
4
V [Y ]
=
(n 1)2
2(n 1) 4
=
(n 1)2
2 4
=
n1
por lo tanto,
V S
2 4
=
n1

Ejemplo 2.11. Suponga que el espesor de un componente para un semiconductor es una caracterstica crtica. El proceso de produccin de esta caracterstica se distribuye normalmente con = 0 6 milsimas de pulgadas. Para
controlar el proceso se toman muestras peridicas de 20 piezas y se define un
lmite central en base a una probabilidad de 0 01 de que la varianza muestral
exceda dicho lmite, si el proceso est bajo control. Qu se puede concluir si
para una muestra dada la desviacin estndar muestral es 0 84 milsima de

normal
84
pulgada?
Solucin:
Sea X la variable aleatoria que representa el espesor del semiconductor, de
esta manera X N (, 0 36). Sea a el lmite central, entonces
(n 1)S 2
(n 1)a
>
2
2

19a
= P 2n1 >
(0 6)2

19a
2
= P 19 >
= 0 01
(0 6)2

P S >a =P
por lo tanto
19a
= 36 19
(0 6)2
de aqu implica que el lmite central es a = 0 6857. Con base a la evidencia
muestral se obtuvo que s2 = (0 84)2 = 0 7056; como este valor supera el
limite central se puede concluir que la muestra no proviene de un proceso con
desviacin estndar de 0 60.

Ejemplo 2.12. Un fabricante de bateras para automviles garantiza que sus
bateras durarn, en promedio, tres aos con una desviacin estndar de un
ao. Si cinco de estas bacterias bateras tienen duraciones de 1 9, 2 4, 3 0,
3 5 y 4 2 aos. Puede asegurarse que la duracin de las bateras tienen una
desviacin estndar de un ao?. Suponga que la duracin de las bateras siguen una distribucin normal.
Solucin:
Con base a la evidencia muestral se tiene que:
s2 = 0 815
Entonces
2 =
(4)(0 815)
(n 1)s2
=
= 3 26
2
1
FaCyT-Matemticas
85
en un valor de una distribucin chi-cuadrado con 4 grados de libertad. Como

el 95 % de los valores de 2 con 4 grados de libertad caen entre 0 484 y 11 143,
el valor calculado con 2 = 1 es razonable y por tanto el fabricante no tiene
razn para sospechar que la desviacin estndar es diferente de un ao.
2.4.2.
Distribucin t de Student
Se sabe que cuando se muestrea una distribucin normal con media y

varianza conocida 2 , la distribucin de
Z=
/ n
(2.21)
es normal estndar. La expresin (2.21) nos permitir, en los captulos siguientes, formular inferencias con respecto a la media de la poblacin. Sin
embargo para calcular Z se requiere que 2 sea conocido; si la varianza es
desconocida y dada la disponibilidad de una muestra aleatoria tomada de la
poblacin se puede reemplazar por su estimacin s, esto es:
T =
S/ n
(2.22)
Desafortunadamente, la distribucin de la expresin (2.22) no sigue de manera exacta una distribucin normal estndar. Por lo tanto, se necesita una
distribucin para el caso en que sea desconocido y sea reemplazado por su
estimacin s. Como se ver, la expresin (2.22) sigue una distribucin t de
Student con n 1 grados de libertad. El principal objetivo de esta seccin es
mostrar los aspectos tericos de la distribucin t de Student

normal
86
Teorema 2.12. Si X y Z son dos variables aleatorias independientes,
y adems X sigue una distribucin chi-cuadrada con grados de
libertad y Z es una variable aleatoria normal estndar, entonces la
distribucin de la variable aleatoria
Z
T =q
sigue una distribucin t de Student con grados de libertad y una

funcin de densidad de probabilidad dada por:

+1
1
1
2
f (t; ) =
< t < , > 0
1 + t2 +1
2
2
Demostracin. Por hiptesis las variables aleatorias X y Z son independientes, por tanto la densidad conjunta de las variables aleatorias X y Z viene
dada por:
f (x, z) = f (x)f (z)
donde f (x) es la funcin de densidad de una variable aleatoria chi-cuadrada
con grados de libertad y f (z) es la densidad de una variable normal estndar. En consecuencia
2
n xo 1
z
1
1
x 2 exp
exp
f (x, z) =
2
2
22 2
2
Haciendo el cambio de variable
r
Z=T
y x=w
entonces el jacobiano de la transformacin es:

p
1
w

T 12 w 2 1

J =
0
1

r

= w

de esta manera se tiene que:

g(t, w) =
22
2 r
n wo 1
t w
w
2 1 exp
exp
2
2
2
2
< t < ,
w>0
FaCyT-Matemticas
87
o
w
g(t, w) =
1
2
n
o
1
t2
w exp 2 1 + w
,

2+1 2
1
2
< t < ,
w>0
Integrando g(t, w) con respecto a w, se obtiene la distribucin marginal de

la variable aleatoria T
o
n
Z w 2 1 w 21 exp 1 1 + t2 w
2
g(t) =
dw

2+1 2
0
n
o
1
t2
1
Z w +1
2
exp
1
+
w
2
1
dw
=
+1
(/2) 0
2 2
Haciendo el siguiente cambio de variable

t2
t2
dm
= 1+
m= 1+
w y
dw
Adems, si
w = 0 m = 0
w = m =
Por lo tanto,
1
g(t) =
(/2)
1
=
(/2)
+1
1
2
n
exp 21 1 +
2
0
+1
1+
Z
t2
o
w
dw
m 2 1
+1
1
t2
2
=
(/2) 1 +
+1
2
t2
+1
1
2
n m o dm

exp
t2
+1
2
1
+
2 2

+1
m 2 1 exp m2
dm
+1
2 2
La ltima integral representa el kernel de una distribucin gamma con parmetros = ( + 1)/2 y = 2. Entonces, Multiplicando tanto numerador y

normal
88

, se tiene que:
denominador por +1
2
g(t) =
+1
2
(/2) 1 +
+1
2
Z
t2
+1
1
2
+1
1
2

exp m2
+1 dm
+1
2 2
2
{z
}
1
(/2) 1 +
t2
,
+1
1
2
< t <
En consecuencia, la funcin de densidad de probabilidad de T es:

+1
2
,
< t <
g(t; ) =
+1
1
t2
2
(/2) 1 +
La distribucin de probabilidad de t se public por primera vez en 1908 en

un artculo de W. S. Gosset. En esa poca, Gosset era empleado de una cervecera irlandesa que desaprobaba la publicacin de investigaciones de sus
empleados. Para evadir esta prohibicin, public su trabajo en secreto bajo
el nombre de Student. En consecuencia, la distribucin t normalmente se
llama distribucin t de Student, o simplemente distribucin t.
La funcin de densidad es simtrica con respecto al origen, y su forma es
muy parecida a la de la normal estndar. En la Figura (2.4.2) se presentan
varias grficas de la distribucin t de Student para distintos valores de y
la grfica de la normal estndar.
Figura 2.2: Comparacin de las funciones de densidad normal estndar y t

FaCyT-Matemticas
89
De la Figura (2.4.2) se puede ver que cuando crece, entonces la distribucin

t de Student tiende a una normal estndar. Adems, se puede demostrar que
el valor esperado de T es:
E [T ] = 0,
>1
y la varianza est dada por:

V [T ] =
,
2
>2
La varianza de T es ligeramente mayor que 1, esto implica que la distribucin

t de Student tiene colas ms pesadas que la distribucin normal estndar. La
funcin generadora de momentos para esta distribucin no esta definida.
Teorema 2.13. Si X y S 2 son la media y la varianza de una muestra

aleatoria de tamao n tomada de una poblacin normal con media
y varianza 2 , entonces la variable aleatoria
T =
S/ n
sigue una distribucin t de Student con n 1 grados de libertad.
Demostracin. Como X1 , X2 , . . . , Xn es una muestra aleatoria tomada de

una poblacin normal con media y varianza 2 , entonces:
X
N (0, 1)
/ n
y
(n 1)S 2
2n1
2
dado que se puede demostrar que X y S 2 son independientes, del Teorema


normal
90
(2.12) se desprende que la distribucin de
T =q
/ n
(n1)S 2 1
2
n1
n(X)
X
/ n
q =
S
2
S
S/ n
es la distribucin t con n 1 grados de libertad.

En los captulos siguientes se usar esta funcin de los estadsticos X y S para
construir intervalos de confianza y hacer pruebas de hiptesis con respecto a
la media de una distribucin normal cuando la varianza de la poblacin sea
desconocida.
Ejemplo 2.13. Un fabricante de cigarrillos afirma que su producto tiene un
contenido promedio de nicotina de 1 83 mg. Si una muestra aleatoria de 8
cigarrillos tiene un contenido de nicotina de 2 0, 1 7, 2 1, 1 9, 2 2, 2 1, 2 0,
1 6 Qu tan cierto es lo que afirma el fabricante? Suponga que la cantidad
de nicotina sigue una distribucin normal.
Solucin:
Con base a la evidencia muestral, se tiene que x = 1 95, s = 0 2070 y n = 8.
Entonces para la muestra obtenida, si = 1 83, entonces:
t0 =
1 95 1 83
= 1 6393
0 2070/ 8
es un valor de una distribucin t de Student con 7 grados de libertad. Como el

95 % de los valores de t7 caen entre 2 365 y 2 365, el valor calculado t0 con
= 1 83 es razonable y por lo tanto la afirmacin del fabricante es cierta.

FaCyT-Matemticas
91
2.5.
Distribucin de la diferencia de medias muestrales

Supongamos que X N (x , x2 ) y Y N y , y2 son dos variables aleatorias independientes. Sean X1 , X2 , . . . , Xnx y Y1 , Y2 , . . . , Yny muestras aleatorias independientes de X y Y , respectivamente. El inters radica en comparar
x y y a travs de la diferencia X Y , por lo tanto, se necesita obtener la
distribucin de X Y cuando el muestreo se lleva a cabo sobre dos poblaciones normales e independientes.
Se sabe que:

x2
X N x ,
nx
y

y2
Y N y ,
ny
luego, para la variable aleatoria X Y , el valor esperado y la varianza vienen
dadas por:

E X Y =E X E Y
= x y

V X Y =V X +V Y
x2 y2
=
+
nx ny
respectivamente. Para conocer la distribucin exacta que sigue la variable
aleatoria X Y se debe saber si las varianzas poblacionales son conocidas o
desconocidas, y si son desconocidas se desea saber si son iguales o no.
2.5.1.
Distribucin de la diferencia de medias cuando se

conocen las varianzas
Si x2 y y2 son conocidas, entonces la distribucin exacta de la variable aleatoria X Y es normal con media = x y y varianza 2 = x2 /nx + y2 /ny ,
Sec 2.5. Distribucin de la diferencia de medias muestrales
92
esto es:

x2 y2
X Y N x y ,
+
nx ny
en consecuencia, la distribucin exacta de
Z=
X Y (x y )
q
y2
x2
+
nx
ny
(2.23)
es normal estndar. Como caso particular, si x2 = y2 = 2 , la expresin

(2.23) se puede escribir como:
Z=
X Y (x y )
q
n1x + n1y
(2.24)
La expresin (2.23) se puede usar para hacer inferencia con respecto a la diferencia de medias poblacionales de dos distribuciones normales con varianzas
conocidas.
Ejemplo 2.14. Se toma una muestra aleatoria de tamao 16 de una poblacin normal que tiene una media de 75 y una desviacin estndar de 8.
De otra poblacin normal independiente se toma una muestra aleatoria de
tamao 9, esta poblacin tiene una media de 70 y una desviacin estndar
de 12. Sean X y Y las medias de cada muestra aleatoria, respectivamente.
Encuentre:
(a) La probabilidad de que X Y sea mayor que 4, y
(b) La probabilidad de que X Y este entre 3 5 y 5 5
Solucin:
Si se denota con X y Y la primera y segunda poblacin, respectivamente.
Entonces:

X N 75, 64/ 16
y Y N 70, 144/ 9
FaCyT-Matemticas
93
a) La probabilidad de que X Y sea mayor que 4, se puede calcular de la

siguiente manera:

X Y (1 2 )
4 (1 2 )
q 2
q 2
>
P X1 X2 > 4 = P
22
2
1
1
+ n2
+ n22
n1
n1
4 (75 70)
= P Z > q
2
82
+ 129
16

1
=P Z>
4 47
= P (Z > 0 22)
= 1 P (Z 0 22)
= 0 587
b) La probabilidad de que X Y este entre 3 5 y 5 5, viene dada por:
3 5 (1 2 )
5 5 (1 2 )
P (3 5 X Y 5 5) = P q 2
Z q 2
2
1
1
2
+ n22
+ n22
n1
n1
3 5 (75 70)
5 5 (75 70)
Z q
=P q
2
2
82
82
+ 129
+ 129
16
16
= P (0 33 Z 0 11)
= P (Z 0 11) P (Z 0 33)
= 0 5438 0 3707
= 0 731

Ejemplo 2.15. La elasticidad de un polmero es afectada por la concentracin de un reactivo. Cuando se utiliza una concentracin baja la elasticidad
promedio verdadera es 55, mientras que cuando se emplea una concentracin
alta la elasticidad promedio verdadera es 60. La desviacin estndar de la
elasticidad es 4 sin importar cul es la concentracin.Si se toman dos muestras aleatorias de tamao 16, calcule: P X Y > 2 .
94
Solucin:
Si se denota con X la elasticidad con concentracin alta y con Y la elasticidad
con concentracin baja, entonces:
x = 60
x = 4
nx = 16
y = 55
y = 4
ny = 16
Entonces

X N 60, 16/ 16

y Y N 55, 16/ 9
Por lo tanto

2 (60 55)
X Y (x y )
q
P X Y >2 =P
> q
1
1
n1x + n1y
4 16
+ 16
= P (Z > 2 1213)
= 1 P (Z 2 1213)
= 0 983

2.5.2.
Distribucin de la diferencia de medias cuando

las varianzas son desconocidas pero iguales
Para el desarrollo de
Z=
X Y (x y )
q
n1x + n1y
Se supuso que la varianzas para las dos distribuciones eran conocidas. Sin
embargo, es poco probable conocer el valor de las varianzas para cada una
de las distribuciones en una situacin real. Se puede obtener la distribucin
exacta de X Y cuando el muestreo se lleve a cabo sobre dos poblaciones
normales independientes con varianzas desconocidas pero iguales. Para cada
una de las dos muestras aleatorias, pueden definirse las varianzas muestrales
Sx2 y Sy2 . Dado que:
(nx 1)Sx2
2nx 1
2
FaCyT-Matemticas
95
y
(ny 1)Sy2
2ny 1
2
y como X es independiente de Y , entonces por el Teorema (2.9) la distribucin de

(nx 1)Sx2 (ny 1)Sy2
W =
+
2
2
tambin es chi-cuadrada con n1 + n2 2 grados de libertad. Por lo tanto el
cociente de
X Y (x y )
q
Z=
n1x + n1y
y la raz cuadrada de W dividida entre sus grados de libertad tiene una
distribucin t de Student con n1 + n2 2 grados de libertad. Es decir,
T =r
XY (x y )
q
n1 + n1
x
2
2
(ny 1)Sy
(nx 1)Sx
+
2
2
nx +ny 2
=r
X Y (x y )

(nx 1)Sx2 +(ny 1)Sy2
1
+
nx +ny 2
nx
1
ny
o
T =
en donde
Sp2 =
X Y (x y )
q
Sp n1x + n1y
(2.25)
(nx 1)Sx2 + (ny 1)Sy2

nx + ny 2
es un estimador ponderado de la varianza poblacional comn desconocida.

La expresin (2.25) se puede usar para hacer inferencia con respecto a la
diferencia de medias poblacionales de dos distribuciones normales cuando las
varianzas son desconocidas pero iguales.
Ejemplo 2.16. La resistencia a la rotura por traccin de un alambre es una

caracteristica de calidad fundamental. Esta resistencia se distribuye normalmente de media y varianza desconocida. Una modificacin en el proceso de
fabricacin que disminuye los costos puede producir una variacin en la resistencia. Se tomaron dos muestras independientes, una antes de la modificacin
96
de tamao 6 de la se obtuvo una media de 452 42 Kg y una desviacin estndar de 5 2 Kg. y otra despus de la modificacin de tamao 12 de la que se
determin la media de 460 63 Kg. y una desviacin estndar de 4 5 Kg. Se
puede considerar que la media de la resistencia se ha modificado?
Solucin:
Si se denota con A el proceso antes de la modificacin y con D el proceso
despus de la modificacin, entonces se tiene:
nA = 6
xA = 452 42
sA = 5 2
nD = 12
xD = 460 63
sD = 4 5
Supongamos que las varianzas del proceso antes y despus de la modificacin

son desconocidas pero iguales, entonces
T =
X A X D (A D )
q
tnA +nD 2
Sp n1A + n1D
donde
(nA 1)s2A + (nD 1)s2D
nA + nD 2
2
5(5 2) + 11)(4 5)2
=
16
357 95
=
16
= 22 3719
s2p =
y de aqu,
sp = 4 7299
Para los datos obtenidos, si A D = 0, entonces
t0 =
452 42 460 63 0
q
1
(4 7299) 16 + 12
8 21
2 36495
= 3 4715
=
FaCyT-Matemticas
97
es un valor de la distribucin t de Student con 16 grados de libertad. La

probabilidad
P (T16 3 4715) < 0 005
Es decir, si el valor verdadero de la diferencia A D es cero, la probabilidad
de observar un valor de T no mayor a 3 4715 es menor de 0 005. Por lo
tanto, se ha observado algo que tiene muy poca posibilidad de ocurrir o la
verdadera diferencia A D 6= 0. Para esta situacin se prefiere elegir que
A D 6= 0. De esta manera, la resistencia a la rotura por traccin de un
alambre se ha modificado.

2.5.3.
Distribucin de la diferencia de medias cuando

las varianzas son desconocidas y distintas
En muchas situaciones no es razonable suponer que x2 = y2 . Sin embargo la

variable aleatoria
X Y (x y )
q
(2.26)
T =
Sy2
Sx2
+
nx
ny
tiene, de manera aproximada, una distribucin t de Student con grados de
libertad dados por:
2
s2x /nx + s2y /ny
=
2 2
(s2y /ny )
(s2x /nx )2
+ ny 1
nx 1
La expresin (2.26) se puede usar para hacer inferencia con respecto a la
diferencia de medias poblacionales cuando las varianzas son desconocidas y
distintas.
Ejemplo 2.17. Un especialista en adquisiciones compra 25 resistores del
vendedor A y 30 del vendedor B. con base a la evidencia muestral la media
y desviacin estndar para los resistores del vendedor A fueron 100 y 1 5
, respectivamente. Para el vendedor B la media y la desviacin estndar
result ser 105 y 2 0 , respectivamente. Existe alguna razn para creer
que las resistencia promedio reales para los resistores del vendedor A y del
vendedor B son distintas?
98
Solucin:
Si se denota con 1 los resistores del vendedor A, se tiene
x1 = 100
s1 = 1 5
n1 = 25
x2 = 105
s2 = 2 0
n2 = 30
Para las muestras obtenidas, si 1 2 = 0, entonces:

t0 =
x1 x2 (1 2 )
100 105
q 2
=q
= 10 58
2
s1
s2
1 52
2 02
+
+ n2
25
30
n1
es un valor de la distribucin t de Student con grados de libertad dados por:

2
s2y 2
sx
+ ny
nx
= 2 2 2 2 2
sx
nx
nx 1

=
1 52
+
25

2 2
1 5
25
251
Sy
ny
ny 1
2
2 02
30
2 2
2 0
30
301
0 0498
2
=
0 0095
= 50 39
= 50
como
P (T52 10 58) < 0 0005
esto quiere decir que, si el verdadero valor de la diferencia 1 2 = 0, la
probabilidad de observar un valor T no mayor de 10 58 es menor a 0 0005.
En cualquier caso, se ha observado algo que tiene muy poca posibilidad de
ocurrir, o el verdadero valor de la diferencia 1 2 6= 0. Para esta situacin
es preferible elegir la segunda. Por lo tanto, hay razn suficiente para asegurar
que las resistencia promedio reales para los resistores del vendedor A y del
vendedor B son distintas.

FaCyT-Matemticas
99
2.5.4.
Distribucin de la diferencia de medias cuando las

varianzas son desconocidas y tamaos de muestras grandes
Se sustituye en (2.23) cada varianza poblacional que es desconocida, por la

correspondiente varianza muestral, considerando que en virtud de los elevados tamaos muestrales ambas estn suficientemente prximas a las varianzas poblacionales para proceder como si fuesen conocidas. de este modo, la
variable aleatoria
X Y (x y )
q
Z=
(2.27)
Sy2
Sx2
+
nx
ny
tiene una distribucin, de manera aproximada, normal estndar.
2.6.
Distribucin F de Snedeer
La idea ahora es tratar de comparar las varianzas de dos distribuciones normales independientes con base a cada muestras aleatorias.
Teorema 2.14. Sean X y Y dos variables aleatorias independientes

chi-cuadrada con 1 y 2 grados de libertad, respectivamente. Entonces, la variable aleatoria F definida como:
F =
X/1
Y /2
tiene una distribucin F con funcin de densidad de probabilidad dada

por:
+ 1 /2 2 /2
2
( 1 2 2 )1 2 f 122 ( + f ) 1 +
2
f >0
1
2
2
1
(
)
(
)
g(f ; 1 , 2 ) =
2
2
0
f 0
(2.28)
Si una variable aleatoria F tiene funcin de densidad dada por (2.28), entonces la variable aleatoria F sigue una distribucin f de Snedeer con 1 y 2
Sec 2.6. Distribucin F de Snedeer
100
grados de libertad en el numerador y denominador, respectivamente, lo que

se denota por:
F f21
Si F f21 , puede demostrarse que el valor esperado de F es
E [F ] =
2
2 2
2 > 2
y la varianza
22 (22 + 21 4)
V [F ] =
1 (2 2)2 (2 4)
2 > 4
En la Figura (2.6) se muestran distintas grficas de la funcin de densidad

de una variable aleatoria F para distintos valores de 1 y 2 .
Figura 2.3: Grfica de la distribucin F
Es una densidad asimtrica positiva, pero la asimetra va disminuyendo a

medida que 1 y 2 van aumentando. La funcin generadora de momentos
para esta distribucin no esta definida.
La aplicacin principal para la cual se desarroll la distribucin F es la
comparacin de varianzas de dos poblaciones normales.
FaCyT-Matemticas
101
Teorema 2.15. Si S12 y S22 son las varianzas muestrales de dos variables aleatorias independienes de tamao n1 y n2 , tomadas de poblaciones normales con varianzas 12 y 22 , entonces:
F =
S12 /12
S22 /22
sigue una distribucin F con (n1 1) grados de libertad en el numerador y (n2 1) grados de libertad en el denominador.
Demostracin. Se sabe que:

(n1 1)S12
W1 =
12
y
W2 =
(n2 1)S22
22
tienen distribuciones chi-cuadradas independientes con 1 = (n1 1) y 2 =

(n2 1) grados de libertad, respectivamente. Entonces por el Teorema (2.14)
implica que:
F =
S12 /12
[(n1 1)S12 /12 ] /(n1 1)
W1 /1
=
=
W2 /2
[(n2 1)S22 /22 ] /(n2 1)
S22 /22
tiene una distribucin F con (n1 1) grados de libertad en el numerador y

(n2 1) grados de libertad en el denominador.
En el caso de que 12 = 22 entonces:
F =
S12
fn1 1,n2 1
S22
Ejemplo 2.18. En una prueba sobre la efectividad de dos tipos distintos de

pldoras para dormir, A y B, se utilizan dos grupos independientes de personas con insomnio. Al grupo 1 de tamao 40 se le administr la pldora
A y al otro grupo 2, de tamao 60, se le administr la B, registrndose el
nmero de horas de sueo de cada individuo participante en el estudio. Si se
102
supone que el nmero de horas de sueo de quienes usan cada tipo de pldora
se distribuye normalmente con 12 y 22 . Determine si es cierto que 12 = 22 ,
sabiendo que la desviacin estndar muestral de los grupos 1 y 2 en estudio
es de 3h y 2h, respectivamente.
Solucin:
Sea X la variable aleatoria que representa las horas de sueo del grupo 1 y Y
la variable aleatoria que representa las horas de sueo del grupo 2, entonces:
X N (1 , 12 ) y Y N (2 , 22 )
y
n1 = 40
s1 = 3h
n2 = 60
s2 = 2h
Para las muestras obtenidas, si 12 = 22 , entonces:

F0 =
s2x
32
=
= 2 25
s2y
22
es un valor de una distribucin F con 39 grados de libertad en el numerador y

59 grados de libertad en el denominador. Como el 95 % de los valores de una
distribucin F con 39 y 59 grados de libertad en el numerador y denominador,
respectivamente, caen entre 0 5507 y 1 7541, el valor calculado F0 suponiendo
que 12 = 22 es poco probable de que ocurra. Por lo tanto, no es cierto suponer
que las varianzas sean iguales.

2.7.
1. Un fabricante de llantas desea calcular un intervalo de rendimiento en

millas que excluya no ms de 10 % del rendimiento de las llantas que
l vende. Todo lo que sabe es que, parar un gran nmero de llantas
probadas, la media de rendimiento fue de 25 000 y que la desviacin
estndar fue de 4000 millas. Qu intervalo sugerira usted?
FaCyT-Matemticas
103
2. Una mquina empleada para llenar cajas de cereal despacha, en promedio, onzas por caja. El fabricante desea que las X onzas reales
despachadas no rebasen por ms de 1 onza a , al menos 75 % del
tiempo. Cul es el mximo valor de , la desviacin estndar de X,
que se puede tolerar si las metas del fabricante han de satifacerse?
3. Cul debe ser el valor ms pequeo de k en el Teorema de Chebyshev
para el que la probabilidad de que una variable aleatoria asuma un
valor entre k y + k sea
a. al menos 0 95
b. al menos 0 99
4. El nmero de licencias de matrimonio expedida en cierta ciudad durante
el mes de junio se puede considerar como una variable aleatoria con
= 124 y = 7 5. De acuero con el Teorema de Chebyshev, con
que probabilidad se puede afirmar que all se emitarn entre 64 y 184
licencias de matrimonio durante el mes de junio?
5. Un estudio del valor alimenticio de cierta clase de pan muestra que la
cantidad de tiamina (vitamina B1 ) en una rebanada se puede considerar
como una variable aleatoria con = 0 260 miligramos y = 0 005
miligramos. De acuerdo al Teorema de Chebyshev, entre que valores
debe estar el contenido de tiamina de
a. al menos 35/36 de todas las rebanadas de este pan?
b. al menos 143/144 de todas las rebanadas de este pan?
6. Un distribuidor minorista vende tres marcas de automviles. Para la
marca A, su utilidad X por venta, est distribuida normalmente con
parmetros (1 , 12 ); para la marca B su utilidad Y por venta est
distribuida normalmente con parmetros (2 , 22 ); para la marca C, su
utilidad W por venta est distribuida normalmente con parmetros
(3 , 32 ). Para un ao, dos quintas partes de las ventas del distribuidor
son de la marca A, un quinto de la marca B y los quintos restantes de
la marca C. Sea U el verdadero promedio de utilidad por ventas para
el ao. Encuentre la media, la varianza y la funcin de densidad de
probabilidad para U. Suponga que X, Y y W son independientes.
104
7. De cada una de dos poblaciones normales con medias idnticas y con

desviaciones estndar de 6 4 y 7 20, se toman muestras aleatorias independientes de 64 observaciones. Encuentre la probabilidad de que
la diferencia entre las medias de las muestras exceda de 0 6 en valor
absoluto.
8. Si X tiene una distribucin exponencial con media , demuestre que
U = 2X/ tiene una distribucin chi-cuadrado con 2 grados de libertad.
9. El coeficiente de variacin (CV) para una muestra aleatoria X1 , X2 , . . . , Xn
est definido por
S
CV =
X
Esta cantidad, que suministra la desviacin estndar como una proporcin de la media, en ocasiones es informativa. Denote con X1 , X2 , . . . , X10
una muestra aleatoria de tamao 10 tomada de una distribucin normal
con media 0 y varianza 2 . Use los siguientes pasos para determinar el
nmero c tal que

S
c = 0 95
P c
X
a. Determinar la distribucin de
U=
10X
S2
b. Determinar la distribucin de
W =
S2
10X
c. Use los resultados al inciso b para determinar la constante c.

10. La filtracin de agua por el suelo depende, entre otras cosas, de la
porosidad (porporcin de huecos por volumen) del suelo. Para comparar
dos tipos de suelo arenoso, se han de tomar n1 = 50 mediciones de la
porosidad del suelo A y n2 = 100 mediciones del suelo B. A partir
de las mediciones se obtuv que 12 = 0 01 y 22 = 0 02. Encuentre la
probabilidad de que la diferencia entre las medias muestrales est a no
ms de 0 05 unidades de la diferencia entre las medias poblacionales
1 2 .
FaCyT-Matemticas
105
11. Para el ejercicio propuesto (10). Suponga que n1 = n2 = n, y encuentre

el valor de n que permita que la diferncia entre las medias muestrales
sea no mayor que 0 04 unidades de 1 2 con probabilidad 0 90.
12. Para un determinado nivel de ingresos, el departamento de Hacienda
sabe que las cantidades declaradas por concepto de deducciones mdicas (X1 ), contribuciones caritativas (X2 ) y gastos varios (X3 ), son
variables aleatorias independientes normalmente distribuidas con medias 400 Bs, 800 Bs y 100 Bs y desviaciones estndar 100 Bs, 250 Bs
y 40 Bs, respectivamente. Cul es la probabilidad de que la cantidad
total declarada por concepto de estas tres deducciones, no sea mayor
de 1600 Bs?
13. Un contratista piensa comprar una gran cantidad de lmparas de alta
intensidad a cierto fabricante. ste asegura al contratista que la duracin promedio de las lmparas es de 1000 horas con una desviacin
estndar igual a 80 horas. El contratista decide comprar las lmparas
slo si una muestra aleatoria de 64 de stas da como resultado una vida
promedio de por lo menos 1000 horas. Cul es la probabilidad de que
el contratista adquiera las lmparas?
14. Un inspector federal de pesos y medidas visita una planta de empacado
para verificar que el peso neto de las cajas sea el indicado en stas. El
gerente de la planta asegura al inspector que el peso promedio de cada
caja es de 750 gr con una desviacin estndar de 5 gr. El inspector
selecciona, al azar, 100 cajas y encuentra que el peso promedio es de
748 gr. Bajo estas condiciones, qu tan probable es tener un peso de
748 gr o menos? Qu actitud debe tomar el inspector?
15. En la fabricacin de cojinetes para motores, se sabe que el dimetro
promedio es de 5cm con una desviacin estndar igual a 0 005cm. El
proceso es vigilado en forma peridica mediante la seleccin aleatoria de
64 cojinetes, midiendo sus correspondientes dimetros. El proceso no se
detiene mientras la probabilidad de que la media muestral se encuentre
entre dos lmites especificados sea de 0 95. Determinar el valor de estos
lmites.
16. En la produccin de cierto material para soldar se sabe que la desviacin
estndar de la tensin de ruptura de este material es de 25 libras. Cul
106
debe ser la tensin de ruptura promedio del proceso si, con base en una
muestra aleatoria de 50 especmenes, la probabilidad de que la media
muestral tenga un valor mayor de 250 libras es de 0 95?
17. Para un gerente de planta es muy importante controlar la variacin
en el espesor de un material plstico. Se sabe que la distribucin del
espesor del material es normal con una desviacin estndar de 0 01 cm.
Una muestra aleatoria de 25 piezas de este material da como resultado
una desviacin estndar de 0 015 cm. Si la varianza de la poblacin es
(0 01)2 cm2 , cul es la probabilidad de que la varianza muestral sea
igual o mayor que (0 015)2 cm2 ? Por lo tanto, qu puede usted concluir
con respecto a la variacin de este proceso?
18. Si se obtiene una muestra aleatoria de n = 16 de una distribucin
normal con media y varianza desconocidas, obtener P (S 2 / 2 6 2 041).
19. Si se obtiene una muestra aleatoria de n = 21 de una distribucin
normal con media y varianza desconocidas, obtener P (S 2 / 2 6 1 421).
20. un fabricante de cigarrillos asegura que el contenido promedio de nicotina, en una de sus marcas, es de 0 6 mg por cigarrillo. una organizacin
independiente mide el nivel de nicotina de 16 cigarrillos de esta marca y
encuentra que el promedio y la desviacin estndar muestral es de 0 75
y 0 175 mg, respectivamente, de nicotina. Si se supone que la cantidad
de nicotina en estos cigarrillos es una variable aleatoria normal, qu
tan probable es el resultado muestral dado el dato proporcionado por
el fabricante?
21. Durante los 12 meses pasados el volumen diario de ventas de un restaurante fue de 2000 Bs. El gerente piensa que los prximos 25 das sern
tpicos con respecto al volumen de ventas normal. Al finalizar los 25
das, el volumen de ventas y su desviacin estndar promedio fueron
de 1800 Bs y 200 Bs, respectivamente. Supngase que el volumen de
ventas diario es una variable aleatoria normal. Si usted fuese el gerente,
tendra alguna razn para creer, con base en este resultado, que hubo
una disminucin en el volumen de ventas promedio diario?
22. El gerente de una refinera piensa modificar el proceso para producir
gasolina a partir de petrleo crudo. El gerente har la modificacin
FaCyT-Matemticas
107
slo si la gasolina promedio que se obtiene por este nuevo proceso (expresada como un porcentaje del crudo) aumenta su valor con respecto
al proceso en uso. Con base en un experimento de laboratorio y mediante el empleo de dos muestras aleatorias de tamao 12, una para
cada proceso, la cantidad de gasolina promedio del proceso en uso es
de 24 6 con una desviacin estndar de 2 3, y para el proceso propuesto
fue de 28 2 con una desviacin estndar de 2 7. El gerente piensa que
los resultados proporcionados por los dos procesos con variables aleatorias independientes normalmente distribuidas con varianza iguales.
Con base en esta evidencia:
a. Debe adoptarse el nuevo proceso?
b. Existe alguna razn para creer que las varianzas son iguales?
23. Una organizacin independiente est interesada es probar la distancia
de frenado a una velocidad de 50 mph para dos marcas distintas de automviles. Para la primera marca se seleccionaron nueve automviles y
se probaron en un medio controlado. La media muestral y la desviacin
estndar fueron de 145 pies y 8 pies, respectivamente. Para la segunda
marca se seleccionaron 12 automviles y la distancia promedio result
ser de 132 pies y una desviacin estndar de 10 pies. Con base en esta
evidencia, existe alguna razn para creer que la distancia de frenado
para ambas marcas, es la misma? Supngase que las distancias de frenado son variables aleatorias independientes normalmente distribuidas
con varianzas iguales.
24. La variacin en el nmero de unidades diarias de cierto producto, el
cual manejan dos operadores A y B, debe ser la misma. Con base en
muestras de tamao nA = 16 das y nB = 21 das, el valor calculado de
las desviaciones estndar muestrales es de SA = 8 2 unidades y SB = 5 8
unidades. Si el nmero de stas, manejadas por los dos operadores,
por da, son dos variables aleatorias independientes que se encuentran
aproximadas, en forma adecuada, por distribuciones normales, existe
alguna razn para creer que las varianzas son iguales?
25. Un supervisor de una planta se interesa en presuponer los costos semanales de reparacin para un determinado tipo de mquina. Estos costos
de reparacin, se han determinado que siguen una distribucin exponencial negativa con = 20 unidades monetarias para cada mquina
108
que se estudi. Sean X1 , . . . , X5 los costos de reparacin de cinco de

ests mquinas para una semana dada. Determinar un nmero C tal
que
!
5
X
P
Xi > C = 0 05
i=1
si se supone que las mquinas trabajan en forma independientes.

26. Supongamos que el tiempo de vida de un caucho por kilometraje de
utilizacin, es una variable aleatoria con distribucin normal con media
0 = 30 000 Km. y desviacin estndar de 5000 Km. El fabricante
afirma que un nuevo proceso de fabricacin de los cauchos incrementa
el tiempo de vida del caucho y para probarlo debe tomar una muestra
tamao n que desea determinar. Si la probabilidad de que la media de
una muestra de tamao n sea mayor que un valor dado C es 0 01 se
rechazar la afirmacin de que la media es 30 000 Km. Para asegurarse
de tomar la decisin correcta, el fabricante quiere que la probabilidad
de que la media de la muestra sea menor o igual que C sea 0 02 cuando
el tiempo de vida promedio realmente sea 1 = 35 000 Km. Calcular el
tamao de la muestra y el valor de C para que los requerimientos de
probabilidad del fabricante se cumplan.
27. Sea X la media de una muestra aleatoria de tamao n, seleccionada
con reemplazo, de la poblacin discreta
x
P (X = x)
2
1/3
3
1/3
7
1/3
y si Y es la media de una muestra aleatoria de tamao m, seleccionada

con reemplazo, de la poblacin discreta
y
P (Y = y)
1
2/3
3
1/3
Si se sacan con reemplazo muestras independientes de tamao n = 125

y m = 100, Cul es la probabilidad de que X Y sea mayor que 1 84
pero menor que 2 63?
28. Sean X1 , X2 , . . . , X5 una muestra aleatoria de una distribucin normal
estndar y X la media muestral de dicha muestra. Sea X6 otra observacin independiente de la misma poblacin. Se pide:
FaCyT-Matemticas
109
P
a. Cul es la distribucin de W = 5i=1 Xi2 ? Por qu?
2
P
b. Cul es la distribucin de U = 5i=1 Xi X ? Por qu?
2
P
c. Cul es la distribucin de 5i=1 Xi X + X62 ? Por qu?
d. Cul es la distribucin de 5X6 / W ? Por qu?
e. Cul es la distribucin de 2X6 / U ? Por qu?

29. Se tienen 3 poblaciones X, Y, W normalmente distribuidas e independientes con medias 20, 40, y 80 y varianzas 16, 45, y 64 respectivamente.
Si se extraen sendas muestras aleatorias de tamao 30, 45, y 50 respectivamente. Determine el valor de k en cada caso:
a.
P
18
30
X
Xj X
2
j=1
b.
20
X
(Yj Y ) > k
j=1
<k
50
X
!
(Wj W )2
= 0 01
j=1
45
X
!1/2
(Yj Y )2
= 0 95
j=1
30. Sea Y una variable aleatoria con distribucin Gamma con parmetro
de forma = 7 5 y escala = 2 y W una variable aleatoria con
distribucin Gamma con parmetro de forma = 7/2 y escala = 5/8.
Calcule

7Y
0 9109
P
16W
2.8.
2.8.1.
Complemento
Momentos y funcin generadora de momentos de
una variable aleatoria
Momentos estadsticos de una variable aleatoria

Los momentos estadsticos de una variable aleatoria X es el valor esperado
de una potencia de la variable aleatoria X o de una funcin de dicha variable.
Estos forman una coleccin de medidas descriptivas que pueden emplearse
Sec 2.8. Complemento
110
para caracterizar la distribucin de probabilidad de X. Aunque puede hablarse de momento estadstico respecto a cualquier punto, existen dos momentos
con significado especial, que son los ms utilizados en probabilidades y estadsticas:
1. El momento alrededor del cero de la variable aleatoria, y
2. El momento alrededor de la media de la variable aleatoria
Todas las proposiciones siguientes con respecto a los momentos se encuentran
sujetas a la existencia de las sumas o integrales.
Definicin 2.12. Sea X una variable aleatoria. El k-simo momento

de X alrededor del cero se define por:
X k
0k = E X k =
x pX (x),
si X es discreta, o

0k = E X k =
Zx
xk fX (x),
si X es continua
Definicin 2.13. Sea X una variable aleatoria. El momento central

de X o el k-simo momento de X alrededor de la media de X se define
por:
h
i X
k = E (X )k =
(x )k pX (x),
si X es discreta, o
x
h
i Z
k
k = E (X ) =
(x )k fX (x),
si X es continua
En la siguiente tabla se muestran los momentos de orden k ms importantes

que contienen informacin acerca de la distribucin de probabilidad de X
FaCyT-Matemticas
111
k
0k
0
1
2
3
4
00
01
02
03
04
k
= E [X 0 ] = 1
= E [X 1 ] = X
= E [X 2 ]
= E [X 3 ]
= E [X 4 ]
0
1
2
3
4

= E (X
= E (X
= E (X
= E (X
= E (X

)0 = 1
)1 = E [X] X = 0
2
)2 = X
)3
)4
Relaciones y equivalencias entre algunos momentos

1. El segundo momento alrededor de la media de X
El segundo momento alrededor de la media es la varianza de la variable aleatoria X y se puede expresar en funcin de los dos primeros
momentos alrededor del origen.

2 = E (X )2 = E X 2 2X + 2

= E X 2 2E [X] + E 2

= E X 2 2 + 2 = E X 2 2
= 02 2
(2.29)
2
= X
La raiz cuadrada positiva de la varianza recibe el nombre de desviacin
estndar y se denota por X .
2. El tercer momento alrededor de la media de X
El tercer momento alrededor de la media de X esta relacionado con
la asimetra de la distribucin de probabilidad de X. Al igual que la
varianza, el tercer momento alrededor de la media se puede expresar en
trminos de los tres primeros momentos alrededor del origen; de hecho,
cualquier momento alrededor de la media puede expresarte en trminos
de los momentos alrededor del origen.

3 = E (X )3 = E X 3 3X 2 + 3X2 3

= E X 3 3E X 2 + 3E [X] 2 E 3

= E X 3 3E X 2 + 32 3

= E X 3 3E X 2 + 23
= 03 302 + 23
(2.30)
112
3. El cuarto momento alrededor de la media de X

El cuarto momento alrededor de la media de X esta relacionado con la
curtosis de la distribucin de probabilidad de X.

4 = E (X )4 = E X 4 4X 3 + 6X 2 2 4X3 + 4

= E X 4 4E X 3 + 62 E X 2 43 E [X] + E 4

= E X 4 4E X 3 + 62 E X 2 43 + 4

= E X 4 4E X 3 + 62 E X 2 34
= 04 403 + 62 02 34
(2.31)
Aplicaciones de los momentos
1. Coeficiente de asimetra
Mide el grado de asimetra de la distribucin de probabilidad de X.
Definicin 2.14. El coeficiente de asimetra (CA) se obtiene a
partir del segundo y tercer momento alrededor de la media:
CA =
(2.32)
(2 ) 2
Si la distribucin de probabilidad es simtrica el CA es 0; en caso

contrario, se puede concluir a partir de la siguiente relacin:
( > 0 Asimtrica positiva
CA
= 0 Simtrica
< 0 Asimtrica negativa
En la siguiente Figura se presentan las grficas tpicas de distribuciones

asimtrica positiva, simtrica y asimtrica negativa.
Figura 2.4: a) asimtrica positiva, b) simtrica, c) asimtrica negativa

FaCyT-Matemticas
113
2. Coeficiente de Curtosis
Mide el grado de que tan puntiaguda es la distribucin de probabilidad
de la variable aleatoria X.
Definicin 2.15. El coeficiente de curtosis (CC) se obtiene a

partir del segundo y cuarto momento alrededor de la media:
CC =
4
(2 )2
(2.33)
Si la distribucin de probabilidad de X es mesocrtica (apuntamiento

moderado), su coeficiente de curtosis es 3; en caso contrario, se puede
concluir a partir de la siguiente relacin:
( > 3 Curva leptocrtica
CC
= 3 Curva mesocrtica
< 3 Curva platicrtica
En la siguiente Figura se presentan las grficas tpicas de distribuciones

leptocrtica, mesocrtica y platicrtica.
Figura 2.5: a) leptocrtica, b) mesocrtica, c) platicrtica

Ejemplo 2.19. Considrese la siguiente distribucin de una variable aleatoria X
x
P (X = x)
10
0 3
11
0 2
12
0 1
13
0 15
14
0 1
15
0 05
16
0
17
0 05
18
0 05
19
0
114
Calcular la media, varianza y los factores de forma.

Solucin:
Con base en la definicin (2.12), los primeros cuatro momentos de X alrededor del cero son:
01 =
19
X
xP (X = x) = (10)(0 3) + (11)(0 2) + + (18)(0 05) + (19)(0) = 12 25
x=10
02 =
19
X
x2 P (X = x) = (10)2 (0 3) + (11)2 (0 2) + + (18)2 (0 05) + (19)2 (0) = 155 45
x=10
03 =
19
X
x3 P (X = x) = (10)3 (0 3) + (11)3 (0 2) + + (18)3 (0 05) + (19)3 (0) = 2048 95
x=10
04 =
19
X
x4 P (X = x) = (10)4 (0 3) + (11)4 (0 2) + + (18)4 (0 05) + (19)4 (0) = 28083 65
x=10
La media de la variable aleatoria X es:

E [X] = 12 25
Usando la expresin (2.29), la varianza de X es:
V [X] = 155 45 (12 25)2 = 5 3875
por la expresin (2.30), el tercer momento central es:
3 = 2048 95 3(12 25)(155 45) + 2(12 25)3 = 12 6937
y por la expresin (2.31), el cuarto momento es:
4 = 28083 65 4(12 25)(2048 95) + 6(12 25)2 (155 45) 3(12 25)4 = 92 1320
Entonces, los dos factores de forma de la distribucin de probabilidad de X se
obtienen empleando las expresiones (2.32) y (2.33), respectivamente, y son
CA =
12 6937
3
(5 3875) 2
= 1 015
y
92 1320
= 3 1742
(5 3875)2
La distribucin de probabilidad de X es asimtrica positiva y leptocrtica.
CC =
FaCyT-Matemticas
115

Ejemplo 2.20. Sea X una variable aleatoria con funcin de densidad de
probabilidad
(
x
x
exp
2 , x > 0
fX (x) = 4
0,
otro caso
Analice su asimtria y su curtosis mediante los coeficientes respectivos.
Solucin:
Los primeros cuatro momentos de X alrededor del cero son:
Z
0
xfX (x)dx
1 = E [X] =
0
Z
n xo
1 2
x exp
=
4 0
2
=4
02
03
04
=E X =
xfX (x)dx
0
Z
n xo
1
x3 exp
=
4 0
2
= 24
Z
=E X =
xfX (x)dx
0
Z
n xo
1 4
x exp
=
4 0
2
= 192
Z
=E X =
xfX (x)dx
0
Z
n xo
1 5
=
x exp
4 0
2
= 1920
116
Entonces:
E [X] = 4
V [X] = 24 42 = 8
y
3 = 03 302 + 23 = 192 3(4)(24) + 2(4)3 = 32
4 = 04 403 + 62 02 34 = 1920 4(4)(192) + 6(4)2 (24) 3(4)4 = 348
Los coeficientes de asimtria y curtosis de la distribucin de X son:
CA =
=
3
3
(2 ) 2
32
3
82
= 2>0
Como el coeficiente de asimtria CA es mayor a cero, nos permite concluir

que la distribucin de probabilidad dada es asimtrica positiva. Por otra parte,
4
(2 )2
348
= 2
8
= 6 6 > 3
CC =
El valor de CC nos indica que la distribucin de probabilidad dada es de

apuntamiento pronunciado o leptocrtica.

2.8.2.
Funcin generadora de momentos de una variable

aleatoria
Hasta ahora se ha calculado los momentos de una variable aleatoria a partir

de la definicin (2.12), pero existe un procedimiento alternativo que con
frecuencia es til y que hace uso de una funcin matemtica.
FaCyT-Matemticas
117
Definicin 2.16. La funcin generadora de momentos (FGM) de la

variable aleatoria X es el valor esperado de exp{tX} y se denota por
MX (t). Esto es,
P
exp{tx}fX (x), caso discreto
MX (t) = E [exp{tX}] = Rx
exp{tx}fX (x), caso continuo
donde t es una variable real tal que h < t < h, h > 0.
La funcin generadora de momentos MX (t) existe slo si la suma o integral en

la definicin anterior converge. Si la MX (t) existe, entonces puede emplearse
para obtener todos los momentos alrededor del cero de la variable aleatoria.
Teorema 2.16. Sea X una variable aleatoria con funcin generadora

de momentos MX (t). Entonces,
0r =
r MX (t)

tr
t=0
Demostracin. Usando la serie de taylor para exp{tX}, se tiene que:

(tX)2 (tX)3
exp{tX} = 1 + tX +
+
+
2!
3!
por lo tanto,
MX (t) = E [exp{tX}]

(tX)2 (tX)3
= E 1 + tX +
+
+
2!
3!
t2 t3
= 1 + tE [X] + E X 2 + E X 3 +
2!
3!
2
3
t
t
= 1 + t01 + 02 + 03 +
2!
3!
118
De aqu se desprende que

r MX (t)
=

tr
t=0
0r
Ejemplo 2.21. Dado que X tiene la funcin de probabilidad

0
1/8
x
P (X = x)
1
3/8
2
3/8
3
1/8
Determine la funcin generadora de momentos de esta variable aleatoria y

utilicela para determinar el E [X] y V [X].
Solucin:
Por definicin
MX (t) = E [exp{tX}] =
exp{tx}fX (x)
3
1
1 3
= + exp{t} + exp{2t} + exp{3t}
8 8
8
8
1
= [1 + 3 exp{t} + 3 exp{2t} + exp{3t}]
8
1
= (1 + exp{t})3
8
por lo tanto,
MX (t) =
1
(1 + exp{t})3
8
Usando el Teorema (2.16), se tiene

MX (t)
3

2
E [X] =
= (1 + exp{t}) exp{t}

t
8
t=0
=
t=0
3
2
y

2 2 MX (t)
E X =

t2
t=0

6
3

=
(1 + exp{t})2 exp{2t} + (1 + exp{t})2 exp{t}

8
8
t=0
=3
FaCyT-Matemticas
119
de esta manera,
E [X] =
3
2
y

V [X] = E X 2 (E [X])2
2
3
9
=3
=3
2
4
3
=
4

Ejemplo 2.22. Sea X una variable aleatoria exponencial con funcin de
densidad de probabilidad
n o
(
1
exp x , x > 0
fX (x) =
0,
otro caso
Halle la funcin generadora de momentos, la esperanza y la varianza de X.
Solucin:
Por definicin
Z
exp{tx}fX (x)dx

1
x
=
exp{tx} exp
0

Z b
1
x
= lm
exp + tx
b 0

Z b
1
1
= lm
exp x
t
dx
b 0

(1 t)
=
lm exp x
dx
(1 t) b
= (1 t)1 , t < 1/
MX (t) = E [exp{tX}] =
por lo tanto
MX (t) = (1 t)1 , t <
120
a partir de MX (t), se tiene que:

E [X] =

MX (t)

= (1 t)2
t
t=0
t=0
=
y

2 2 MX (t)
2
3
E X =
= 2 (1 t)
t2
t=0
t=0
= 2 2
dando como resultado que:

V [X] = E X 2 (E [X])2
= 2 2 2
= 2

Propiedades de la funcin generadora de momentos de una variable
aleatoria
La funcin generadora de momentos no siempre existe, pero cuando lo hace identifica de manera completa y unvoca la distribucin de la variable
aleatoria respectiva, por lo que:
Teorema 2.17. Si X y Y son dos variables aleatorias con funcin generadora de momentos MX (t) y MY (t), respectivamente, y
MX (t) = MY (t), entonces X y Y siguen la misma distribucin de
probabilidad.
Teorema 2.18. Si X es una variable aleatoria y a es una constante,

entonces
MX+a (t) = exp {at} MX (t)
FaCyT-Matemticas
121
Demostracin.
MX+a (t) = E [exp{t (X + a)}]

= E [exp{tX + at}]
= E [exp{tX} exp{at}]
= exp{at}E [exp{tX}]
= exp {at} MX (t)
Teorema 2.19. Si X es una variable aleatoria y a es una constante,

entonces
MaX (t) = MX (at)
Demostracin.
MaX (t) = E [exp{t (aX)}]
= E [exp{(ta) X}]
= MX (at)
Teorema
2.20. Si X1 , X2 , . . . , Xn son variables aleatorias independientes con funciones generadoras de momentos
MX1 (t) , MX2 (t) , . . . , MXn (t), respectivamente, y si
Y = a1 X1 + a2 X2 + + an Xn
entones la funcin generadora de momento de Y es:
MY (t) = MX1 (a1 t) Ma2 X2 (t) Man Xn (t)
122
Demostracin.
MY (t) = E [exp{t (a1 X1 + a2 X2 + + an Xn )}]
= E [exp{ta1 X1 + ta2 X2 + + tan Xn }]
= E [exp{ta1 X1 } exp{ta2 X2 } exp{tan Xn }]
= E [exp{ta1 X1 }] E [exp{ta2 X2 }] E [exp{tan Xn }]
= MX1 (a1 t) Ma2 X2 (t) Man Xn (t)
Ejemplo 2.23. Considrese el ejemplo (2.22). Encuentre la funcin generadora de momentos de cada una de las siguientes variablea aleatorias
a) V = 5X
b) W = X + 5
c) Y = X1 +X2 + +Xn , donde X1 , X2 , . . . , Xn es una muestra aleatoria
tomada de esa poblacin.
Solucin:
Solucin a)
Como la funcin generadora de momentos de X es:
MX (t) = (1 t)1 , t <
Entonces, por el Teorema (2.19), la funcin generadora de momentos de V

es:
MV (t) = MX (5t)
= (1 5t)1 , t <
1
5
Solucin b)
por el Teorema (2.18), la funcin generadora de momentos de W es:
MW (t) = exp {5t} MX (t)
= exp {5t} (1 t)1 , t <
FaCyT-Matemticas
123
Solucin c)
Como X1 , X2 , . . . , Xn es una muestra aleatoria tomada de esa poblacin y
por el Teorema (2.17), la funcin generadora de momentos de cada Xi , (i =
1, 2, . . . , n), es:
MXi (t) = (1 t)1 , t < 1/
(i = 1, 2, . . . , n)
Por el Teorema (2.20), la funcin generadora de momentos de Y es:

MY (t) = MX1 (a1 t) Ma2 X2 (t) Man Xn (t)
= (1 t)1 (1 t)1 (1 t)1
= (1 t)n
de esta manera,
MY (t) = (1 t)n , t <
Teorema 2.21. Sea X una variable aleatoria con funcin (densidad)

de probabilidad f (x) y g(X) una funcin de X. Entones la funcin
generadora de momentos para g(X) es:
Z
Mg(X) (t) = E [exp{tg(X)}] =
exp{tg(x)}f (x)dx
2.8.3.
1. Una variable aleatoria continua X tiene la distribucin de probabilidad

siguiente:
(
4xe2x , x > 0
f (x) =
0 en otro caso
a. Encuentre la funcin generadora de momentos de X.
b. Encuentre la media y la varianza de X.
c. Calcule el coeficiente de asimtria y curtosis. Que concluye?
124
2. Sean X1 , X2 , . . . , Xn variables aleatorias independientes exponenciales

con parmetro .
a. Encuentre la funcin generadora de momentos de Y = X1 + X2 +
+ Xn .
b. Cul es la distribucin de la variable aleatoria Y ?
3. Sea X una variable aleatoria cuya funcin de densidad de probabilidad
es

x 2
1
exp
,
< x <
f (x) =
4(1/2)
4
a. Encuentre la funcin generadora de momentos de
Y = X2
b. Halle, a partir de la funcin generadora de momentos, E [Y ] y
V [Y ].
c. Encuentre la funcin generadora de momentos de
U=
Y
8
d. Halle, a partir de la funcin generadora de momentos, E [U ] y

V [U ].
4. Sea Y una variable aleatoria de una distribucin con funcin de densidad de probabilidad
n 2o
(
y
y
2
, si y > 0.
2 exp
2
2
f (y; ) =
0
otro caso,
a. Encuentre la funcin generadora de momentos de
g(Y ) = Y 2
b. Calcule a partir de la FGM E [g(Y )], V [g(Y )], CA y CC.
5. Sea X una variable aleatoria cuya funcin de densidad viene dada por
f (x) = exp{(x )2 },
< x < ; < <

FaCyT-Matemticas
125
a. Encuentre la funcin generadora de momentos de X.

b. Encuentre la media y la varianza de X.
c. Calcule el coeficiente de asimtria y curtosis. Que concluye?
6. Dada W = 3X + 5, donde X se distribuye as:
f (x) = exp{x};
x>0
Halle la funcin generadora de momentos, la media y la varianza de W.

7. Sean X y Y variables aleatorias estadisticamente independientes, con
MX (t) =
1
1
,t <
2
(1 3t)
3
MY (t) =
1
1
,t <
5
(1 2t)
2
sean U = 2X 3, V = 3Y + 5 y Z = U + V . Halle MZ (t).

8. Sea Z una variable aleatoria normalmente distribuida con media 0 y
varianza 1. Determinar la distribucin de Z 2 .
9. Suponga que X1 y X2 son variables aleatorias normales estndar e
independiente. Encuentre la funcin generadora de momentos de U =
X12 + X22 .
10. Suponga que X tiene una distribucin gamma con parmetro y . Use
el mtodo de las funciones generadoras de momentos para demostrar
que W = 2X/ tiene una distribucin 2 con 2 grados de libertad.
11. Sean X1 , X2 , . . . , Xn variables aleatorias independientes tales que cada
Xi tiene una distribucin gamma con parmetros i y . Esto es, las
distribuciones de las X podran tener diferentes , pero todas tienen
el mismo valor para . Demuestre que U = X1 + X2 + + Xn tiene
una distribucin gamma con parmetros 1 + 2 + + n y .
12. Sean X1 , X2 , . . . , Xn n variables aleatorias independientes de Poisson
con parmetros 1 , 2 , . . . , n , respectivamente. Mediante el empleo de
la funcin generadora de momentos, demostrar que la suma de estas
variables tambin es una variable aleatoria de Poisson con parmetros
1 + 2 + + n .
126
13. Sean X1 y X2 dos variables aleatorias independientes binomial con

parmetros n1 y p, y n2 y p, respectivamente. Demostrar que la suma
de X1 y X2 es una variable aleatoria binomial con parmetros n1 + n2
y p.
14. Sean X1 y X2 dos variables aleatorias independientes distribuidas exponencialmente con el mismo parmetro . Demostrar que la suma de
X1 y X2 es una variable aleatoria gamma con parmetro de forma 2 y
parmetro de escala .
FaCyT-Matemticas
Captulo 3
Estimacin puntual
3.1.
Introduccin
La inferencia estadstica est relacionada con los mtodos y procedimientos

para obtener conclusiones o generalizaciones acerca de una poblacin. Estas
conclusiones sobre la poblacin pueden estar relacionadas con la forma funcional de la distribucin de la poblacin o con los valores de uno o varios
parmetros de la misma.
El estudio de la inferencia estadstica se divide en dos grandes campos: por un
lado se tiene el problema de estimacin de los parmetros de la distribucin
de la poblacin, y por el otro, las pruebas de hiptesis. A su vez el problema
de la estimacin se puede dividir en dos reas: la estimacin puntual y la
estimacin por intervalos de confianza.
En forma similar, en el campo de las pruebas de hiptesis se pueden considerar dos reas: pruebas de hiptesis sobre los parmetros de la distribucin
de la poblacin y pruebas de bondad de ajuste
puntual
Estimacin intervalos de confianza

(
Inferencia Estadstica
sobre parmetros
Prueba de hiptesis bondad de ajuste

En este captulo se tratar el problema de estimacin del o los parmetros
desconocidos de una distribucin de probabilidad, y en los captulos siguientes
se estudiar el campo de pruebas de hiptesis.
127
3.1.1.
128
Estimacin puntual
Definicin 3.1 (ESTIMADOR PUNTUAL). Si X es una variable aleatoria con funcin de densidad de probabilidad f (x; ), caracterizada por el parmetro desconocido y si X1 , X2 , . . . , Xn es
una muestra aleatoria de tamao n de X, entonces la estadstica
= g(X1 , X2 , . . . , Xn ) correspondiente a se llama estimador puntual de o funcin de decisin.
Se suele denominar estimador de a la estadstica de los valores de la muestra aleatoria X1 , X2 , . . . , Xn y se habla de estimacin de al valor que toma
dicha estadstica cuando se obtienen las realizaciones de las n variables aleatorias que constituyen la muestra aleatoria.
Ejemplo 3.1. Estimador de un parmetro desconocido
1. Cuando se usa la media muestral X para estimar la media de una
poblacin.
2. Cuando se usa la proporcin muestral P para estimar el parmetro de
una distribucin binomial p.

Ejemplo 3.2. Estimacin de un parmetro desconocido
Considrese el ejemplo (3.1), item (1), supngase que
x1 = 3 42, x2 = 3 61, x3 = 2 91, x4 = 5 10, x5 = 5 99,
x6 = 4 44, x7 = 3 59, x8 = 5 55, x9 = 6 82, x10 = 6 37
son las realizaciones de 10 variables aleatorias que constituyen una muestra aleatoria de una poblacin con media desconocida. Si se usa X como
estimador del parmetro desconocido , entonces una estimacin para es:
10
P
x=
xi
i=1
10
47 8
= 4 78
10
FaCyT-Matemticas
Cap 3. Estimacin puntual
129

Como los estimadores son variables aleatorias, uno de los principales problemas de la estimacin puntual es estudiar sus distribuciones muestrales.
Por ejemplo, cuando se calcula la varianza muestral corregida sobre la base de una muestra aleatoria, difcilmente se puede esperar de que el valor
de s2 que se obtiene sea realmente igual a la varianza de la poblacin 2 ,
pero ayudara saber si se puede esperar de que el valor de s2 sea en forma
aproximado igual a la varianza de la poblacin. Asimismo, si se debe decidir
si se utiliza la mediana Med o la media muestral x de una muestra aleatoria para determinar el valor de la media de una poblacin, sera importante
saber, entre otros datos, si x o Med tiene mayor probabilidad de producir
un valor que sea realmente aproximado al valor de la media de una poblacin.
Bsicamente el problema de estimacin puntual es: encontrar una estadstica = g(X1 , X2 , . . . , Xn ) que proporcione la mejor estimacin de . Sin
embargo, no existe una regla nica que permite construir estos estimadores.
Por ejemplo, la media y la mediana de una distribucin simtrica son iguales,
pero la media muestral y la mediana muestral (cuyos valores no son iguales
en general) son ambas estimaciones posibles para la media poblacional. En
este caso, cul es el mejor estimador para la media poblacional?
Para elegir entre varios estimadores de un mismo parmetro hay que definir
criterios de comparacin. Se empezar por presentar dos mtodos clsicos
para la obtencin de estimadores: el mtodo por mxima verosimilitud y el
mtodo de los momentos, y a continuacin algunas propiedades deseables
para decidir si un estimador es bueno.
3.2.
3.2.1.
Mtodos para construir estimadores

Mtodo por mxima verosimilitud
Se sabe que la funcin de verosimilitud de una muestra de n variables aleatorias X1 , X2 , . . . , Xn independientes e idnticamente distribuidas se define
como la funcin de densidad conjunta de dichas variables. Si se denota por
L (x1 , x2 , . . . , xn ; ) la verosimilitud de la muestra como funcin de , donde
= (1 , 2 , . . . , p ) es el vector de parmetros desconocidos de la distribucin
Sec 3.2. Mtodos para construir estimadores
130
de la poblacin, entonces se tiene que:

L (x1 , x2 , . . . , xn ; ) = f (x1 , x2 , . . . , xn ; )
= f1 (x1 ; ) f2 (x2 ; ) fn (xn ; )
n
Y
=
fi (xi ; )
i=1
Luego el estimador de mxima verosimilitud (EMV) de , es aquel vector

b que maximiza la funcin de verosimilitud. Por lo tanto para encontrar
estos estimadores se debe derivar la funcin de verosimilitud con respecto a

cada uno de los parmetros a estimar, igualar a cero y despejar el respectivo
parmetro, es decir:
L (x1 , x2 , . . . , xn ; )
= 0 j = 1, 2, . . . , p
i
(3.1)
Como generalmente la funcin de verosimilitud es compleja, y debido a la

naturaleza de est, se escoge por lo comn, mximizar el logarimo neperiano
de la funcin de verosimilitud, y esto se debe a la relacin biunvoca existente
entre una funcin y su logaritmo. Entonces maximizar L (x1 , x2 , . . . , xn ; ) es
equivalente a maximizar Ln (L (x1 , x2 , . . . , xn ; )). Por lo tanto, la ecuacin
(3.1) queda de la siguiente forma:
Ln (L (x1 , x2 , . . . , xn ; ))
= 0 j = 1, 2, . . . , p
i
Ejemplo 3.3. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una variable
aleatoria X de Bernoulli. Obtener el estimador de mxima verosimilitud del
parmetro p.
Solucin:
Como X se distribuye Bernoulli, la funcin de probabilidad es:
(
px (1 p)1x
f (x; p) =
0
x = 0, 1
donde p es el parmetro por estimar. La funcin de verosimilitud de la muesFaCyT-Matemticas
131
tra aleatoria de tamao n es:
L (x1 , x2 , . . . , xn ; p) = f (x1 ; p) f (x2 ; p) f (xn ; p)

= px1 (1 p)1x1 px2 (1 p)1x2 pxn (1 p)1xn
n
Y
=
pxi (1 p)1xi
i=1
n
P
=p
xi
i=1
(1 p)
n
P
xi
i=1
El logaritmo neperiano de la funcin de verosimilitud es:

!
!
n
n
X
X
Ln (L (x1 , x2 , . . . , xn ; p)) =
xi Ln(p) + n
xi Ln(1 p)
i=1
i=1
Derivando la funcin de verosimilitud con respecto a p, se tiene:

n
n
P
P
xi n
xi
Ln (L (x1 , x2 , . . . , xn ; p))
i=1
i=1
=
p
p
1p
Al igualar a cero la expresin anterior
n
n
P
P
xi n
xi
i=1
i=1
=0
pb
1 pb
n
P
y resolvindola para pb, se tiene que pb = (1/n) xi . Para probar que pb es el
i=1
valor que maximiza el logaritmo neperiano de la funcin de verosimilitud se

debe calcular la segunda derivada con respecto a p y evaluarla en pb:
n
n
P
P
x
+
2p
xi np2
i
2 Ln (L (x1 , x2 , . . . , xn ; p))
i=1
= i=1
p2
[p(1 p)]2
y

2 Ln (L (x1 , x2 , . . . , xn ; p))

p2
n
P
p= i=1n
xi
n2
=
n
P
i=1
xi 1
n
P
xi
i=1

como (1/n)
(1/n)
n
P
n
P
i=1
132
xi < 1, la segunda derivada es negativa, por lo tanto pb =
xi es el valor que maximiza el Ln (L (x1 , x2 , . . . , xn ; p)). En conse-
i=1
cuencia, el estimador de mxima verosimilitud de p es:

n
P
PbM V =
Xi
i=1
Para un ejemplo especifico, si se observan 20 xitos en 25 ensayos de Bernoulli, la estimacin de mxima verosimilitud de p es 10/25 = 0 8.

normal con una funcin de densidad de probabilidad
f x; ,

(x )2
< x, <
exp
,
=
2
>0
2
2 2
1
Determine los estimadores de y 2 usando el mtodo de mxima verosimilitud.

Solucin:
Ya que y 2 son los parmetros desconocidos de esta distribucin, entonces
el vector de parmetros desconocidos es = (1 , 2 ) = (, 2 ). La funcin de
verosimilitud est dada por:

L x1 , x2 , . . . , xn ; , 2 = f x1 ; , 2 f x2 ; , 2 f xn ; , 2

(x1 )2
1
(xn )2
1
exp
exp
=
2 2
2 2
2 2
2 2
(
)
n
1
1 X
2
=
exp
(xi )
n/2
n/2
2
2
2 i=1
(2) ( )
Luego, el logaritmo neperiano de la funcin de verosimilitud viene dado por:

Ln L x1 , x2 , . . . , xn ; , 2
n

1 X
n
n
(xi )2
= Ln (2) Ln 2 2
2
2
2 i=1
FaCyT-Matemticas
133
Derivando con respecto a y con respecto a 2 , se tiene que:

n
Ln (L (x1 , x2 , . . . , xn ; , 2 ))
1 X
= 2
(xi )
i=1
n
n
1 X
Ln (L (x1 , x2 , . . . , xn ; , 2 ))
=
+
(xi )2
2
2 2 2 ( 2 )2 i=1
Igualando a cero ambas ecuaciones:

n
1 X
(xi
b) = 0
b2
(3.2)
n
X
n
1
+ 2
(xi
b)2 = 0
2
b
2
2 b2 i=1
(3.3)
i=1
De la ecuacin (3.2) se despeja el estimador del parmetro

n
n
X
1 X
(xi
b) = 0
(xi
b) = 0
b2
i=1
i=1
n
X
xi nb
=0
i=1
n
P
b=
xi
i=1
b=x
Luego sustituyendo el valor de
b en la ecuacin (3.3) y despejando el esti2
mador de , se tiene que:
n
P
(xi x)2
n
X
i=1
2
b
= 0 n +
(xi x)2 = 0
2
i=1
2 b2
nb2 +
n
P
b2 =
(xi x)2
i=1
134
Por tanto, los estimadores de mxima verosimilitud de y 2 , son:
bM V = X
y
n
P
b2 M V =
Xi X
2
i=1
respectivamente.

En el ejemplo anterior no se verific que los valores de
bM V y b2 M V son los
que realmente maximizan la funcin de verosimilitud, es decir, que son los
estimadores de mxima verosimilitud de y 2 , respectivamente. Esto se
debe a la siguiente observacin:
Observacin 3.1. Dado que una funcin de verosimilitud es el producto,
ya sea de probabilidades o de densidades, stas generalmente se encuentran
acotadas y son continuas en los parmetros. En consecuencia, el resultado es
que la solucin de la primera derivada proporcionar el valor para el cul la
funcin de verosimilitud es mxima.
Ejemplo 3.5. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una variable
aleatoria distribuida uniformemente en el intervalo (0, ), con desconocido.
Utilice el mtodo de mxima verosimilitud para estimar el valor del parmetro a partir de la muestra aleatoria.
Solucin:
Como X U (0, ), entonces la funcin de densidad de esta variable aleatoria
est dada por:
(
1
si 0 x
f (x) =
0 en cualquier otro caso
Por lo tanto, la funcin de verosimilitud de la muestra aleatoria de tamao
n, viene dada por:
L (x1 , x2 , . . . , xn ; ) = f (x1 ; ) f (x2 ; ) f (xn ; )
(
1
si 0 xi i = 1, 2, . . . , n
n
=
FaCyT-Matemticas
135
Luego el logaritmo de la funcin de verosimilitud es:

Ln (L (x1 , x2 , . . . , xn ; )) = nLn ()
Derivando con respecto al parmetro e igualando a cero, se tiene que:
n
Ln (L (x1 , x2 , . . . , xn ; ))
= =0
b
No se puede encontrar de manera directa el valor de que maximiza la funcin de verosimilitud L (x1 , x2 , . . . , xn ; ) = 1n . Debido a que la funcin de
verosimilitud es una funcin montona decreciente, esto implica que el mximo de la funcin de verosimilitud se presenta en el extremo izquierdo del
intervalo (0, ) y como 0 xi , para todo i = 1, 2, . . . , n, entonces el
estimador de mxima verosimilitud de es bM V = M ax (X1 , X2 , . . . , Xn ).

Una propiedad til de los estimadores de mxima verosimilitud es la de
invarianza que se anuncia en el siguiente Teorema.
Teorema 3.1. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin
con funcin (densidad) de probabilidad f (x; ). Si b es el estimador de mb
xima verosimilitud de , y si g() es una funcin uno a uno, entonces g()
es el estimador mxima verosimilitud de la imagen de bajo la funcin g.
Este principio de invarianza de los estimadores mxima verosimilitud se puede enunciar de manera ms general de la siguiente forma:
Teorema 3.2. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin
con funcin
(densidad) de probabilidad f (x; ), donde = (1 , 2 , . . . , p ).
b = b1 , b2 , . . . , bp es el estimador mxima verosimilitud de , y si
Si
g() = (g1 (), g2 (), . . . , gl ()), 1 l k, entonces el estimador de mxima
verosimilitud de la imagen de bajo g es

b g2 (),
b . . . , gl ()
b
g1 (),
normal con media y varianza 2 (ambos desconocidos). Determine los estimadores de mxima verosimilitud de 3, 2 y 1/.
136
Solucin:
Del ejemplo (3.4), dado que, el estimador de mxima verosimilitud de es:
bM V = X
entonces, por la propiedad de invarianza de los estimadores de mxima verosimilitud, se tiene que el estimador de mxima verosimilitud de 3, 2 y 1/
son:
c M V = 3X
3
2
b2 M V = X
d
1/
= 1/X
MV
respectivamente.

3.2.2.
Mtodo de los Momentos
Histricamente uno de los mtodos de estimacin ms antiguos; consiste en

igualar un determinado nmero de momentos apropiados de la distribucin
de la poblacin con los correspondientes momentos muestrales, con lo cul
se obtienen tantas ecuaciones, segn se necesiten, para resolver y obtener los
estimadores de los parmetros desconocidos de la poblacin.
Definicin 3.2. El k-simo momento alrededor del cero de una muestra aleatoria X1 , X2 , . . . , Xn de tamao n de una distribucin con funcin (densidad) de probabilidad f (x; ), es la media de sus k-simas
potencias y se denota por medio de Mk ; en forma simblica, se tiene
que:
n
1X k
Mk =
X
n i=1 i
Sea X1 , X2 , . . . , Xn una muestra aleatoria con funcin de densidad f (x; ),
donde = (1 , 2 , . . . , p ) es el vector de parmetros (desconocidos), entonces
FaCyT-Matemticas
137
los estimadores de 1 , 2 , . . . , p bajo el mtodo de los momentos, se encuentran resolviendo simultneamente, las ecuaciones que resultan de igualar los
momentos tericos apropiados con los momentos muestrales o empricos.
n
P
M1 =
i=1
M2 =
i=1
Xi
n
n
P
Xi2
n
= E [X]

= E X2
..
.
..
.
n
P
Mp =
Xip
i=1
= E [X p ]

normal con media y varianza 2 . Obtenga, por el mtodo de los momentos,
los estimadores de los parmetros y 2 .
Solucin:
Como son dos parmetros los que se necesitan estimar, se igualan los dos
primeros momentos poblacionales con sus respectivos momentos muestrales,
esto es:
n
P
M1 =
i=1
M2 =
i=1
Xi
n
n
P
Xi2
n
= E [X]

= E X2
Los primeros momentos poblacionales estn dados por:

E [X] =

E X 2 = V [X] + {E [X]}2 = 2 + 2
138
Por lo tanto:
n
P
Xi
i=1
n
n
P
(3.4)
= 2 + 2
(3.5)
Xi2
i=1
n
De la ecuacin (3.4), se tiene:
n
P
bM M =
Xi
i=1
=X
y de la ecuacin (3.5), se tiene:

n
P
b2 =
i=1
i=1
Xi2
n
n
P
Xi2
1
=
n
b2
X
n
X
!
Xi2 nX
i=1
n
2
1X
=
Xi X
n i=1
por lo tanto,
n
2
1X
b2 M M =
Xi X
n i=1
De lo anterior se puede concluir que el estimador por el mtodo de los momentos de la media poblacional es la media muestral X, mientras que el
estimador por el mtodo de los momentos de la varianza poblacional 2 no
es la varianza muestral corregida S 2 , sino que es la varianza muestral V 2 .

FaCyT-Matemticas
139
Observacin 3.2. En este ejemplo, los estimadores por el mtodo de los

momentos conciden con los estimadores que se obtuvieron con el mtodo por
mxima verosimilitud (ver ejemplo (3.4)). En general, no necesariamente son
iguales.
Ejemplo 3.8. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n de
una distribucin uniforme (0, ) con desconocido. Utilice el mtodo de los
momentos para estimar .
Solucin:
En este caso se iguala el primer momento poblacional con el primer momento
muestral, ya que se quiere estimar un slo parmetro, esto es:
n
P
Xi
i=1
= E [X]
M1 =
n
Como X U (0, ), entonces, la funcin de densidad de probabilidad viene
dada por:
(
1
si 0 x
f (x; ) =
por lo que, el valor esperado de X se obtiene como:
Z
E [X] =
xf (x; ) dx
0
Z
x
dx
=
0

x2
=
2
0
=
2
Luego:
n
P
Xi
i=1
2X
b =
Xi = 2X
n i=1
Por lo tanto, el estimador de por el mtodo de los momentos es:

bM M = 2X
140


uniforme en el intervalo (, ). Determinar por el mtodo de los momentos
el estimador de .
Solucin:
Igualando el primer momento poblacional con el primer momento muestral
se tiene que:
n
P
Xi
i=1
= E [X]
M1 =
n
Como X U (, ), entonces, la funcin de densidad de probabilidad viene
dada por:
(
1
si x
f (x; ) = 2
Por lo que, el valor esperado de X se obtiene como:
Z
E [X] =
xf (x; ) dx
x
dx
2

x2
=
4
=0
Como el primer momento poblacional no tiene ninguna informacin sobre
, se plantea en igualar el segundo momento poblacional con el segundo momento muestral
n
P
Xi2

M2 = i=1
= E X2
n
FaCyT-Matemticas
141
Calculando el segundo momento poblacional:

Z
2
x2 f (x; ) dx
E X =
x2
dx
2
Z
=

x
=
6
3
Por lo tanto, E [X 2 ] = 2 /3, as que:

M2 = 2 /3
b =
p
3M2
por consiguiente, el estimador por el metodo de los momentos de es:

v
u n
u3 X
bM M = t
X2
n i=1 i

3.3.
Propiedades de los estimadores puntuales
El valor de un estimador una vez obtenida la muestra, generalmente difiere

del valor del parmetro que se pretende estimar, o sea que es poco probable
que sus valores coincidan. La diferencia entre ambas magnitudes se denomina error de estimacin. La magnitud de este error se podra calcular si
se estuviese el valor del parmetro; pero ste por lo general es desconocido,
razn por lo cul se trata de estimar (aproximar). Obviamente un buen estimador b para ser aquel que tenga una diferencia b lo ms pequea
posible. Pero como esta diferencia es aleatoria se espera que sea pequea con
alta probabilidad. Adems por ser el estimador de un parmetro una funcin
de las variables de la muestra aleatoria, es evidente que se pueden escoger
distintos estimadores para un mismo parmetro, puesto que se puede elegir
arbitrariamente la funcin que se va a utilizar. Por ejemplo, supngase que
Sec 3.3. Propiedades de los estimadores puntuales
142
se desea estimar la media de una poblacin y se toma una muestra aleatoria X1 , X2 , . . . , Xn de tamao n de dicha poblacin; se pueden elegir como
estimador de la media las siguientes estadsticas:
b1 = X
b2 = X1
b3 = Xn
X1 + Xn
b4 =
2
b5 = M
b6 = Mx (Xi )
media muestral
el primer valor de la muestra
el ltimo valor de la muestra
el promedio del primer y ltimo valor de la muestra
mediana muestral
mximo de la muestra
Es decir, para cada parmetro desconocido se pueden elegir muchos, prcticamente infinitos, estimadores. Es evidente que se debera tener algn tipo
de criterio para juzgar si un estimador elegido, es un buen estimador, o si
uno es mejor que otro; es decir, algn criterio que indique la eficacia de nuestra eleccin. Al buscar el mejor estimador se har uso de una cantidad muy
importante que recibe el nombre de error cuadrtico medio de un estimador.
Definicin 3.3. (ERROR CUADRTICO MEDIO DE UN

ESTIMADOR) Sea b cualquier estimador de un parmetro desconocido . Se define el error cuadrtico medio de b como el valor
esperado del cuadrado de la diferencia entre b y . Para culquier
b se denotar el error cuadrtico medio por ECM ();
b de
estimador ,
esta forma

2
b
b
ECM = E
(3.6)
El error cuadrtico medio de un estimador b puede expresarse como la suma

de dos componentes no negativas:
b y
La varianza del estimador ,
El cuadrado del sesgo del mismo.
FaCyT-Matemticas
143
En efecto,

2
ECM b = E b

2
2
b
b
= E 2 +

h i
2
= E b
2E b + 2
h i
h i2
h i
2
2
= E b
E b
+ E b
2E b + 2
h i h i
2
= V b + E b
h i
2
b
= V + B b
(3.7)
De la ecuacin (3.7) se puede comprender la razn del por qu el error cuadrtico medio es una cantidad muy importante para evaluar a los posibles
estimadores de . Estas dos componentes estn relacionadas con las propiedades deseables de un estimador. De manera especifica, la varianza de un
estimador debe ser lo ms pequea posible mientras que la distribucin de
muestreo del estimador debe concentrarse alrededor del valor del parmetro.
Observacin 3.3. Generalmente no existe ningn estimador que minimice

el error cuadrtico medio para todos los posibles valores de . Es decir, un
estimador puede tener un error cuadrtico medio mnimo para algunos valores
de , mientras que otro estimador tendr la misma propiedad, pero para otros
valores de .
Ejemplo 3.10. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao 10 de
alguna distribucin tal que E [X] = y V [X] = 2 . Considerese las estadsticas:
b1 = X
y
n
P
b2 =
Xi
i=1
n+1
144
como posibles estimadores de . Obtener los errores cuadrticos medios de

b1 y b2 . Cul de los dos estimadores es mejor?
Solucin:
Primero se calcula el error cuadrtico medio de cada uno de los estimadores
propuestos, pues el que lo tenga menor, ser el mejor estimador para .
ECM (b1 ) = V [b1 ] + B (b1 )2
n
P
X
i=1 i

E [b1 ] = E X = E
n
n
1X
1X
E [Xi ] =
E [X]
=
n i=1
n i=1
n
=
n
=
por lo tanto, B (b1 ) = E [b1 ] = 0, y
V [b1 ] = V X
n
P
i=1 Xi
= V
n
n
n
1 X
1 X
= 2
V [Xi ] = 2
V [X]
n i=1
n i=1
n 2
n2
2
=
n
=
de este modo, el error cuadrtico medio de b1 es:

ECM (b1 ) = V [b1 ] + B (b1 )2 =
2
n
De manera similar,
FaCyT-Matemticas
145
ECM (b2 ) = V [b2 ] + B (b2 )2

n
P
n
n
i=1 Xi
1 X
1 X
E [b2 ] = E
E [Xi ] =
E [X]
=
n + 1 n + 1 i=1
n + 1 i=1
=
n
n+1
n
P
n
n
X
X
i=1 Xi
1
1
V [b2 ] = V
V [Xi ] =
V [X]
=
n + 1 (n + 1)2 i=1
(n + 1)2 i=1
n 2
(n + 1)2
por lo tanto,
ECM (b2 ) = V [b2 ] + B (b2 )2

2
n
n 2
+
=
(n + 1)2
n+1

2
n 2
n (n + 1)
=
+
(n + 1)2
n+1

2
n 2
+
=
(n + 1)2
n+1
2
n
2
=
+
(n + 1)2 (n + 1)2
n 2 + 2
=
(n + 1)2
Como puede apreciarse los errores cuadrticos medios, o al menos uno de
ellos, dependen del parmetro , que es desconocido, y por lo tanto para compararlos es instructiva su representacin grfica considerando como abscisa.
Al no depender del parmetro, la grfica del ECM (b1 ) es una recta paralela
al eje de las abscisas. En cambio ECM (b2 ) es un polinomio de segundo grado
146
ECM

ECM b2

ECM b1
Figura 3.1: Grfica de los errores cuadrticos medios de ambos estimadores.

en por lo que su grfica es una parbola que, evidentemente, no posee puntos
de corte con el eje de abscisas, pues n 2 + 2 = 0 no tiene soluciones reales,
y cuyo vrtice se encuentra en el punto

n 2
0,
(n + 1)2
y abre haca arriba, ya que el coeficiente de 2 es positivo. En la representacin conjunta de ambas grficas de la Figura (3.1) es evidente que el menor
error cuadrtico medio se presenta a un estimador para unos valores de , y
al otro para los dems valores.
En general, como no es conocido el valor del parmetro, es imposible pronunciarse sobre cul de los estimadores es mejor, la situacin ideal sera la
de que un estimador tuviese el menor error cuadrtico medio para cualquier
valor del parmetro, es decir que tuviese menor error cuadrtico medio de
manera uniforme.

Es por esta razn que se deben examinar criterios adicionales para la seleccin
de los estimadores de , an a pesar de que el error cuadrtico medio de un
estimador sea un concepto muy importante. A continuacin se presentarn
algunos criterios para comparar estimadores de un parmetro desconocido .
FaCyT-Matemticas
147
De manera especifica se estudiarn las propiedades deseables de los estimadores: insesgabilidad, consistencia, insesgado de varianza mnima, eficientes
y suficientes.
3.3.1.
Estimadores insesgados
Como no hay ningn estimador perfecto que de siempre la respuesta correcta

debera, por lo menos, hacerlo en promedio, es decir, que el valor esperado de
un estimador sea igual al parmetro que trata de estimar. Si ste es el caso,
se dice que el estimador es insesgado; formalmente:
Definicin 3.4. Sea b un estimador de , se dice que b es un estimador insesgado de si y slo si

h i
E b =
Sino se cumple esto, se dice que el estimador b es un estimador sesgado de .
Definicin 3.5. (SESGO DE UN ESTIMADOR PUNTUAL)

El sesgo de un estimador puntual n se define como
b = E()
b
Bn ()
(3.8)

normal con E [X] = y V [X] = 2 . Comprobar si los estimadores de mxima verosimilitud de y 2 son estimadores insesgados.
Solucin:
Los estimadores de mxima verosimilitud de y 2 , son:
n
P
bM V = X
b2 M V =
Xi X
i=1
2
148
respectivamente. Primero se comprobar si

bM V = X es un estimador insesgado para el parmetro ,
n
P
i=1 Xi

E [b
M V ] = E X = E
n
n
P
n
P
E [Xi ]
i=1
n
n
=
=
n
E [X]
i=1
por tanto,
bM V es un estimador insesgado para . Ahora se comprobar si
2
b
M V es un estimador insesgado para 2 ,
n
2
P
" n
#
i
h
X
i=1 Xi X 1
2
= E
E b2 M V = E
Xi X
n
n
i=1
#
" n
n
h 2i
X
1
1 X 2
2
= E
Xi2 nX =
E Xi E X
n
n i=1
i=1
n

2
1X
=
V [Xi ] + (E [Xi ])2 V X + E X
n i=1
n

2
1X
2
=
V [X] + (E [X]) V X + E X
n i=1
2

n

1X 2
2
2
=
+
+
n i=1
n
2
1
2
2
= n +
2
n
n
2
= 2 + 2
2
n

1
2
= 1
n
(n 1) 2
=
n
FaCyT-Matemticas
149
h
i
Como E b2 M V 6= 2 , entonces el estimador de mxima verosimilitud de 2
es un estimador sesgado para 2 . El sesgo del estimador es:

h
i
2
(n 1) 2
2 =
S b2 M V = E b2 M V 2 =
n
n
Pero si el estimador est dada como en la definicin (2.6), se puede comprobar que S 2 es un estimador insesgado para 2 . En efecto,
n
P
i=1

E S2 = E
Xi X
n1
2
" n
#
X
2
1
=
Xi X
n 1E
i=1
" n
#
n
h 2i
X
1 X 2
1
2
2
E
Xi nX =
=
E Xi E X
n1
n 1 i=1
i=1
n

2
1 X
2
=
V [Xi ] + (E [Xi ]) V X + E X
n 1 i=1
n
2

1 X
=
V [X] + (E [X])2 V X + E X
n 1 i=1
2

n

1 X 2
2
2
=
+
+
n 1 i=1
n
2
1
n 2 + 2
2
n1
n
2
= 2 + 2
2
n

1
2
= 1
n
(n 1) 2
=
n1
= 2
=
Por tanto, S 2 es un estimador insesgado para 2 .

150
Ejemplo 3.12. Sea X1 , X2 , X3 una muestra aleatoria de una distribucin

con funcin de densidad de probabilidad
(
x
1
exp
, x > 0
f (x; ) =
0,
sino
Considere los siguientes estimadores para
X 1 + X2
b2 =
, b3 = X
2
verificar cules de los estimadores anteriores son insesgados.
b1 = X1 ,
Solucin:
El valor esperado de la poblacin se obtiene como:
Z
n xo
1
E [X] =
x exp
dx
0
Z b
n xo
1
x exp dx
= lm
b 0
b
Z b

n
o
o
n
x
1
x
exp dx
= lm x exp + lm
b 0
b

0
Z b
n xo
= lm
exp dx
b 0

n x ob

= lm exp
b

0
=
Ahora se calculan el valor esperado para cada estimador a fin de verificar
cules
h i son insesgados:
E b1 = E [X1 ] = , entonces b1 es un estimador insesgado para .
h i

2
E b2 = E X1 +X
= 12 (E [X1 ] + E [X2 ]) = 2
= , entonces b2 es un esti2
2
mador insesgado para .
h i

2 +X3 ]
2 ]+E[X3 ]
E b3 = E X = E[X1 +X
= E[X1 ]+E[X
= 3
= , entones b3 es
3
3
3
un estimador insesgado para .
FaCyT-Matemticas
151

Definicin 3.6. Sea b un estimador de , se dice que b es un estimador asintticamente insesgado de si al aumentar el tamao
de la muestra, su media tiende a coincidir con el parmetro , y por
lo tanto, su sesgo tiende a cero. Esto es,
h i
lm E b =
n
Ejemplo 3.13. Considrese el ejemplo (3.11). Demuestre que el estimador

de mxima verosimilitud de 2 es un estimador asintticamente insesgado
para 2 .
Solucin:
Como
i (n 1)
2
b
2
E MV =
n
h
y
i
h
(n 1) 2
2
b
lm E M V = lm
= 2
n
n
n
Entonces, b2 M V es un estimador asintticamente insesgado para 2 .

3.3.2.
Estimadores insesgados de varianza mnima
La varianza de un estimador insesgado es la cantidad ms importante para

decidir que tan bueno es el estimador para estimar un parmetro . Si se tienen varios estimadores insesgados de un parmetro, por lo general se escoge
el que tenga la menor varianza.
En muchos casos resulta prohibitivo determinar las varianzas de todos los
estimadores insesgados de y seleccionar el estimador que tenga la varianza
ms pequea. Entonces, Cmo obtener el estimador insesgado de varianza
mnima, si existe?. Para dar una respuesta a la pregunta anterior se usa un
resultado que recibe el nombre de cota inferior de Cramr-Rao, el cul se
presenta en el siguiente Teorema:
152
Teorema 3.3. Sea X1 , X2 , . . . , Xn una muestra aleatoria de ua distribucin con funcin (densidad) de probabilidad f (x; ). Si b es un
estimador insesgado de , entonces la varianza de b debe satisfacer
la siguiente desigualdad
h i
1

V b
(3.9)
2
Ln(f (X;))
nE
El Teorema anterior establece un limite inferior para la varianza de un estimador insesgado de . Para un estimador insesgado cuya varianza alcance la
cota de Cramr-Rao, se tiene la siguiente definicin:
Definicin 3.7. Si b es un estimador insesgado de y
h i
1

V b =
2
Ln(f (X;))
nE
entonces se dice que b es un estimador eficiente de .

Ejemplo 3.14. Demostrar que X es un estimador eficiente para la media
de una poblacin normal.
Solucin:
En el ejemplo (3.4) se demostr que X es un estimador insesgado para ;
luego, slo faltara probar que la varianza de X alcanza la cota de CramrRao. Dado que la funcin de densidad de probabilidad de una distribucin
normal est dada por:

1
(x )2
< x, <
2
f x; , =
exp
,
2
2
>0
2
2
entonces, el logaritmo neperiano de f (x; , 2 ) es:
Ln f x; , 2

= Ln

(x )2
(x )2
2
exp
=
Ln
2
2 2
2 2
2 2
1
FaCyT-Matemticas
153
y, derivando parcialmente con respecto a se tiene que:

Ln (f (x; , 2 ))
x
=
2
Entonces,
"
E
Ln (f (X; , 2 ))
2 #
"
2 #
X
=E
2

1
= 4 E (X )2
V [X]
2
=
=
4
4
1
= 2
Por consiguiente, se tiene:

1
nE

y como V X =
eficiente para .
2
n

Ln(f (X;, 2 ))
2 =
1
n
1
2
=
2
n
(ver Seccin (2.1.1)), se deduce que X es un estimador

Como se ha indicado, los estimadores insesgados suelen compararse en trminos de sus varianzas, de esto se presenta la siguiente definicin:
Definicin 3.8. Si b1 y b2 son dos estimadores insesgados de un parmetro

de b1 es menor que la varianza de b2 , es decir,
h i y la
h varianza
i
V b1 V b2 , cumplindose la desigualdad en el sentido estricto
para algn valor de . Entonces se dice que b1 es relativamente ms
eficiente que b2 .
154
Algunas veces es comn utilizar el cociente

h i
V b1
h i
V b2
para determinar la eficiencia relativa de b2 con respecto a b1 .
Si los estimadores son sesgados, se emplean sus errores cuadrticos medios
para determinar las eficiencias relativas, teniendo para este caso la siguiente
definicin:
Definicin 3.9. Un estimador b2 de se denomina inadmisible si

existe otro estimador b1 tal que

para todo
ECM b1 ECM b2
cumplindose la desigualdad en el sentido estricto para algn valor
de .
Es decir, un estimador b2 es inadmisible si existe otro estimador b1 que es

al menos igual de bueno que b2 para todo posible valor del parmetro y lo
supera para algn valor de . Se dice tambin que b1 domina a b2 uniformemente en .
Un estimador es admisible cuando no es inadmisible, es decir, cuando no
existe otro que lo domine uniformemente en .
Ejemplo 3.15. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con media y varianza 2 (ambos desconocidos). Consider los
siguientes estimadores para 2 :
n
P
b12 = i=1
Xi X
2
n
FaCyT-Matemticas
155
y
n
P
Xi X
b22 = i=1
2
n1
demuestre que b22 es un estimador inadmisible.

Solucin:
Para demostrar que b22 es un estimador inadmisible, se debe probar que la
desigualdad

ECM b12 ECM b22
es cierta para todos los valores de 2 en el espacio parametral y se cumple en
el sentido estricto para algn valor de 2 .
Si X1 , X2 , . . . , Xn es una muestra aleatoria de una distribucin normal con
media y varianza 2 , entonces la variable aleatoria
n
P
Y =
Xi X
i=1
2
2n1

h i
2
2
2
b
b
ECM 1 = V 1 + B b12
n
P
h i
i=1
E b12 = E
n
2
2
P
2
Xi X
Xi X
= E i=1
n
n 2
n
P
2
i=1
E
(n 1) 2
n
2
Xi X
2
= E [Y ]
2
n
156
n
P
h i
i=1
V b12 = V
Xi X
n
n
P
4
i=1
V
2
n
2(n 1) 4
n2
n
2
2
P
2
X
= V i=1
n 2
2
Xi X
4
= V [Y ]
2
n
por tanto,
h i
2

2
2
b
b
ECM 1 = V 1 + B b12

2
2(n 1) 4
(n 1) 2
2
=
+
n2
n
2
2
n 2 n 2
2(n 1) 4
+
=
n2
n
4
4
2(n 1)
=
+ 2
2
n
n
2n 4 4
2n 4 2 4 + 4
=
=
n2
n2
4
(2n 1)
=
n2
de una manera similar, se puede demostrar que:

ECM b22 =
2 4
(n 1)
FaCyT-Matemticas
157
Entonces,

ECM b12 ECM b22
(2n 1) 4
n2
(n 1)(2n 1) 4
(2n2 n 2n + 1) 4
2n2 4 3n 4 + 4 2n2 4
2 4
(n 1)
2n2 4
2n2 4
0
4 3n 4
1
3
por tanto, si n 1/3 el error cuadrtico medio de b12 es de manera

uniformemente menor que el error cuadrtico medio de b22 . Por lo tanto b22 es un estimador inadmisible para 2 .
3.3.3.
Estimadores consistentes
Es razonable esperar que un estimador mejore a medida que se aumenta el

tamao de la muestra y cuando este tamao sea muy grande los estimadores
tomen valores muy prximos a los parmetros respectivos. Los estimadores
bn asociados a una muestra aleatoria de tamao n constituyen sucesiones de
variables aleatorias; un buen estimador debera converger en algn sentido
haca . Este concepto se generalizar mediante la siguiente definicin de
consistencia.
Definicin 3.10. Se dice que un estimador bn de un parmetro

es un estimador consistente para cuando converge en probabilidad
hacia , es decir, si y slo si para cualquier > 0 se cumple que:

b
lm P |n | < = 1
n+
158
Ejemplo 3.16. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con media y varianza 1. Demuestre que
n
1X
bn = X n =
Xi
n i=1
es un estimador consistente para .
Solucin:
Para demostrar que bn = X n es un estimador consistente para , ntese que:

P |bn | < = P | X n | <

= P < X n <

= P < Xn < +
Como X1 , X2 , . . . , Xn es una muestra aleatoria de una distribucin N (, 1),
se tiene que:
#
" n
n
n
n

1X
1X
1X
1X
1
Xi =
E [Xi ] =
E [X] =
= (n) =
E Xn = E
n i=1
n i=1
n i=1
n i=1
n
y
#
n
n
n
n
1 X
1
1X
1 X
1 X
n
Xi = 2
=V
V [Xi ] = 2
V [X] = 2
1= 2 = ,
n i=1
n i=1
n i=1
n i=1
n
n
"
V Xn
por lo tanto,

Xn N
1
,
n
por consiguiente,
P < Xn < + =
n n
o
1
p
exp (xn )2 dxn
2
2 1/n
(3.10)
haciendo el cambio de variable y = xn , se tiene que dy = dxn . Cuando

xn = , y = , y cuando xn = + , y = . Sustituyendo estos cambios
FaCyT-Matemticas
159
en la ecuacin (3.10), se tiene que:
Z
P < Xn < + =
n n o
n
exp y 2 dy
2
2
aplicando nuevamente un cambio de variable, esto es, z =

el mismo anlisis anterior, se tiene que:
P < Xn < + =
ny, y haciendo
2
1
z
exp
dz,
2
2
esto implica que:
Z
b
P |n | < =

2
1
z
exp
dz,
2
2
y por consiguiente,
n+
2
1
z
exp
dz
n n
2
2
2
Z
z
1
exp
=
dz
2
2
= 1,
Z

b
lm P |n | < = lm

por ser la funcin de densidad de probabilidad de una variable aleatoria normal con media 0 y varianza 1. Por tanto, bn = X n es un estimador consistente para .

En general no es necesario realizar todos estos clculos para verificar si un
estimador es consistente, se puede usar las siguientes condiciones suficientes
(a pesar de no ser condiciones necesarias) que son una consecuencia inmediata
de la desigualdad de Chebyshev y son enunciadas en el siguiente Teorema.
160
Teorema 3.4. La estadstica b es un estimador consistente del parmetro si:

1. b es un estimador insesgado
h i
2. lm V b = 0
n
Demostracin. Por hiptesis se tiene que b es un estimador insesgado para

, por lo tanto:
h i
E b =
Usando la desigualdad de Chebyshev, se tiene que:
r h i!
1
P |bn | k V b 2 para algun k > 0
k
r h i
Sea = k V b > 0, esto implica que k =

P |bn |
q ,
V[b]
y por tanto:
h i
V b
2
y

lm P |bn | lm
de esta manera
h i
V b
2
=0

lm P |bn | = 0

b
lm P |n | < = 1
por consiguiente, bn es un estimador consistente para .

Observacin 3.4. Para demostrar que ests condiciones no son necesarias,
slo se debe probar que un estimador puede ser consistente sin ser insesgado.
FaCyT-Matemticas
161
Ejemplo 3.17. Suponga que X1 , X2 , . . . , Xn es una muestra aleatoria de una

distribucin normal, con E [X] = y V [X] = 2 . Demuestre que:
n
2
1 X
Xi X
S =
n 1 i=1
2
es un estimador consistente para 2 .

Solucin:
En el ejemplo (3.11) se demostr que S 2 es un estimador insesgado para ,
faltara comprobar el segundo tem del Teorema (3.4), es decir, probar que:

lm V S 2 = 0
n
El Teorema (2.11) nos dice que

(n 1) S 2
2n1
2
y por el ejemplo (2.10) se tiene que:

2 4
V S2 =
n1
Por lo tanto:
2 4
=0
n
n+ n 1
En consecuencia, S 2 es estimador consistente para 2 .

lm V S 2 = lm
3.3.4.
Estimadores suficientes
Considrese una muestra aleatoria X1 , X2 , . . . , Xn tomada de una poblacin

con funcin (densidad) de probabilidad f (x; ). Como se sabe la muestra
aleatoria X1 , X2 , . . . , Xn quedar reducida a un determinado estadstico b
llamado estimador de . Cunta informacin se pierde al resumir la muestra
b Si b es suficiente para entonces no hay prdida de inforaleatoria en ?
macin. Entonces, de manera intuitiva, una estadstica b es un estadstico
suficiente para un parmetro si resume toda la informacin contenida en
la muestra aleatoria con respecto a .
162
Definicin 3.11. La estadstica b es una estadstica suficiente

del parmetro si y slo si la distribucin conjunta de la muestra
b es independiente de , es decir,
aleatoria X1 , X2 , . . . , Xn , dado ,

f x1 , x2 , . . . , xn , b

f x1 , x2 , . . . , xn |b =
g b
no dependa de .
La utilidad de un estadstico suficiente recae en el hecho de qu si un estimador insesgado de un parmetro es una funcin de una estadstica suficiente,
entonces tendr la varianza ms pequea de entre todos los estimadores insesgados de que no se encuentran basados en una estadstica suficiente. De
hecho, si existe el estimador eficiente de , est ser un estadstico suficiente.
Ejemplo 3.18. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin de Poisson cuya funcin de probabilidad es
f (x; ) =
x exp {}
x!
x = 0, 1, 2, . . .
b = X para es una estadstica suficiente.

Demostrar que el estimador
Solucin:
b=X
Como la distribucin de Poisson es discreta, entonces para probar que
es una estadstica suficiente para se debe demostrar que la distribucin
b es independiente de .
conjunta de X1 , X2 , . . . , Xn , dado ,
FaCyT-Matemticas
163

f x1 , x2 , . . . , xn |b = P X1 = x1 , X2 = x2 , . . . , Xn = xn |X = x

P X 1 = x1 , . . . , X n = x n , X = x

=
P X=x
P
P (X1 = x1 , . . . , Xn = xn , ni=1 Xi = nx)
P
=
P ( ni=1 Xi = nx)
Pn1
P X1 = x1 , . . . , Xn1 = xn1 , Xn = nx i=1
Xi
Pn
=
P ( i=1 Xi = nx)
Pn1
xi
P (X1 = x1 ) P (Xn1 = xn1 ) P Xn = nx i=1
Pn
=
P ( i=1 Xi = nx)
Pn1
x1 exp{}xn1 exp{}nx i=1

Pn1
x1 !xn1 !(nx i=1
xi ) !
exp{}
(n)(nx) exp{n}
(nx)!
Pn1
xi
exp{n}x1 xn1 nx i=1

Pn1
x1 !xn1 !(nx i=1
xi )!
xi
(n)(nx) exp{n}
(nx)!
(nx)!
Pn1
xi !
n(nx) x1 ! xn1 ! nx i=1
Evidentemente la anterior probabilidad condicional no depende de , de donde

se concluye que X es una estadstica suficiente para . Utilizando un razon
P
namiento anlogo, se puede demostrar que
Xi tambin es una estadstica
i=1
suficiente.

Ejemplo 3.19. Demuestre que la estadstica Y = 16 (X1 + 2X2 + 3X3 ) no es
suficiente para estimar el parmetro p de la poblacin de Bernoulli.
Solucin:
Se debe demostrar que:
f (x1 , x2 , x3 |Y ) =
f (x1 , x2 , x3 , y)
g (Y )
164
no es independiente de p para algunos valores de X1 , X2 y X3 . Por lo tanto,

consider el caso en particular donde X1 = 1 ,X2 = 1 y X3 = 0, de manera
que:
P (X1 = 1, X2 = 1, X3 = 0, Y = 1/2)
P (Y = 1/2)
P (X1 = 1) P (X2 = 1) P (X3 = 0)
=
P (Y = 1/2)
f (x1 , x2 , x3 |y) =
Como X1 , X2 , X3 se distribuye Bernoulli, entonces

f (xi ; p) = pxi (1 p)1xi
x = 0, 1
de manera que:
P (X1 = 1) = p,
P (X2 = 1) = p,
P (X3 = 0) = 1 p
y
P (Y = 1/2) = P (X1 = 1) P (X2 = 1) P (X3 = 0) + P (X1 = 0) P (X2 = 0) P (X3 = 1)
en consecuencia,
p2 (1 p)
p2 (1 p)
f (x1 , x2 , x3 |Y = 1/2) = 2
=
p (1 p) + p(1 p)2
p(1 p)[p + 1 p]
=p
que depende de p. Por lo tanto, la estadstica Y = 16 (X1 + 2X2 + 3X3 ) no es
una estadstica suficiente para p.

ya que puede ser muy tedioso probar con la definicin (3.11) si una estadstica
es un estimador suficiente para un parmetro dado, usualmente es ms fcil
utilizar el siguiente Teorema, llamado Teorema de factorizacin de Neyman
para tal fin. Adems, este Teorema sirve para construir estadsticas suficientes
para un parmetro desconocido .
FaCyT-Matemticas
165
Teorema 3.5 (Teorema de factorizacin de Neyman). Sea

X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin con una
funcin de densidad de probabilidad f (x, ). Se dice que la estadstica b es un estimador suficiente para si y slo si la funcin de
verosimilitud puede factorizarse de la siguiente forma:

b g (x1 , x2 , . . . , xn )
L (x1 , x2 , . . . , xn ; ) = h ,

b en donde h ,
b depende slo de y b
para cualquier valor b de ;
y g (x1 , x2 , . . . , xn ) no contiene al parmetro desconocido .
Ejemplo 3.20. Supongase que X1 , X2 , . . . , Xn es una muestra aleatoria de
una distribucin exponencial con parmetro , cuya funcin de densidad de
probabilidad es:
(
x
1
exp
, x > 0
f (x; ) =
0,
sino
Demostrar que X es un estimador suficiente para .
Solucin:
La funcin de verosimilitud es:
L (x1 , x2 , . . . , xn ; ) = f (x1 ; ) f (x2 ; ) f (xn ; )
n
n
n xo
Y
Y
1
i
=
f (xi ; ) =
exp
i=1
)
( i=1 n
n
1
1X
xi
=
exp
1=1
n
P
n
xi
n
1
i=1
=
exp
n

1
nx
=
exp
= h (x, ) g (x1 , x2 , . . . , xn )

donde h (x; ) =

1 n
166
n
o
exp nX
y g (x1 , x2 , . . . , xn ) = 1. Por el Teorema
(3.5), X es un estimador suficiente para .

Ejemplo 3.21. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin Poisson cuya funcin de probabilidad es
f (x; ) =
exp {} x
x!
Encontrar si es posible un estadstico suficiente para .

Solucin:
L (x1 , x2 , . . . , xn ; ) = f (x1 ; ) f (x2 ; ) f (xn ; )
exp {} xn
exp {} x1 exp {} x2
=
x1 !
x2 !
xn !
n
P
exp {n} i=1

=
n
Q
xi !
xi
i=1
n
P
xi
1
exp {n} i=1
= Q
n
xi !
i=1
= g (x1 , x2 , . . . , xn ) h
n
X
!
xi ;
i=1
donde g (x1 , x2 , . . . , xn ) =
Teorema (3.5),
n
P
1
n
Q
xi !

y h
n
P
n
P

xi ;
= exp {n}
1=1
xi
. Por el
i=1
i=1
Xi es un estadstico suficiente para .
1=1

Con la Definicin (3.11) y el Teorema (3.5) se han presentado dos formas de
cerciorarnos de si una estadstica b es un estimador suficiente para un parmetro desconocido . Por lo general el Teorema de factorizacin de Neyman
FaCyT-Matemticas
167
nos conduce a la solucin ms sencilla; pero para demostrar que b no es suficiente, casi siempre es ms simple proceder por medio de la definicin (3.11).
Teorema 3.6. Cualquier funcin uno a uno de una estadstica suficiente, tambin es suficiente.
Ejemplo 3.22. Considrese el ejemplo (3.21). Si se define el estimador para
b=X
Es un estimador suficiente?
Solucin:
n
b = X es una funcin uno a uno de la estadstica suficiente P Xi ,
Como
1=1
b = X tambin es una estadstica suficiente.

entonces por el Teorema (3.6),
De esta manera, el estimador
b=X
es un estimador suficiente para .

3.4.
Propiedades de los estimadores de mxima

verosimilitud
Cuando existe, el estimador de mxima verosimilitud tiene algunas propiedades interesantes:

Generalmente es consistente.
Es asintticamente normal.
No es siempre insesgado, pero lo es asintticamente.
Es funcin de un estadstico suficiente, siempre y cuando el estimador
de mxima verosimilitud sea nico.
Sec 3.5. Estimacin puntual bayesiana
168
Entre todos los estimadores asintticamente insesgados, tiene la varianza asintticamente ms pequea, es decir, es eficiente.
Si el estimador de mxima verosimilitud es un estadstico suficiente,
entonces es un estadstico minimal, es decir, no se puede encontrar otro
estadstico suficiente que haga una mejor reduccin de los datos.
3.5.
Estimacin puntual bayesiana
En el problema de estimacin de un parmetro de una distribucin de funcin

de probabilidad (densidad) f (x; ), es frecuente tener algunas ideas sobre los
valores que puede tomar . En este caso conviene tomar en cuenta este conocimiento o creencia que se puede traducir en una distribucin de probabilidad
sobre el espacio de parmetros, llamada distibucin a priori. Es decir que
ahora no es un parmetro constante, sino una variable aleatoria, la cul se
denotar por y a la realizacin de por .
Definicin 3.12. Sea una variable aleatoria definida de manera
tal que sus valores representan las posibles opciones en que puede ocurrir un fenmeno aleatorio antes de llevar a cabo un experimento. El
grado de creencia con respecto a estas posibilidades se encuentra expresado por una funcin de distribucin (), denominada funcin
de distribucin a priori de .
la especificacin de la forma de () depende de la conviccin que se tenga

con respecto a los valores de antes de que la informacin de la muestra se
encuentre disponible; por tanto, esta distribucin no depende de los valores
muestrales.
Cuando la informacin a priori con respecto a los valores de se combina
con la informacin que proporcion la muestra, el resultado es un conjunto
de informacin modificada con respecto a la variable aleatoria . En otras
palabras, la combinacin de la distribucin a priori y de la funcin de verosimilitud origina una distribucin condicional para , dado el resultado
muestral, que se conoce como la distribucin a posteriori de . Esta combinacin se hace de acuerdo al Teorema de Bayes.
FaCyT-Matemticas
169
Definicin 3.13. Sea () la distribucin a priori de y sea

L (x1 , x2 , . . . , xn |) la funcin de verosimilitud, condicional a un valor
particular de . Entonces la distribucin a posteriori de dada
la evidencia muestral x1 , x2 , . . . , xn , es:
(|x1 , x2 , . . . , xn ) = R
L (x1 , x2 , . . . , xn |) ()
L (x1 , x2 , . . . , xn |) () d
(3.11)
Es interesante notar que el denominador de la ecuacin

(3.11) es la funcin de
R
densidad de probabilidad marginal de X y como L (x1 , x2 , . . . , xn |) () d
no depende de , entonces:
(|x1 , x2 , . . . , xn ) L (x1 , x2 , . . . , xn |) ()
(3.12)
La funcin de distribucin a posteriori resume la informacin total, despus

de haber observado la muestra L (x1 , x2 , . . . , xn |) e incluir la informacin
externa ().
Una vez obtenida la distribucin a posteriori de , se puede estimar el verdadero valor de de diferentes formas, por ejemplo dando un valor. La estimacin puntual bayesiana consiste por lo general en tomar como estimacin
del parmetro la moda, la media, la mediana, la varianza, entre otros; de la
distribucin a posteriori de .
Definicin 3.14. Una funcin de densidad de probabilidad de una
variable aleatoria X tpicamente tiene la forma Cg(x; ). El proposito de C es hacer que la funcin de densidad de probabilidad integre
uno, la proporcin restante es llamada el kernel de la funcin de
densidad de probabilidad.
Ejemplo 3.23. Si X G (, ), entonces la funcin de densidad de probabilidad de X esta dada por
(
1
1
exp{ x }, si x > 0, , > 0
x
f (x; , ) = ()
0,
cualquier otro caso
170
en donde () es la funcin gamma. El kernel de esta funcin es x1 exp{ x }

y C = 1/() .

Ejemplo 3.24. Si X N (, 2 ), entonces la funcin de densidad de probabilidad de X esta dada por

1
(x )2
2
exp
f x; , =
2 2
2 2
si el inters recae en , el kernel de la funcin es

(x )2
1
exp
y C=
2
2
2 2
en caso de que el inters sea sobre y 2 , el kernel de la funcin es

1
(x )2
1
exp
y
C
=
2 2
2

Ejemplo 3.25. Si X exp (), entonces su funcin de densidad de probabilidad es:
(
exp{x}, si x > 0, > 0
f (x; ) =
0,
otro caso
a) Si la distribucin a priori para es 1, es decir, () = 1. Hallar la
distribucin a posteriori para y un estimador para .
b) Si () = exp{}. Hallar la distribucin a posteriori para y un
estimador para .
Solucin:
a) La distribucin a posteriori de viene dada por la expresin (3.12), la
cul es:
(|x1 , x2 , . . . , xn ) L (x1 , x2 , . . . , xn |) ()
FaCyT-Matemticas
171
La funcin de verosimilitud viene dada por:

L (x1 , x2 , . . . , xn |) = f (x1 |) f (x2 |) f (xn |)
= exp {x1 } exp {x2 } exp {xn }
( n
)
X
n
= exp
xi
(
n
i=1
n
X
= exp
)
xi
i=1
por tanto, la distribucin a posteriori de viene dada por:

(|X) L (x1 , x2 , . . . , xn |) ()
(
)
n
X
= n exp
xi
(i=1
= n+11 exp
n
X
)
xi
(3.13)
i=1
la expresin (3.13) representa el kernel de una distribucin gamma con

n
P
parmetro de forma n + 1 y escala 1/ xi , es decir
i=1
|x1 , x2 , . . . , xn G
n
+
1,
n
P
xi
i=1
Luego se puede tomar como estimador puntual para , la esperanza de

la distribucin a posteriori:
n+1
E [|x1 , x2 , . . . , xn ] = P
n
xi
i=1
b) Y si la distribucin a priori para viene dada por () = exp{},

la distribucin a posteriori de viene dada por:
172
(|x1 , x2 , . . . , xn ) L (x1 , x2 , . . . , xn |) ()
(
)
n
X
n
= exp
xi exp {}
(i=1
=
n+11
exp
n
X
!)
xi + 1
(3.14)
i=1
la expresin (3.14) nuevamente representa el kernel de una distribucin

n
P
gamma con parmetro de forma n + 1 y escala 1/(1 +
xi ), es decir
i=1
|x1 , x2 , . . . , xn G
n + 1,
1+
1
n
P
xi
i=1
Luego se puede tomar como estimador puntual para , la esperanza de

la distribucin a posteriori:
E [|x1 , x2 , . . . , xn ] =
n+1
n
P
1+
xi
i=1

Ejemplo 3.26. Si X Bernoulli (), entonces su funcin de densidad de
probabilidad es:
(
x (1 )1x , si x = 1, 0
f (x; ) =
0,
otro caso
Hallar la distribucin a posteriori de y un estimador para el mismo, si la
distribucin a priori para es beta con parmetros y , es decir, si la
funcin de densidad de probabilidad de es:
(
(+) 1
(1 )1 , si 0 < x < 1, , > 0
() = ()()
0,
otro caso
FaCyT-Matemticas
173
Solucin:
Se calcula la funcin de verosimilitud condicionada a :
n
Y
L (x1 , x2 , . . . , xn |) =
i=1
n
Y
f (xi |)
xi (1 )1xi
i=1
n
P
xi
= i=1 (1 )
n
P
xi
i=1
Luego la distribucin a posteriori de viene dada por:

(|x1 , x2 , . . . , xn ) L (x1 , x2 , . . . , xn |) ()
n
P
xi
= i=1 (1 )
n
P
i=1
xi +1
n
P
xi
i=1
(1 )
( + ) 1
(1 )1
() ()
n
P
xi +1
(3.15)
i=1
la expresin (3.15) representa el kernel de una distribucin beta. Por lo tanto,

!
n
n
X
X
(|x1 , x2 , . . . , xn ) BET A
xi + , n
xi +
i=1
i=1
Tomando como estimador puntual para la esperanza de la distribucin a

posteriori, nos queda:
n
n
P
P
xi +
xi +
i=1
i=1
E [(|x1 , x2 , . . . , xn )] = P
=
n
n
P
n++
xi + + n
xi +
i=1
i=1
3.6.
Ejercicios Propuestos
1. Suponga que se tiene una muestra aleatoria de tamao 2n tomada de

una poblacin X, tal que E [X] = y V [X] = 2 . Sean
2n
X1 =
1 X
Xi
2n i=1
X2 =
1X
Xi
n i=1
Sec 3.6. Ejercicios Propuestos
174
dos estimadores de . cul es el mejor estimador de ? Explique su

eleccin.
2. Sea X1 , X2 , . . . , X7 una muestra aleatoria de una poblacin que tiene
media y varianza 2 . Considere los siguientes estimadores de :
T1 =
X1 + X 2 + + X 7
7
T2 =
2X1 X6 + X4
2
a. Alguno de estos estimadores es insesgado?

b. Cul estimador es el mejor? En qu sentido es mejor?
3. Calcule la eficiencia relativa de los estimadores del ejercicio anterior.
4. Suponga que T1 y T2 son estimadores del parmetro . Se sabe que
E [T1 ] = , E [T2 ] = /2, V [T1 ] = 10, V [T2 ] = 4. Qu estimador es
mejor? En qu sentido lo es?
5. Suponga que T1 , T2 y T3 son estimadores de . Se sabe que E [T1 ] =
E [T2 ] = , E [T3 ] 6= , V [T1 ] = 12, V [T2 ] = 10 y E [(T3 )2 ] = 6.
Haga una comparacin de estos tres estimadores. Cul prefiere? Por
que?
6. Sea X una variable aleatoria normal con media = 0 y varianza 2 y
X1 , X2 , . . . , Xn una muestra aleatoria de X. Demostrar que
n
P
Xi2
i=1
n
es un estimador insesgado de 2 .
7.
a. Demuestre que
n
X
V =
(Xi X )2 /n
2
i=1
es un estimador sesgado de 2 .
b. Determine la magnitud del sesgo en el estimador.
FaCyT-Matemticas
175
c. Qu sucede con el sesgo a medida que aumenta el tamao n de

la muestra?
8. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n.
2
a. Demuestre que X es un estimador sesgado de 2 .

b. Determine la magnitud del sesgo en este estimador.
c. Qu sucede con el sesgo a medida que aumenta el tamao n de
la muestra?
d. Verifique si el estimador es asintticamente insesgado.
9. Supngase que X es una variable aleatoria con media y varianza 2 .
Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n tomada de una
poblacin representada por X. Demuestre que la media muestral X y
la varianza muestral
n
P
(Xi X )2
i=1
S2 =
n1
son estimadores insesgados de y 2 , respectivamente.
10. De una poblacin que tiene media y varianza 2 , se toman tres muestras aleatorias de tamaos n1 = 20, n2 = 10 y n3 = 8. Sean S12 , S22 , S32
las varianzas muestrales. Demuestre que
S2 =
20S12 + 10S22 + 8S32

38
es un estimador insesgado de 2 .
11. Si X es una variable aleatoria binomial y
T1 =
X
n
T2 =
X +1
n+2
son estimadores del parmetro p,

a. Son insesgados?
b. Si alguno no es insesgado, determine el sesgo del estimador.
176
c. Obtenga el error cuadrtico medio de T1 y T2 . Comente sobre el

ECM de estos estimadores para p(1 p) = 0,25 y n = 5, 10, 30, 50
y 100. Que concluye?
12. Si X 1 es la media de una muestra aleatoria de tamao n tomada de
una poblacin normal con media y varianza 12 , y X 2 la media de
una muestra aleatoria de tamao n tomada de una poblacin normal
con media y varianza 22 , demuestre que
a. T = wX 1 +(1w)X 2 , donde 0 w 1, es un estimador insesgado
de .
b. Para qu valores de w, la varianza del estimador T es un mnimo?
c. Si los tamaos de las muestras son diferentes, pero las varianzas
son iguales Para qu valor de w la varianza del estimador T es
mnimo?
13. Suponga que se tiene una muestra aleatoria de tamao 2n de una poblacin denotada por X, y E [X] = y V [X] = 2 . Sean
2n
X1 =
1 X
Xi
2n i=1
X2 =
1 X
Xi
n 1 i6=3
dos estimadores de . Determine si dichos estimadores son insesgados,

calcule el ECM de cada estimador y diga cul es al mejor estimador
de . estudie adems la consistencia de ambos estimadores.
14. Obtenga el estimador de mxima verosimilitud del parmetro p de una
distribucin geomtrica.
15. Sea X una variable aleatoria con la siguiente distribucin de probabilidad:
(
( + 1)x , 0 < x < 1
f (x) =
0 en otro caso
Encuentre el estimador mxima verosimilitud de , con base en una
muestra aleatoria de tamao n.
16. Una variable aleatoria X tiene la siguiente funcin densidad de probabilidad
(
exp {(x )} , x >
f (x) =
0 en otro caso
FaCyT-Matemticas
177
Qu puede decirse sobre el estimador mxima verosimilitud de ?

17. Una empresa se dedica al envasado de legumbres, y dispone una mquina, para rellenar los paquetes cuya etiqueta indica 1 kg, que cuando sta
perfectamente regulada vierte aproximadamente esa cantidad, errando
unas veces por exceso y otras por defecto, pero siempre una cantidad
insignificante. A causa de un accidente, la llenadora se ha desequilibrado y se desconoce la cantidad promedio que deposita en cada paquete.
A partir de una muestra aleatoria de 12 paquetes, se han propuestos
dos estimadores para la misma:
12
1 X
Xi
b=
12 i=1
12
1 X
=
Xi ,
13 i=1
donde Xi denota el peso del i-simo paquete de la muestra. En esas

condiciones, cul de los dos estimadores es mejor estudiando su ECM?
18. Sea X1 , X2 , . . . , X16 una muestra aleatoria de una poblacin con funcin
de probabilidad
(
p(x; n, p) =
n!
px (1 p)nx , x = 0, 1, 2, . . . , n
(n x)!x!
0,
0p1
Estime por el mtodo de mxima verosimilitud el parmetro p.

19. Consideremos una poblacin sobre la que se est estudiando cierta caracterstica representada por la variable aleatoria X, cuya funcin de
probabilidad viene definida as:
P (X = x) = (1 )x1
x = 1, 2, 3, . . .
con 0 1
Determine el estimador mxima verosimilitud del parmetro poblacional (suponga que mediante muestreo aleatorio simple se ha efectuado
n observaciones).
20. Determine el estimador del parmetro de una distribucin exponencial
que se obtiene por el mtodo de mxima verosimilitud. Compruebe las
propiedades de insesgadez, suficiencia, eficiencia y consistencia de tal
estimador.
178
21. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con funcin

de probabilidad
( 1
x
2
x
exp
, x > 0, > 0
f (x; ) =
23
0,
para cualquier otro valor
Si E(X) = 3 y V ar(X) = 32 .
(a) Demostrar que b = X/3 es un estimador insesgado, eficiente, consistente, y suficiente para .
(b) Hallar el estimador por el mtodo de mxima verosimilitud para
.
22. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin exponencial, es decir,
f (x; ) = exp {x} ,
x > 0, > 0,
Prubese que la cota de Cramer-Rao para estimadores insesgados de

es 2 /n.
23. La vida til de un aparato de aire acondicionado sigue una distribucin
de Rayleigh, cuya funcin de densidad obedece a la formula:

x2
x
2
x>0
f (x; ) = 2 exp 2 ,
2
Obtenga la estimacin por el mtodo de mxima verosimilitud del parmetro desconocido 2 . Es sta una estadstica para 2 . A partir de
una muestra aleatoria de 10 aparatos que han durado funcionando 750,
215, 520, 853, 1042, 911, 876, 924, 978, y 413 das respectivamente.
24. Sea X una variable aleatoria que se distribuye segn la siguiente funcin
de densidad:
(
k
,
xk y >1
f (x; ) =
x+1
0,
otro caso
Obtenga los estimadores mxima verosimilitud.
FaCyT-Matemticas
179
25. Sea X1 , X2 , X3 , X4 y X5 una muestra aleatoria de una poblacin cuya

distribucin es normal con media y varianza 2 . Considrese las estadsticas T1 = (X1 +X2 + +X5 )/5 y T2 = (X1 +X2 +2X3 +X4 +X5 )/6
como estimadores de . Identificar la estadstica que posee la varianza
ms pequea.
26. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin cuya distribucin es normal con media y varianzas 2 (ambos desconocidos).
De las siguientes, cules son estadsticas?
a.
n
P
Xi
i=1
b. X1 + X2
c. Xi , i = 1, 2, . . . , n
d. X12 + X22 exp(X3 )
e. Xi /, i = 1, 2, . . . , n
n
2
P
f.
Xi X
i=1
27. Verifique si el siguiente estimador del parmetro p de la distribucin

Binomial es insesgado, asintticamente insesgado o sesgado
X + n/2
pb =
n+ n
28. Sea X1 , X2 , . . . , X4 , una muestra aleatoria de una poblacin con distribucin exponencial negativa, cuya funcin de densidad es
n o
(
1
exp
x ,
f (x; ) =
0,
otro caso
Considrese los siguientes estimadores para
2)
4)
3 +4X4 )
T1 = X1 , T2 = (X1 +X
+ (X3 +X
, T2 = (X1 +2X2 +3X
y T4 = X
6
3
5
a. Cules son estimadores insesgados de ?
b. Entre los estimadores insesgados, Cul tiene la varianza ms pequea?
180
29. Sea X1 , X2 , . . . , Xn una muestra aleatoria de la funcin de densidad de

probabilidad
(
( + 1)y , 0 < y < 1 > 1
f (x; ) =
0
otro caso
Encuentre un estimador para por el mtodo de los momentos y el por
le mtodo de mxima verosimilitud.
30. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con funcin
de densidad de probabilidad uniforme en el intervalo (0, ) donde es
desconocida. Use el mtodo de momentos para estimar el parmetro
. Demuestre que el estimador encontrado es un estimador consistente
para .
31. Si X1 , X2 , . . . , Xn denotan una muestra aleatoria de la distribucin normal con media conocida = 0 y varianza desconocida 2 , encuentre el
estimador de 2 por el mtodo de los momentos.
probabilidad dada por
(
2
( y), 0 y
2
f (x; ) =
0,
otro caso
Encuentre un estimador para usando el mtodo de momentos.
33. Sea X1 , X2 , . . . , Xn de la funcin de densidad de probabilidad dada por
(
(2) 1
(1 x)1 , 0 y 1,
2x
[()]
f (x; ) =
0
otro caso
Encuentre un estimador para usando el mtodo de momentos.
1
Ayuda: E [X] = 12 y V [X] = 4(2+1)
.
34. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin uniforme
con funcin de densidad de probabilidad f (xi ; ) = 1/. Encuentre el
estimador de mxima verosimilitud para .
FaCyT-Matemticas
181
35. La funcin de verosimilitud L (x1 , x2 , . . . , xn ; ) toma valores diferentes dependiendo de los argumentos (x1 , x2 , . . . , xn ). Un mtodo para
deducir un estadstico suficiente mnimo desarrollado por Lehmann y
Scheff usa la relacin entre las verosimilitudes evaluadas en dos puntos
(x1 , x2 , . . . , xn ) y (y1 , y2 , . . . , yn ):
L (x1 , x2 , . . . , xn ; )
L (y1 , y2 , . . . , yn ; )
Muchas veces es posible hallar una funcin g (x1 , x2 , . . . , xn ) tal que
esta relacin no tenga parmetros desconocidos si y slo si
g (x1 , x2 , . . . , xn ) = g (y1 , y2 , . . . , yn )
Si se puede hallar esa funcin g, entonces g (X1 , X2 , . . . , Xn ) es un estadstico suficiente mnimo para .
a. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin de
Bernoulli. De acuerdo con el mtodo de Lehmann y Scheff, cul
es el estadstico suficiente mnimo para p?
b. Sea X1 , X2 , . . . , Xn una muestra aleatoria de la funcin de densidad de Weibull, dada por
n 2o
(
2x
exp x , x > 0
f (x; ) =
0,
otro caso
De acuerdo con el mtodo de Lehmann y Scheff, cul es el estadstico suficiente mnimo para ?
36. Sea X1 , X2 , . . . , X2n+1 una muestra aleatoria de una distribucin normal.
a. Pruebe que la media muestral y la mediana son estimadores insesgados para .
b. cul es la eficiencia de la mediana con relacin a la media? cul
de los dos estimadores prefiere?
37. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin Gamma
con parmetros de forma y escala (ambos desconocidos). Obtenga
por el mtodos de los momentos los estimadores para y .
182
38. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin binomial

negativa con parmetros p y k. Estimar por el mtodos de los momentos
los parmetros p y k.
b no es igual a
39. Demuestre que si b es un estimador insesgado de y V[]
2
2
b no es un estimador insesgado de .
cero, entonces ()
2
40. Demuestre que X es un estimador asintticamente insesgado de 2 .

41. Supngase que se utiliza el valor ms grande de una muestra aleatoria
de tamao n (es decir, el estadstico de orden n X(n) ) para estimar el
parmetro de la poblacin
(
1
, 0<x<
f (x; ) =
0, otro caso
Verifique se este estimador es
a. Un estimador insesgado
b. Un estimador consistente.
42. Dada una muestra aleatoria de tamao n tomada de una poblacin que
tiene la funcin de densidad
(
1
exp{ (x)
}, x >
f (x; ) =
0,
otro caso
donde < < y 0 < < , obtenga estimaciones simltaneas
de mxima verosimilitud para y .
43. Una mquina produce diariamente un lote de piezas. Un criterio basado
sobre normas de calidad vigente permite clasificar cada pieza fabricada como defectuosa o no defectuosa. El cliente aceptara el lote si la
proporcin de piezas defectuosas contenidas en el lote no sobrepasa
el valor 0 . El fabricante tiene que controlaar entonces la proporcin
de piezas defectuosas contenidas en cada lote que fabrica. Pero si la
cantidad de piezas N de cada lote es muy grande, no podr examinar
cada una para determinar el valor de . El fabricante efecta entonces
el control de calidad de una muestra aleatoria pequa con n piezas. Se
FaCyT-Matemticas
183
define la variable aleatoria X que toma el valor 1 si la pieza es defectuosa y 0 en el caso contrario. Sean X1 , X2 , . . . , Xn una muestra aleatoria
tomada del lote. Obtener el estimador de mxima verosimilitud de .
44. Sea X N (, 1) y la distribucin a priori N (0, 10).
a. Obtenga la distribucin a posteriori para .
b. Cul es la moda y la media de la distribucin a posteriori para
?
184
FaCyT-Matemticas
Captulo 4
Estimacin por intervalos
Una estimacin por intervalos de un parmetro desconocido es un intervalo

de la forma
lu
donde los puntos extremos l y u dependen de la estimacin b de para
b
una muestra aleatoria en particular, y de la distribucin de muestreo de .
b
Puesto que muestras diferentes producen estimaciones distintas de y, en
consecuencia, valores diferentes de los puntos extremos l y u, estos puntos
son valores de variables aleatorias, por ejemplo, L y U, respectivamente. De
b es posible determinar los valores de L y U
la distribucin de muestreo de
tales que la siguiente proposicin probabilstica sea verdadera:
P (L U ) = 1
donde 0 < < 1. Por lo tanto, se tiene una probabilidad de 1 de seleccionar una muestra aleatoria que produzca un intervalo que contenga el
valor verdadero de .
El intervalo resultante
lu
se conoce como intervalo de confianza del 100(1 ) % para el parmetro
desconocido . Las cantidades l y u reciben el nombre de lmite de confianza
inferior y superior, respectivamente, y 1 es el coeficiente de confianza.
4.1.
Interpretacin de un intervalo de confianza
La interpretacin de un intervalo de confianza radica en un sentido en una

probabilidad a largo plazo; es decir, si se recopila un nmero infinito de mues185
Sec 4.1. Interpretacin de un intervalo de confianza
186
tras aleatorias y se calcula un intervalo de confianza del 100(1 ) % para

, para cada una de las muestras, entonces el 100(1 ) % de esos intervalos
contienen el valor verdadero de .
Esta situacin se ilustra en la Figura (4.6), la cul presenta varios intervalos
de confianza del 100(1 ) % para el parmetro .
Figura 4.1: Construccin repetida de un intervalo de confianza para

Ntese que uno de los 20 intervalos no contiene el valor verdadero de . Si
el intervalo de confianza fuera del 95 %, esto significara que en una corrida
larga slo el 5 % de los intervalos no contendran a .
En la prctica, se obtiene slo una muestra aleatoria y se calcula un intervalo
de confianza del 100(1 ) %
lu
Este intervalo de confianza no es ms que una realizacin del intervalo aleatorio
[L, U ]
FaCyT-Matemticas
Cap 4. Estimacin por intervalos
187
con base en los datos de una sola muestra, en el que la estimacin de

b Dado que el valor de probabilidad de 100(1 ) % se refiere slo al
es .
intervalo aleatorio [L, U ], es incorrecto decir que la probabilidad de que se
encuentre contenido en el intervalo [l, u] es de 1 , es decir, no es razonable
asociar un nivel de probabilidad a este evento especifico. Esta proposicin
tiene una interpretacin de frecuencia; esto es, no se sabe si es correcta para
la muestra en particular, pero el mtodo utilizado para obtener el intervalo
[l, u] proporciona proposiciones correctas el 100(1 ) % de las veces. As,
cuando se escriba
P (l u) = 1
no se esta formulando ninguna proposicin probabilstica en el sentido clsica,
sino ms bien expresa un grado de confianza.
4.2.
Construcin de un intervalo de confianza:

Mtodo del pivote
Este mtodo consiste en determinar una cantidad que acte como pivote y
que posea las dos caracteristicas siguientes:
1. Que sea una funcin de una estadstica suficiente T y del parmetro
desconocido , donde sea la nica cantidad desconocida,
X = f (T, )
2. Que su distribucin de probabilidad no dependen del parmetro .
Como la probabilidad del evento del evento (a X b) no resulta afectada
por un cambio de escala o una translacin de X. Entonces se seleccionan dos
valores x1 y x2 tales que
P (x1 X x2 ) = 1
mediante una manipulacin algebraica se puede modificar el contenido entre
parntesis y expresarlo como
P (L (T ) U (T )) = 1
Sec 4.3. Intervalo de confianza para la media de una distribucin

normal
188
en donde L (T ) y U (T ) son funciones de la estadstica T y de esta forma
variables aleatorias.
Sustituyendo los estimadores calculados a partir de la muestra aleatoria en
L (T ) y U (T ), se obtiene el intervalo
lu
que recibe el nombre de intervalo de confianza bilateral, ya que se especifican los limites inferior y superior de . En algunas ocasiones puede ser til
construir intervalos de confianza unilaterales, de la forma:
P (L (T ) ) = 1
o
P ( U (T )) = 1
el primero es un intervalo de confianza unilateral inferior para , y el segundo
es un intervalo de confianza unilateral superior.
4.3.
Intervalo de confianza para la media de

una distribucin normal
4.3.1.
Caso en el que la varianza de la poblacin es conocida
Sea X una variable aleatoria y supngase que la distribucin de probabilidad

de dicha variable es normal con media (desconocida) y varianza 2 conocida.
Dada una muestra aleatoria X1 , X2 , . . . , Xn se utilizar como estimador puntual la media muestral X. Se sabe que la distribucin muestral de X es
normal con media y varianza 2 , es decir,

X N , 2 /n
En consecuencia, la variable aleatoria
Z=
/ n
FaCyT-Matemticas
189
sigue una distribucin normal estndar. Dicha variable se utilizar como cantidad pivote para calcular el intervalo de confianza para . Entonces, de la
figura (4.2)
Figura 4.2: P z 2 Z z1 2 = 1

P z 2 Z z1 2 = 1

X
z1 2 = 1
P z 2
/ n

P z2
X z1 2
=1
n
n

X =1
P z 2 X z1 2
n
n

P X z 2
X z1 2
=1
n
n

P X z1 2
X z 2
=1
n
n
Como z 2 = z1 2 , se tiene que

P X z1 2
X + z1 2
=1
n
n
(4.1)
es el intervalo aleatorio para . La probabilidad de que este intervalo de

confianza contenga el valor de la media es 1 . Si se sustituye la variable
aleatoria X en (4.1) por el estimado x calculado a partir de las realizaciones de
las variables aleatorias que constituyen la muestra aleatoria X1 , X2 , . . . , Xn ,

normal
190
se obtiene un intervalo de confianza estimado del 100(1 ) % para :

x z1 2
x + z1 2
n
n
en donde:

l = x z1 2
es el lmite de confianza inferior
y

u=x+z
1
2
es el lmite de confianza superior
Ejemplo 4.1. La nota de una prueba de aptitud siguen una distribucin normal con desviacin estndar 28 2. Una muestra aleatoria de nueve alumnos
arroja los siguientes resultados:
n = 9,
n
X
i=1
xi = 1098 y
n
X
x2i = 138148
i=1
a. Hallar un intervalo de confianza del 90 % para la media poblacional .

b. Razonar sin hacer clculos si la longitud de un intervalo del 95 % ser
menor, mayor o igual que la del obtenido en el item anterior.
c. Cul ser el tamao de la muestra mnimo necesaria para obtener un
intervalo del 90 % de nivel de confianza, con longitud 10? (la longitud
del intervalo es la diferencia entre sus extremos).
Solucin:
Solucin a.
Sea X la variable aleatoria que representa la nota del alumno, entonces X sigue una distribucin normal con media (desconocida) y desviacin estndar
= 28 2; el intervalo de confianza para es

x z1 2
n
donde z1 2 es el valor de la distribucin normal estndar que verifica
P Z z1 2 = 1
2
FaCyT-Matemticas
191
es decir, el valor que deja un rea igual a 1
a la izquierda.
Para los datos dados,

n
P
x=
xi
i=1
1098
= 122
9
como 1 = 0 9, entonces = 0 1 y
z1 2 = z1 0 1 = z0 95 = 1 95
2
por el enunciado se sabe que = 28 2. Entonces el intervalo de confianza

estimado para , es:

28 2
, o bien, 122 9 4
122 1 95
9
es decir,
106 6 137 5
Solucin b.
Observando el intervalo de confianza estimado para

x z1 2
n
para un coeficiente de confianza grande, el valor cuantil incrementa dando
como resultado un intervalo de confianza ms amplio.
Otra forma de justificar esto es recurriendo a la frmula del intervalo, que
nos dice que su longitud viene dado por:

Lo = x + z1 2
x z1 2
n
n
o
Lo = 2z1 2
(4.2)
n
Ahora, si y n permanecen fijos, para estudiar como vara Lo al cambiar
basta ver como vara el cuantil. Al intervalo del 95 % le corresponde:
1 = 0 95,
entonces = 0 05

normal
192
entonces disminuye. Por lo tanto, la cantidad z1 2 aumenta. En consecuencia, de la expresin (4.2) se ve que Lo aumenta.
Solucin c.
Ahora se pregunta por el valor de n para un y una longitud Lo dadas. De
la expresin (4.2), se tiene que

Lo = 2z1 2
n
de aqu
n = 2z1 2

Lo
y

2
n = 2z1 2
Lo
as que,

n = 2z1 2
2
2
28 2
= 2(1 65)
= 86 60
Lo
10
Ntese que el valor de n, por su significado, debe ser un nmero natural; as

que en este caso el tamao muestral mnimo es n = 87.

Seleccin del tamao muestral
Supngase que se especifica que el muestreo se efecta sobre una poblacin
que tiene una distribucin normal con media desconocida y varianza 2
conocida. Se desea estimar el tamao necesario de la muestra que, con probabilidad 1, la media muestral X se encuentre en un intervalo de confianza
igual a unidades de . Se tiene que:

P X z1 2
X + z1 2
=1
n
n
entonces

P | X |< = 1
en donde:

= z1 2
FaCyT-Matemticas
193
y
n=
z1 2
2
Ejemplo 4.2. Qu tan grande se debe tomar una muestra en el ejemplo

(4.1), si se requiere tener 90 % de confianza de que nuestra estimacin x de
difiera a lo sumo de 2 5 del verdadero valor de .
Solucin:
n=
z1 2
2
Como
= 2 5,
z1 2 = z0 95 = 1 65 y
= 28 2
entonces

n=
(1 65)(28 2)
2 5
2
= 346 41
por lo tanto, el tamao muestral ha de ser, como mnimo, de tamao n = 347

alumnos. Esto es, se puede tener una confianza del 90 % de que una muestra
aleatoria de tamao 347 alumnos proporcionar una estimacin x que difiera
de por una cantidad menor que 2 5.

Intervalos de confianza unilaterales
Un intervalo de confianza inferior estimado del 100(1 ) % para es:

x z1
mientras que el intervalo de confinza superior estimado del 100(1 ) % para

es:

x + z1
n

normal
194
4.3.2.
Caso en el que la varianza de la poblacin es desconocida
Con frecuencia se intenta estimar la media de una poblacin cuando se desconoce la varianza de la poblacin. De la Seccin (2.4.2) se sabe que si se tiene
una muestra aleatoria X1 , X2 , . . . , Xn de una distribucin normal, entonces
la variable aleatoria
X
T =
S/ n
tiene una distribucin t de Student con n 1 grados de libertad. Aqu S es
la desviacin estndar de la muestra aleatoria. Entonces, si la varianza 2 de
la poblacin es desconocida se puede utilizar T como cantidad pivote para
construir un intervalo de confianza estimado para del 100(1 ) %. De la
figura (4.3),
Figura 4.3: P t 2 ,n1 T t1 2 ,n1 = 1

se puede asegurar que

P t 2 ,n1 T t1 2 ,n1 = 1
donde: t1 2 ,n1 es el valor de t con n 1 grados de libertad, para el cul
deja un rea igual a 1 2 a la izquierda. Al sustituir por T, en la expresin
anterior

X
t1 2 ,n1 = 1
P t 2 ,n1
S/ n
FaCyT-Matemticas
195
Al multiplicar cada trmino en la desigualdad por S/ n, despus restar X

de cada trmino y multiplicar por 1, se obtiene

S
S
X t 2 ,n1
=1
P X t1 2 ,n1
n
n
como t 2 ,n1 = t1 2 ,n1 , se tiene el intervalo aleatorio:

S
S
P X t1 2 ,n1
X + t1 2 ,n1
=1
n
n
Para una muestra aleatoria particular de tamao n, se calcula la media x y
la desviacin estndar s y se obtiene el intervalo de confianza estimado del
100(1 ) % para

s
s
x t1 2 ,n1
x + t1 2 ,n1
n
n
Ejemplo 4.3. El contenido de siete contenedores similares de cido sulfrico con 9 8, 10 2, 10 4, 9 8, 10, 10 2 y 9 6 litros. Encuentre un intervalo de
confianza del 95 % para la media de todos los contenedores si se supone una
distribucin aproximadamente normal.
Solucin:
La media muestral y la desviacin estndar muestral para la muestra de tamao n = 7 son:
x = 10 y s = 0 283
Adems, el coeficiente de confianza es:
1 = 0 95 entonces
= 0 05 y
= 0 025
2
entonces, t1 2 ,n1 = t0 975,6 = 2 447. De aqu es intervalo de confianza estimado del 95 % para es:

0 283
0 283
10 (2 447)
10 + (2 447)
7
7
que se reduce a
9 74 10 26

Sec 4.4. Intervalo de confianza para la diferencia de medias de dos

poblaciones normales independientes
196
Un intervalo de confianza inferior estimado del 100(1 ) % para es:

s
x t1,n1
n
mientras que el intervalo de confinza superior estimado del 100(1 ) % para
es:

s
x + t1,n1
n
4.4.
Intervalo de confianza para la diferencia de

medias de dos poblaciones normales independientes
Supngase que se necesita comparar el rendimiento medio de dos procesos

diferentes de fabricacin, la calidad media de dos marcas diferentes de un
mismo artculo, la capacidad media de dos candidatos a un puesto de trabajo . . ., tales problemas pueden abordarse mediante el clculo de un intervalo
de confianza para la diferencias de medias de rendimientos, calidades, capacidades . . ., que son evaluadas por variables cuya distribucin pueda suponerse
normal.
4.4.1.
Caso de ambos varianzas conocidas
Sean X1 , X2 , . . . , Xn y Y1 , Y2 , . . . , Ym dos muestras aleatorias de dos distribuciones normales independientes, con medias x y y y varianzas x2 y y2
(conocidas), respectivamente. Si
n
P
X=
i=1
Xi
m
P
Yi
i=1
y Y =
n
m
son las medias muestrales para las muestras aleatorias de X y Y , respectivamente. Entonces, de la seccin (2.5), la variable aleatoria
Z=
X Y (x y )
q
y2
x2
+
n
m
(4.3)
FaCyT-Matemticas
197
tiene una distribucin normal estndar. La expresin (4.3) se puede usar como
cantidad pivote para construir un intervalo de confianza para la diferencia
x y . De la figura (4.2), se puede asegurar que:

(4.4)
P z1 2 Z z1 2 = 1
Sustituyendo (4.3) en (4.4)
X Y (x y )
q
z1 2 = 1
P z1 2
y2
x2
+m
n
Multiplicando por
r
x2 y2
+
n
m
restando la diferencia de medias muestrales X Y y, finalmente, multiplicando por 1 en todos sus miembros, se tiene que
!
r
r
x2 y2
x2 y2
+
x y X Y + z1 2
+
= 1
P X Y z1 2
n
m
n
m
Para muestras aleatorias particulares de tamaos n y m, se calculan los
valores de x y y y se obtiene el intervalo de confianza del 100(1 ) % para
x y
r
r
x2 y2
x2 y2
+
x y x y + z1 2
+
x y z1 2
n
m
n
m
en donde el valor cuantil z1 2 , es tal que:
P Z z1 2 = 1
2
Ejemplo 4.4. Construya un intervalo de confianza del 94 % para la diferencia real entre las duraciones de dos marcas de bombillo, si una muestra
aleatoria de 40 bombillos tomada de la primera marca tuv una duracin media de 418 horas y una muestra aleatoria de 50 bombillos de la segunda marca
dieron una duracin media de 402 horas. Las desviaciones estndar de las
dos poblaciones son 26 y 22 horas, respectivamente. Qu se puede concluir?

198
Solucin:
Si se denota con 1 y 2, la primera y segunda marca, respectivamente, entonces
x1 = 418 h
1 = 26 h
n1 = 40
x2 = 402 h
2 = 22 h
n2 = 50
como 1 = 0 94, entonces = 0 06 y 2 = 0 03. Entonces un intervalo de

confianza estimado del 94 % para la diferencia de las medias 1 2 viene
dado de la siguiente manera:
l 1 2 u
donde:
r
x2 y2
+
nr m
262 222
+
=418 402 z0 97
40
50
=16 1 88(5 16)
=16 9 7
=6 3 h
l =x y z1 2
y
r
x2 y2
+
nr m
262 222
=418 402 + z0 97
+
40
50
=16 + 1 88(5 16)
=16 + 9 7
=25 7 h
l =x y + z1 2
Por consiguiente, un intervalo de confianza del 94 % para la diferencia real

en la duracin promedio de las marcas de los bombillos es:
6 3 h 1 2 25 7 h
como el intervalo de confianza estimado no incluye al cero y contiene valores
positivos, implica que la duracin promedio de los bombillos de la primera
FaCyT-Matemticas
199
marca 1 es mayor a la duracin promedio de los bombillos de la segunda

marca 2 . Por tanto, este resultado nos permite afirmar, con el nivel de
confianza de 0 94, que la primera marca tiene mayor duracin media (mayor
media) que los bombillos de la segunda marca.

Seleccin del tamao de la muestra
Si los tamaos de las dos muestras aleatorias son iguales (nx = ny = n),
entonces puede determinarse el tamao requerido de la muestra de modo
que se tenga una confianza del 100(1 ) % en que el error de estimacin de
x y por x y sea menor que , esto es:

P | X Y (x y )| < = 1
(4.5)
como
r
P
| X Y (x y )| < z1 2
a partir de (4.5) y (4.6), se tiene que:

r
= z1 2
x2 y2
+
n
m
!
=1
(4.6)
x2 y2
+
n
m
resolviendo para n la ecuacin anterior, el tamao muestral necesario de

ambas muestras para alcanzar una cota de error con un nivel de confianza
dado es:
z1 2

2
n=
x2 + y2
Ejemplo 4.5. Un experimentador desea comparar la efectividad de dos mtodos de capacitacin para obreros que van a realizar una operacin de ensamble. los obreros seleccionados han de dividirse en dos grupos de igual
tamao, el primero para recibir el mtodo A de capacitacin y el segundo el
mtodo B de capacitacin. Despus de la capacitacin cada obrero realizar
la operacin de ensamble y se registrar el tiempo que le tome hacerlo. La
variabilidad de cada mtodo de ensamble es aproximadamente de 2 = 4. Si
la estimacin de la diferencia en los tiempos promedio de ensamble debe ser
correcta con una variacin de no ms de 1 minuto con probabilidad de 0 95,

200
cuntos trabajadores deben incluirse en cada grupo?
Solucin:
Si se puede suponer normalidad en los tiempos de ensamble para cada mtodo
y como el tamao de la muestra es la misma para ambos grupos, entonces el
tamao de trabajadores que debe incluirse en cada grupo viene dada por la
siguiente expresin
z1 2

2
A2 + B2
n=
donde 1 = 0 95, entoces = 0 05 y /2 = 0 025. Por lo tanto

z
2
0 975
n=
(4 + 4) = 8(1 96)2 = 30 73
1
de esta manera, se deben incluir al menos 31 trabajadores en cada grupo para
tener una confianza del 95 % en que el error de estimacin de la diferencia
A B por xA xB ser menor que 1 minuto.

Un intervalo unilateral superior del 100(1 ) % de confianza para x y
es:
r
x2 y2
+
x y x y + z1
n
m
mientras que un intervalo unilateral inferior del 100(1 ) % de confianza
es:
r
x2 y2
x y z1
+
x y
n
m
4.4.2.
Caso en que las varianzas son desconocidas pero

iguales
Sean X1 , . . . , Xn y Y1 , . . . , Ym dos muestras aleatorias de dos poblaciones

normales independientes con medias x y y ambas con igual varianzas 2 ,
desconocida. Si
n
m
n
2
P
P
P
Xi
Yi
Xi X
X = i=1 , Y = i=1 , Sx2 = i=1
n
m
n1
FaCyT-Matemticas
201
n
P
Sy2 =
Yi Y
2
i=1
Sp2 =
m1
Entonces, de la Seccin (2.5), la variable
T =
(n 1)Sx2 + (m 1)Sy2
n+m2
X Y (x y )
q
Sp n1 + m1
(4.7)
tiene una distribucin t de Student con n + m 2 grados de libertad. La expresin (4.7) se puede usar como cantidad pivote para construir un intervalo
de confianza estimado del 100(1 ) % para la diferencia x y cuando las
varianzas de ambas poblaciones son desconocidas pero iguales. De la figura
(4.3), se puede asegurar que

(4.8)
P t1 2 ,n+m2 T t1 2 ,n+m2 = 1
sustituyendo (4.7) en (4.8), se tiene que:
X Y (x y )
q
P t1 2 ,n+m2
t1 2 ,n+m2 = 1
1
1
Sp n + m
Multiplicando por
r
Sp
1
1
+
n m
restando la diferencia de medias muestrales X Y y, finalmente, multiplicando por 1 en todos sus miembros, se tiene que
r
P
X Y t1 2 ,n+m2 Sp
1
1
+
x y X Y + t1 2 ,n+m2 Sp
n
m
1
1
+
n
m
!
= 1
Si x, y, s2x y s2y son las medias y las varianzas de dos muestras aleatorias
de tamaos n y m, respectivamente, tomadas de dos poblaciones normales e
independientes con varianzas desconocidas pero iguales, entonces un intervalo
de confianza estimado del 100(1 ) % para la diferencia entre las medias
x y es:
r
r
1
1
1
1
x y t1 2 ,n+m2 sp
+
x y x y + t1 2 ,n+m2 sp
+
n m
n m

202
donde:
(n 1)s2x + (m 1)s2y
n+m2
es el estimador combinado de la desviacin estndar comn de la poblacin,
y t1 2 ,n+m2 es el valor cuantil tal que:
P T t1 2 ,n+m2 = 1
2
Ejemplo 4.6. Para alcanzar la mxima eficiencia al realizar una operacin
de ensamble en una planta manufacturera, obreros nuevos requieren aproximadamente un periodo de capacitacin de 1 mes. Se sugirieron un nuevo
mtodo de capacitacin y se realiz un examen para comparar el nuevo mtodo contra el procedimiento estndar. Dos grupos de nueve obreros nuevos
cada unos fueron capacitados durante 3 semanas, un grupo usando el nuevo mtodo y el otro siguiendo el procedimiento estndar de capacitacin. El
tiempo (en minutos) requerido por cada obrero para ensamblar el dispositivo
se registr al final del periodo de 3 semanas. Las mediciones resultantes son
las que se muestran en la siguiente tabla
sp =
Estndar
Nuevo
32
35
37
31
35
29
28
25
41
34
44
40
35
27
31
32
34
31
Calcule la diferencia real de la medias E N con un coeficiente de confianza

de 0 95. Suponga que los tiempos de ensamble estn distribuidos normalmente en forma aproximada, que las varianzas de los tiempos de ensamble son
aproximadamente iguales para los dos mtodos y que las muestras son independientes.
Solucin:
Para los datos de la tabla
xE = 35 22 h
sE = 24 445 h
nE = 9
xN = 31 56 h
sN = 20 027 h
nN = 9
Como 1 = 0 95, entonces = 0 05 y 2 = 0 025. Entonces, un intervalo

de confianza del 95 % para la diferencia de las medias E N viene dado
de la siguiente manera:
l E N u
FaCyT-Matemticas
203
donde:
r
l =x y t1 2 ,n+m2 sp
1
1
+
n m
r
=35 22 31 56 t0 975,16 (4 716)

r
2
=3 66 (2 120)(4 716)
9
=3 66 4 71
= 1 05
1 1
+
9 9
y
r
u =x y + t1 2 ,n+m2 sp
1
1
+
n m
r
=35 22 + 31 56 t0 975,16 (4 716)

r
2
=3 66 + (2 120)(4 716)
9
=3 66 + 4 71
=8 37
1 1
+
9 9
por consiguiente, un intervalo de confianza del 95 % para la diferencia E N

es:
1 05 E N 8 37
Como el intervalo de confianza estimado del 95 % contiene valores positivos y
negativos, se puede decir que ninguno de los mtodos de capacitacin produce
un tiempo medio de ensamble que difiera uno del otro.

Un intervalo de confianza superior estimado del 100(1 ) % para x y
es:
r
1
1
x y x y + t1,n+m2 sp
+
n m

204
mientras que el intervalo de confianza estimado superior del 100(1 ) %
para x y es:
r
1
1
+
x y
x y t1,n+m2 sp
n m
4.4.3.
Caso en que las varianzas son desconocidas y distintas
De la seccin (2.5.3), se sabe que la variable:

T =
X Y (x y )
q
Sy2
Sx2
+
nx
ny
(4.9)

libertad dados por:
2
Sx2 /nx + Sy2 /ny
=
(4.10)
2 2
(Sy2 /ny )
(Sx2 /nx )2
+ ny +1
nx +1
Por tanto, se puede usar la expresin (4.9) como cantidad pivote para construir un intervalo de confianza del 100(1 ) % para x y . De la figura
(4.3), se tiene que:

(4.11)
P t1 2 T t1 2 1
El intervalo de confianza para x y puede obternerse si se sustituye T en
la expresin (4.9) y se despeja el trmino x y entre las desigualdades.
Si x, y, s2x y s2y son las medias y las varianzas de dos muestras aleatorias de
tamaos nx y ny , respectivamente, tomadas de dos poblaciones normales e
independientes con varianzas desconocidas y distintas, entonces un intervalo
de confianza estimado del 100(1 ) % para la diferencia entre las medias
x y es:
s
s
s2y
s2x
s2x
sy
x y t1 2 ,
+
x y x y + t1 2 ,
+
nx ny
nx ny
donde: est dada por la expresin (4.10) y t1 2 , es el valor cuantil tal que
P T t1 2 , = 1
2
FaCyT-Matemticas
205
Ejemplo 4.7. Se piensa que la concentracin del ingrediente activo de un

detergente lquido para ropa, es afectada por el tipo de catalizador utilizado en
el proceso de fabricacin. Se realizan 10 obervaciones con cada catalizador, y
se obtienen los datos siguientes:
Catalizador 1
Catalizador 2
57 9
66 4
66 2
71 7
65 4
70 3
65 4
69 3
65 2
64 8
62 6
69 6
67 6
68 6
63 7
69 4
67 2
65 3
71
68 8
Encuentre un intervalo de confianza del 95 % para las diferencias de las concentraciones activas promedio, suponiendo que las varianzas no son iguales.
Solucin:
Para los datos de la Tabla
x1 = 65 22
s1 = 3 44
n1 = 10
x2 = 68 42
s2 = 2 22
n2 = 10
Como 1 = 0 95, entonces = 0 05 y
2
s1
n1
s2
2
n2
s21
s2
+ n22
n1
2 2

n1 1
2
= 0 025 y
2
(3 44)2
(2 22)2
+
10
10

2 2
2 2

n2 1
(3 44)
10
101
(2 22)
10
101
(1 68)
2 82
=
0 16 + 0 03
0 19
= 14 84 14
Un intervalo de confianza del 95 % para la diferencia de las concentraciones

activas promedio suponiendo que las varianzas no son iguales, viene dado
por:
l 1 2 u

206
donde:
s
s2
s21
+ 2
n1 n1
r
(3 44)2 (2 22)2
= 65 22 68 42 t0 975,14
+
10
10
= 3 2 (2 14)(1 29) = 3 2 2 76
= 5 96
l = x1 x2 t1 2 ,
y
s
s21
s2
+ 2
n1 n1
r
(3 44)2 (2 22)2
= 65 22 68 42 + t0 975,14
+
10
10
= 3 2 + (2 14)(1 29) = 3 2 + 2 76
= 0 44
u = x1 x2 + t1 2 ,
de esta manera, el intervalo de confianza estimado del 95 % para 1 2 es:

5 96 1 2 0 44
Observe que el intervalo de confianza no contiene el cero, entonces la concentracin promedio del ingrediente activo si se ve afectada por el tipo de
catalizador utilizado.

Un intervalo de confianza superior estimado del 100(1 ) % para x y
es:
s
s2y
s2x
+
x y x y + t1,
nx ny
mientras que el intervalo de confianza inferior estimado del 100(1) % para
x y es:
s
s2y
s2x
x y t1,
+
x y
nx ny
FaCyT-Matemticas
207
4.5.
Intervalo de confianza para la varianza de

Supngase que se desea obtener un intervalo de confianza estimado del 100(1

) % para la varianza 2 de una poblacin normal. Si X1 , X2 , . . . , Xn es una
muestra aleatoria de tamao n tomada de esta poblacin normal, y si S 2 es
la varianza muestral, entonces, de la seccin (2.4) se sabe que si la poblacin
es normal, la variable
(n 1)S 2
(4.12)
X=
2
sigue una distribucin chi-cuadrada con n 1 grados de libertad. La expresin (4.12) se puede usar como cantidad pivote para construir un intervalo
de confianza del 100(1 ) % para la varianza 2 de una poblacin normal.
De la figura (4.4)
Figura 4.4: P 2 ,n1 X 21 ,n1 = 1

2
Se nota que:

,n1
2
21 ,n1
2
=1
Sustituyendo (4.12) en (4.13), se tiene que:

(n 1)S 2
2
2
1 ,n1 = 1
P ,n1
2
2
2
La expresin anterior se puede escribir de la siguiente manera:
!
2
(n 1)S 2
(n
1)S
P
=1
2
21 ,n1
2 ,n1
2
(4.13)
Sec 4.5. Intervalo de confianza para la varianza de una

distribucin normal
208
Si s2 es la varianza muestral de una muestra aleatoria tomada de una distribucin normal con varianza desconocida 2 , entonces un intervalo de confianza
estimado del 100(1 ) % para 2 es:
(n 1)s2
(n 1)s2
2
21 ,n1
2 ,n1
2
donde: ,n1 y
2
21 ,n1
2
son los valores cuantiles tales que

2
P X ,n1 =
2
2

P X 21 ,n1 = 1
2
2
respectivamente.
Ejemplo 4.8. Un experimentador desea comprobar que la variabilidad de
mediciones obtenidas al usar un equipo diseado para medir el volumen de
una fuente de audio. Doces mediciones independientes registradas por este
equipo para la misma fuente de sonido fueron
4 1
10 2
3 9 3 8 5 2 4 3
7 1 6 7 8 8 9 7
4
5 9
Determine un intervalo de confianza para 2 del 90 %.

Soluccin:
Para los datos n = 12 y s2 = 5 5481. Si se puede suponer normalidad en las
mediciones registradas por este equipo, entonces un intervalo de confianza
estimado para 2 del 90 %, viene dado por:
(n 1)s2
(n 1)s2
2
21 ,n1
2 ,n1
2
donde:
l=
(n 1)s2
21 ,n1
2
(11)(5 5481)
61 0291
=
2
0 95,11
19 6752
= 3 1018
FaCyT-Matemticas
209
y
l=
(n 1)s2
2 ,n1
2
61 0291
(11)(5 5481)
=
=
2
0 05,11
4 5748
= 13 3402
de esta manera
3 1018 2 13 3402

Un intervalo de confianza superior estimado del 100(1 ) % para 2 es:
2
(n 1)S 2
2,n1

2 es:
(n 1)s2
2
2
1,n1
4.6.
Intervalo de confianza para el cociente de

las varianzas de dos distribuciones normales
Supngase que se tienen dos poblaciones normales e independientes con

varianzas desconocidas x2 y y2 , respectivamente. Sean X1 , X2 , . . . , Xnx y
Y1 , Y2 , . . . , Yny dos muestras aleatorias de tamaos nx y ny , respectivamente;
si Sx2 y Sy2 son las varianzas nuestrales, entonces, de la seccin (2.6) se sabe
que la variable
S 2 / 2
(4.14)
F = x2 x2
Sy /y
Sec 4.6. Intervalo de confianza para el cociente de las varianzas de

dos distribuciones normales
210
sigue una distribucin F con nx 1 y ny 1 grados de libertad en el numerador y denominador, respectivamente. La expresin (4.14) se puede usar
como cantidad pivote para encontrar un intervalo de confianza estimado del
100(1 ) % para y2 /x2 . De la figura (4.5)
Figura 4.5: P f 2 ,nx 1,ny 1 F f1 2 ,nx 1,ny 1
se observa que:

P f 2 ,nx 1,ny 1 F f1 2 ,nx 1,ny 1 = 1
(4.15)
Sustituyendo la expresin (4.14) en (4.15), se tiene

Sx2 /x2
P f 2 ,nx 1,ny 1 2 2 f1 2 ,nx 1,ny 1 = 1
Sy /y
Por consiguiente,

2
y2
Sy2
Sy
f ,n 1,ny 1 2 2 f1 2 ,nx 1,ny 1 = 1
P
Sx2 2 x
x
Sx
Si s2x y s2y son las varianzas muestrales de las dos muestras aleatorias de
tamaos nx y ny , respectivamente, tomadas de dos poblaciones normales e
independientes con varianzas desconocidas x2 y y2 , entonces un intervalo de
confianza estimado del 100(1 ) % para y2 /x2 es:
y2
s2y
s2y
f1 2 ,nx 1,ny 1
,n 1,ny 1
s2x 2 x
x2
s2x
FaCyT-Matemticas
211
donde f 2 ,nx 1,ny 1 y f1 2 ,nx 1,ny 1 son los valores cuantiles tale que:

P F f 2 ,nx 1,ny 1 =
2
y
P F f1 2 ,nx 1,ny 1 = 1
2
respectivamente.
Ejemplo 4.9. Considere el ejemplo (4.7), construya un intervalo de confianza del 95 % para el cociente de las varianzas poblacionales 12 /22 . Parece
razonable concluir que las varianzas no son iguales?
Solucin:
Si se puede suponer normalidad en los datos obtenidos por cada catalizador,
entonces un intervalo de confianza estimado del 95 % para el cociente de las
varianzas poblacionales 12 /22 , viene dado por:
12
s21
s21
f1 2 ,n2 1,n1 1
,n
1,n
1
1
s22 2 2
22
s22
donde:
s21
f ,n 1,n2 1
s22 2 1
(3 44)2
f0 025,9,9 = (2 4)(0 248)
=
(2 22)2
= 0 5952
l=
y
s21
f1 2 ,n1 1,n2 1
s22
(3 44)2
=
f0 025,9,9 = (2 4)(4 026)
(2 22)2
= 9 6624
u=
entonces, el intervalo de confianza estimado del 95 % para el cociente de las

varianzas poblacionales 12 /22 es:
0 5952
12
9 6624
22
Sec 4.7. Intervalo de confianza para el parmetro p cuando se

muestra una distribucin binomial
212
Como el intervalo de confianza contiene el uno, no es razonable suponer que
las varianzas no son iguales.

Un intervalo de confianza superior estimado del 100(1 ) % para y2 /x2 es:
y2
s2y
f1,nx 1,ny 1
x2
s2x
y2 /x2 es:
s2y
y2
f,nx 1,ny 1 2
s2x
x
4.7.
Intervalo de confianza para el parmetro p

cuando se muestra una distribucin binomial
Supongase que se necesita calcular un intervalo de confianza para el parmetro p desconocido de una distribucin binomial. Dada una muestra aleatoria
de tamao n, se estima p mediante la proporcin muestral
X
Pb =
n
en donde, X sigue una distribucin binomial con parmetros n y p. Cuando
el tamao muestral es suficientemente grande, la distribucin de
Pb p
Z=q
(4.16)
p(1p)
n
puede considerarse aproximadamente normal con media cero y varianza uno.
FaCyT-Matemticas
213
Mediante un proceso idntico al seguido para obtener (4.1) resulta el intervalo

de confianza para p. Sea z1 2 el valor cuantil de una distribucin normal de
media cero y varianza uno. Entonces se verifica que:
b
P p
P z1 2 q
z1 2 ' 1
(4.17)
p(1p)
n
Si en las desigualdades de (4.17) se multiplica por

r
p(1 p)
n
se resta la proporcin muestral Pb, y se multiplica por 1 en todos sus miembros, queda el intervalo aleatorio
!
r
r
p(1
p)
p(1
p)
P Pb z1 2
p Pb + z1 2
'1
(4.18)
n
n
Observe, que los lmites inferior y superior del intervalo de confianza obtenidos a partir de la expresin (4.18) contienen el parmetro desconocido p.
Sin embargo, una solucin a este problema es remplazar p por Pb, lo que da
como resultado
s
s
b
b
b
b
P (1 P )
P (1 P )
p Pb + z1 2
' 1 (4.19)
P Pb z1 2
n
n
De esta forma, un intervalo de confianza aproximado del 100(1 ) % para
el parmetro de proporcin p, es
r
r
pb(1 pb)
pb(1 pb)
pb z1 2
p pb + z1 2
(4.20)
n
n
en donde el estimador pb = x/n se obtiene de la muestra aleatoria de tamao
n.
Ejemplo 4.10. En una muestra aleatoria de 85 soportes para el cigueal de
un motor de automvil, 10 tienen un terminado que es ms rugoso de lo que
las especificaciones permiten. Determine un intervalo de confianza estimado
Sec 4.7. Intervalo de confianza para el parmetro p cuando se

muestra una distribucin binomial
214
del 95 % para la verdadera proporcin p de soportes en la poblacin que exceden las especificaciones de rigosidad.
Solucin:
La estimacin puntual de la proporcin de soportes en la poblacin que exceden las especificaciones de rigosidad es
pb =
10
x
=
= 0 12
n
85
un intervalo de confianza estimado para p viene dado por:

r
r
pb(1 pb)
pb(1 pb)
pb z0 025
p pb + z0 025
n
n
o
r
r
0 12(0 88)
0 12(0 88)
0 12 1 96
p 0 12 + 1 96
85
85
lo cual se reduce a
0 05 p 0 19
(4.21)
(4.22)
4.7.1.
Seleccin de la muestra
Cuando sea posible seleccionar el tamao de la muestra, puede escogerse

a n de modo que exista una confianza del 100(1 ) % de que el error de
estimacin es menor que algn valor especificado . De la expresin (4.18), se
tiene una confianza aproximadap
del 100(1) % de que el error de estimacin
b
= |P p| es menor que z1 2 p(1 p)/n. Igualando
r
= z1 2
p(1 p)
n
y se resuelve para n, el tamao de la muestra es:

n=
z1 2
2
p(1 p)
(4.23)
Notes que para utilizar la ecuacin (4.23) se requiere conocer el valor del
parmetro desconocido p. Una manera de resolver el problema es siendo
FaCyT-Matemticas
215
conservador y elegir p de manera que el valor de p(1 p) sea un mximo

(0 p 1), esto es, seleccionar n utilizando el hecho de que el tamao de
la muestra obtenido en la ecuacin (4.23) siempre es mximo para p = 0 5, y
esto se puede usar para obtener una cota superior sobre n. Entonces, se tiene
una confianza del 100(1 ) % de que el error de estimacin de p por pb sea
menor que si el tamao de la muestra es
n=
z1 2
2
(0 25)
(4.24)
Ejemplo 4.11. Considere el Ejemplo (4.10). Qu tan grande debe ser el

tamao de la muestra si se desea tener una confianza del 95 % de que el error
al utilizar pb como estimacin de p sea menor que 0 05?
Solucin:
Utilizando la ecuacin (4.24), el tamao de la muestra es:

2
2
z
1 96
0 025
n=
(0 25) ' 385
(0 25) =
0 05

Un intervalo de confianza inferior estimado del 100(1 ) % para p es:
r
pb(1 pb)
pb z1
p
(4.25)
n
y, un intervalo de confianza superior estimado del 100(1 ) % para p es:
r
pb(1 pb)
p pb + z1
(4.26)
n
4.8.
Intervalo de confianza para la diferencias

de proporciones
Supongase que se necesita construir un intervalo de confianza para la diferencias de proporciones p1 p2 de dos distribuciones binomiales. Dadas dos
Sec 4.8. Intervalo de confianza para la diferencias de proporciones

216
muestras aleatorias de tamao n1 y n2 , la variable aleatoria
Pb1 Pb2 (p1 p2 )
Z=q
b
Pb1 (1Pb1 )
Pb2 )
+ P2 (1
n1
n2
(4.27)
puede considerarse aproximadamente normal con media cero y varianza uno.

Mediante un proceso idntico al seguido para obtener (4.1) resulta el intervalo
de confianza para p. Sea z1 2 el valor cuantil de una distribucin normal de
media cero y varianza uno. Entonces se verifica que:
b
b
P1 P2 (p1 p2 )
z1 2 ' 1
(4.28)
P z1 2 q
Pb1 (1Pb1 )
Pb2 (1Pb2 )
+
n1
n2
Si en las desigualdades de (4.28) se multiplica por
s
Pb1 (1 Pb1 ) Pb2 (1 Pb2 )
+
n1
n2
se resta la diferencias de proporciones muestrales Pb1 Pb2 , y se multiplica por
1 en todos sus miembros, queda el intervalo aleatorio
P Pb1 Pb2 z1
2
Pb1 (1 Pb1 )
Pb2 (1 Pb2 )
+
p1 p2 Pb1 Pb2 + z1
2
n1
n2
Pb1 (1 Pb1 )
Pb2 (1 Pb2 )
+
n1
n2
(4.29)
que es, de forma aproximada 1 para n grande. De esta forma, un intervalo

de confianza aproximado del 100(1 ) % para el parmetro de proporcin
p, es
r
pb1 pb2 z
1
2
pb1 (1 pb1 )
pb2 (1 pb2 )
+
p1 p2 pb1 pb2 + z1 2
n1
n2
pb1 (1 pb1 )
pb2 (1 pb2 )
+
n1
n2
(4.30)
en donde el estimador pb1 = x1 /n1 y pb2 = x2 /n2 se obtiene de las muestras

aleatorias de tamao n1 y n2 , respectivamente.
Ejemplo 4.12. Considere el proceso de fabricacin de soportes para cigueales del Ejemplo (4.10). Supngase que se hace una modificacin al proceso de
acabado de la superficie y que, de manera subsecuente, se toma una segunda
FaCyT-Matemticas
217
muestra aleaoria de 85 ejes. El nmero de ejes defectuosos es esta segunda

muestra es 8. Determine un intervalo de confianza estimado del 95 % para
la diferencia de proporciones de los soportes defectuosos por ambos procesos.
Qu concluye sobre los cambios hechos al proceso de acabado de la superficie?
Solucin:
Como n1 = 85, pb1 = 0 12, n2 = 85, pb2 = 0 09. Un intervalo de confianza
estimado del 95 % para la diferencia p1 p2 , se puede obtener de la expresin
(4.30), de la siguiente manera:
r
pb1 pb2 z0 025
pb1 (1 pb1 )
pb2 (1 pb2 )
+
p1 p2 pb1 pb2 + z0 025
n1
n2
o
r
0 120 091 96
0 12(0 88)
0 09(0 91
+
p1 p2 0 120 09+1 96
85
n2
pb1 (1 pb1 )
pb2 (1 pb2 )
+
n1
n2
(4.31)
0 12(0 88)
0 09(0 91
+
85
n2
(4.32)
lo cual se reduce
0 06 p1 p2 0 12
Como este intervalo de confianza incluye al cero, con base en los datos muestrales, parece poco probable que los cambios hechos en el proceso de acabado de
la superficie hayan reducido el nmero de soportes defectuosos para cigueal
producidos por el proceso.

Un intervalo de confianza inferior estimado del 100(1 ) % para p1 p2 es:
s
pb1 pb2 z1
pb1 (1 pb1 ) pb2 (1 pb2 )

+
p1 p2
n1
n2
(4.33)
y, un intervalo de confianza superior estimado del 100(1 ) % para p1 p2

es:
s
pb1 (1 pb1 ) pb2 (1 pb2 )
p1 p2 pb1 pb2 z1
+
(4.34)
n1
n2
4.9.
218
Ejercicios Propuestos
1. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin Poisson con

parmetro , cuando n es relativamente grande, la media muestral X
es aproximadamente normal con media y varianza /n.
a. Cul es la distribucin (aproximada) de la siguiente variable?
X
p
/n
b. Utilice los resultados del inciso a. para encontrar un intervalo de
confianza del 100(1 ) % para .
2. Se supone que la duracin de una pila elctrica para calculadora de
bolsillo tiene distribucin normal. Se prueba una muestra aleatoria de
10 pilas hasta el agotamiento, y se obtienen las duraciones siguientes:
25 5 h 26 1 h
26 8
23 2
24 2
28 4
25 0
27 8
27 3
25 7
Determine un intervalo de confianza bilateral al 90 % para la duracin
media.
3. Con los datos del Ejercicio anterior, fije un lmite inferior de confianza
al 95 % para la duracin media.
4. Una variable aleatoria distribuida normalmente tiene una media desconocida , y varianza conocida 2 = 16. Encuentre el tamao muestral
necesario para establecer un intervalo de confianza bilateral al 95 %
para , con una amplitud total de 1.
5. Considere los datos del Ejercicio (2). Determine un intervalo de confianza bilateral al 90 % para la varianza de la duracin de las pilas.
Convierta este intervalo en un intervalo de confianza correspondiente
para la desviacin estndar de la duracin de las pilas.
FaCyT-Matemticas
219
6. Se supone que el voltaje de salida de una fuente de energa tiene distribucin normal. Enseguida se presentan 16 observaciones de voltaje.
10 35 9 30
11 65 12 00
11 54 9 95
10 44 9 25
10 00
11 25
10 28
9 38
9 96
9 58
8 37
10 85
a. Determine un intervalo de confianza bilateral al 95 % para .

b. Determine un intervalo de confianza bilateral al 95 % para 2 .
c. Determine un intervalo superior de confianza bilateral al 95 % para
2.
7. Se investiga el dimetro de las varillas de acero fabricadas en dos diferentes mquinas de extrusin. Para ello se toman dos muestras aleatorias de tamaos n1 = 15 y n2 = 18; las medias y las varianzas muestrales son x1 = 8 73, s21 = 0 35, x2 = 8 68 y s22 = 0 40, respectivamente.
Suponga que 12 = 22 . Construya un intervalo de confianza bilateral del
95 % para la diferencia en el dimetro promedio de varilla.
8. Se toman dos muestras aleatorias de tamaos n1 = 15 y n2 = 10 de

dos termocoples diferentes. Las medias y la varianzas muestrales son
x1 = 300, s21 = 16, x2 = 305 y s22 = 49, respectivamente. Suponga
que 12 6= 22 . Construya un intervalo de confianza bilateral del 95 %
para 1 2 . Qu conclusin puede obtenerse sobre las lecturas de
temperatura promedio de los dos termocoples?
9. El administrador de un lote de automviles prueba dos marcas radiales.

Para ello asigna al azar una llanta de cada marca a las dos ruedas
posteriores de ocho automviles, y luego corre los automviles hasta que
las llantas se desgastan. Los datos obtenidos (en kilometros) aparecen
220
en la siguiente tabla
Automvil Marca 1 Marca 2

1
2
3
4
5
6
7
8
36925
45300
36240
32100
37210
48360
38200
33500
34318
42280
35500
31950
38045
47800
37810
33215
Encuentre un intervalo de confianza del 99 % para la diferencia en el

tiempo promedio de duracin. Con base en estos clculos, qu llanta
es la que usted preferira?
10. Se usan dos mquinas para llenar botellas de vidrio con gaseosa. Los
procesos de llenado tienen desviaciones estndares conocidas 1 = 0 010
L y 2 = 0 015 L, respectivamente. Una muestra aleatoria de n1 = 25
botellas de la maquina 1, y una muestra aleatoria de n2 = 20 botellas de la mquina 2, dan como resultado contenidos medios netos de
x1 = 2 04 L y x1 = 2 07 L, respectivamente. Determine un intervalo
de confianza de 95 % para la diferencia en volumen medio de llenado. Concluira, con base en los resultados de este clculo, que ambas
mquinas producen el mismo volumen de llenado?.
11. Dos tcnicos de control de calidad miden el acabado de la superficie de

una pieza metlica, obteniendo los resultados siguientes. Suponga que
FaCyT-Matemticas
221
las mediciones se distribuyen normalmente

Tcnico 1 Tcnico 2
1 45
1 37
1 21
1 54
1 48
1 29
1 34
1 54
1 41
1 56
1 37
1 20
1 31
1 27
1 35
a. Fije un intervalo de confianza al 95 % para la diferencia media

de las mediciones de acabado de superficie, suponiendo que las
varianzas son iguales.
b. Obtenga una estimacin para el cociente de las varianzas del error
de las medicin de los tcnicos, mediante un intervalo de confianza
al 95 %.
c. Determine un intervalo de confianza al 95 % para la varianza de
las mediciones del tcnico 2.
12. Se ha estudiado de manera extensa un sistema operativo para computadoras personales, y se sabe que la desviacin estndar del tiempo de
respuesta de un comando en particular es = 8 milisegundos. Se instalauna nueva versin del sistema operativo, y se desea estimar el tiempo
de respuesta promedio para el nuevo sistema de modo que pueda asegurarse que el intervalo de confianza del 95 % para tiene una longitud
a lo ms de cinco milisegundos. Si puede suponerse que el tiempo de
respuesta tiene una distribucin normal y que = 8 para el nuevo
sistema, que tamao de muestra recomendara utilizar?
13. Se investiga la resistencia a la tensin de ruptura del hilo proporcionado
por dos fabricantes. De la experiencia con los procesos de los fabricantes, se sabe que 1 = 5 psi y 2 = 4 psi. Una muestra aleatoria de
20 especmenes de prueba provenientes de cada fabricante arroja como
resultados x1 = 88 psi y x2 = 91 psi, respectivamente. Encuentre un
intervalo de confianza del 90 % para la diferencia entre las medias de la
222
tensin de ruptura. Existe alguna evidencia que apoye la afirmacin

de que el hilo del fabricante 2 tiene una mayor resistencia media?
14. En el ejercicio (13), supngase que se desea construir un intervalo de
confianza del 90 % para 1 2 , de modo que el error al estimar esta
cantidad sea menor que 1 5 psi. Cul es el tamao de la muestra que
debe tomarse de cada pobalcin?
15. Se utilizan dos procesos diferentes de templado, uno con agua salada y
otro con aceite, en muestras de un tipo particular de aleacin metlica.
Los resultados se muestran a continuacin. Considere que la dureza (o
grado de temple) est distribuida normalmente.
Templado de agua salada
Templado en aceite
145
150
153
148
141
152
146
154
139
148
152
150
147
155
140
146
158
152
151
143
a. Fije un intervalo de confianza al 95 % para la diferencia en dureza,

suponiendo que las varianzas son iguales.
b. Construya un intervalo de confianza al 95 % para la razn 12 /22 .
16. Una muestra aleatoria de 200 tarjetas de circuitos impresos contiene
25 piezas defectuosas. Estime la fraccin de disconformes del proceso.
Determine un intervalo de confianza bilateral al 90 % para la verdadera
fraccin de disconformes en el proceso de fabricacin.
17. Una muestra aleatoria de 500 piezas contiene 75 disconformes. Estime
la fraccin de disconformidades del proceso. Fije un intervalo superior
de confianza al 95 % para la verdadera fraccin de disconformes del
proceso.
FaCyT-Matemticas
223
18. Se usan dos procesos para fabricar piezas forjadas que se utilizan en el
montaje de un ala de avin. De 200 piezas, seleccionadas del proceso
1, se tiene que 30 no cumplen con las especificaciones de resistencia,
mientras que 300 piezas, seleccionadas del proceso 2, 40 no estn conformes. Calcule la fraccin de disconformes para cada proceso. Determine
un intervalo de confianza al 90 % para la diferencia en la fraccin de
disconformes de los dos procesos.
19. Se analiza la fraccin de productos defectuosos producidos por dos lneas de produccin. Una muestra aleatoria de 100 unidades provenientes de la lnea 1 contiene 10 que son defectuosas, mientras que una
muestra aleatoria de 120 unidades de la lnea 2 tiene 25 que son defectuosas. Encuentre un intervalo de confianza del 99 % para la diferencia
en fracciones de productos defectuosos producidos por las dos lneas.
224
FaCyT-Matemticas
Captulo 5
Prueba de hiptesis sobre los parmetros
5.1.
Elementos de una prueba de hiptesis
El objetivo de una prueba estadstica es probar una hiptesis con respecto

a los valores de uno o ms parmetros poblacionales. Por lo general se tiene
una teora, es decir una hiptesis de investigacin, acerca del o los parmetros que se desea apoyar.
Por ejemplo, un fabricante asegura, a una compaa que le compra un producto en forma regular, que el porcentaje de productos defectuosos no es
mayor del 5 %. Un ingeniero de control de calidad que no cree en la afirmacin del fabricante, podra buscar apoyar la hiptesis de investigacin de que
el fabricante no est dicindole la verdad a la compaa.
El apoyo para est hiptesis de investigacin, tambin llamada hiptesis alternativa, se obtiene mostrando (usando los datos muestrales como evidencia)
que lo contrario a la hiptesis alternativa, llamado hiptesis nula, es falso.
Por lo tanto, una teora se comprueba demostrando que no hay evidencia que
sustente la teora opuesta; en cierto sentido, una prueba por contradiccin.
Como el ingeniero de control de calidad busca apoyo para la hiptesis alternativa de que la afirmacin por el fabricante es falsa, la hiptesis alternativa
es que el valor de p es mayor que 0 05.
Ha : p > 0 05
Si el ingeniero puede demostrar que los datos apoyan el rechazo de la hiptesis nula H0 : p = 0 05 en favor de la hiptesis alternativa Ha : p > 0 05, se
ha alcanzado el objetivo de investigacin. An cuando es comn hablar de
225
Sec 5.1. Elementos de una prueba de hiptesis
226
probar una hiptesis nula, el objetivo de investigacin suele ser demostrar

apoyo para la hiptesis alternativa, si dicho apoyo se justifica.
Una pregunta natural que surge al tratar de apoyar una hiptesis estadstica
es,
Cmo se usan los datos muestrales para decidir entre la hiptesis nula y la
hiptesis alternativa?
Por ejemplo, suponga que el ingeniero de control de calidad selecciona aleatoriamente n = 15 productos del inventario y se registra el nmero de productos
defectuosos X que hay en la muestra. Si todos los productos en la muestra
estn defectuosos, es decir, X = 15
Qu concluira el ingeniero acerca de la afirmacin del fabricante?
Si el fabricante en realidad dice la verdad (el porcentaje de productos defectuosos no es mayor del 5 %), no es imposible observar que X = 15 productos
estn defectuosos en la muestra de tamao n = 15, pero es altamente improbable. Es mucho ms probable que se observe X = 15 productos defectuosos
en la muestra de tamao n = 15 si la hiptesis alternativa fuera cierta. Entonces, se rechazara la hiptesis nula H0 : p = 0 05 en favor de la hiptesis
alternativa Ha : p > 0 05. Si se observan X = 14 productos defectuosos en la
muestra de tamao n = 15 (o cualquier otro valor grande de X ), un razonamiento anlogo nos llevara a la misma conclusin.
Cualquier prueba de hiptesis estadstica funciona exactamente de la misma
forma y est compuesta de los mismos elementos.
Elementos de una prueba estadstica

1. Hiptesis nula, H0
2. Hiptesis alternativa, Ha
3. Estadstico de prueba
4. Regin de rechazo
FaCyT-Matemticas
227
Cap 5. Prueba de hiptesis sobre los parmetros
Definicin 5.1. Hiptesis nula

La hiptesis nula es la hiptesis a ser probada y se denota por H0 .
Para el ejemplo, la hiptesis nula es
H0 : p = 0 05
Definicin 5.2. Hiptesis alternativa
La hiptesis alternativa (o investigacin) es la hiptesis a ser aceptada
en caso que H0 sea rechazada y se denota por Ha .
Por lo general la hiptesis alternativa es la que se quiere probar con base en
la informacin contenida en la muestra; as, para el ejemplo,
Ha : p > 0 05
Una hiptesis puede ser sencilla o compuesta. Si una hiptesis estadstica
asigna valores particulares a todos los parmetros desconocidos e identifica
la forma funcional de la distribucin de inters, recibe el nombre de hiptesis
sencilla o simple; de otra forma, se le conoce como hiptesis compuesta. Para
el ejemplo, si X sigue un modelo binomial con parmetros n = 15 y p,
entonces la hiptesis nula H0 es sencilla y la hiptesis alternativa Ha es una
hiptesis compuesta.
Definicin 5.3. Estadstico de prueba
Es una funcin de las variables aleatorias que se observaron en la
muestra en las que la decisin estadstica estar basada.
En el ejemplo, X que representa el nmero de productos defectuosos que hay
en la muestra de tamao n = 15 es el estadstico de prueba.
Definicin 5.4. Regin de rechazo (RR)
La regin de rechazo especifica los valores del estadstico de prueba
para el cul la hiptesis nula H0 ha de ser rechazada en favor de la
hiptesis alternativa Ha . Se denota como RR.
228
Si, para una muestra particular, el valor calculado del estadstico de prueba
cae en la regin de rechazo RR, se rechaza la hiptesis nula H0 y se acepta
la hiptesis alternativa Ha . Si el valor del estadstico de prueba no cae en la
regin de rechazo RR, se acepta H0 .
Para el ejemplo, valores grandes de X conduce al rechazo de la hiptesis nula
H0 , entonces una regin de rechazo que se puede considerar es el conjunto
de todos los valores de X mayores o iguales a 5. Dicho de otra forma,
RR = {x : x 5}
Como se ha dicho valores grandes de X son favorables para la hiptesis
alternativa Ha : p > 0 05 y contradictorio para la hiptesis nula H0 : p = 0 05.
Entonces de manera intuitiva se puede seleccionar la regin de rechazo como
RR = {x : x k}
Pero surge una pregunta,
Qu valor se debe escoger para k?
En forma general, se busca algunos criterios objetivos para decidir cul valor
de k especifica una buena regin de rechazo de la forma {x : x k}.
Para cualquier regin de rechazo fija (determinada para un valor particular
de k ), existen dos tipos de errores que pueden cometerse al llegar a una
decisin. Se puede decidir a favor de la hiptesis alternativa Ha cuando H0
es verdadera (error tipo I), o se puede decidir a favor de H0 cuando Ha es
en realidad verdadera (error tipo II). La siguiente tabla muestra las distintas
alternativas con los posibles resultados:
H0 es cierta
H1 es cierta
Acepta H0
Decisin correcta
Error tipo II
Rechazar H0
Error tipo I
Decisin correcta
FaCyT-Matemticas
229
Definicin 5.5. Error tipo I

Se comete un error tipo I si H0 es rechazada cuando H0 es verdadera.
La probabilidad de rechazar H0 , dado que H0 es cierta, se define como
la probabilidad del error tipo I y se denota por . El valor de se
denomina nivel de la prueba o nivel de significancia. Esto es:
= P (rechazar H0 | H0 es cierta)
Definicin 5.6. Error tipo II

Se comete un error tipo II si H0 es aceptada cuando Ha es verdadera. La probabilidad de no poder rechazar H0 , dado que H0 es falsa, se
define como la probabilidad del error tipo II y se denota por . Esto
es:
= P (no poder rechazar H0 | H0 es falsa)
Ejemplo 5.1. Para el ejemplo en que se muestrearon n = 15 productos. Se
desea probar
H0 : p = 0 05
vs
Ha : p > 0 05
El estadstico de prueba es X, el nmero de productos defectuosos. Calcule
si se selecciona RR = {x 5} como la regin de rechazo.
Solucin:
Por definicin,
= P (Error tipo I )
= P (rechazar H0 | H0 es verdadera)
= P (valor del estadstico de prueba est en RR |H0 es verdadera)
= P (X 5 | p = 0 05)
= 1 FB (4; 15, 0 05)
= 1 0 9994
= 0 0006
230
Entonces, si se decide usar la regin de rechazo RR = {x 5}, se asume

un riesgo muy pequeo ( = 0 0006) de concluir que el fabricante no tiene
razn cuando en realidad el porcentaje de productos defectuosos no es mayor
del 5 %.

Ejemplo 5.2. En el ejemplo (5.1), La prueba es tan buena como para evitar concluir que el fabricante tiene la razn si en realidad el porcentaje de
productos defectuosos es mayor al 5 %? Suponga que p = 0 1, cul es la
probabilidad de que la muestra errneamente nos lleve a concluir que H0
es verdadera y que el fabricante tiene la razn?
Solucin:
Por definicin,
= P (Error tipo II ) = P (00 Aceptar00 H0 | Ha es verdadera)
= P (el valor del estadstico de prueba no est en RR | Ha es verdadera)
= P (X 4 | p = 0 1) = FB (4; 15, 0 1)
= 0 9873
Si se usa la regin de rechazo RR = {x 5}, la prueba por lo general
nos llevar a concluir que el fabricante tiene la razn en su afirmacin (con
probabilidad = 0 9873), an cuando p = 0 1.

Ejemplo 5.3. En el ejemplo (5.1), calcule el valor de si p = 0 3 y p = 0 5.
Solucin:
(0 3) = P (X 4 | p = 0 3) = FB (4; 15, 0 3) = 0 5155
y
(0 5) = P (X 4 | p = 0 5) = FB (4; 15, 0 5) = 0 0592

Observacin 5.1. El valor de depende del valor del parmetro p. Cuando
mayor sea la diferencia entre p y el valor hiptetico (nulo) de p = 0 05, menor
es la probabilidad de que no se rechace la hiptesis nula.
FaCyT-Matemticas
231
Ejemplo 5.4. Para las regiones de rachazo RR = {x 2} y RR = {x 6},

calcule el nivel de la prueba y calcule si p = 0 1, p = 0 3 y p = 0 5.
Compare estos resultados con los valores obtenidos en los ejemplos anteriores donde RR = {x 5}.
Solucin:
Para la regin de rechazo RR = {x 2}:
= P (Error tipo I )
= P (X 2 | p = 0 05)
= 1 FB (1; 15, 0 05)
= 1 0 8290
= 0 171
y la probabilidad del error tipo II para p = 0 1, p = 0 3 y p = 0 5 son:
(0 1) = P (X 1 | p = 0 1) = FB (1; 15, 0 1) = 0 5490
(0 3) = P (X 1 | p = 0 3) = FB (1; 15, 0 3) = 0 0353
(0 5) = P (X 1 | p = 0 5) = FB (1; 15, 0 5) = 0 0005
De la misma manera, para la regin de rechazo RR = {x 6}, la probabilidad
del error tipo I es:
= P (Error tipo I )
= P (X 6 | p = 0 05)
= 1 FB (5; 15, 0 05)
= 1 0 9999
= 0 0001
y la probabilidad del error tipo II para p = 0 1, p = 0 3 y p = 0 5 son:
(0 1) = P (X 5 | p = 0 1) = FB (5; 15, 0 1) = 0 9978
(0 3) = P (X 5 | p = 0 3) = FB (5; 15, 0 3) = 0 7216
(0 5) = P (X 5 | p = 0 5) = FB (5; 15, 0 5) = 0 1509
232

Observacin 5.2. Si se cambia la regin de rechazo para aumentar , entonces disminuir. Del mismo modo, si el cambio en la regin de rechazo
resulta en una disminucin en , entonces aumentar de manera uniforme.
Por tanto, y estn relacionados de manera inversa.
Para casi todas las pruebas estadsticas, si est fija en algn valor aceptablemente pequeo, disminuye cuando se aumenta el tamao muestral.
Ejemplo 5.5. Ahora si se muestrean n = 20 productos. Calcule la probabilidad del error tipo I y la probabilidad del error tipo II si p = 0 1,
p = 0 3 y p = 0 5 para cada una de las regiones de rechazo RR = {x 2},
RR = {x 5} y RR = {x 6}. Compare los resultados con los obtenidos
cuando se muestrearon n = 15 productos.
Solucin:
Sea X el nmero de productos defectuosos en la muestra de tamao n = 20.
Entonces:
Para la regin de rechazo RR = {x 2} la probabilidad del error tipo
I viene dada por:
= P (Error tipo I ) = P (X 2 | p = 0 05)
= 1 FB (1; 20, 0 05) = 1 0 7358
= 0 2642
Para la regin de rechazo RR = {x 2}, la probabilidad del error tipo
II si p = 0 1, p = 0 3 y p = 0 5 vienen dadas por:
(0 1) = P (X 1 | p = 0 1) = FB (1; 20, 0 1) = 0 3912
(0 3) = P (X 1 | p = 0 3) = FB (1; 20, 0 3) = 0 0076
(0 5) = P (X 1 | p = 0 5) = FB (1; 20, 0 5) = 0 0000
I viene dada por:
= P (Error tipo I ) = P (X 5 | p = 0 05)
= 1 FB (4; 20, 0 05) = 1 0 9974
= 0 0026
FaCyT-Matemticas
233

(0 1) = P (X 4 | p = 0 1) = FB (4; 20, 0 1) = 0 9568
(0 3) = P (X 4 | p = 0 3) = FB (4; 20, 0 3) = 0 2375
(0 5) = P (X 4 | p = 0 5) = FB (4; 20, 0 5) = 0 0059
I viene dada por:
= P (Error tipo I ) = P (X 6 | p = 0 05)
= 1 FB (5; 20, 0 05) = 1 0 9997
= 0 0003
(0 1) = P (X 5 | p = 0 1) = FB (5; 20, 0 1) = 0 9887
(0 3) = P (X 5 | p = 0 3) = FB (5; 20, 0 3) = 0 4164
(0 5) = P (X 5 | p = 0 5) = FB (5; 20, 0 5) = 0 0207

5.2.
Pruebas para muestras grandes
Supngase que se desea probar un conjunto de hiptesis respecto a un parmetro con base en una muestra aleatoria X1 , X2 , . . . , Xn . En est seccin
se desarrollarn procedimientos de prueba de hiptesis que estn basados
en un estimador b que tiene una distribucin muestral normal (aproximadamente) con media y error estndar b, es decir, estimadores de tales que
b N (, 2b).
La tabla siguiente muestra algunos estimadores puntuales b para el parmetro
objetivo cuya distribucin muestral para tamao(s) de muestra(s) grandes
siguen de manera aproximada una distribucin normal con media y error
estndar b
Sec 5.2. Pruebas para muestras grandes
234
Parmetro
objetivo
tamao(s)
muestral(es)
Estimador
puntual b

E b
Error
estndar b
X
Pb =
n
s
1 2
n1 y n2
X1 X2
n1 y n2
c1 P
c2
P
1 2
r
p1 p2
p1 p2
p(1p)
n
12
+
n1
22
n2
p1 (1 p1 )
+
n1
p2 (1p2 )
n2
Si 0 es un valor especifico de , se puede, por ejemplo, probar
H0 : = 0
vs
Ha : > 0
La siguiente figura (5.1) contiene una grfica que ilustra las distribuciones
muestrales de b para varios valores de
Figura 5.1: distribuciones muestrales del estimador b para varios valores de

FaCyT-Matemticas
235
De manera intuitiva, si la realizacin del estimador b esta cerca a 0 , parece

razonable aceptar H0 . Pero, si en realidad > 0 , es ms probable que b sea
ms grande. En consecuencia, valores grandes de b (valores mayores a 0 en
una cantidad apropiada) favorecen al rechazo de H0 : = 0 y una aceptacin
de Ha : > 0 . Esto es, las hiptesis nula y alternativa, el estadstico de
prueba y la regin de rechazo son:
H0 : = 0
vs
Ha : > 0
Estadistico de prueba : b

RR = b > k para alguna seleccin de k
El valor real de k en la regin de rechazo RR se determina al fijar la probabilidad del error tipo I (el nivel de la prueba o significancia) y escoger k de
manera que

b
= P > k | = 0
Si H0 es verdadera, b tiene una distribucin normal con media 0 y error
estndar b. Por tanto

= P b > k | = 0

k 0
=P Z>
b

k 0
=1P Z
b
y

k 0
P Z
=1
b
de la figura (5.2)
236
Figura 5.2: Regin de rechazo de muestra grande de cola superior
implica que:
k 0
= z1
b
y de aqu se tiene que:
k = 0 + z1 b
(5.1)
Entonces, si se desea probar una prueba al nivel de significancia , el valor

de k dado por la expresin (5.1), es la seleccin apropiada para k. De esta
manera la regin de rechazo viene dada por:
o n b
n
o
0
RR = b : b > 0 + z1 b = b :
> z1
b
Si
Z0 =
b 0
b
se usa como estadstico de prueba, la regin de rechazo tambin se puede

escribir como:
RR = {z0 > z1 }
Por lo tanto, una forma equivalente de la prueba de hiptesis, con un nivel
FaCyT-Matemticas
237
de significancia , es la siguiente:
H0 : = 0
vs
Ha : > 0
Estadistico de prueba : Z0 =

RR = z0 > z1
b 0
b
Ejemplo 5.6. El vicepresidente de ventas de una gran empresa afirma que

los vendedores estn promediando no ms de 15 contactos de ventas por semana (le gustara aumentar esta cantidad). Como prueba de su afirmacin,
aleatoriamente se seleccionan n = 36 vendedores y se registra el nmero de
contactos hechos por cada uno para una sola semana seleccionada al azar.
La media y la varianza de las 36 mediciones fueron 17 y 9, respectivamente.
La evidencia contradice lo dicho por el vicepresidente? Use una prueba con
un nivel de significancia = 0 05.
Solucin:
El parmetro de inters es el nmero medio de contactos por semana, . Por
lo tanto,
H0 : = 15
vs
Ha : > 15
Se sabe que para n lo suficientemente grande, la media muestral X es un estimador puntual de que est distribuida normalmente en forma aproximada
con
y
X =
X =
n
de esta manera, el estadstico de prueba es:
Z0 =
X 0
X 0
=
X
/ n
y, la regin de rechazo es:

RR = {z0 > z1 }
238
como = 0 05, entonces z10 05 = z0 95 = 1 645, y

RR = {z0 > 1 645}
La varianza poblacional 2 no se conoce, pero puede estimarse de manera
muy precisa (n = 36 es suficientemente grande) con la varianza muestral
s2 = 9. El valor observado del estadstico de prueba es aproximadamente
x 0
17 15
=
=4
z0 =
s/ n
3/ 36
Debido a que valor observado de z0 se encuentra en la regin de rechazo, se
rechaza H0 : = 15. Entonces, al nivel de significancia = 0 05, la evidencia
es suficiente para indicar que la afirmacin del vicepresidente es incorrecta y
que el nmero promedio de contactos de venta por semana es mayor que 15.

Ejemplo 5.7. Se usan dos procesos para fabricar piezas forjadas que se utilizan en el montaje de un ala de avin. Un anlista de calidad afirma que
la fraccin de piezas forjadas defectuosas para el proceso 1 es mayor al del
proceso 2. De 200 piezas, seleccionadas del proceso 1, se tiene que 30 no
cumplen con las especificaciones de resistencia, mientras que de 300 piezas,
seleccionadas del proceso 2, 40 estn defectuosas. Los datos muestrales apoyan la afirmacin del anlista de calidad? Use una prueba con un nivel de
significancia = 0 01.
Solucin:
Si X1 y X2 denota el nmero de piezas defectuosas en las muestras de tamao
200 y 300, tomadas de los procesos 1 y 2, respectivamete. Entoces X1 y X2 son
variables aleatorias binomiales, con p1 y p2 denotando la probabilidad de que
la pieza seleccionada al azar del proceso 1 y 2 sea defectuosa, respectivamente.
En consecuencia, se desea probar la hiptesis nula
H0 : p1 p2 = 0
vs
Ha : p1 p2 > 0
El estadstico de prueba, est dado por:
Z=r
c1 P
c2 (p1 p2 )
P
p1 (1 p1 ) p2 (1 p2 )
+
n1
n2
FaCyT-Matemticas
239
Como se esta considerendo la distribucin de Z bajo H0 , entonces p1 = p2 =

p. De esta manera
c1 P
c2
P
Z0 = r
p(1 p) p(1 p)
+
n1
n2
Ya que el valor de p no se conoce, se combina la informacin de las dos
muestras para obtener el estimador combinado
X1 + X2
Pb =
n1 + n2
Por lo tanto, el estadstico de prueba es:
Z0 = s
c1 P
c2
P
Pb(1 Pb) Pb(1 Pb)
+
n1
n2
Como P (Z 2 33) = 0 99, la regin de rechazo es

RR = {z0 2 33}
El valor observado del estadstico de prueba bajo H0 es:
z0 = r
30/200 40/300
70/500(1 70/500) 70/500(1 70/500)

+
200
300
0 0167
=
0 0318
= 0 5252
Como el valor observado de Z no est en la regin de rechazo, por lo tanto

no se puede rechazar la hiptesis nula en favor de la hiptesis alternativa.
En trminos de su aplicacin, se concluye que en el nivel de significancia de
= 0 01, la evidencia no apoya la afirmacin del anlista de calidad.

240
La prueba de
H0 : = 0
vs
Ha : < 0
se hace de modo anlogo, excepto que ahora se rechaza H0 para valores de b
que sean mucho menores que 0 . El estadstico de prueba sigue siendo
Z0 =
b 0
b
pero para un nivel de significancia fijo se rechaza la hiptesis nula cuando

z0 z . La figura (5.3) muestra la regin de rechazo
Figura 5.3: Regin de rechazo de muestra grande de cola inferior

Se llama Ha : < 0 una cola inferior alternativa y a RR = {z0 z } una
regin de rechazo de cola inferior. Al probar
H0 : = 0
vs
Ha : 6= 0
se rechaza H0 si b es mucho menor o mucho mayor que 0 . El estadstico de
prueba sigue siendo:
b 0
Z0 =
b
pero la regin de rechazo est ubicada simtricamente en las dos colas de la
distribucin de probabilidad para Z como se ilustra en la figura (5.4)
FaCyT-Matemticas
241
Figura 5.4: Regin de rechazo de muestra grande de cola inferior

Entonces, se rechaza H0 si z0 z/2 o z0 z1/2 . De un modo equivalente,
se rechaza H0 si |z0 | z1/2 .
Resumen de las pruebas de hiptesis de nivel para muestras grandes
Pruebas de hiptesis de nivel para muestras grandes
H0 : = 0
> 0
Ha : < 0
6= 0
(alternativa de cola superior)

(alternativa de cola inferior)
(alternativa de dos colas)
b 0
Estadstico de prueba: Z0 =
b
(RR de cola superior)

{z0 > z1 }
Regin de rechazo : {z0 < z }
(RR de cola inferior)
{|z0 | > z1 2 } (RR de dos colas)
Como dicidir cul hiptesis alternativa usar para una prueba? La respuesta
depende de la hiptesis que se quiera apoyar. Por ejemplo, si se quiere detectar un aumento en el tiempo de armado promedio de un artculo, se debe
localizar la regin de rachazo en la cola superior de la distribucin normal.
242
Por otra manera, en un proceso de manucfactura si se quiere detectar un

cambio en la media de una caracteristica de calidad de un artculo, se debe localizar la regin de rechazo en ambas colas de la distribucin normal
estndar y emplear una prueba de dos colas.
Ejemplo 5.8. Una compaia petrolera pronto tendr que cambiar una gran
parte de su produccin de una frmula que contiene tetraetil-plomo a una
frmula sin plomo. Una caracteristica de calidad importante de la gasolina
es el ndice de octano en carretera. Si se usa gasolina con ndice demasiado
bajo para la comprensin del motor, habr golpeteo excesivo. La compaia ha
formulado el producto libre de plomo de manera que su ndice de octano en
carretera sea idntico al ndice del producto anterior, con plomo. Se realiza un
experimento en el cul se hacen 50 observaciones independientes del ndice
octnico en carretera para cada una de las formulaciones. Los resultados se
presentan en la siguiente tabla
Formulacin 1 (con plomo) Formulacin 2 (sin plomo)
n1 = 50
x1 = 90 70
s21 = 1 35
n2 = 50
x1 = 90 80
s22 = 1 06
Los datos presentan evidencia para sugerir una diferencia entre el ndice
octnico medio para la formulacin 1 (con plomo) y el ndice octnico medio
para la formulacin 2 (sin plomo). Use un nivel de significancia de 0 01.
Solucin:
Como se desea probar la hiptesis de que las media difieren, se debe probar
H0 : 1 2 = 0
vs
Ha : 1 2 6= 0
Como las muestras son independientes y ambas son grandes, el estadstico de
prueba est dado por
Z0 =
X 1 X 2 (1 2 )
q 2
1
2
+ n22
n1
FaCyT-Matemticas
243
donde 12 y 22 son las respectivas varianzas poblacionales. La regin de rechazo de dos colas viene dada por:
RR = {|z0 | z1/2 }
donde = 0 01 y /2 = 0 01/2 = 0 005. Como P (Z 2 58) = 0 995,
entonces, la regin de rechazo es:
RR = {|z0 | 2 58}
Para muestras grandes, las varianzas muestrales dan buenas estimaciones
de sus correspondientes varianzas poblaciones. En consecuencia, el valor del
estadstico de prueba bajo H0 es:
z0 =
90 70 90 80 0
q
= 0 46
1 35
1 06
+
50
50
Este valor no est en la regin de rechazo, por lo tanto, no se puede rechazar

H0 . En consecuencia, en el nivel = 0 01, se concluye que no hay suficiente evidencia estadstica para sugerir una diferencia entre el ndice octnico
medio para la formulacin 1 (con plomo) y el ndice octnico medio para
la formulacin 2 (sin plomo). Como aplicacin, la compaa puede cambiar
gran parte de su producin por la nueva frmula sin plomo.

5.3.
Clculo de probabilidades de error tipo II
Considrese la prueba
H0 : = 0
vs
Ha : > 0
Supngase que en realidad = a donde (a > 0 ). La regin de rechazo es
de la forma:
RR = {b : b > k}
Sec 5.3. Clculo de probabilidades de error tipo II
244
donde k = 0 + z1 b. Dado que la probabilidad del error tipo II es igual a

la probabilidad de no rechazar H0 cuando est es verdadera, entonces:
= P (Error tipo II) = P (No poder rechazar H0 | Ha es verdadera)
= P (el valor del estadstico de prueba no cae en la RR | Ha es verdadera)

= P b k | = a

= P b 0 + z1 b | = a

z1 b + 0 a
(5.2)
=P Z
b
Al sustituir cualquier valor a de la hiptesis alternativa en la expresin
anterior, se puede calcular el correspondiente valor de la probabilidad del
error tipo II. Para una muestra fija de tamao n, el valor de depende de
la distancia entre a y 0 . Si a est cerca de 0 , el valor de a es difcil de
detectar, y la probabilidad de no poder rechazar H0 cuando esta es falsa
tiende a ser grande. En cambio, si a est lejos de 0 , el valor de a es fcil de
detectar y la probabilidad de no poder rechazar H0 cuando esta es falsa es
mucho menor. Como se observ en la Seccin (5.1), para un valor especificado
de , la probabilidad de no poder rechazar H0 cuando esta es falsa puede
hacerse menor si se escoge un tamao muestral n grande. Para los otros casos,
se pueden desarrollar expresiones similares a (5.2).
Ejemplo 5.9. Considere el ejemplo (5.6). Si realmente = 16, cul es la
probabilidad de que la prueba no detecte este valor? es decir, la probabilidad
de que la prueba no pueda rechazar H0 dado que esta es falsa.
Solucin:
= P (Error tipo II ) = P (no poder rechazar H0 | Ha es verdadera)
= P (el valor del estadstico de prueba no este en RR | Ha es verdadera)

= P X k | = 16
donde
3
k = 0 + z0 95 = 15 + 1 645
n
36
= 15 8225
FaCyT-Matemticas
245
y

= P X 15 8225 | = 16

15 8225 16
=P Z
3/ 36
= P (Z 0 36)
= 0 3594
En la figura (5.5) se ilustra la regin de rechazo, la probabilidad del error tipo
I y la probabilidad del error tipo II .
Figura 5.5: Regin de rechazo para el ejemplo (5.9) (k = 15 8225)

5.4.
Determinacin del tamao muestral para

la prueba Z
Supngase que se desea probar
H0 : = 0
vs
Ha : > 0
Para y fijos, se tiene que:
= P X > k | = 0
k 0
Z>
/ n

=
Sec 5.4. Determinacin del tamao muestral para la prueba Z 246

de aqu, se tiene que:
k 0
= z1
/ n

k = 0 + z1
n
(5.3)
de la misma forma
= P X k | = a

v k a
P Z
=
/ n
de aqu:
k a
= z
/ n
y

k = a + z
n
igualando las ecuaciones (5.3) y (5.4),

= a + z
0 + z1
n
n
(5.4)
y despejando n, se tiene que:

n=
(z1 z )2 2
(a 0 )2
(5.5)
es el tamao muestral para satisfacer el nivel de significancia y la probabilidad del error tipo II .
Se obtendra exactamente la misma expresin (5.5) para el tamao muestral
n ( y fijos), para probar
H0 : = 0
vs
Ha : < 0
En el caso en que se desea obtener el tamao muestral n para probar
H0 : = 0
vs
Ha : 6= 0
FaCyT-Matemticas
247
se podra utilizar un procedimiento semejante al que se acaba de emplear

para obtener la frmula para n, la cul viene dada por:
n=
(z1/2 z )2 2
(a 0 )2
(5.6)
Ejemplo 5.10. Suponga que el vicepresidente del ejemplo (5.6), desea probar
H0 : = 15
vs
Ha : = 16
con = = 0 05. Determine el tamao muestral que asegura esta precisin.
Suponga que 2 es aproximadamente 9.
Solucin:
Como = = 0 05, se deduce que z1 = z0 95 = 1 645 y z = z0 05 =
1 645. Entonces
(z1 + z )2 2
(1 645 + 1 645)2 (9)
n=
=
(a 0 )2
(16 15)2
= 97 4
Por lo tanto, deben usarse n = 98 observaciones para satisfacer que = =
0 05.

5.5.
Nivel de significancia alcanzado o valor p
Definicin 5.7. Si W es un estadstico de prueba, el valor p denotado

por vp , o nivel de significancia alcanzado, es el nivel ms pequeo de
significancia para el cual la informacin observada indica que la
hiptesis nula debe ser rechazada.
Dado que el valor p depende del estadstico de prueba, entonces esta cantidad
Vp es un estadstico que representa el valor ms pequeo de para el cul
Sec 5.5. Nivel de significancia alcanzado o valor p
248
se puede rechazar la hiptesis nula. Cuanto ms pequeo sea el vp , es ms

fuerte la evidencia de que la hiptesis nula debe ser rechazada. Por lo tanto,
si:
vp > la hiptesis nula no puede ser rachazada.
vp la hiptesis nula es rechazada para ese valor de .
Ejemplo 5.11. Considere el ejemplo (5.1) donde se muestrearon n = 15
productos. Se desea probar
H0 : p = 0 05
vs
Ha : p > 0 05
El estadstico de prueba es X, el nmero de productos defectuosos en la muestra de tamao n = 15, cul es el valor p si X = 4? Interprete el resultado.
Solucin:
Como H0 debera ser rechazada para valores grandes de X. Entonces, el valor
p para est prueba est dado por
P (X 4)
donde X tiene una distribucin binomial con n = 15 y p = 0 05. Entonces,
vp = P (X 4)
= 1 P (X 3)
= 1 FB (3; 15, 0 05)
= 1 0 9945
= 0 0055
Por tanto, vp = 0 0055 representa el valor ms pequeo de para el cul la
hiptesis nula es rechazada, en consecuencia, si se especifica cualquier valor
de 0 0055 sera llevado a rechazar H0 y concluir que el fabricante no
tiene la razn acerca de su afirmacin.

FaCyT-Matemticas
249
El ejemplo (5.11) indica el mtodo general para calcular valores p. Si se quiere

rechazar H0 en favor de Ha y RR = {w k}, el valor p relacionado con un
valor observado w0 de W est dado por
vp = P (W w0 | H0 es cierta)
De la misma manera, si se quiere rechazar H0 en favor de Ha y RR = {w
k}, el valor p relacionado con un valor observado w0 de W est dado por
vp = P (W w0 | H0 es cierta)
Para una alternativa de dos colas el clculo del valor p se ilustra en el siguiente
ejemplo
Ejemplo 5.12. Considere el ejemplo (5.8). Encuentre el valor p para el estadstico de prueba.
Solucin:
El valor del estadstico de prueba, calculado a partir de los datos observados,
fue z0 = 0 46. Como esta es una prueba de dos colas, el valor p viene dado
por:
vp = P (Z 0 46 Z 0 46)
= P (Z 0 46) + P (Z 0 46)
= 2P (Z 0 46) = 2 [1 P (Z 0 46)]
= 2[1 0 6772) = 2(0 3228]
= 0 6456
Por lo tanto, si = 0 01, un valor menor que vp = 0 6456, no se puede
rechazar H0 .

En resumen, para las pruebas de distribuciones normales, si z0 es el valor
calculado del estadstico de prueba, entonces el valor p viene dado por:
2[1 P (Z |z0 |)] para una prueba de dos colas

vp = 1 P (Z z0 )
para una prueba de cola superior
P (Z z0 )
para una prueba de cola inferior
Sec 5.6. Pruebas de hiptesis sobre la media de una distribucin

normal, varianza desconocida
250
Es muy til presentar los resultados de una prueba de hiptesis en trminos
del valor p, ya que esto conlleva mucha ms informacin para el experimentador que la simple proposicin rechazar H0 o no se puede rechazar H0 . Es
decir, el rechazo de H0 con un nivel de significancia 0 05 tiene un significado
mayor si el valor del estadstico de prueba esta bien ubicado en la regin
crtica, excediendo por ms del 5 % al valor crtico, que si apenas excede este
valor.
5.6.
Pruebas de hiptesis sobre la media de una

distribucin normal, varianza desconocida
Supngase que X1 , X2 , . . . , Xn es una muestra aleatoria de tamao n de una

distribucin normal con media y varianza 2 (ambas desconocidas). De la
seccin (2.4.2), se sabe que la variable:
T =
S/ n
tiene una distribucin t de Student con n 1 grados de libertad.

Como la distribucin t de Student es simtrica, la regin de rechazo para
una prueba de hiptesis H0 : = 0 con muestras pequeas, se determina
de forma semejante a la empleada con el estadstico Z de una muestra grande.
Por analoga con la prueba Z, la regin de rechazo para la alternativa de cola
superior Ha : > 0 viene dada por:
RR = {t0 > t1,n1 }
donde t1,n1 es el valor tal que P (T < t1,n1 ) = 1 para una distribucin t de Student con n 1 grado de libertad.
Resumen de las pruebas de hiptesis de nivel para muestras pequea para
FaCyT-Matemticas
251
Prueba para muestras pequea para (varianza

desconocida)
Suposiciones: X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con media
H0 : = 0
> 0
Ha : < 0
6= 0

X 0
Estadstico de prueba: T0 =
S/ n

{t0 t1,n1 }
Regin de rechazo : {t0 t,n1 }
{|t0 | t1 2 ,n1 } (RR de dos colas)
Ejemplo 5.13. Un ingeniero que trabaja para una fabricante de llantas investiga la duracin promedio de un compuesto nuevo de caucho. Para ello,
construye 16 llantas y las prueba en una carretera hasta alcanzar el fin de la
vida til de stas. Los datos, en Km, obtenidos son los siguientes:
60613
60545
59836
60257
59554
60000
60252
59997
59784
69947
60221
60135
60311
60220
50040
60523
al ingeniero le gustara demostrar que la vida til promedio de las nuevas

llantas exceden los 60 mil km. Proponga y pruebe la hiptesis apropiadas.
Obtenga una conclusin con = 0 05.
Solucin:
Supngase que el tiempo de duracin de las nuevas llantas tiene una distriUniversidad de Carabobo
Sec 5.6. Pruebas de hiptesis sobre la media de una distribucin

normal, varianza desconocida
252
bucin normal. Se desea probar
H0 : = 60000
vs
Ha : > 60000
El estadstico de prueba es:
T0 =
X 0
S/ n
y la regin de rechazo es:

RR = {t0 t1,n1 } = {t0 t0 95,15 } = {t0 1 721}
Puesto que x = 60139 69 y s2 = 13292850 y n = 16, el valor del estadstico
de prueba bajo H0 es:
t0 =
x 0
60139 69 60000
=
= 0 153
s/ n
3645 936/ 16
Dado que t0 = 0 153 < 1 721, no se puede rechazar H0 al nivel de significancia

de = 0 05. De este modo, no se tiene evidencia fuerte que permita concluir
que la vida til promedio de las nuevas llantas exceden los 60 mil km.

Ejemplo 5.14. Cul es el valor p relacionado con el estadstico de prueba
del ejemplo (5.13)?
Solucin:
Como la hiptesis nula debe ser rechazada si t0 es grande, el valor mnimo
de para el cul la hiptesis nula puede ser rechazada es el valor p, esto es:
vp = P (T 0 153)
donde T tiene una distribucin t de Student con n1 = 15 grados de libertad.
Por lo tanto, el valo p viene dado por:
vp = P (T15 0 153) = 1 P (T15 < 0 153)
FaCyT-Matemticas
253
por interpolacin lineal, se tiene que P (T15 < 0 153) 0 553, de esta manera
el valor p es:
vp = 1 P (T15 < 0 153) 1 0 553 = 0 447
Como vp > 0 05, no se puede rechazar H0 al nivel de significancia de =
0 05.

5.7.
Pruebas de hiptesis sobre las medias de

dos distribuciones normales, varianzas desconocidas
Supngase que se necesita probar hiptesis que compara las medias de dos
distribuciones normales donde las varianzas x2 y y2 son desconocidas. Para
probar ests hiptesis se utilizar la distribucin t de Student. Se pueden
suponer dos casos. En el primer caso, se supondr que las varianzas de las
dos distribuciones son desconocidas pero iguales. En el segundo, se supondr
que x2 y y2 son desconocidas y distintas.
5.7.1.
Caso 1: x2 = y2 = 2
Supngase que X1 , X2 , . . . , Xnx y Y1 , Y2 , . . . , Yny son muestras aleatorias independientes seleccionadas de dos distribuciones normales con media x y
varianza 2 , y media y y varianza 2 , respectivamente. De la subseccin
(2.5.2), se sabe que la variable:
T =
donde:
Sp2 =
X Y (x y )
q
Sp n1x + n1y
(nx 1)Sx2 + (ny 1)Sy2

nx + ny 2
tiene una distribucin t de Student con nx ny 2 grados de libertad. Si se

desea probar la hiptesis nula H0 : x y = D0 para algn valor fijo D0 ,
Sec 5.7. Pruebas de hiptesis sobre las medias de dos

distribuciones normales, varianzas desconocidas
254
contra alternativas de cola superior, cola inferior, y de dos colas se puede

proceder de la misma forma que en la prueba de muestras grandes, excepto
que se utiliza el estadstico t y las tablas de las distribuciones t de Student.
Resumen de las pruebas de hiptesis de nivel para muestras pequeas para
x y
Prueba para muestras pequeas para x y

Suposiciones: muestras independientes de distribuciones normales
con x2 = y2
H0 : x y = D0
x y > D0
Ha : x y < D0
6= D
x

Estadstico de prueba: T0 =
Regin de rechazo :
(nx 1)Sx2 + (ny 1)Sy2

X Y D0
q
, donde Sp2 =
nx + ny 2
Sp n1x + n1y
{t0 t1,nx +ny 2 }
{t0 t,nx +ny 2 }

{|t | t
0
1 2 ,nx +ny 2 } (RR de dos colas)
Ejemplo 5.15. Dos distintos tipos de botellas de vidrio son adecuados para
su utilizacin en una embotelladora de bebidas gaseosas. La resistencia a la
presin interna de un envase es una caracterstica de calidad importante. De
una muestra aleatoria de n1 = 12 botellas del tipo 1, la resistencia media y
desviacin son x1 = 175 8 psi y s1 = 3 4 psi, respectivamente. Mientras que
una muestra aleatoria de n2 = 10 botellas del tipo 2, la resistencia media y
desviacin son x2 = 181 3 psi y s2 = 3 8 psi, respectivamente. La compaa
no utilizar el diseo de la botella 2 a no ser que su resistencia a la presin
exceda la del diseo 1 en, por lo menos, 5 psi. Suponga que la resistencia a
la presin interna es una variable normal para ambos diseos. Utilizar el
diseo 2, con base en los datos muestrales? Utilice = 0 01.
FaCyT-Matemticas
255
Solucin:
Se desea probar la hiptesis de que la resistencia a la presin interna de las
botellas del diseo 2 excede a la presin interna de las botellas del diseo 1
en, por lo menos, 5 psi. Por lo tanto,
H0 : 2 1 = 5
vs
Ha : 2 1 > 5
Suponiendo que 12 = 22 , el estadstico de prueba es:
T0 =
X 2 X 1 D0
q
Sp n11 + n11
donde:
Sp2 =
(n1 1)S12 + (n1 1)S12

n1 + n1 2
La regin de rechazo viene dada por:

RR = {t0 t1,n1 +n1 2 } = {t0 t0 99,20 }
donde t0 99,20 es el valor cuantil tal que
P (T20 t0 99,20 ) = 0 99
De la tabla (**), se tiene que t0 99,20 = 2 528. Por lo tanto,
RR = {t0 2 528}
Para los datos muestrales, la estimacin para la varianza comn es:
(n1 1)s21 + (n1 1)s21
11(3 4)2 + 9(3 8)2
=
n1 + n1 2
20
257 12
=
20
= 12 86
s2p =
Sec 5.7. Pruebas de hiptesis sobre las medias de dos

distribuciones normales, varianzas desconocidas
256
y el estadstico de prueba bajo H0 es:

t0 =
X 1 X 2 D0
181 3 175 8 5
q
q
=
1
1
1
1
sp n1 + n1
(3 59) 12
+ 10
0 5
1 54
= 0 325
Ya que t0 = 0 325 < 2 528 no se puede rechazar H0 . Al nivel de significancia

de = 0 01, no hay evidencia suficiente para utilizar el diseo de la botella
2.

5.7.2.
Caso 2: x2 6= y2
Algunas veces no es razonable suponer que las varianzas desconocidas x2 y

y2 sean iguales. En este caso no existe una estadstica t exacta para probar
H0 : x y = D0 . Sin embargo, de la seccin (2.5.3), la variable aleatoria
T =
X Y (x y )
q
S2
Sx2
+ nyy
nx
(5.7)

libertad dados por:
2
Sx2 /nx + Sy2 /ny
=
2 2
(Sy2 /ny )
(Sx2 /nx )2
+ ny 1
nx 1
Si se desea probar la hiptesis nula H0 : x y = D0 para algn valor fijo D0 ,
contra alternativas de cola superior, cola inferior, y de dos colas se prueban
de la misma forma que cuando x2 = y2 , excepto de que ahora se emplea
T como estadstico de prueba, con el reemplazo de n1 + n2 2 por para
determinar el nmero de grados de libertad.
Ejemplo 5.16. Dos compaas fabrican un material de caucho para su uso
en aplicaciones automovilsticas. La pieza estar sujeta a un desgaste abrasivo en el campo de aplicacin, as que se decide comparar en una prueba el
FaCyT-Matemticas
257
material producido por cada compaa. Para ello se toman 15 muestras de

material producido por cada compaa y se someten a una prueba de abrasin,
donde se observa el desgaste despus de 1000 ciclos. Para la compaa 1, la
media y la desviacin estndar muestral del desgaste es x1 = 20 mg/1000
ciclos y s1 = 6 mg/1000 ciclos, mientras que para la compaa 2, la media
y la desviacin estndar muestral del desgaste es x2 = 15 mg/1000 ciclos
y s2 = 15 mg/1000 ciclos. Los datos apoyan la afirmacin de que ambas
compaas producen material que tienen el mismo desgaste promedio? Utilice = 0 05 y suponga que las varianzas desconocidas son distintas.
Solucin:
Los parmetros de inters es el desgaste promedio 1 y 2 de las compaas 1
y 2, respectivamente. La hiptesis nula y alternativa para esta situacin son:
H0 : 2 1 = 0
vs
Ha : 2 1 6= 0
El estadstico de prueba es
X Y
T0 = q 2
Sy2
Sx
+
nx
ny
La regin de rechazo es
RR = {|t0 | t1/2,v }
donde
=
s2x /nx + s2y /ny

(s2x /nx )2
nx 1
2
2
(s2y /ny )
2=
ny 1
(62 /15 + 152 /15)

(62 /15)2
151
(152 /15)2
151
2 = 18 99 18
como = 0 05, se rechaza H0 si RR = {|t0 | t0 975,18 = 2 101} Para los

datos obtenidos en la muestra, se tiene que:
xy
20 15
5
t0 = q 2
=
= 1 199
=q
2
sy
sx
4
1713
62
152
+ ny
+ 15
nx
15
Puesto que 2 101 < t0 < 2 101, no se puede rechazar H0 con el nivel de
significancia = 0 05. No hay evidencia fuerte que indique que el desgaste
abrasivo promedio sea diferente para las dos compaas.
Sec 5.8. Pruebas de hiptesis sobre la varianza de una

distribucin normal
258

5.8.
Pruebas de hiptesis sobre la varianza de

Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con

media desconocida y varianza 2 desconocida. Se sabe del Teorema (2.11)
que:
(n 1)S 2
2 =
2
tiene una distribucin chi-cuadrado con = n1 grados de libertad. Suponga
que se necesita probar H0 : 2 = 02 para algn valor fijo 02 contra Ha : 2 >
02 . Se puede usar
(n 1)S 2
20 =
02
como el estadstico de prueba, pero cmo se debe seleccionar la regin de
rechazo RR?
De manera intuitiva, valores grandes de S 2 (que estima el verdadero valor
de 2 ) con respecto a 02 , ms fuerte es la evidencia que apoye la hiptesis
H0 : 2 > 02 . Observe que S 2 es grande con respecto a 02 si y slo si
20 =
(n 1)S 2
02
es grande. Entonces, una regin de rechazo para probar H0 : 2 = 02 contra

Ha : 2 > 02 puede ser de la forma RR = {20 k} para una constante k
apropiada. Si se desea una prueba para la cual la probabilidad de un error
tipo I es , se usa la regin de rechazo
RR = {2 21,n1 }
donde 21,n1 es el valor cuantil tal que

P 2 21,n1 = 1
Si se desea probar H0 : 2 = 02 contra Ha : 2 < 02 un razonamiento anlogo
lleva a una regin de rechazo ubicada en la cola inferior de la distribucin
FaCyT-Matemticas
259
2 . Por otra parte, se puede probar H0 : 2 = 02 contra Ha : 2 6= 02 para el

cul la regin de rechazo se ubica en las dos colas de la distribucin 2 .
Resumen de las pruebas de hiptesis de nivel para 2
Prueba de hiptesis para la varianza poblacional 2
Suposiciones: X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con media y varianza 2 .
H0 : 2 = 02
2
2
> 0
Ha : 2 < 02
2 6= 2
0

(n 1)S 2
Estadstico de prueba: 20 =
02
2
2
{0 1,n1 }
Regin de rechazo :
{20
{2
0
2,n1 }
21 ,n1
2

20
21 ,n1 }
2
(RR de dos colas)
Ejemplo 5.17. Se inserta un remache en un agujero. Si la desviacin estndar del dimetro del agujero es mayor que 0 01 mm, entonces existe una
probabilidad inaceptablemente grande de que el remache no entre en el agujero. Se toma una muestra aleatoria de n = 15 piezas, y se mide el dimetro del
agujero. La desviacin estndar muestral de las mediciones de estos dimetros es s = 0 008 mm existe evidencia fuerte que indique que la desviacin
estndar del dimetro del agujero es mayor que 0 01 mm? Utilice = 0 01.
Solucin:
Se desea probar la hiptesis de que la desviacin estndar del dimetro de
remache es mayor que 0 01 mm. Por tanto,
2
2
H0 : = (0 01)
vs
Ha : 2 > (0 01)2

distribucin normal
260
El estadstico de prueba es:

20 =
(n 1)S 2
02
y la regin de rechazo, viene dada por:

RR = {20 21,n1 } = {20 20 99,14 }
De la tabla (**), se tiene que 20 99,14 = 29 17. Por lo tanto, la regin de
rechazo es:
RR = {20 29 17}
Para los datos muestrales, el valor del estadstico de prueba bajo H0 es:
(n 1)S 2
14(0 008)2
=
02
(0 01)2
= 8 96
20 =
Como 20 = 8 96 < 29 17 no se puede rechazar H0 . Al nivel de significancia de

= 0 01, no hay evidencia suficiente que indique que la desviacin estndar
del dimetro del remache es mayor que 0 01 mm.

Ejemplo 5.18. Considere el ejemplo (5.17). Encuentre el valor p de esta
prueba.
Solucin:
El valor p es la probabilidad de que una variable aleatoria 2 con 14 grados
de libertad sea mayor que el valor observado de 8 96. Entonces,

vp = P 2 8 96

= 1 P 2 8 96
De la figura (5.18)
FaCyT-Matemticas
261
Figura 5.6: Valor p para el ejemplo (5.17)

el rea sombreada excede de 0 01, y entonces el valor p es mayor que 0 01.
Por lo tanto, no se puede rechazar H0 .
Para obtener un valor aproximado del valor p se puede utilizar interpolacin
o extrapolacin lineal. De la tabla (***), se ve que, para 14 grados de libertad
20 1 = 7 79 y 20 9 = 21 07. Entonces, se deduce que

0 1 < P 2 8 96 < 0 9
Usando interpolacin lineal se obtiene que:

P 2 8 96 0 1705
y de esta manera, el valor p (aproximado) para la prueba es:
vp 1 0 1705
= 0 8295

Ejemplo 5.19. Un fabricante de pernos o esprragos esta convencido de que
esta produciendo pernos con varianzas en los dimetros de 0 01. Con propsitos de control de calidad, se obtuvo una muestra de 25 pernos de una lnea
de produccin para estimar la varianza de todos los dimetros, la cul result
ser s2 = 0 009 mm2 Los datos contradicen la afirmacin del fabricante de
pernos? Determine el valor p para la prueba. Qu concluira si se elige un
nivel de significancia de 0 05?

distribucin normal
262
Solucin:
Se requiere una prueba de dos colas,
H0 : = 0 01
vs
Ha : 2 6= 0 01
El valor del estadstico de prueba bajo H0 es:
24(0 009)
(n 1)s2
=
2
0
0 01
= 21 6
20 =
Como se tiene una alternativa de dos colas y la distribucin chi-cuadrado es

asimtrica, entonces para el clculo del valor p, no se puede proceder de la
misma forma que en las pruebas de la distribucin normal o la distribucin t
de Student que son distribuciones simtricas. En consecuencia, se tiene que
aproximar el valor p para esta prueba. De la tabla (***), se tiene que para
24 grados de libertad 20 025 = 12 40 y 20 975 = 39 38. Como indica la figura
(5.7)

El valor del estadstico de prueba se encuentra ms cerca del valor crtico del
extremo izquierdo de la distribucin chi-cuadrado con 24 grados de libertad.
Por lo tanto, se calcula P (2 21 6) y como se debe incluir un rea correspondiente igual en la cola superior, entonces el valor p de la prueba viene
dado por

vp = 2P 2 21 6
Como para 24 grados de libertad 20 1 = 15 66 y 20 9 = 33 20, usando interpolacin lineal, se tiene que:

P 2 21 6 0 3709
FaCyT-Matemticas
263
y de esta forma el valor p (aproximado) de la prueba es:

vp 2(0 3709) = 0 7418
Ya sea que se use los valores crticos obtenidos de la tabla (**) o el valor p
obtenido (es evidente que = 0 05 es menor que el valor p), por lo tanto
no se puede rechazar la afirmacin del fabricante de pernos en el nivel de
= 0 05.

5.9.
Pruebas de hiptesis sobre la varianzas de

dos distribuciones normales
Supngase que X1 , X2 , . . . , Xnx y Y1 , Y2 , . . . , Yny son muestras aleatorias independientes seleccionadas de dos distribuciones normales con media x y
varianza x2 , y media y y varianza y2 , respectivamente, donde las varianzas
x2 y y2 son desconocidas. Si Sx2 y Sy2 son las varianzas muestrales, entonces
del Teorema (2.15), se tiene que:
F =
y2 Sx2
Sx2 /x2
=
Sy2 /y2
x2 Sy2
sigue una distribucin F con (nx 1) grados de libertad en el numerador

y (ny 1) grados de libertad en el denominador. Supngase que se desea
probar la hiptesis nula H0 : x2 = y2 contra la alternativa H0 : x2 > y2 .
Como las varianzas muestrales Sx2 y Sy2 estiman las respectivas varianzas
poblacionales, de manera intuitiva, se rechaza H0 en favor de Ha si Sx2 es
mucho mayor que Sy2 . Por lo tanto, la forma de la regin de rechazo es:
RR = {Sx2 /Sy2 k}
en donde k se elige de modo que la probabilidad de cometer un error tipo
I sea . El valor apropiado de k depende de la distribucin de probabilidad
del estadstico Sx2 /Sy2 bajo H0 . De esta manera,

= P Sx2 /Sy2 k | x2 = y2
Sec 5.9. Pruebas de hiptesis sobre la varianzas de dos

distribuciones normales
264
Dada la hiptesis nula que x2 = y2 , se deduce que F = Sx2 /Sy2 y la regin de

rechazo RR dada antes es equivalente a
RR = {F k} = {F f1 }
en donde f1 es el valor cuantil de la distribucin F con v1 = nx 1 y v2 =
ny 1 grados de libertad en el numerador y denominador, respectivamente,
tal que
P (F f1 ) = 1
Para la prueba de la hiptesis nula H0 : x2 = y2 contra la alternativa
H0 : x2 < y2 o la prueba de la hiptesis nula H0 : x2 = y2 contra la alternativa H0 : x2 6= y2 se puede proceder de una forma anloga para obtener
la regin de rechazo para un tamao del error tipo I . Para la hiptesis
alternativa de cola inferior, se rechaza H0 en favor de Ha si Sx2 es mucho
menor que Sy2 y para la hiptesis alternativa de dos colas se rechaza H0 en
favor de Ha si Sx2 es suficientemente diferente de Sy2 . En la siguiente tabla se
presenta un resumen de las pruebas de hiptesis de nivel sobre la varianzas
de dos distribuciones normales
Prueba de hiptesis para x2 = y2
Suposiciones: muestras independientes de poblaciones normales.
H0 : x2 = y2
2
2
x > y
Ha : x2 < y2
2
x 6= y2

s2
Estadstico de prueba bajo H0 : f0 = x2
sy

{f0 f1,nx 1,xy 1 }
RR : {f0 f,nx 1,xy 1 }
{f0 f1 2 ,nx 1,xy 1 o f0 f 2 ,nx 1,xy 1 } (RR de dos colas)
FaCyT-Matemticas
265
Ejemplo 5.20. Consider el ejemplo (5.15) en donde se asumi que las varianzas eran iguales al comparar la resistencia a la presin interna de dos
tipos de botellas Existe alguna evidencia que indique una diferencia en las
varianzas poblacionales? Utilice = 0 1.
Solucin:
Se desea probar
2
2
H0 : 1 = 2
vs
Ha : 12 6= 22
El estadstico de prueba bajo H0 es:
F0 =
S12
S22
Dado que n1 = 12, n2 = 10 y = 0 1, la regin de rechazo es:

RR = {f0 f1 2 ,n1 1,x2 1 o f0 f 2 ,n1 1,x2 1 }
= {f0 f0 95,11,9 o f0 f0 05,11,9 }
De la tabla (***), se tiene que f0 95,11,9 = 3 10 y f0 05,11,9 = 1/f0 95,9,11 =
1/2 90 = 0 35. De esta manera, la regin de rechazo es:
RR = {f0 3 10 o f0 0 35}
Dado que s21 = (3 4)2 y s22 = (3 8)2 , el valor de estadstico de prueba bajo H0
es:
s2
11 56
= 0 80
f0 = 12 =
s2
14 44
Como f0 05,11,9 = 0 35 < 0 80 < f0 95,11,9 = 3 10, no se puede rechazar H0 con
el nivel de significancia = 0 1. Por lo tanto, no hay evidencia fuerte que
indique una diferencia en las varianzas poblacionales.

Ejemplo 5.21. Considere el ejemplo (5.20). Encuentre el valor p de esta
prueba.
Sec 5.9. Pruebas de hiptesis sobre la varianzas de dos

distribuciones normales
266
Solucin:
Dado que el valor calculado esta ms prximo a la cola inferior de la distribucin F que a la cola superior (ver figura (***)), entonces se calcula la
probabilidad de que una variable aleatoria F con 11 y 9 grados de libertad en
el numerador y denominador, respectivamente, sea menor que 0 80 es , esto
es:
P (F 0 80)
dado que es arbitrario el hecho de cul poblacin sea identificada como la
uno, el valor del estadstico de prueba bajo H0 tambin pud calcularse
como
14 44
s2
= 1 25
f0 = 22 =
s1
11 56
La probabilidad de que una variable aleatoria F con 9 y 11 grados de libertad
en el numerador y denominador, respectivamente, sea mayor que 1 25 es,
esto es:
P (F 1 25) = 1 P (F 1 25)
1
De esta manera, el valor p del estadstico de prueba es la suma de las dos
probabilidades
vp =
Como vp > 0 1 no es posible rechazar la hiptesis nula H0 .

FaCyT-Matemticas
267
5.10.
Potencia de las pruebas
La calidad de una prueba es medida por y , las probabilidades de errores

tipo I y tipo II, respectivamente. Por lo general, el valor de (mxima probabilidad del error tipo I que se puede tolerar) se fija y se determina la regin
de rechazo. Un concepto relacionado muy til para evaluar el desempeo de
una prueba recibe el nombre de potencia de la prueba.
Definicin 5.8. Potencia de la prueba

Suponga que W es el estadstico de prueba y RR es la regin de rechazo para
una prueba de una hiptesis estadstica que involucra el valor de un parmetro
. Entonces, la potencia de la prueba es la probabilidad de que la prueba lleve
al rechazo de H0 cuando el valor real del parmetro es , y se denota por p().
Esto es:
p() = P (W este en la RR cuando el cuando el valor real del parmetro es )
Dado que () es la probabilidad de que un valor de la estadstica de prueba

no se encuentre en la regin de rechazo RR cuando H0 es falsa, entoces
1 () representa la probabilidad de que un valor de la estadstica de
prueba se encuentre en la regin de rechazo RR cuando H0 es falsa. De esta
manera,
si H0 es cierta
p() =
1 () si Ha es cierta
Si el valor del parmetro de Ha es cierto, entonces la potencia de una prueba
es la probabilidad de detectar que H0 es, en forma verdadera, falsa.
Se sabe que para un fijo y una hiptesis alternativa dada, para cualquier
valor de a partir de Ha , puede disminuirse la probabilidad del error tipo II
si se incrementa el tamao de la muestra. De este hecho, se desprende que la
funcin potencia aumentar conforme aumente el tamao de la muestra, es
decir, aumenta la capacidad de la prueba para detectar que la hiptesis nula
es en forma verdadera, falsa.
Sec 5.10. Potencia de las pruebas
268
Ejemplo 5.22. Considere el ejemplo (5.8). Si el verdadero valor de 2 es

2 = 1 1,cul sera la probabilidad de que la prueba detecte este valor?
Solucin:
Como la diferencia 1 2 = 1 esta bajo la hiptesis alternativa, entonces la
probabilidad de que la prueba detecte este valor es la potencia de la prueba,
es decir,
p (1 2 ) = P (rechazar H0 | H0 es falsa)
dado que se tiene una hiptesis alternativa de dos colas, entonces la forma
de regin de rechazo viene dada por:
RR = {X 1 X 2 k1 o X 1 X 2 k2 }
donde k1 y k2 son los valores crticos con respecto a la distribucin de muestreo de X 1 X 2 . En consecuencia, la probabilidad de que la prueba detecte
esta diferencia es:

p (1) = P X 1 X 2 k1 o X 1 X 2 k2 | 1 2 = 1
Dado que = 0 01, los valores crticos se pueden determinar y de esta manera
especificar la regin de rechazo, de manera tal que

P X 1 X 2 k1 o X 1 X 2 k2 | 1 2 = 0 = 0 01
bajo H0 y dado que las muestras son grandes, la distribucin de muestreo de

X 1 X 2 tiene una distribucin normal (aproximada) con:
E X1 X2 = 0 y V X1 X2
12 22
=
+
n1 n2
FaCyT-Matemticas
269
Entonces

0 01 = P X 1 X 2 k1 o X 1 X 2 k2 | 1 2 = 0

= P X 1 X 2 k1 | 1 2 = 0 + P X 1 X 2 k2 | 1 2 = 0
k1 0
k2 0
= P Z q 2
+ P Z q 2
2
2
1
1
+ n22
+ n22
n1
n1
k1
+ P Z q k2
= P Z q
1 06
1 06
1 35
1 35
+ 50
+ 50
50
50
|
{z
} |
{z
}
0 005
0 005
Dado que se pueden determinar el valor cuantil z0 005 de la normal estndar

tales que
P (Z z0 005 ) = 0 005
se tiene que:
k2
q
1 35
50
1 06
50
= z0 005
y de aqu
r
1 35 1 06
+
50
50
r
2 41
= 2 58
50
= 0 56
k1 = z0 005
por simtria, se tiene que k2 = 0 56. De esta manera, la probabilidad pedida

270
viene dada por:

X 1 X 2 0 56 o X 1 X 2 0 56 | 1 2 = 1

= P X 1 X 2 0 56 | 1 2 = 1 + P X 1 X 2 0 56 | 1 2 = 1
0 56 1
0 56 1
+ P Z q
= P Z q
1 35
1 06
1 35
1 06
50 + 50
50 + 50
p(1) = P
= P (Z 7 10) + P (Z 2)
= P (Z 7 10) + 1 P (Z 2) = 0 + 1 0 0228
= 0 9772
De esta forma, la probabilidad de que la prueba detecte la diferencia entre

las medias 1 2 = 1 es 0 9772.

Ejemplo 5.23. Considere el ejemplo (5.17). Supngase que si la verdadera
desviacin estndar del dimetro excede el valor 0 01 mm en un 25 % cul
es la probabilidad de que la prueba nos lleve a rechazar la hiptesis nula?
Solucin:
La potencia de la prueba para un valor a2 que esta en la hiptesis alternativa
es:
p(a2 ) = P (rechazar H0 | H0 es falsa)
donde a = 0 01 + 0 01(0 25) = 0 0125. Dado que se tiene una alternativa de
cola derecha, la forma de la regin de rechazo viene dada por:
RR = {S 2 k}
Dado que = 0 01, el valor de k se obtiene de la siguiente manera:
0 01 = P (rechazar H0 | H0 es cierta)

= P S 2 k | 2 = (0 01)2

14k
2
= P 14
(0 01)2
De aqu que:

P 214
14k
(0 01)2

= 0 99
FaCyT-Matemticas
271
Dado que se puede determinar el valor cuantil 20 99,14 de la distribucin chicuadrada con 14 grados de libertad tal que

P 2 20 99,14 = 0 99
se tiene que:
14k
= 20 99,14
2
(0 01)
despejando a k de la expresin anterior
(0 01)2
14
(0 01)2
= 29 17
14
= 0 00020
k = 20 99,14
Por consiguiente,
p((0 0125)2 ) = P S 2 0 00020 | a2 = (0 0125)2

14(0 00020)
2
= P 14
(0 0125)2

= P 214 17 92

= 1 P 214 17 92
Como los valores cuantiles 20 1,14 = 7 79 y 20 9,14 = 21 07, entonces (por

interpolacin lineal)

P 214 17 92 0 7102
de esta manera, si la verdadera varianza del dimetro es 2 = (0 0125)2 , la
probabilidad de que la prueba nos lleve a rechazar la hiptesis nula es:
p(0 0125)2 ) 1 0 7102 = 0 2898

Si se tiene una hiptesis alternativa compuesta, la probabilidad del error
tipo II y la potencia de la prueba varan para los diferentes valores de bajo
la hiptesis alternativa Ha . A la funcin (), se le conoce como funcin
caracteristica de operacin y cuando se grfica () para diversos valores de
de Ha , se obtiene una curva caracteristica de operacin y a la funcin p()
se le conoce como funcin potencia y cuando se grfica p() para diversos
valores de de Ha , se obtiene la curva de potencia de la prueba.
272
Ejemplo 5.24. La cantidad promedio que se coloca en un recipiente en un

proceso de llenado se supone que es de 20 litros. En forma peridica, se
escogen al azar 25 recipientes y el contenido de cada uno de stos se pesa.
Se desea probar
H0 : = 20
vs
Ha : 6= 20
El proceso se juzga como fuera de control cuando la media muestral X es
menor o igual a 19 8 o mayor o igual a 20 2 litros. Se supone que la cantidad
que se vaca en cada recipiente se encuentra de forma aproximada por una
distribucin normal con una desviacin estndar de 0 5 litros.
a. Obtener la probabilidad del error tipo I.
b. Obtener y graficar la funcin de potencia para los siguientes valores
medios de llenado: 19 5, 19 6, 19 7, 19 8, 19 9, 20, 20 1, 20 2, 20 3, 20 4,
20 5.
c. Como una prueba alternativa, considrese el rechazo de H0 cuando X
19 75 o X 20 25. Si el tamao del error tipo I es de 0 05, cul de
las dos pruebas es la mejor?
Solucin:
Solucin a.
Bajo la hiptesis nula H0 , la distribucin de X es de forma aproximada
2
= 0 25/25. Por lo tanto, la probanormal con media X = 20 y varianza X
bilidad del error tipo I es:

= P X 19 8 o X 20 2 | = 20

= P X 19 8 | = 20 + P X 20 2 | = 20

19 8 20
20 2 20
=P Z
+P Z
0 5/ 25
0 5/ 25
= P (Z 2) + P (Z 2)
por simetra
= 2P (Z 2) = 2(0 0228)
= 0 0456
FaCyT-Matemticas
273
Solucin b.
Por definicin, la potencia de la prueba viene dada por:
p() = P (Rechazar H0 cuando el valor del parmetro es )
de esta manera, si = 19 5 la potencia de la prueba es:

p(19 5) = P X 19 8 o X 20 2 | = 19 5

= P X 19 8 | = 19 5 + P X 20 2 | = 19 5

20 2 19 5
19 8 19 5
+P Z
=P Z
0 5/ 25
0 5/ 25
= P (Z 3) + P (Z 7)
= P (Z 3) + 1 P (Z 7) = 0 9987 + 1 1
= 0 9987
De la misma forma se puede continuar el proceso de calcular la potencia de
la prueba para los otros valores medios de llenado. En la siguiente tabla se
presenta los resultados obtenidos.
19 5
19 6
19 7
19 8 19 9
20
20 1 20 2
20 3
20 4
20 5
p() 0 9987 0 9772 0 8413 0 5 0 16 0 0456 0 16 0 5 0 8413 0 9772 0 9987
Solucin c.
La probabilidad del error tipo I es:

= P X 19 75 o X 20 25 | = 20

= P X 19 75 | = 20 + P X 20 25 | = 20

19 75 20
20 25 20
+P Z
=P Z
0 5/ 25
0 5/ 25
= P (Z 2 5) + P (Z 2 5)
por simetra
= 2P (Z 2 5) = 2(0 0062)
= 0 0124
Ya que ambas pruebas tienen valores de menores al tamao mximo que
puede tolerarse del error tipo I, se compararn sus funciones de potencia para
274
decidir cul es la mejor de las dos. La potencia de la prueba para = 19 5

viene dada por:

p(19 5) = P X 19 75 o X 20 25 | = 19 5

= P X 19 75 | = 19 5 + P X 20 25 | = 19 5

19 75 19 5
20 25 19 5
=P Z
+P Z
0 5/ 25
0 5/ 25
= P (Z 2 5) + P (Z 7 5)
= P (Z 2 5) + 1 P (Z 7 5) = 0 9938 + 1 1
= 0 9938
En la siguiente tabla se dan las potencias de la prueba para los distintos
valores medios de llenado.
19 5
19 6
19 7
19 8
19 9
20
20 1
20 2
20 3
20 4
20 5
p() 0 9938 0 9332 0 6915 0 3085 0 0670 0 0124 0 0670 0 3085 0 6915 0 9332 0 9938
De las tablas anteriores se observa que para cualquier valor de , la potencia

de la prueba del item b es mayor que la prueba del item c. De acuerdo con
lo anterior, la prueba del item b es la mejor prueba a utilizar para probar las
hiptesis indicadas. La figura (1.8) muestra las grficas de la funcin potencia
para la prueba del item b y c. La curva punteada es la funcin potencia de la
prueba del item c.
Figura 5.9: Grficas de las funcin potencia del item b y c

FaCyT-Matemticas
275
5.11.
Lema de Neyman-Pearson
Supngase que se desea probar una hiptesis nula

H0 : = 0
contra una hiptesis alternativa simple
Ha : = a
Como se est interesado slo en dos valores particulares de (0 y a ), se
desea escoger una regin de rechazo RR para que = p(0 ) sea un valor fijo
y p(a ) sea tan grande como sea posible. Es decir, se busca la ms potente
prueba de nivel . El siguiente Teorema, conocido como Teorema de NeymanPearson, proporciona la forma de la regin de rechazo. La regin de rechazo
real depende del valor especificado para .
Teorema 5.1. (Teorema de Neyman-Pearson) Supngase que

se desea probar la hiptesis nula simple H0 : = 0 contra la hiptesis alternativa simple Ha : = a , con base en una muestra aleatoria
X1 , X2 , . . . , Xn de tamao n de una poblacin cuya funcin (densidad) de probabilidad es f (x; ). Sea L (x1 , x2 , . . . , xn ; ) la funcin de
verosimilitud de la muestra aleatoria cuando el valor del parmetro
es . Entonces, para un dado, la prueba que maximiza la potencia
en a tiene una regin de rechazo, RR, determinada por
L (x1 , x2 , . . . , xn ; 0 )
k
L (x1 , x2 , . . . , xn ; a )
interior a RR,
L (x1 , x2 , . . . , xn ; 0 )
k
L (x1 , x2 , . . . , xn ; a )
exterior a RR,

una distribucin normal con media desconocida y varianza 2 conocida.
Sec 5.11. Lema de Neyman-Pearson
276
Determinar la mejor regin crtica de tamao para probar
H0 : = 0
vs
Ha : = a
en donde a > 0 .
Solucin:
L (x1 , x2 , . . . , xn ; )
1
(2)n/2 ( 2 )n/2
n
1 X
(xi )2
exp 2
2 i=1
Bajo H0 la funcin de verosimilitud es:

L (x1 , x2 , . . . , xn ; 0 )
1
(2)n/2 ( 2 )n/2
n
1 X
exp 2
(xi 0 )2
2 i=1
y bajo Ha esta es:

L (x1 , x2 , . . . , xn ; a )
1
(2)n/2 ( 2 )n/2
n
1 X
exp 2
(xi a )2
2 i=1
Entonces, por el Teorema (5.1), la mejor regin crtica es aquella para la cual

n
P
2
1
exp 22
(xi 0 )
i=1

k
n
P
2
1
exp 22
(xi a )
i=1
por propiedades de potenciacin, esta desigualdad se puede escribir como

(
" n
#)
n
X
X
1
exp
(xi a )2
(xi 0 )2
k
2
2 i=1
i=1
tomando logaritmo neperiano en ambos lados de la desigualdad y multiplicando por 2 2 , se tiene que:
n
X
i=1
(xi a )2
n
X
(xi 0 )2 2 2 ln(k)
(5.8)
i=1
FaCyT-Matemticas
277
desarrollando y simplificando el lado izquierdo de (5.8), se tiene que:

n
X
i=1
(xi a )
n
X
n
X
(xi 0 ) =
i=1
x2i 2a
i=1
n
X
xi + n2a
i=1
n
X
x2i + 20
i=1
= n(2a 20 ) 2(a 0 )
n
X
n
X
xi n20
i=1
xi
i=1
sustituyendo en (5.8), se tiene que:

n(2a
20 )
2(a 0 )
n
X
xi 2 2 ln(k)
i=1
o
2(a 0 )
n
X
xi 2 2 ln(k) n(2a 20 )
i=1
puesto que a > 0 , la cantidad 2(a 0 ) es negativa; de esta forma

n
X
xi
i=1
o
x
n(2a 20 2 2 ln(k))
2(a 0 )
n(2a 20 ) 2 2 ln(k)
2n(a 0 )
(5.9)
La expresin (5.9) define la forma de la mejor regin crtica para probar
H0 : = 0
vs
Ha : = a
en donde a > 0 . Es decir, la mejor regin crtica es el extremo derecho de
la distribucin de muestreo de X bajo la hiptesis nula.
Para un dado, el valor crtico c se puede determinar de manera tal que:

P X c | = 0 =
Ya que bajo H0 ,

X N 0 , 2 /n
Sec 5.11. Lema de Neyman-Pearson
278
entonces
= P X c | = 0

= 1 P X c | = 0

c 0
= 0
=1P Z
/ n
y

c 0
= 0 = 1
P Z
/ n
de esta manera:
o
c 0
= z1
/ n
c = z1 + 0
n
por lo tanto, se rechaza H0 : = 0 en favor de la hiptesis alternativa

Ha : = a cuando el valor de X sea mayor o igual a n z1 +0 . Entonces,
la prueba de nivel que tiene el mximo valor posible para la potencia de la
prueba p(a ) est basada en el estadstico X y la regin de rechazo RR =
{x n z1 + 0 }.

Observese que ni el estadstico de prueba ni la regin de rechazo dependen del
valor particular asignado a a siempre que a > 0 . Esto es, para cualquier
valor de a mayor que 0 , se obtiene la misma regin de rechazo. Por lo
tanto, la prueba de nivel con la regin de rechazo dada anteriormente
tiene el mximo valor posible para la potencia p(a ) para toda a > 0 .
Es la prueba uniformemente ms potente para probar H0 : = 0 contra la
hiptesis alternativa Ha : > a .
una distribucin de Poisson con parmetro desconocido. Determinar la
mejor regin crtica de tamao para probar
H0 : = 0
vs
Ha : = a
FaCyT-Matemticas
279
donde a > 0 .
Solucin:
La funcin de verosimilitud bajo H0 y bajo Ha son:
n
P
xi
exp{n0 }i=1
0
L(x1 , . . . , xn ; 0 ) =
n
Q
xi !
i=1
y
n
P
xi
exp{na }i=1
a
L(x1 , . . . , xn ; a ) =
n
Q
xi !
i=1
respectivamente. De est manera, la mejor regin crtica es aquella para la

cul
L(x1 , . . . , xn ; 0 )
k
L(x1 , . . . , xn ; a )
o
n
P
exp{n0 }i=1
0
n
Q
xi !
i=1
n
P
exp{na }i=1
a
n
Q
xi !
i=1
o

0
a
xi
k
xi
n
P
xi
i=1
exp{n(a 0 )} k
Tomando logaritmo neperiano, se tiene que:

ln(0 /1 )
n
X
xi + n(a 0 ) ln(k)
i=1
o
ln(0 /1 )
n
X
i=1
xi ln(k) n(a 0 )
280
Pero si a > 0 , entonces 0 < 0 /a < 1 y el nmero neperiano de un

nmero entre 0 y 1 es negativo. Por lo tanto,
n
X
i=1
xi
ln(k) n(a 0 )
ln(0 /1 )
(5.10)
La expresin (5.10) define la forma de la mejor regin crtica para probar

H0 : = 0 contra H0 : = a > 0 .
Dado que Y =
n
P
Xi tambin es una variable aleatoria de Poisson con par-
i=1
metro n0 bajo H0 , el valor crtico se escoge de manera tal que

!
n
X
P
Xi c =
i=1
Debido a que Y es una variable discreta, es ms difcil determinar el valor

crtico c de manera tal que
!
n
X
P
Xi c
i=1
sea exactamente igual a la probabilidad del error tipo I . Lo que se hace

para esta situacin es escoger el valor crtico c cuya rea deber ser lo ms
cercana al tamao del error tipo I que pueda tolerarse.

5.12.
1. Un fabricante de automviles importante ha tenido que retirar varios

modelos de su lnea 2009 debido a problemas de control de calidad
que no fueron descubiertos con los procedimientos finales de inspeccin
aleatoria. ste es un ejemplo de:
a. Error tipo I.
b. Error tipo II.
c. Error tipo I y error tipo II.
FaCyT-Matemticas
281
d. Ningn tipo de error.

2. Si se dice que = 0 10 para una prueba de hiptesis dada, entonces se
esta diciendo que:
a. 10 % es nuestro estndar mnimo para una probabilidad aceptable.
b. 10 % es el riesgo que se corre de rechazar una hiptesis que es
cierta.
c. 10 % es el riesgo que se corre de aceptar una hiptesis que es falsa.
d. a. y b. solamente.
e. a. y c. solamente.
3. Suponga que se realiza una prueba de hiptesis para un proceso en el
que un error tipo I puede ser muy costoso, pero un error tipo II puede
resultar relativamente barato y sin importancia. Cul de los siguientes
sera la mejor eleccin para en esta prueba?
a. 0 01.
b. 0 10.
c. 0 25.
d. 0 50.
e. Ninguno de los anteriores.
4. Se esta interesado en probar si una moneda est o no balanceada, con
base en el nmero de caras X en 36 tiros de la moneda.
a. Enuncie las hiptesis nula y alternativa para esta situacin.
b. Si se usa la regin de rechazo, RR = {|x 18| 4}, cul es el
valor de ? cul es el valor de si p = 0 7?
5. Los salarios por hora en una industria particular estn distribuidos
normalmente con media de $13 20 y desviacin estndar de $2 5. Una
compaa en esta industria emplea 40 trabajadores, pagndoles un promedio de $12 20 por hora. Esta compaa puede ser acusada de pagar
salarios abajo del estndar? Use una prueba de nivel 0 01.
282
6. El ndice Rockwell de dureza para acero se determina al presionar una

punta de diamante en el acero y medir la profundidad de la penetracin.
Para 50 especmenes de una aleacin de acero, el ndice Rockwell de
dureza promedio es 62 con desviacin estndar de 8. El fabricante dice
que esta aleacin tiene un ndice de dureza promedio de al menos 64.
Hay suficiente evidencia para refutar lo dicho por el fabricante con un
nivel de significancia de 1 %?
7. Un fabricante asegura que al menos 20 % del pblico prefiri su producto. Se toma una muestra de 100 personas para comprobar su afirmacin.
Con = 0 05, qu tan pequeo necesitara ser el porcentaje muestral
antes de que la aseveracin pueda ser refutada legtimamente?
8. Un politlogo cree que la fraccin p1 de republicanos es mayor que
la fraccin p2 de demcratas que estn a favor de la pena de muerte.
l adquiri muestras aleatorias de 200 republicanos y 200 demcratas
y encontr 46 republicanos y 34 demcratas a favor de la pena de
muerte. Esta evidencia proporciona apoyo estadstico para la creencia
del investigador? Use = 0 05.
9. Consulte el ejercicio (6). El acero es suficientemente duro para satisfacer
los requisitos de uso si la dureza media Rockwell no cae por debajo de
60. Usando la regin de rechazo encontrada en el ejercicio (6), encuentre
la probabilidad de que la prueba no pueda rechazar H0 cuando la media
real es = 60.
10. Consulte el ejercicio (6). El politlogo debera haber diseado una prueba para la cul es suficientemente pequea cuando p1 excede a p2 en
una cantidad significativa. Por ejemplo, determine un tamao muestral
comn n para una prueba con = 0 05 y 0 20 cuando en realidad
p1 excede a p2 en 0 1. (Sugerencia: el valor mximo de p(1 p) es 0 25).
11. Una compaa de productos para el consumidor est desarrollando un
nuevo champ, y est interesada en la altura de la espuma (en mm). La
altura de la espuma tiene una distribucin normal, con una desviacin
estndar de 20 mm. La compaa desea probar H0 : = 175 mm contra
Ha : > 175mm, utilizando los resultados obtenidos con 10 muestras.
a. Encuentre la probabilidad del error tipo I si la regin crtica es
RR = {x > 185}.
FaCyT-Matemticas
283

b. Cul es la probabilidad del error tipo II si la verdadera altura
promedio de la espuma es 195 mm?
c. Supngase que la media muestral es x = 190 mm. a que conclusin puede llegarse?
d. Suponga ahora que el tamao de la muestra aumenta a n = 16.
Dnde debe colocarse la frontera de la regin crtica si se desea
que la probabilidad del error tipo I siga siendo la misma que cuando el tamao de la muestra era n = 10?
e. Con n = 16 y la regin crtica determinada en el inciso d., encuentre la probabilidad del error tipo II si el valor verdadero de la
altura promedio de la espuma es 190 mm.
f. Compare el valor obtenido en el inciso e. con el calculado en el
inciso b. A qu conclusin puede llegar?
12. Se estudia el rendimiento de un proceso qumico. De la experiencia previa con este proceso, se sabe que la desviacin estndar del rendimiento
es 3. En los cincos das anteriores de operacin de la planta, se han observado los siguientes rendimientos: 91 6 %, 88 75 %, 90 8 %, 89 95 % y
91 3 %. Utilice = 0 05.
a. Existe evidencia de que el rendimiento no es del 90 %?
b. Cul es el valor p de esta prueba?
c. Qu tamao de muestra se requiere para detectar un rendimiento
promedio verdadero de 85 % con una probabilidad de 0 95?
c. Cul es la probabilidad del error tipo II si el rendimiento promedio verdadero es 92 %?
13. Una muestra aleatoria de 37 estudiantes de segundo grado que practicaban deporte obtuvieron calificaciones de habilidad manual con una
media de 32 19 y una desviacin estndar de 4 34. Una muestra independiente de 37 estudiantes del mismo grado que no los practicaban
tuv calificaciones de destreza manual con media de 31 68 y una desviacin estndar de 4 56.
a. Aplique una prueba para ver si existe suficiente evidencia que indique que los estudiantes de segundo grado que practican deportes
tienen una calificacin ms alta en destreza manual. Use = 0 05.
284
b. Para la regin de rechazo empleada en el inciso a., calcule cuando

1 2 = 3.
c. Encuentre los tamaos muestrales que dan como resultado =
0 05 y = 0 05 cuando 1 2 = 3. (Suponga muestras de igual
tamao para cada grupo).
14. Una mquina expendedora de gaseosas fue diseada para descargar en
promedio 7 onzas de lquido por taza. En una prueba de la mquina,
diez tazas de lquido se sacaron de la mquina y se midieron. La media
y la desviacin estndar de las diez mediciones fueron 7 1 onzas y 0 12
onzas, respectivamente. Estos datos presentan suficiente evidencia para indicar que la descarga media difiere de 7 onzas?
a. Qu se puede decir acerca del nivel de significancia alcanzado
para esta prueba?
b. Cul es la decisin adecuada si = 0 10.
15. Suponga que se prueba H0 : 1 = 2 contra Ha : 1 6= 2 y se planea
utilizar muestras de las dos poblaciones del mismo tamao. Se supone
que embas poblaciones son normales con varianza iguales a 2 = 9. Si se
utiliza = 0 05 y si la verdadera media 1 es 1 = 2 + , qu tamao
de la muestra debe utilizarse para que la potencia de esta prueba sea
al menos 0 90?
16. Existen dos tipos de metales A y B apropiados para su uso por un
fabricante de piezas de fundicin. La tensin de ruptura de ese metal
es un parmetro importante. Se han tomado dos muestras aleatorias
de 11 metales de los dos tipos de metales, y se han realizado ensayos
a corte, la media de la muestra A fue de 50000 lb de presin, la media
de la muestra B fue de 45000 lb de presin, sus desviaciones fueron de
500 lb y 475 lb, respectivamente. La compaia no adoptar el metal A
a menos que la tensin de ruptura de ste exceda a la del metal B al
menos por 4500 lb de presin. Con base a la informacin contenida en la
muestra, la compaia deber utilizar el metal A? Utilice = 0 02 para
llegar a una decisin, asuma igualdad de desviaciones poblacionales.
17. Un diseador de productos est interesado en reducir el tiempo de
secado de una pintura tapaporos. Se prueban dos frmulas de pintura;
la frmula 1 tiene el contenido qumico estndar, y la frmula 2 tiene
FaCyT-Matemticas
285

un nuevo ingrediente secante que debe reducir el tiempo de secado. De
la experiencia se sabe que la desviacin estndar del tiempo de secado
es ocho minutos, y esta variabilidad inherente no debe verse afectada
por la adicin del nuevo ingrediente. Se pintan diez especmenes con la
frmula 1, y otros diez con la frmula 2. Los dos tiempos promedio de
secado muestrales son x1 = 121 min y x2 = 112 min, respectivamente.
a. A qu conclusiones puede llegar el diseador del producto sobre
la eficacia del nuevo ingrediente, utilizando = 0 05?
b. Supngase que la verdadera diferencia en los tiempos de secado es
1 2 = 3 min. Qu tamao de la muestra debe utilizarse para
que la probailidad de que la pruebe detecte este valor sea de 0 10
. (Suponga que el tamao de las muestras son iguales).
18. Sea X1 , X2 , . . . , X20 una muestra aleatoria de tamao n = 20 de una

distribucin normal con media desconocida y varianza 2 = 5 conocida. Se desea probar H0 : = 7 contra Ha : > 7.
a. Encuentre la prueba uniformemente ms potente con nivel de significancia 0 05.
b. Para la prueba del inciso a., encuentre la potencia en cada uno de
los siguientes valores alternativos para : a = 7 5, 8 0, 8 5, 9 0.
c. Trace una grfica de la funcin potencia.
d. Cul es el mnimo tamao muestral para que una prueba de nivel
= 0 05 tenga potencia de al menos 0 80 cuando = 8?
19. Suponga que X1 , X2 , . . . , Xn constituyen una muestra aleatoria de una
distribucin normal con media conocida y varianza 2 desconocida.
Encuentre la prueba de nivel ms potente de H0 : 2 = 02 contra
Ha : 2 = 12 , donde 12 > 02 . Muestre que esta prueba es equivalente
a una prueba 2 . La prueba es uniformemente ms potente para Ha :
2 > 02 ?
20. Suponga que se tiene una muestra aleatoria de cuatro observaciones de
la funcin de densidad
(
2
x
1
x
exp
, x > 0
3
2
f (x; ) =
0,
286
a. Encuentre la regin de rechazo para la prueba ms potente de

H0 : = 0 contra Ha : = a , suponiendo que a > 0 . (Sugerencia: haga uso de la distribucin 2 ).
b. La prueba dad en el inciso a. es uniformemente ms potente para
la alternativa > 0 ?
21. Suponga que X es una muestra aleatoria de tamao 1 desde una poblacin con funcin de densidad
(
x1 , 0 x 1
f (x; ) =
0,
donde > 0
a. Trace la funcin de potencia de la prueba con regin de rechazo:
X > 0 5.
b. Con base en la sola observacin de X, encuentre una prueba uniformemente ms potente de tamao para probar H0 : = 1 contra
Ha : > 1.
probabilidad dada por
(
m
1
mxm1 exp x , x > 0
f (x; ) =
0,
con m denotando una constante conocida.
a. Encuentre la prueba uniformemente ms potente para probar H0 : =
0 contra Ha : > 0 .
b. Si la prueba del inciso a. ha de tener 0 = 100, = 0 05, = 0 05
cuando a = 400, encuentre el tamao muestral apropiado y la
regin crtica.
23. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin que tiene
una distribucin de Poisson con media .
a. Encuentre la forma de la regin de rechazo para una prueba ms
potente de H0 : = 0 contra Ha : = a , donde a > 0 .
FaCyT-Matemticas
287

b. Recuerde que
n
P
Xi tiene una idstribucin de Poisson con media
i=1
n. Indique el modo en que esta informacin se puede utilizar para

determinar constantes asociadas con la regin de rechazo obtenida
en el inciso a.
c. La prueba obtenida en el inciso a. es uniformemente ms potente
para probar H0 : = 0 contra Ha : > 0 ? Por qu?
d. Encuentre la forma de la regin de rechazo para una prueba ms
potente de H0 : = 0 contra Ha : = a , donde a < 0 .
24. suponga que X1 , X2 , . . . , Xn denota una muestra aleatoria de una poblacin que tiene una distribucin exponencial con media .
a. Encuentre la prueba uniformemente ms potente para probar H0 : =
0 contra Ha : = a , donde a < 0 .
b. La prueba obtenida en el inciso a. es uniformemente ms potente
para probar H0 : = 0 contra Ha : < 0 ?
25. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con distribucin de bernoulli y parmetro p. Esto es:
p(xi ; p) = pxi (1 p)1xi ,
xi = 0, 1.
a. Defina la regin de rechazo para la prueba ms potente de H0 : p =

p0 contra Ha : p = pa , donde p0 < pa .
n
P
b. Recuerde que
Xi tiene una distribucin binomial con parmei=1
tros n y p. Indique el modo de determinar los valores de cualesquiera constantes contenidas en la regin de rechazo obtenidas en
el inciso a.
288
FaCyT-Matemticas
Tablas estadsticas
TABLA 1: Valores de la distribucin acumulativa normal estndar.

TABLA 2: Valores de cuantiles de la distribucin acumulativa chicuadrada.
TABLA 3: Valores de cuantiles de la distribucin acumulativa t de
Student.
TABLA 4: Valores de cuantiles de la distribucin acumulativa F de
Fisher.
289
290
Tabla 1: Valores de la distribucin acumulativa normal estndar

z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
-3.5
-3.4
-3.3
-3.2
-3.1
-3.0
-2.9
-2.8
-2.7
-2.6
-2.5
-2.4
-2.3
-2.2
-2.1
-2.0
-1.9
-1.8
-1.7
-1.6
-1.5
-1.4
-1.3
-1.2
-1.1
-1.0
-0.9
-0.8
-0.7
-0.6
-0.5
-0.4
-0.3
-0.2
-0.1
-0.0
0.0002
0.0003
0.0005
0.0007
0.0010
0.0013
0.0019
0.0026
0.0035
0.0047
0.0062
0.0082
0.0107
0.0139
0.0179
0.0228
0.0287
0.0359
0.0446
0.0548
0.0668
0.0808
0.0968
0.1151
0.1357
0.1587
0.1841
0.2119
0.2420
0.2743
0.3085
0.3446
0.3821
0.4207
0.4602
0.5000
0.0002
0.0003
0.0005
0.0007
0.0009
0.0013
0.0018
0.0025
0.0034
0.0045
0.0060
0.0080
0.0104
0.0136
0.0174
0.0222
0.0281
0.0351
0.0436
0.0537
0.0655
0.0793
0.0951
0.1131
0.1335
0.1562
0.1814
0.2090
0.2389
0.2709
0.3050
0.3409
0.3783
0.4168
0.4562
0.4960
0.0002
0.0003
0.0005
0.0006
0.0009
0.0013
0.0018
0.0024
0.0033
0.0044
0.0059
0.0078
0.0102
0.0132
0.0170
0.0217
0.0274
0.0344
0.0427
0.0526
0.0643
0.0778
0.0934
0.1112
0.1314
0.1539
0.1788
0.2061
0.2358
0.2676
0.3015
0.3372
0.3745
0.4129
0.4522
0.4920
0.0002
0.0003
0.0004
0.0006
0.0009
0.0012
0.0017
0.0023
0.0032
0.0043
0.0057
0.0075
0.0099
0.0129
0.0166
0.0212
0.0268
0.0336
0.0418
0.0516
0.0630
0.0764
0.0918
0.1093
0.1292
0.1515
0.1762
0.2033
0.2327
0.2643
0.2981
0.3336
0.3707
0.4090
0.4483
0.4880
0.0002
0.0003
0.0004
0.0006
0.0008
0.0012
0.0016
0.0023
0.0031
0.0041
0.0055
0.0073
0.0096
0.0125
0.0162
0.0207
0.0262
0.0329
0.0409
0.0505
0.0618
0.0749
0.0901
0.1075
0.1271
0.1492
0.1736
0.2005
0.2297
0.2611
0.2946
0.3300
0.3669
0.4052
0.4443
0.4840
0.0002
0.0003
0.0004
0.0006
0.0008
0.0011
0.0016
0.0022
0.0030
0.0040
0.0054
0.0071
0.0094
0.0122
0.0158
0.0202
0.0256
0.0322
0.0401
0.0495
0.0606
0.0735
0.0885
0.1056
0.1251
0.1469
0.1711
0.1977
0.2266
0.2578
0.2912
0.3264
0.3632
0.4013
0.4404
0.4801
0.0002
0.0003
0.0004
0.0006
0.0008
0.0011
0.0015
0.0021
0.0029
0.0039
0.0052
0.0069
0.0091
0.0119
0.0154
0.0197
0.0250
0.0314
0.0392
0.0485
0.0594
0.0721
0.0869
0.1038
0.1230
0.1446
0.1685
0.1949
0.2236
0.2546
0.2877
0.3228
0.3594
0.3974
0.4364
0.4761
0.0002
0.0003
0.0004
0.0005
0.0008
0.0011
0.0015
0.0021
0.0028
0.0038
0.0051
0.0068
0.0089
0.0116
0.0150
0.0192
0.0244
0.0307
0.0384
0.0475
0.0582
0.0708
0.0853
0.1020
0.1210
0.1423
0.1660
0.1922
0.2206
0.2514
0.2843
0.3192
0.3557
0.3936
0.4325
0.4721
0.0002
0.0003
0.0004
0.0005
0.0007
0.0010
0.0014
0.0020
0.0027
0.0037
0.0049
0.0066
0.0087
0.0113
0.0146
0.0188
0.0239
0.0301
0.0375
0.0465
0.0571
0.0694
0.0838
0.1003
0.1190
0.1401
0.1635
0.1894
0.2177
0.2483
0.2810
0.3156
0.3520
0.3897
0.4286
0.4681
0.0002
0.0002
0.0003
0.0005
0.0007
0.0010
0.0014
0.0019
0.0026
0.0036
0.0048
0.0064
0.0084
0.0110
0.0143
0.0183
0.0233
0.0294
0.0367
0.0455
0.0559
0.0681
0.0823
0.0985
0.1170
0.1379
0.1611
0.1867
0.2148
0.2451
0.2776
0.3121
0.3483
0.3859
0.4247
0.4641
FaCyT-Matemticas
291
Tabla 1: Valores de la distribucin acumulativa normal estndar

z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
0.9998
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.9998
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
0.9998
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.9997
0.9998
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7703
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.9997
0.9998
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.9998
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.9998
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
292
Tabla 2: Valores de cuantiles de la distribucin acumulativa chicuadrada
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
0 005
0.00
0.01
0.07
0.21
0.41
0.67
0.99
1.34
1.73
2.15
2.60
3.06
3.56
4.07
4.59
5.14
5.69
6.25
6.82
7.42
8.02
8.62
9.25
9.87
10.50
11.13
11.79
12.44
13.09
13.77
17.16
20.67
24.28
27.96
35.50
43.25
51.14
59.17
67.30
0 010
0.00
0.02
0.11
0.30
0.55
0.87
1.24
1.64
2.09
2.55
3.05
3.57
4.10
4.65
5.23
5.81
6.40
7.00
7.63
8.25
8.89
9.53
10.19
10.85
11.51
12.19
12.87
13.55
14.24
14.94
18.49
22.14
25.88
29.68
37.46
45.42
53.52
61.74
70.05
0 025
0.00
0.05
0.22
0.48
0.83
1.24
1.69
2.18
2.70
3.24
3.81
4.40
5.01
5.62
6.26
6.90
7.56
8.23
8.90
9.59
10.28
10.98
11.69
12.40
13.11
13.84
14.57
15.30
16.04
16.78
20.56
24.42
28.36
32.35
40.47
48.75
57.15
65.64
74.22
0 050
0.00
0.10
0.35
0.71
1.15
1.63
2.17
2.73
3.32
3.94
4.57
5.22
5.89
6.57
7.26
7.96
8.67
9.39
10.11
10.85
11.59
12.34
13.09
13.84
14.61
15.38
16.15
16.92
17.70
18.49
22.46
26.51
30.61
34.76
43.19
51.74
60.39
69.13
77.93
0 100
0.02
0.21
0.58
1.06
1.61
2.20
2.83
3.49
4.17
4.86
5.58
6.30
7.04
7.79
8.55
9.31
10.08
10.86
11.65
12.44
13.24
14.04
14.85
15.66
16.47
17.29
18.11
18.94
19.77
20.60
24.79
29.06
33.36
37.69
46.46
55.33
64.28
73.29
82.36
0 900
2.71
4.60
6.25
7.78
9.24
10.65
12.02
13.36
14.69
15.99
17.28
18.55
19.81
21.07
22.31
23.55
24.77
25.99
27.21
28.42
29.62
30.82
32.01
33.20
34.38
35.57
36.74
37.92
39.09
40.26
46.06
51.80
57.50
63.16
74.39
85.52
96.57
107.56
118.49
0 950
3.84
5.99
7.82
9.49
11.07
12.60
14.07
15.51
16.93
18.31
19.68
21.03
22.37
23.69
25.00
26.30
27.59
28.88
30.15
31.42
32.68
33.93
35.18
36.42
37.66
38.89
40.12
41.34
42.56
43.78
49.81
55.75
61.65
67.50
79.08
90.53
101.88
113.14
124.34
0 975
5.02
7.38
9.36
11.15
12.84
14.46
16.02
17.55
19.03
20.50
21.93
23.35
24.75
26.13
27.50
28.86
30.20
31.54
32.87
34.18
35.49
36.79
38.09
39.38
40.66
41.94
43.21
44.47
45.74
46.99
53.22
59.34
65.41
71.42
83.30
95.03
106.63
118.14
129.56
0 990
6.64
9.22
11.32
13.28
15.09
16.81
18.47
20.08
21.65
23.19
24.75
26.25
27.72
29.17
30.61
32.03
33.43
34.83
36.22
37.59
38.96
40.31
41.66
43.00
44.34
45.66
46.99
48.30
49.61
50.91
57.36
63.71
69.98
76.17
88.40
100.44
112.34
124.13
135.82
0 995
7.90
0.59
12.82
14.82
16.76
18.55
20.27
21.94
23.56
25.15
26.71
28.25
29.88
31.38
32.86
34.32
35.77
37.21
38.63
40.05
41.45
42.84
44.23
45.60
46.97
48.33
49.69
51.04
52.38
53.71
60.31
66.80
73.20
79.52
91.98
104.24
116.35
128.32
140.19
FaCyT-Matemticas
293
Tabla 3: Valores de cuantiles de la distribucin acumulativa t de

Student
t0 001
t0 005
t0 010
t0 025
t0 050
t0 100
t0 200
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
-318.309
-22.327
-10.215
-7.173
-5.893
-5.208
-4.785
-4.501
-4.297
-4.144
-4.025
-3.930
-3.852
-3.787
-3.733
-3.686
-3.646
-3.610
-3.579
-3.552
-3.527
-3.505
-3.485
-3.467
-3.450
-3.435
-3.421
-3.408
-3.396
-3.385
-3.340
-3.307
-3.281
-3.261
-3.232
-3.211
-3.195
-3.183
-3.174
-63.657
-9.925
-5.841
-4.604
-4.032
-3.707
-3.499
-3.355
-3.250
-3.169
-3.106
-3.055
-3.012
-2.977
-2.947
-2.921
-2.898
-2.878
-2.861
-2.845
-2.831
-2.819
-2.807
-2.797
-2.787
-2.779
-2.771
-2.763
-2.756
-2.750
-2.724
-2.704
-2.690
-2.678
-2.660
-2.648
-2.639
-2.632
-2.626
-31.821
-6.965
-4.541
-3.747
-3.365
-3.143
-2.998
-2.896
-2.821
-2.764
-2.718
-2.681
-2.650
-2.624
-2.602
-2.583
-2.567
-2.552
-2.539
-2.528
-2.518
-2.508
-2.500
-2.492
-2.485
-2.479
-2.473
-2.467
-2.462
-2.457
-2.438
-2.423
-2.412
-2.403
-2.390
-2.381
-2.374
-2.369
-2.364
-12.706
-4.303
-3.182
-2.571
-2.571
-2.447
-2.365
-2.306
-2.262
-2.228
-2.201
-2.179
-2.160
-2.145
-2.131
-2.120
-2.110
-2.101
-2.093
-2.086
-2.080
-2.074
-2.069
-2.064
-2.060
-2.056
-2.052
-2.048
-2.045
-2.042
-2.030
-2.021
-2.014
-2.009
-2.000
-1.994
-1.990
-1.987
-1.984
-6.314
-2.920
-2.353
-2.015
-2.015
-1.943
-1.895
-1.860
-1.833
-1.812
-1.796
-1.782
-1.771
-1.761
-1.753
-1.746
-1.740
-1.734
-1.729
-1.725
-1.721
-1.717
-1.714
-1.711
-1.708
-1.706
-1.703
-1.701
-1.699
-1.697
-1.690
-1.684
-1.679
-1.676
-1.671
-1.667
-1.664
-1.662
-1.660
-3.078
-1.886
-1.638
-1.476
-1.476
-1.440
-1.415
-1.397
-1.383
-1.372
-1.363
-1.356
-1.350
-1.345
-1.341
-1.337
-1.333
-1.330
-1.328
-1.325
-1.323
-1.321
-1.319
-1.318
-1.316
-1.315
-1.314
-1.313
-1.311
-1.310
-1.306
-1.303
-1.301
-1.299
-1.296
-1.294
-1.292
-1.291
-1.290
-1.376
-1.061
-0.978
-0.920
-0.920
-0.906
-0.896
-0.889
-0.883
-0.879
-0.876
-0.873
-0.870
-0.868
-0.866
-0.865
-0.863
-0.862
-0.861
-0.860
-0.859
-0.858
-0.858
-0.857
-0.856
-0.856
-0.855
-0.855
-0.854
-0.854
-0.852
-0.851
-0.850
-0.849
-0.848
-0.847
-0.846
-0.846
-0.845
294
Tabla 3: Valores de cuantiles de la distribucin acumulativa t de

Student
t0 800
t0 900
t0 950
t0 975
t0 990
t0 995
t0 999
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.852
0.851
0.850
0.849
0.848
0.847
0.846
0.846
0.845
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.306
1.303
1.301
1.299
1.296
1.294
1.292
1.291
1.290
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.690
1.684
1.679
1.676
1.671
1.667
1.664
1.662
1.660
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.030
2.021
2.014
2.009
2.000
1.994
1.990
1.987
1.984
31.820
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.267
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.438
2.423
2.412
2.403
2.390
2.381
2.374
2.368
2.364
63.656
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.724
2.704
2.690
2.678
2.660
2.648
2.639
2.632
2.626
318.294
22.327
10.214
7.173
5.893
5.208
4.785
4.501
4.297
4.144
4.025
3.930
3.852
3.787
3.733
3.686
3.646
3.610
3.579
3.552
3.527
3.505
3.485
3.467
3.450
3.435
3.421
3.408
3.396
2.285
3.340
3.307
3.281
3.261
3.232
3.211
3.195
3.183
3.174
FaCyT-Matemticas
295
Tabla 4: Valores de cuantiles de la distribucin acumulativa F de

Fisher
1 = 0 90
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200
1 grados de libertad del numerador

10
11
12
13
39.86
8.526
5.538
4.545
4.060
3.776
3.589
3.458
3.360
3.285
3.225
3.177
3.136
3.102
3.073
3.048
3.026
3.007
2.990
2.975
2.961
2.949
2.937
2.927
2.918
2.909
2.901
2.894
2.887
2.881
2.835
2.809
2.791
2.779
2.769
2.762
2.756
2.731
49.50
9.000
5.462
4.325
3.780
3.463
3.257
3.113
3.006
2.924
2.860
2.807
2.763
2.726
2.695
2.668
2.645
2.624
2.606
2.589
2.575
2.561
2.549
2.538
2.528
2.519
2.511
2.503
2.495
2.489
2.440
2.412
2.393
2.380
2.370
2.363
2.356
2.329
53.59
9.162
5.391
4.191
3.619
3.289
3.074
2.924
2.813
2.728
2.660
2.606
2.560
2.522
2.490
2.462
2.437
2.416
2.397
2.380
2.365
2.351
2.339
2.327
2.317
2.307
2.299
2.291
2.283
2.276
2.226
2.197
2.177
2.164
2.154
2.146
2.139
2.111
55.83
9.243
5.343
4.107
3.520
3.181
2.961
2.806
2.693
2.605
2.536
2.480
2.434
2.395
2.361
2.333
2.308
2.286
2.266
2.249
2.233
2.219
2.207
2.195
2.184
2.174
2.165
2.157
2.149
2.142
2.091
2.061
2.041
2.027
2.016
2.008
2.002
1.973
57.24
9.293
5.309
4.051
3.453
3.108
2.883
2.726
2.611
2.522
2.451
2.394
2.347
2.307
2.273
2.244
2.218
2.196
2.176
2.158
2.142
2.128
2.115
2.103
2.092
2.082
2.073
2.064
2.057
2.049
1.997
1.966
1.946
1.931
1.921
1.912
1.906
1.876
58.20
9.326
5.285
4.010
3.405
3.055
2.827
2.668
2.551
2.461
2.389
2.331
2.283
2.243
2.208
2.178
2.152
2.130
2.109
2.091
2.075
2.060
2.047
2.035
2.024
2.014
2.005
1.996
1.988
1.980
1.927
1.895
1.875
1.860
1.849
1.841
1.834
1.804
58.91
9.349
5.266
3.979
3.368
3.014
2.785
2.624
2.505
2.414
2.342
2.283
2.234
2.193
2.158
2.128
2.102
2.079
2.058
2.040
2.023
2.008
1.995
1.983
1.971
1.961
1.952
1.943
1.935
1.927
1.873
1.840
1.819
1.804
1.793
1.785
1.778
1.747
59.44
9.367
5.252
3.955
3.339
2.983
2.752
2.589
2.469
2.377
2.304
2.245
2.195
2.154
2.119
2.088
2.061
2.038
2.017
1.999
1.982
1.967
1.953
1.941
1.929
1.919
1.909
1.900
1.892
1.884
1.829
1.796
1.775
1.760
1.748
1.739
1.732
1.701
59.86
9.381
5.240
3.936
3.316
2.958
2.725
2.561
2.440
2.347
2.274
2.214
2.164
2.122
2.086
2.055
2.028
2.005
1.984
1.965
1.948
1.933
1.919
1.906
1.895
1.884
1.874
1.865
1.857
1.849
1.793
1.760
1.738
1.723
1.711
1.702
1.695
1.663
60.19
9.392
5.230
3.920
3.297
2.937
2.703
2.538
2.416
2.323
2.248
2.188
2.138
2.095
2.059
2.028
2.001
1.977
1.956
1.937
1.920
1.904
1.890
1.877
1.866
1.855
1.845
1.836
1.827
1.819
1.763
1.729
1.707
1.691
1.680
1.670
1.663
1.631
60.47
9.401
5.222
3.907
3.282
2.920
2.684
2.519
2.396
2.302
2.227
2.166
2.116
2.073
2.037
2.005
1.978
1.954
1.932
1.913
1.896
1.880
1.866
1.853
1.841
1.830
1.820
1.811
1.802
1.794
1.737
1.703
1.680
1.665
1.653
1.643
1.636
1.603
60.71
9.408
5.216
3.896
3.268
2.905
2.668
2.502
2.379
2.284
2.209
2.147
2.097
2.054
2.017
1.985
1.958
1.933
1.912
1.892
1.875
1.859
1.845
1.832
1.820
1.809
1.799
1.790
1.781
1.773
1.715
1.680
1.657
1.641
1.629
1.620
1.612
1.579
60.90
9.415
5.210
3.886
3.257
2.892
2.654
2.488
2.364
2.269
2.193
2.131
2.080
2.037
2.000
1.968
1.940
1.916
1.894
1.875
1.857
1.841
1.827
1.814
1.802
1.790
1.780
1.771
1.762
1.754
1.695
1.660
1.637
1.621
1.609
1.599
1.592
1.558
296

Fisher
1 = 0 90
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

14
15
16
17
18
19
20
21
22
23
24
25
26
61.07
9.420
5.205
3.878
3.247
2.881
2.643
2.475
2.351
2.255
2.179
2.117
2.066
2.022
1.985
1.953
1.925
1.900
1.878
1.859
1.841
1.825
1.811
1.797
1.785
1.774
1.764
1.754
1.745
1.737
1.678
1.643
1.619
1.603
1.590
1.581
1.573
1.539
61.22
9.425
5.200
3.870
3.238
2.871
2.632
2.464
2.340
2.244
2.167
2.105
2.053
2.010
1.972
1.940
1.912
1.887
1.865
1.845
1.827
1.811
1.796
1.783
1.771
1.760
1.749
1.740
1.731
1.722
1.662
1.627
1.603
1.587
1.574
1.564
1.557
1.522
61.35
9.429
5.196
3.864
3.230
2.863
2.623
2.454
2.330
2.233
2.156
2.094
2.042
1.998
1.961
1.928
1.900
1.875
1.852
1.833
1.815
1.798
1.784
1.770
1.758
1.747
1.736
1.726
1.717
1.709
1.649
1.613
1.589
1.572
1.559
1.550
1.542
1.507
61.46
9.433
5.193
3.858
3.223
2.855
2.615
2.446
2.320
2.224
2.147
2.084
2.032
1.988
1.950
1.917
1.889
1.864
1.841
1.821
1.803
1.787
1.772
1.759
1.746
1.735
1.724
1.715
1.705
1.697
1.636
1.600
1.576
1.559
1.546
1.536
1.528
1.493
61.56
9.436
5.190
3.853
3.217
2.848
2.607
2.438
2.312
2.215
2.138
2.075
2.023
1.978
1.941
1.908
1.879
1.854
1.831
1.811
1.793
1.777
1.762
1.748
1.736
1.724
1.714
1.704
1.695
1.686
1.625
1.588
1.564
1.547
1.534
1.524
1.516
1.480
61.65
9.439
5.187
3.848
3.212
2.842
2.601
2.431
2.305
2.208
2.130
2.067
2.014
1.970
1.932
1.899
1.870
1.845
1.822
1.802
1.784
1.768
1.753
1.739
1.726
1.715
1.704
1.694
1.685
1.676
1.615
1.578
1.553
1.536
1.523
1.513
1.505
1.468
61.74
9.441
5.184
3.844
3.207
2.836
2.595
2.425
2.298
2.201
2.123
2.060
2.007
1.962
1.924
1.891
1.862
1.837
1.814
1.794
1.776
1.759
1.744
1.730
1.718
1.706
1.695
1.685
1.676
1.667
1.605
1.568
1.543
1.526
1.513
1.503
1.494
1.458
61.81
9.444
5.182
3.841
3.202
2.831
2.589
2.419
2.292
2.194
2.117
2.053
2.000
1.955
1.917
1.884
1.855
1.829
1.807
1.786
1.768
1.751
1.736
1.722
1.710
1.698
1.687
1.677
1.668
1.659
1.596
1.559
1.534
1.517
1.503
1.493
1.485
1.448
61.88
9.446
5.180
3.837
3.198
2.827
2.584
2.414
2.287
2.189
2.111
2.047
1.994
1.949
1.911
1.877
1.848
1.823
1.800
1.779
1.761
1.744
1.729
1.715
1.702
1.690
1.680
1.669
1.660
1.651
1.588
1.551
1.526
1.508
1.495
1.484
1.476
1.438
61.94
9.448
5.178
3.834
3.194
2.822
2.580
2.409
2.282
2.183
2.105
2.041
1.988
1.943
1.905
1.871
1.842
1.816
1.793
1.773
1.754
1.737
1.722
1.708
1.695
1.683
1.673
1.662
1.653
1.644
1.581
1.543
1.518
1.500
1.487
1.476
1.468
1.430
62.00
9.450
5.176
3.831
3.191
2.818
2.575
2.404
2.277
2.178
2.100
2.036
1.983
1.938
1.899
1.866
1.836
1.810
1.787
1.767
1.748
1.731
1.716
1.702
1.689
1.677
1.666
1.656
1.647
1.638
1.574
1.536
1.511
1.493
1.479
1.468
1.460
1.422
62.05
9.451
5.175
3.828
3.187
2.815
2.571
2.400
2.272
2.174
2.095
2.031
1.978
1.933
1.894
1.860
1.831
1.805
1.782
1.761
1.742
1.726
1.710
1.696
1.683
1.671
1.660
1.650
1.640
1.632
1.568
1.529
1.504
1.486
1.472
1.461
1.453
1.414
62.10
9.453
5.173
3.826
3.184
2.811
2.568
2.396
2.268
2.170
2.091
2.027
1.973
1.928
1.889
1.855
1.826
1.800
1.777
1.756
1.737
1.720
1.705
1.691
1.678
1.666
1.655
1.644
1.635
1.626
1.562
1.523
1.498
1.479
1.465
1.455
1.446
1.407
FaCyT-Matemticas
297

Fisher
1 = 0 90
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

27
28
29
30
40
50
60
70
80
90
100
200
62.14
9.454
5.172
3.823
3.181
2.808
2.564
2.392
2.265
2.166
2.087
2.022
1.969
1.923
1.885
1.851
1.821
1.795
1.772
1.751
1.732
1.715
1.700
1.686
1.672
1.660
1.649
1.639
1.630
1.621
1.556
1.517
1.492
1.473
1.459
1.448
1.440
1.400
62.18
9.456
5.170
3.821
3.179
2.805
2.561
2.389
2.261
2.162
2.083
2.019
1.965
1.919
1.880
1.847
1.817
1.791
1.767
1.746
1.728
1.711
1.695
1.681
1.668
1.656
1.645
1.634
1.625
1.616
1.551
1.512
1.486
1.467
1.453
1.442
1.434
1.394
62.22
9.457
5.169
3.819
3.176
2.803
2.558
2.386
2.258
2.159
2.080
2.015
1.961
1.916
1.876
1.843
1.813
1.787
1.763
1.742
1.723
1.706
1.691
1.676
1.663
1.651
1.640
1.630
1.620
1.611
1.546
1.507
1.481
1.462
1.448
1.437
1.428
1.388
62.26
9.458
5.168
3.817
3.174
2.800
2.555
2.383
2.255
2.155
2.076
2.011
1.958
1.912
1.873
1.839
1.809
1.783
1.759
1.738
1.719
1.702
1.686
1.672
1.659
1.647
1.636
1.625
1.616
1.606
1.541
1.502
1.476
1.457
1.443
1.432
1.423
1.383
62.52
9.466
5.160
3.804
3.157
2.781
2.535
2.361
2.232
2.132
2.052
1.986
1.931
1.885
1.845
1.811
1.781
1.754
1.730
1.708
1.689
1.671
1.655
1.641
1.627
1.615
1.603
1.592
1.583
1.573
1.506
1.465
1.437
1.418
1.403
1.391
1.382
1.339
62.68
9.471
5.155
3.795
3.147
2.770
2.523
2.348
2.218
2.117
2.036
1.970
1.915
1.869
1.828
1.793
1.763
1.736
1.711
1.690
1.670
1.652
1.636
1.621
1.607
1.594
1.583
1.572
1.562
1.552
1.483
1.441
1.413
1.392
1.377
1.365
1.355
1.310
62.79
9.475
5.151
3.790
3.140
2.762
2.514
2.339
2.208
2.107
2.026
1.960
1.904
1.857
1.817
1.782
1.751
1.723
1.699
1.677
1.657
1.639
1.622
1.607
1.593
1.581
1.569
1.558
1.547
1.538
1.467
1.424
1.395
1.374
1.358
1.346
1.336
1.289
62.87
9.477
5.149
3.786
3.135
2.756
2.508
2.333
2.202
2.100
2.019
1.952
1.896
1.849
1.808
1.773
1.742
1.714
1.690
1.667
1.647
1.629
1.613
1.597
1.583
1.570
1.558
1.547
1.537
1.527
1.455
1.412
1.382
1.361
1.344
1.332
1.321
1.273
62.92
9.479
5.147
3.782
3.132
2.752
2.504
2.328
2.196
2.095
2.013
1.946
1.890
1.843
1.802
1.766
1.735
1.707
1.683
1.660
1.640
1.622
1.605
1.590
1.576
1.562
1.550
1.539
1.529
1.519
1.447
1.402
1.372
1.350
1.334
1.321
1.310
1.261
62.97
9.480
5.145
3.780
3.129
2.749
2.500
2.324
2.192
2.090
2.009
1.942
1.886
1.838
1.797
1.761
1.730
1.702
1.677
1.655
1.634
1.616
1.599
1.584
1.569
1.556
1.544
1.533
1.522
1.512
1.439
1.395
1.364
1.342
1.325
1.312
1.301
1.250
63.00
9.481
5.144
3.778
3.126
2.746
2.497
2.321
2.189
2.087
2.005
1.938
1.882
1.834
1.793
1.757
1.726
1.698
1.673
1.650
1.630
1.611
1.594
1.579
1.565
1.551
1.539
1.528
1.517
1.507
1.434
1.388
1.358
1.335
1.318
1.304
1.293
1.242
63.16
9.486
5.139
3.769
3.116
2.734
2.484
2.307
2.174
2.071
1.989
1.921
1.864
1.816
1.774
1.738
1.706
1.678
1.652
1.629
1.608
1.590
1.572
1.556
1.542
1.528
1.515
1.504
1.493
1.482
1.406
1.359
1.326
1.302
1.284
1.269
1.257
1.199
298

Fisher
1 = 0 95
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

10
11
12
13
161.4
18.51
10.128
7.709
6.608
5.987
5.591
5.318
5.117
4.965
4.844
4.747
4.667
4.600
4.543
4.494
4.451
4.414
4.381
4.351
4.325
4.301
4.279
4.260
4.242
4.225
4.210
4.196
4.183
4.171
4.085
4.034
4.001
3.978
3.960
3.947
3.936
3.888
199.5
19.00
9.552
6.944
5.786
5.143
4.737
4.459
4.256
4.103
3.982
3.885
3.806
3.739
3.682
3.634
3.592
3.555
3.522
3.493
3.467
3.443
3.422
3.403
3.385
3.369
3.354
3.340
3.328
3.316
3.232
3.183
3.150
3.128
3.111
3.098
3.087
3.041
215.7
19.16
9.277
6.591
5.409
4.757
4.347
4.066
3.863
3.708
3.587
3.490
3.411
3.344
3.287
3.239
3.197
3.160
3.127
3.098
3.072
3.049
3.028
3.009
2.991
2.975
2.960
2.947
2.934
2.922
2.839
2.790
2.758
2.736
2.719
2.706
2.696
2.650
224.6
19.24
9.117
6.388
5.192
4.534
4.120
3.838
3.633
3.478
3.357
3.259
3.179
3.112
3.056
3.007
2.965
2.928
2.895
2.866
2.840
2.817
2.796
2.776
2.759
2.743
2.728
2.714
2.701
2.690
2.606
2.557
2.525
2.503
2.486
2.473
2.463
2.417
230.2
19.29
9.013
6.256
5.050
4.387
3.972
3.688
3.482
3.326
3.204
3.106
3.025
2.958
2.901
2.852
2.810
2.773
2.740
2.711
2.685
2.661
2.640
2.621
2.603
2.587
2.572
2.558
2.545
2.534
2.449
2.400
2.368
2.346
2.329
2.316
2.305
2.259
234.0
19.32
8.941
6.163
4.950
4.284
3.866
3.581
3.374
3.217
3.095
2.996
2.915
2.848
2.790
2.741
2.699
2.661
2.628
2.599
2.573
2.549
2.528
2.508
2.490
2.474
2.459
2.445
2.432
2.421
2.336
2.286
2.254
2.231
2.214
2.201
2.191
2.144
236.8
19.35
8.887
6.094
4.876
4.207
3.787
3.500
3.293
3.135
3.012
2.913
2.832
2.764
2.707
2.657
2.614
2.577
2.544
2.514
2.488
2.464
2.442
2.423
2.405
2.388
2.373
2.359
2.346
2.334
2.249
2.199
2.167
2.143
2.126
2.113
2.103
2.056
238.9
19.37
8.845
6.041
4.818
4.147
3.726
3.438
3.230
3.072
2.948
2.849
2.767
2.699
2.641
2.591
2.548
2.510
2.477
2.447
2.420
2.397
2.375
2.355
2.337
2.321
2.305
2.291
2.278
2.266
2.180
2.130
2.097
2.074
2.056
2.043
2.032
1.985
240.5
19.38
8.812
5.999
4.772
4.099
3.677
3.388
3.179
3.020
2.896
2.796
2.714
2.646
2.588
2.538
2.494
2.456
2.423
2.393
2.366
2.342
2.320
2.300
2.282
2.265
2.250
2.236
2.223
2.211
2.124
2.073
2.040
2.017
1.999
1.986
1.975
1.927
241.9
19.39
8.785
5.964
4.735
4.060
3.637
3.347
3.137
2.978
2.854
2.753
2.671
2.602
2.544
2.494
2.450
2.412
2.378
2.348
2.321
2.297
2.275
2.255
2.236
2.220
2.204
2.190
2.177
2.165
2.077
2.026
1.993
1.969
1.951
1.938
1.927
1.878
243.0
19.40
8.763
5.936
4.704
4.027
3.603
3.313
3.102
2.943
2.818
2.717
2.635
2.565
2.507
2.456
2.413
2.374
2.340
2.310
2.283
2.259
2.236
2.216
2.198
2.181
2.166
2.151
2.138
2.126
2.038
1.986
1.952
1.928
1.910
1.897
1.886
1.837
243.9
19.41
8.745
5.912
4.678
4.000
3.575
3.284
3.073
2.913
2.788
2.687
2.604
2.534
2.475
2.425
2.381
2.342
2.308
2.278
2.250
2.226
2.204
2.183
2.165
2.148
2.132
2.118
2.104
2.092
2.003
1.952
1.917
1.893
1.875
1.861
1.850
1.801
244.7
19.41
8.729
5.891
4.655
3.976
3.550
3.259
3.048
2.887
2.761
2.660
2.577
2.507
2.448
2.397
2.353
2.314
2.280
2.250
2.222
2.198
2.175
2.155
2.136
2.119
2.103
2.089
2.075
2.063
1.974
1.921
1.887
1.863
1.845
1.830
1.819
1.769
FaCyT-Matemticas
299

Fisher
1 = 0 95
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

14
15
16
17
18
19
20
21
22
23
24
25
26
245.4
19.42
8.715
5.873
4.636
3.956
3.529
3.237
3.025
2.865
2.739
2.637
2.554
2.484
2.424
2.373
2.329
2.290
2.256
2.225
2.197
2.173
2.150
2.130
2.111
2.094
2.078
2.064
2.050
2.037
1.948
1.895
1.860
1.836
1.817
1.803
1.792
1.742
245.9
19.43
8.703
5.858
4.619
3.938
3.511
3.218
3.006
2.845
2.719
2.617
2.533
2.463
2.403
2.352
2.308
2.269
2.234
2.203
2.176
2.151
2.128
2.108
2.089
2.072
2.056
2.041
2.027
2.015
1.924
1.871
1.836
1.812
1.793
1.779
1.768
1.717
246.5
19.43
8.692
5.844
4.604
3.922
3.494
3.202
2.989
2.828
2.701
2.599
2.515
2.445
2.385
2.333
2.289
2.250
2.215
2.184
2.156
2.131
2.109
2.088
2.069
2.052
2.036
2.021
2.007
1.995
1.904
1.850
1.815
1.790
1.772
1.757
1.746
1.694
246.9
19.44
8.683
5.832
4.590
3.908
3.480
3.187
2.974
2.812
2.685
2.583
2.499
2.428
2.368
2.317
2.272
2.233
2.198
2.167
2.139
2.114
2.091
2.070
2.051
2.034
2.018
2.003
1.989
1.976
1.885
1.831
1.796
1.771
1.752
1.737
1.726
1.674
247.3
19.44
8.675
5.821
4.579
3.896
3.467
3.173
2.960
2.798
2.671
2.568
2.484
2.413
2.353
2.302
2.257
2.217
2.182
2.151
2.123
2.098
2.075
2.054
2.035
2.018
2.002
1.987
1.973
1.960
1.868
1.814
1.778
1.753
1.734
1.720
1.708
1.656
247.7
19.44
8.667
5.811
4.568
3.884
3.455
3.161
2.948
2.785
2.658
2.555
2.471
2.400
2.340
2.288
2.243
2.203
2.168
2.137
2.109
2.084
2.061
2.040
2.021
2.003
1.987
1.972
1.958
1.945
1.853
1.798
1.763
1.737
1.718
1.703
1.691
1.639
248.0
19.45
8.660
5.803
4.558
3.874
3.445
3.150
2.936
2.774
2.646
2.544
2.459
2.388
2.328
2.276
2.230
2.191
2.155
2.124
2.096
2.071
2.048
2.027
2.007
1.990
1.974
1.959
1.945
1.932
1.839
1.784
1.748
1.722
1.703
1.688
1.676
1.623
248.3
19.45
8.654
5.795
4.549
3.865
3.435
3.140
2.926
2.764
2.636
2.533
2.448
2.377
2.316
2.264
2.219
2.179
2.144
2.112
2.084
2.059
2.036
2.015
1.995
1.978
1.961
1.946
1.932
1.919
1.826
1.771
1.735
1.709
1.689
1.675
1.663
1.609
248.6
19.45
8.648
5.787
4.541
3.856
3.426
3.131
2.917
2.754
2.626
2.523
2.438
2.367
2.306
2.254
2.208
2.168
2.133
2.102
2.073
2.048
2.025
2.003
1.984
1.966
1.950
1.935
1.921
1.908
1.814
1.759
1.722
1.696
1.677
1.662
1.650
1.596
248.8
19.45
8.643
5.781
4.534
3.849
3.418
3.123
2.908
2.745
2.617
2.514
2.429
2.357
2.297
2.244
2.199
2.159
2.123
2.092
2.063
2.038
2.014
1.993
1.974
1.956
1.940
1.924
1.910
1.897
1.803
1.748
1.711
1.685
1.665
1.650
1.638
1.583
249.1
19.45
8.638
5.774
4.527
3.841
3.410
3.115
2.900
2.737
2.609
2.505
2.420
2.349
2.288
2.235
2.190
2.150
2.114
2.082
2.054
2.028
2.005
1.984
1.964
1.946
1.930
1.915
1.901
1.887
1.793
1.737
1.700
1.674
1.654
1.639
1.627
1.572
249.3
19.46
8.634
5.769
4.521
3.835
3.404
3.108
2.893
2.730
2.601
2.498
2.412
2.341
2.280
2.227
2.181
2.141
2.106
2.074
2.045
2.020
1.996
1.975
1.955
1.938
1.921
1.906
1.891
1.878
1.783
1.727
1.690
1.664
1.644
1.629
1.616
1.561
249.5
19.46
8.630
5.763
4.515
3.829
3.397
3.102
2.886
2.723
2.594
2.491
2.405
2.333
2.272
2.220
2.174
2.134
2.098
2.066
2.037
2.012
1.988
1.967
1.947
1.929
1.913
1.897
1.883
1.870
1.775
1.718
1.681
1.654
1.634
1.619
1.607
1.551
300

Fisher
1 = 0 95
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

27
28
29
30
40
50
60
70
80
90
100
200
249.6
19.46
8.626
5.759
4.510
3.823
3.391
3.095
2.880
2.716
2.588
2.484
2.398
2.326
2.265
2.212
2.167
2.126
2.090
2.059
2.030
2.004
1.981
1.959
1.939
1.921
1.905
1.889
1.875
1.862
1.766
1.710
1.672
1.646
1.626
1.610
1.598
1.542
249.8
19.46
8.623
5.754
4.505
3.818
3.386
3.090
2.874
2.710
2.582
2.478
2.392
2.320
2.259
2.206
2.160
2.119
2.084
2.052
2.023
1.997
1.973
1.952
1.932
1.914
1.898
1.882
1.868
1.854
1.759
1.702
1.664
1.637
1.617
1.601
1.589
1.533
249.9
19.46
8.620
5.750
4.500
3.813
3.381
3.084
2.869
2.705
2.576
2.472
2.386
2.314
2.253
2.200
2.154
2.113
2.077
2.045
2.016
1.990
1.967
1.945
1.926
1.907
1.891
1.875
1.861
1.847
1.751
1.694
1.656
1.629
1.609
1.593
1.581
1.524
250.1
19.46
8.617
5.746
4.496
3.808
3.376
3.079
2.864
2.700
2.570
2.466
2.380
2.308
2.247
2.194
2.148
2.107
2.071
2.039
2.010
1.984
1.961
1.939
1.919
1.901
1.884
1.869
1.854
1.841
1.744
1.687
1.649
1.622
1.602
1.586
1.573
1.516
251.1
19.47
8.594
5.717
4.464
3.774
3.340
3.043
2.826
2.661
2.531
2.426
2.339
2.266
2.204
2.151
2.104
2.063
2.026
1.994
1.965
1.938
1.914
1.892
1.872
1.853
1.836
1.820
1.806
1.792
1.693
1.634
1.594
1.566
1.545
1.528
1.515
1.455
251.8
19.48
8.581
5.699
4.444
3.754
3.319
3.020
2.803
2.637
2.507
2.401
2.314
2.241
2.178
2.124
2.077
2.035
1.999
1.966
1.936
1.909
1.885
1.863
1.842
1.823
1.806
1.790
1.775
1.761
1.660
1.599
1.559
1.530
1.508
1.491
1.477
1.415
252.2
19.48
8.572
5.688
4.431
3.740
3.304
3.005
2.787
2.621
2.490
2.384
2.297
2.223
2.160
2.106
2.058
2.017
1.980
1.946
1.916
1.889
1.865
1.842
1.822
1.803
1.785
1.769
1.754
1.740
1.637
1.576
1.534
1.505
1.482
1.465
1.450
1.386
252.5
19.48
8.566
5.679
4.422
3.730
3.294
2.994
2.776
2.609
2.478
2.372
2.284
2.210
2.147
2.093
2.045
2.003
1.966
1.932
1.902
1.875
1.850
1.828
1.807
1.788
1.770
1.754
1.738
1.724
1.621
1.558
1.516
1.486
1.463
1.445
1.430
1.364
252.7
19.48
8.561
5.673
4.415
3.722
3.286
2.986
2.768
2.601
2.469
2.363
2.275
2.201
2.137
2.083
2.035
1.993
1.955
1.922
1.891
1.864
1.839
1.816
1.796
1.776
1.758
1.742
1.726
1.712
1.608
1.544
1.502
1.471
1.448
1.429
1.415
1.346
252.9
19.49
8.557
5.668
4.409
3.716
3.280
2.980
2.761
2.594
2.462
2.356
2.267
2.193
2.130
2.075
2.027
1.985
1.947
1.913
1.883
1.856
1.830
1.808
1.787
1.767
1.749
1.733
1.717
1.703
1.597
1.534
1.491
1.459
1.436
1.417
1.402
1.332
253.0
19.49
8.554
5.664
4.405
3.712
3.275
2.975
2.756
2.588
2.457
2.350
2.261
2.187
2.123
2.068
2.020
1.978
1.940
1.907
1.876
1.849
1.823
1.800
1.779
1.760
1.742
1.725
1.710
1.695
1.589
1.525
1.481
1.450
1.426
1.407
1.392
1.321
253.7
19.49
8.540
5.646
4.385
3.690
3.252
2.951
2.731
2.563
2.431
2.323
2.234
2.159
2.095
2.039
1.991
1.948
1.910
1.875
1.845
1.817
1.791
1.768
1.746
1.726
1.708
1.691
1.675
1.660
1.551
1.484
1.438
1.404
1.379
1.358
1.342
1.263
FaCyT-Matemticas
301

Fisher
1 = 0 975
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

10
11
12
13
647.8
38.51
17.44
12.218
10.007
8.813
8.073
7.571
7.209
6.937
6.724
6.554
6.414
6.298
6.200
6.115
6.042
5.978
5.922
5.871
5.827
5.786
5.750
5.717
5.686
5.659
5.633
5.610
5.588
5.568
5.424
5.340
5.286
5.247
5.218
5.196
5.179
5.100
799.5
39.00
16.044
10.649
8.434
7.260
6.542
6.059
5.715
5.456
5.256
5.096
4.965
4.857
4.765
4.687
4.619
4.560
4.508
4.461
4.420
4.383
4.349
4.319
4.291
4.265
4.242
4.221
4.201
4.182
4.051
3.975
3.925
3.890
3.864
3.844
3.828
3.758
864.2
39.17
15.44
9.979
7.764
6.599
5.890
5.416
5.078
4.826
4.630
4.474
4.347
4.242
4.153
4.077
4.011
3.954
3.903
3.859
3.819
3.783
3.750
3.721
3.694
3.670
3.647
3.626
3.607
3.589
3.463
3.390
3.343
3.309
3.284
3.265
3.250
3.182
899.6
39.25
15.10
9.604
7.388
6.227
5.523
5.053
4.718
4.468
4.275
4.121
3.996
3.892
3.804
3.729
3.665
3.608
3.559
3.515
3.475
3.440
3.408
3.379
3.353
3.329
3.307
3.286
3.267
3.250
3.126
3.054
3.008
2.975
2.950
2.932
2.917
2.850
921.8
39.30
14.89
9.364
7.146
5.988
5.285
4.817
4.484
4.236
4.044
3.891
3.767
3.663
3.576
3.502
3.438
3.382
3.333
3.289
3.250
3.215
3.183
3.155
3.129
3.105
3.083
3.063
3.044
3.026
2.904
2.833
2.786
2.754
2.730
2.711
2.696
2.630
937.1
39.33
14.74
9.197
6.978
5.820
5.119
4.652
4.320
4.072
3.881
3.728
3.604
3.501
3.415
3.341
3.277
3.221
3.172
3.128
3.090
3.055
3.023
2.995
2.969
2.945
2.923
2.903
2.884
2.867
2.744
2.674
2.627
2.595
2.571
2.552
2.537
2.472
948.2
39.36
14.62
9.074
6.853
5.695
4.995
4.529
4.197
3.950
3.759
3.607
3.483
3.380
3.293
3.219
3.156
3.100
3.051
3.007
2.969
2.934
2.902
2.874
2.848
2.824
2.802
2.782
2.763
2.746
2.624
2.553
2.507
2.474
2.450
2.432
2.417
2.351
956.6
39.37
14.54
8.980
6.757
5.600
4.899
4.433
4.102
3.855
3.664
3.512
3.388
3.285
3.199
3.125
3.061
3.005
2.956
2.913
2.874
2.839
2.808
2.779
2.753
2.729
2.707
2.687
2.669
2.651
2.529
2.458
2.412
2.379
2.355
2.336
2.321
2.256
963.3
39.39
14.47
8.905
6.681
5.523
4.823
4.357
4.026
3.779
3.588
3.436
3.312
3.209
3.123
3.049
2.985
2.929
2.880
2.837
2.798
2.763
2.731
2.703
2.677
2.653
2.631
2.611
2.592
2.575
2.452
2.381
2.334
2.302
2.277
2.259
2.244
2.178
968.6
39.40
14.42
8.844
6.619
5.461
4.761
4.295
3.964
3.717
3.526
3.374
3.250
3.147
3.060
2.986
2.922
2.866
2.817
2.774
2.735
2.700
2.668
2.640
2.613
2.590
2.568
2.547
2.529
2.511
2.388
2.317
2.270
2.237
2.213
2.194
2.179
2.113
973.0
39.41
14.37
8.794
6.568
5.410
4.709
4.243
3.912
3.665
3.474
3.321
3.197
3.095
3.008
2.934
2.870
2.814
2.765
2.721
2.682
2.647
2.615
2.586
2.560
2.536
2.514
2.494
2.475
2.458
2.334
2.263
2.216
2.183
2.158
2.140
2.124
2.058
976.7
39.42
14.34
8.751
6.525
5.366
4.666
4.200
3.868
3.621
3.430
3.277
3.153
3.050
2.963
2.889
2.825
2.769
2.720
2.676
2.637
2.602
2.570
2.541
2.515
2.491
2.469
2.448
2.430
2.412
2.288
2.216
2.169
2.136
2.111
2.092
2.077
2.010
979.8
39.42
14.31
8.715
6.488
5.329
4.628
4.162
3.831
3.583
3.392
3.239
3.115
3.012
2.925
2.851
2.786
2.730
2.681
2.637
2.598
2.563
2.531
2.502
2.476
2.452
2.429
2.409
2.390
2.372
2.248
2.176
2.129
2.095
2.071
2.051
2.036
1.969
302

Fisher
1 = 0 975
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

14
15
16
17
18
19
20
21
22
23
24
25
26
982.5
39.43
14.28
8.684
6.456
5.297
4.596
4.130
3.798
3.550
3.359
3.206
3.082
2.979
2.891
2.817
2.753
2.696
2.647
2.603
2.564
2.528
2.497
2.468
2.441
2.417
2.395
2.374
2.355
2.338
2.213
2.140
2.093
2.059
2.035
2.015
2.000
1.932
984.9
39.43
14.25
8.657
6.428
5.269
4.568
4.101
3.769
3.522
3.330
3.177
3.053
2.949
2.862
2.788
2.723
2.667
2.617
2.573
2.534
2.498
2.466
2.437
2.411
2.387
2.364
2.344
2.325
2.307
2.182
2.109
2.061
2.028
2.003
1.983
1.968
1.900
986.9
39.44
14.23
8.633
6.403
5.244
4.543
4.076
3.744
3.496
3.304
3.152
3.027
2.923
2.836
2.761
2.697
2.640
2.591
2.547
2.507
2.472
2.440
2.411
2.384
2.360
2.337
2.317
2.298
2.280
2.154
2.081
2.033
1.999
1.974
1.955
1.939
1.870
988.7
39.44
14.21
8.611
6.381
5.222
4.521
4.054
3.722
3.474
3.282
3.129
3.004
2.900
2.813
2.738
2.673
2.617
2.567
2.523
2.483
2.448
2.416
2.386
2.360
2.335
2.313
2.292
2.273
2.255
2.129
2.056
2.008
1.974
1.948
1.929
1.913
1.844
990.3
39.44
14.20
8.592
6.362
5.202
4.501
4.034
3.701
3.453
3.261
3.108
2.983
2.879
2.792
2.717
2.652
2.596
2.546
2.501
2.462
2.426
2.394
2.365
2.338
2.314
2.291
2.270
2.251
2.233
2.107
2.033
1.985
1.950
1.925
1.905
1.890
1.820
991.8
39.45
14.18
8.575
6.344
5.184
4.483
4.016
3.683
3.435
3.243
3.090
2.965
2.861
2.773
2.698
2.633
2.576
2.526
2.482
2.442
2.407
2.374
2.345
2.318
2.294
2.271
2.251
2.231
2.213
2.086
2.012
1.964
1.929
1.904
1.884
1.868
1.798
993.1
39.45
14.17
8.560
6.329
5.168
4.467
3.999
3.667
3.419
3.226
3.073
2.948
2.844
2.756
2.681
2.616
2.559
2.509
2.464
2.425
2.389
2.357
2.327
2.300
2.276
2.253
2.232
2.213
2.195
2.068
1.993
1.944
1.910
1.884
1.864
1.849
1.778
994.3
39.45
14.16
8.546
6.314
5.154
4.452
3.985
3.652
3.403
3.211
3.057
2.932
2.828
2.740
2.665
2.600
2.543
2.493
2.448
2.409
2.373
2.340
2.311
2.284
2.259
2.237
2.216
2.196
2.178
2.051
1.976
1.927
1.892
1.866
1.846
1.830
1.759
995.4
39.45
14.14
8.533
6.301
5.141
4.439
3.971
3.638
3.390
3.197
3.043
2.918
2.814
2.726
2.651
2.585
2.529
2.478
2.434
2.394
2.358
2.325
2.296
2.269
2.244
2.222
2.201
2.181
2.163
2.035
1.960
1.911
1.876
1.850
1.830
1.814
1.742
996.3
39.46
14.13
8.522
6.289
5.128
4.426
3.959
3.626
3.377
3.184
3.031
2.905
2.801
2.713
2.637
2.572
2.515
2.465
2.420
2.380
2.344
2.312
2.282
2.255
2.230
2.208
2.187
2.167
2.149
2.020
1.945
1.896
1.861
1.835
1.814
1.798
1.726
997.3
39.46
14.12
8.511
6.278
5.117
4.415
3.947
3.614
3.365
3.173
3.019
2.893
2.789
2.701
2.625
2.560
2.503
2.452
2.408
2.368
2.332
2.299
2.269
2.242
2.217
2.195
2.174
2.154
2.136
2.007
1.931
1.882
1.847
1.820
1.800
1.784
1.712
998.1
39.46
14.12
8.501
6.268
5.107
4.405
3.937
3.604
3.355
3.162
3.008
2.882
2.778
2.689
2.614
2.548
2.491
2.441
2.396
2.356
2.320
2.287
2.257
2.230
2.205
2.183
2.161
2.142
2.124
1.994
1.919
1.869
1.833
1.807
1.787
1.770
1.698
998.8
39.46
14.11
8.492
6.258
5.097
4.395
3.927
3.594
3.345
3.152
2.998
2.872
2.767
2.679
2.603
2.538
2.481
2.430
2.385
2.345
2.309
2.276
2.246
2.219
2.194
2.171
2.150
2.131
2.112
1.983
1.907
1.857
1.821
1.795
1.774
1.758
1.685
FaCyT-Matemticas
303

Fisher
1 = 0 975
1 = P (F f1,1 ,2 )
1
2
27
28
29
30

40
50
60
70
80
90
100
200
999.6
39.461 39.462 39.463 39.465 39.473 39.478 39.481 39.484 39.486 39.487 39.488 39.493
1000.2 1000.8 1001.4 1005.6 1008.1 1009.8 1011.0 1011.9 1012.6 1013.2 1015.7
14.100 14.093 14.086 14.081 14.036 14.010 13.992 13.979 13.970 13.962 13.956 13.929
8.483
8.475
8.468
8.461
8.411
8.381
8.360
8.346
8.335
8.326
8.319
6.250
6.242
6.234
6.227
6.175
6.144
6.123
6.107
6.096
6.087
6.080
6.048
5.088
5.080
5.072
5.065
5.012
4.980
4.959
4.943
4.932
4.923
4.915
4.882
4.386
4.378
4.370
4.362
4.309
4.276
4.254
4.239
4.227
4.218
4.210
4.176
3.918
3.909
3.901
3.894
3.840
3.807
3.784
3.768
3.756
3.747
3.739
3.705
8.288
3.584
3.576
3.568
3.560
3.505
3.472
3.449
3.433
3.421
3.411
3.403
3.368
10
3.335
3.327
3.319
3.311
3.255
3.221
3.198
3.182
3.169
3.160
3.152
3.116
11
3.142
3.133
3.125
3.118
3.061
3.027
3.004
2.987
2.974
2.964
2.956
2.920
12
2.988
2.979
2.971
2.963
2.906
2.871
2.848
2.831
2.818
2.808
2.800
2.763
13
2.862
2.853
2.845
2.837
2.780
2.744
2.720
2.703
2.690
2.680
2.671
2.634
14
2.758
2.749
2.740
2.732
2.674
2.638
2.614
2.597
2.583
2.573
2.565
2.526
15
2.669
2.660
2.652
2.644
2.585
2.549
2.524
2.506
2.493
2.482
2.474
2.435
16
2.594
2.584
2.576
2.568
2.509
2.472
2.447
2.429
2.415
2.405
2.396
2.357
17
2.528
2.519
2.510
2.502
2.442
2.405
2.380
2.362
2.348
2.337
2.329
2.289
18
2.471
2.461
2.453
2.445
2.384
2.347
2.321
2.303
2.289
2.278
2.269
2.229
19
2.420
2.411
2.402
2.394
2.333
2.295
2.270
2.251
2.237
2.226
2.217
2.176
20
2.375
2.366
2.357
2.349
2.287
2.249
2.223
2.205
2.190
2.179
2.170
2.128
21
2.335
2.325
2.317
2.308
2.246
2.208
2.182
2.163
2.148
2.137
2.128
2.086
22
2.299
2.289
2.280
2.272
2.210
2.171
2.145
2.125
2.111
2.099
2.090
2.047
23
2.266
2.256
2.247
2.239
2.176
2.137
2.111
2.091
2.077
2.065
2.056
2.013
24
2.236
2.226
2.217
2.209
2.146
2.107
2.080
2.060
2.045
2.034
2.024
1.981
25
2.209
2.199
2.190
2.182
2.118
2.079
2.052
2.032
2.017
2.005
1.996
1.952
26
2.184
2.174
2.165
2.157
2.093
2.053
2.026
2.006
1.991
1.979
1.969
1.925
27
2.161
2.151
2.142
2.133
2.069
2.029
2.002
1.982
1.966
1.954
1.945
1.900
28
2.140
2.130
2.121
2.112
2.048
2.007
1.980
1.959
1.944
1.932
1.922
1.877
29
2.120
2.110
2.101
2.092
2.028
1.987
1.959
1.939
1.923
1.911
1.901
1.855
30
2.102
2.092
2.083
2.074
2.009
1.968
1.940
1.920
1.904
1.892
1.882
1.835
40
1.972
1.962
1.952
1.943
1.875
1.832
1.803
1.781
1.764
1.751
1.741
1.691
50
1.895
1.885
1.875
1.866
1.796
1.752
1.721
1.698
1.681
1.667
1.656
1.603
60
1.845
1.835
1.825
1.815
1.744
1.699
1.667
1.643
1.625
1.611
1.599
1.543
70
1.810
1.799
1.789
1.779
1.707
1.660
1.628
1.604
1.585
1.570
1.558
1.500
80
1.783
1.772
1.762
1.752
1.679
1.632
1.599
1.574
1.555
1.540
1.527
1.467
90
1.763
1.752
1.741
1.731
1.657
1.610
1.576
1.551
1.531
1.516
1.503
1.441
100
1.746
1.735
1.725
1.715
1.640
1.592
1.558
1.532
1.512
1.496
1.483
1.420
200
1.673
1.661
1.650
1.640
1.562
1.511
1.474
1.447
1.425
1.407
1.393
1.320
304

Fisher
1 = 0 99
1 = P (F f1,1 ,2 )
1
2

5
10
11
12
13
4052.2 4999.3 5403.5 5624.3 5763.9 5858.9 5928.3 5980.9 6022.4 6055.9 6083.4 6106.7 6125.8
98.502 99.000 99.164 99.251 99.302 99.331 99.357 99.375 99.390 99.397 99.408 99.419 99.422
34.116 30.816 29.457 28.710 28.237 27.911 27.671 27.489 27.345 27.228 27.132 27.052 26.983
21.198 18.000 16.694 15.977 15.522 15.207 14.976 14.799 14.659 14.546 14.452 14.374 14.306
16.258 13.274 12.060 11.392 10.967 10.672 10.456 10.289 10.158 10.051 9.963
9.888
13.745 10.925 9.780
9.148
8.746
8.466
8.260
8.102
7.976
7.874
7.790
7.718
7.657
12.246 9.547
8.451
7.847
7.460
7.191
6.993
6.840
6.719
6.620
6.538
6.469
6.410
5.609
9.825
11.259 8.649
7.591
7.006
6.632
6.371
6.178
6.029
5.911
5.814
5.734
5.667
10.562 8.022
6.992
6.422
6.057
5.802
5.613
5.467
5.351
5.257
5.178
5.111
5.055
10
10.044 7.559
6.552
5.994
5.636
5.386
5.200
5.057
4.942
4.849
4.772
4.706
4.650
11
9.646
7.206
6.217
5.668
5.316
5.069
4.886
4.744
4.632
4.539
4.462
4.397
4.342
12
9.330
6.927
5.953
5.412
5.064
4.821
4.640
4.499
4.388
4.296
4.220
4.155
4.100
13
9.074
6.701
5.739
5.205
4.862
4.620
4.441
4.302
4.191
4.100
4.025
3.960
3.905
14
8.862
6.515
5.564
5.035
4.695
4.456
4.278
4.140
4.030
3.939
3.864
3.800
3.745
15
8.683
6.359
5.417
4.893
4.556
4.318
4.142
4.004
3.895
3.805
3.730
3.666
3.612
16
8.531
6.226
5.292
4.773
4.437
4.202
4.026
3.890
3.780
3.691
3.616
3.553
3.498
17
8.400
6.112
5.185
4.669
4.336
4.101
3.927
3.791
3.682
3.593
3.518
3.455
3.401
18
8.285
6.013
5.092
4.579
4.248
4.015
3.841
3.705
3.597
3.508
3.434
3.371
3.316
19
8.185
5.926
5.010
4.500
4.171
3.939
3.765
3.631
3.523
3.434
3.360
3.297
3.242
20
8.096
5.849
4.938
4.431
4.103
3.871
3.699
3.564
3.457
3.368
3.294
3.231
3.177
21
8.017
5.780
4.874
4.369
4.042
3.812
3.640
3.506
3.398
3.310
3.236
3.173
3.119
22
7.945
5.719
4.817
4.313
3.988
3.758
3.587
3.453
3.346
3.258
3.184
3.121
3.067
23
7.881
5.664
4.765
4.264
3.939
3.710
3.539
3.406
3.299
3.211
3.137
3.074
3.020
24
7.823
5.614
4.718
4.218
3.895
3.667
3.496
3.363
3.256
3.168
3.094
3.032
2.977
25
7.770
5.568
4.675
4.177
3.855
3.627
3.457
3.324
3.217
3.129
3.056
2.993
2.939
26
7.721
5.526
4.637
4.140
3.818
3.591
3.421
3.288
3.182
3.094
3.021
2.958
2.904
27
7.677
5.488
4.601
4.106
3.785
3.558
3.388
3.256
3.149
3.062
2.988
2.926
2.872
28
7.636
5.453
4.568
4.074
3.754
3.528
3.358
3.226
3.120
3.032
2.959
2.896
2.842
29
7.598
5.420
4.538
4.045
3.725
3.499
3.330
3.198
3.092
3.005
2.931
2.868
2.814
30
7.562
5.390
4.510
4.018
3.699
3.473
3.305
3.173
3.067
2.979
2.906
2.843
2.789
40
7.314
5.178
4.313
3.828
3.514
3.291
3.124
2.993
2.888
2.801
2.727
2.665
2.611
50
7.171
5.057
4.199
3.720
3.408
3.186
3.020
2.890
2.785
2.698
2.625
2.563
2.508
60
7.077
4.977
4.126
3.649
3.339
3.119
2.953
2.823
2.718
2.632
2.559
2.496
2.442
70
7.011
4.922
4.074
3.600
3.291
3.071
2.906
2.777
2.672
2.585
2.512
2.450
2.395
80
6.963
4.881
4.036
3.563
3.255
3.036
2.871
2.742
2.637
2.551
2.478
2.415
2.361
90
6.925
4.849
4.007
3.535
3.228
3.009
2.845
2.715
2.611
2.524
2.451
2.389
2.334
100
6.895
4.824
3.984
3.513
3.206
2.988
2.823
2.694
2.590
2.503
2.430
2.368
2.313
200
6.763
4.713
3.881
3.414
3.110
2.893
2.730
2.601
2.497
2.411
2.338
2.275
2.220
FaCyT-Matemticas
305

Fisher
1 = 0 99
1 = P (F f1,1 ,2 )
1
2
14
15
16
17

18
19
20
21
22
23
24
25
26
6143.0 6156.9 6170.0 6181.1 6191.4 6200.8 6208.7 6216.1 6223.1 6228.7 6234.3 6239.9 6244.5
99.426 99.433 99.437 99.441 99.444 99.448 99.448 99.451 99.455 99.455 99.455 99.459 99.462
26.924 26.872 26.826 26.786 26.751 26.719 26.690 26.664 26.639 26.617 26.597 26.579 26.562
14.249 14.198 14.154 14.114 14.079 14.048 14.019 13.994 13.970 13.949 13.929 13.911 13.894
9.770
9.722
9.680
9.643
9.609
9.580
9.553
9.528
9.506
9.485
9.466
9.449
7.605
7.559
7.519
7.483
7.451
7.422
7.396
7.372
7.351
7.331
7.313
7.296
7.281
6.359
6.314
6.275
6.240
6.209
6.181
6.155
6.132
6.111
6.092
6.074
6.058
6.043
9.433
5.559
5.515
5.477
5.442
5.412
5.384
5.359
5.336
5.316
5.297
5.279
5.263
5.248
5.005
4.962
4.924
4.890
4.860
4.833
4.808
4.786
4.765
4.746
4.729
4.713
4.698
10
4.601
4.558
4.520
4.487
4.457
4.430
4.405
4.383
4.363
4.344
4.327
4.311
4.296
11
4.293
4.251
4.213
4.180
4.150
4.123
4.099
4.077
4.057
4.038
4.021
4.005
3.990
12
4.052
4.010
3.972
3.939
3.910
3.883
3.858
3.836
3.816
3.798
3.780
3.765
3.750
13
3.857
3.815
3.778
3.745
3.716
3.689
3.665
3.643
3.622
3.604
3.587
3.571
3.556
14
3.698
3.656
3.619
3.586
3.556
3.529
3.505
3.483
3.463
3.444
3.427
3.412
3.397
15
3.564
3.522
3.485
3.452
3.423
3.396
3.372
3.350
3.330
3.311
3.294
3.278
3.264
16
3.451
3.409
3.372
3.339
3.310
3.283
3.259
3.237
3.216
3.198
3.181
3.165
3.150
17
3.353
3.312
3.275
3.242
3.212
3.186
3.162
3.139
3.119
3.101
3.083
3.068
3.053
18
3.269
3.227
3.190
3.158
3.128
3.101
3.077
3.055
3.035
3.016
2.999
2.983
2.968
19
3.195
3.153
3.116
3.084
3.054
3.027
3.003
2.981
2.961
2.942
2.925
2.909
2.894
20
3.130
3.088
3.051
3.018
2.989
2.962
2.938
2.916
2.895
2.877
2.859
2.843
2.829
21
3.072
3.030
2.993
2.960
2.931
2.904
2.880
2.857
2.837
2.818
2.801
2.785
2.770
22
3.019
2.978
2.941
2.908
2.879
2.852
2.827
2.805
2.785
2.766
2.749
2.733
2.718
23
2.973
2.931
2.894
2.861
2.832
2.805
2.780
2.758
2.738
2.719
2.702
2.686
2.671
24
2.930
2.889
2.852
2.819
2.789
2.762
2.738
2.716
2.695
2.676
2.659
2.643
2.628
25
2.892
2.850
2.813
2.780
2.751
2.724
2.699
2.677
2.657
2.638
2.620
2.604
2.589
26
2.857
2.815
2.778
2.745
2.715
2.688
2.664
2.642
2.621
2.602
2.585
2.569
2.554
27
2.824
2.783
2.746
2.713
2.683
2.656
2.632
2.609
2.589
2.570
2.552
2.536
2.521
28
2.795
2.753
2.716
2.683
2.653
2.626
2.602
2.579
2.559
2.540
2.522
2.506
2.491
29
2.767
2.726
2.689
2.656
2.626
2.599
2.574
2.552
2.531
2.512
2.495
2.478
2.463
30
2.742
2.700
2.663
2.630
2.600
2.573
2.549
2.526
2.506
2.487
2.469
2.453
2.437
40
2.563
2.522
2.484
2.451
2.421
2.394
2.369
2.346
2.325
2.306
2.288
2.271
2.256
50
2.461
2.419
2.382
2.348
2.318
2.290
2.265
2.242
2.221
2.202
2.183
2.167
2.151
60
2.394
2.352
2.315
2.281
2.251
2.223
2.198
2.175
2.153
2.134
2.115
2.098
2.083
70
2.348
2.306
2.268
2.234
2.204
2.176
2.150
2.127
2.106
2.086
2.067
2.050
2.034
80
2.313
2.271
2.233
2.199
2.169
2.141
2.115
2.092
2.070
2.050
2.032
2.015
1.999
90
2.286
2.244
2.206
2.172
2.142
2.114
2.088
2.065
2.043
2.023
2.004
1.987
1.971
100
2.265
2.223
2.185
2.151
2.120
2.092
2.067
2.043
2.021
2.001
1.983
1.965
1.949
200
2.172
2.129
2.091
2.057
2.026
1.997
1.971
1.947
1.925
1.905
1.886
1.868
1.851
306

Fisher
1 = 0 99
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

27
28
29
30
40
50
60
70
80
90
100
200
6249.1
99.462
26.546
13.878
9.418
7.266
6.029
5.234
4.684
4.283
3.977
3.736
3.543
3.383
3.250
3.137
3.039
2.955
2.880
2.815
2.756
2.704
2.657
2.614
2.575
2.540
2.507
2.477
2.449
2.423
2.241
2.136
2.068
2.019
1.983
1.956
1.934
1.836
6252.9
99.462
26.531
13.864
9.404
7.253
6.016
5.221
4.672
4.270
3.964
3.724
3.530
3.371
3.237
3.124
3.026
2.942
2.868
2.802
2.743
2.691
2.644
2.601
2.562
2.526
2.494
2.464
2.436
2.410
2.228
2.123
2.054
2.005
1.969
1.942
1.919
1.821
6257.1
99.462
26.517
13.850
9.391
7.240
6.003
5.209
4.660
4.258
3.952
3.712
3.518
3.359
3.225
3.112
3.014
2.930
2.855
2.790
2.731
2.679
2.632
2.589
2.550
2.514
2.481
2.451
2.423
2.398
2.215
2.110
2.041
1.992
1.956
1.928
1.906
1.807
6260.4
99.466
26.504
13.838
9.379
7.229
5.992
5.198
4.649
4.247
3.941
3.701
3.507
3.348
3.214
3.101
3.003
2.919
2.844
2.778
2.720
2.667
2.620
2.577
2.538
2.503
2.470
2.440
2.412
2.386
2.203
2.098
2.028
1.980
1.944
1.916
1.893
1.794
6286.4
99.477
26.411
13.745
9.291
7.143
5.908
5.116
4.567
4.165
3.860
3.619
3.425
3.266
3.132
3.018
2.920
2.835
2.761
2.695
2.636
2.583
2.536
2.492
2.453
2.417
2.384
2.354
2.325
2.299
2.114
2.007
1.936
1.886
1.849
1.820
1.797
1.694
6302.3
99.477
26.354
13.690
9.238
7.091
5.858
5.065
4.517
4.115
3.810
3.569
3.375
3.215
3.081
2.967
2.869
2.784
2.709
2.643
2.584
2.531
2.483
2.440
2.400
2.364
2.330
2.300
2.271
2.245
2.058
1.949
1.877
1.826
1.788
1.759
1.735
1.629
6312.9
99.484
26.316
13.652
9.202
7.057
5.824
5.032
4.483
4.082
3.776
3.535
3.341
3.181
3.047
2.933
2.835
2.749
2.674
2.608
2.548
2.495
2.447
2.403
2.364
2.327
2.294
2.263
2.234
2.208
2.019
1.909
1.836
1.785
1.746
1.716
1.692
1.583
6320.9
99.484
26.289
13.626
9.176
7.032
5.799
5.007
4.459
4.058
3.752
3.511
3.317
3.157
3.022
2.908
2.810
2.724
2.649
2.582
2.523
2.469
2.421
2.377
2.337
2.301
2.267
2.236
2.207
2.181
1.991
1.880
1.806
1.754
1.714
1.684
1.659
1.548
6326.5
99.484
26.269
13.605
9.157
7.013
5.781
4.989
4.441
4.039
3.734
3.493
3.298
3.138
3.004
2.889
2.791
2.705
2.630
2.563
2.503
2.450
2.401
2.357
2.317
2.281
2.247
2.216
2.187
2.160
1.969
1.857
1.783
1.730
1.690
1.659
1.634
1.521
6330.7
99.488
26.253
13.590
9.142
6.998
5.766
4.975
4.426
4.025
3.719
3.478
3.284
3.124
2.989
2.875
2.776
2.690
2.614
2.548
2.488
2.434
2.386
2.342
2.302
2.265
2.231
2.200
2.171
2.144
1.952
1.839
1.764
1.711
1.671
1.639
1.614
1.499
6333.9
99.491
26.241
13.577
9.130
6.987
5.755
4.963
4.415
4.014
3.708
3.467
3.272
3.112
2.977
2.863
2.764
2.678
2.602
2.535
2.476
2.422
2.373
2.329
2.289
2.252
2.218
2.187
2.158
2.131
1.938
1.825
1.749
1.695
1.655
1.623
1.598
1.481
6349.8
99.491
26.183
13.520
9.075
6.934
5.702
4.911
4.363
3.962
3.656
3.414
3.219
3.059
2.923
2.808
2.709
2.623
2.547
2.479
2.419
2.365
2.316
2.271
2.230
2.193
2.159
2.127
2.097
2.070
1.874
1.757
1.678
1.622
1.579
1.546
1.518
1.391
FaCyT-Matemticas

Estadistica I. Metodos Estadisticos I FACYT - UC

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Estadistica I. Metodos Estadisticos I FACYT - UC

Uploaded by

Copyright:

Available Formats

ndice general

2.5. Distribucin de la diferencia de medias muestrales . . . . . . . 91

4. Estimacin por intervalos

4.3.2. Caso en el que la varianza de la poblacin es desconocida194

5. Prueba de hiptesis sobre los parmetros

La estadstica es una rama de las matemticas que se ocupa de los mtodos

El aspecto ms importante de la estadstica es la obtencin de conclusiones

Sec 1.1. Introduccin

Cap 1. Introduccin a la estadstica

Ejemplo 1.2. De poblacin

Sec 1.1. Introduccin

Ejemplo 1.3. De muestra

Cap 1. Introduccin a la estadstica

Los datos u observaciones:

Sec 1.1. Introduccin

Cap 1. Introduccin a la estadstica

Sec 1.2. Medidas numricas descriptivas

Muestreo con reemplazo

Muestreo sin reemplazo

Medidas numricas descriptivas

Cap 1. Introduccin a la estadstica

Ejemplo 1.12. Un ingeniero Industrial desea conocer el comportamiento de

Se desea obtener informacin relevante a partir de la informacin contenida

Sec 1.2. Medidas numricas descriptivas

Definicin 1.1. (MEDIA MUESTRAL)

Ejemplo 1.13. Clculo de la media muestral

Definicin 1.2. (MEDIANA MUESTRAL)

es una observacin que es numricamente distante del resto de los datos.

Cap 1. Introduccin a la estadstica

Si el tamao de la muestra aleatoria es impar, la mediana es el valor de la

x(n/2) +x(1+n/2) , si n es par

Como el tamao de la muestra (n = 50) es par, la mediana muestral esta

Sec 1.2. Medidas numricas descriptivas

Definicin 1.3. (MEDIA TRUNCADA)

Las medias truncadas ms usadas son x0 1 y x0 2 . Por [m] se entiende

Ejemplo 1.15. Clculo de la media truncada

y para = 0 1 la media truncada es

Definicin 1.4. (MODA)

La moda muestra hacia que valor tienden las realizaciones a agruparse. En

Cap 1. Introduccin a la estadstica

de realizaciones cuyo valor sea el mismo. En esta situacin no es clara la

Una medida de localizacin proporciona informacin acerca de ciertos valores

0, 25, 75, 100

48, 49, 51, 52

En ambos conjuntos, x = y = M edx = M edy = 50. Estos dos conjuntos son

ver definicin (2.2)

Sec 1.2. Medidas numricas descriptivas

Definicin 1.5. (VARIANZA MUESTRAL)

Cuando la varianza de la poblacin es desconocida y se usa la expresin (1.4)

Definicin 1.6. (VARIANZA MUESTRAL CORREGIDA)

La varianza es una medida razonablemente buena de la variabilidad debido a

Definicin 1.7. (DESVIACIN ESTANDAR MUESTRAL)

Cap 1. Introduccin a la estadstica

A menudo se utiliza la desviacin estndar en relacin con la varianza como

Ejemplo 1.17. Clculo de la varianza y desviacin estndar corregida

A continuacin se ilustran los pasos que se deben seguir para el clculo de la

se usa la ecuacin (1.7), para obtener la varianza corregida

y de la ecuacin (1.6) se sigue que la desviacin estndar es

Sec 1.2. Medidas numricas descriptivas

Definicin 1.8. (DESVIACIN MEDIA)

|xi x| = |8 05 8 0498| + |7 86 8 0498| + |8 10 8 0498| + + |8 04 8 0498|

Definicin 1.9. (DESVIACIN MEDIANA)

Cap 1. Introduccin a la estadstica

Ejemplo 1.19. Clculo de la desviacin mediana