You are on page 1of 310

ndice general

1. Introduccin a la estadstica
1.1. Introduccin . . . . . . . . . . . . . . . . . . .
1.2. Medidas numricas descriptivas . . . . . . . .
1.2.1. Medidas de localizacin . . . . . . . . .
1.2.2. Medidas de variabilidad . . . . . . . .
1.3. Tabla y grficas para datos numricos . . . . .
1.3.1. Distribucin de frecuencias . . . . . . .
1.3.2. Grficos . . . . . . . . . . . . . . . . .
1.4. Medidas numricas para datos agrupados . . .
1.5. Puntos de posicin para datos de una tabla de
1.6. Ejercicios propuestos . . . . . . . . . . . . . .

. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
frecuencia
. . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

2. Distribucin en el muestreo
2.1. Principales estadsticos. . . . . . . . . . . . . . . . . . . . . . .
2.1.1. Media muestral X . . . . . . . . . . . . . . . . . . . .
2.1.2. Varianza muestral V 2 . . . . . . . . . . . . . . . . . . .
2.1.3. Proporcin muestral P . . . . . . . . . . . . . . . . . .
2.1.4. Estadstico de orden . . . . . . . . . . . . . . . . . . .
2.2. Distribuciones lmites . . . . . . . . . . . . . . . . . . . . . . .
2.2.1. Desigualdad de chebyshev . . . . . . . . . . . . . . . .
2.2.2. Ley de los grandes nmeros . . . . . . . . . . . . . . .
2.3. Distribuciones muestrales de algunos estadsticos importantes .
2.3.1. Distribucin muestral de X . . . . . . . . . . . . . . .
2.4. Distribuciones muestrales relacionadas con la distribucin normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.1. Distribucin chi-cuadrado de Pearson . . . . . . . . . .
2.4.2. Distribucin t de Student . . . . . . . . . . . . . . . .
i

1
1
8
9
13
18
18
23
29
34
36
45
49
49
51
54
54
61
61
65
68
70
76
77
85

NDICE GENERAL

ii

2.5. Distribucin de la diferencia de medias muestrales . . . . . . . 91


2.5.1. Distribucin de la diferencia de medias cuando se conocen las varianzas . . . . . . . . . . . . . . . . . . . . 91
2.5.2. Distribucin de la diferencia de medias cuando las varianzas son desconocidas pero iguales . . . . . . . . . . 94
2.5.3. Distribucin de la diferencia de medias cuando las varianzas son desconocidas y distintas . . . . . . . . . . . 97
2.5.4. Distribucin de la diferencia de medias cuando las varianzas son desconocidas y tamaos de muestras grandes 99
2.6. Distribucin F de Snedeer . . . . . . . . . . . . . . . . . . . . 99
2.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . 102
2.8. Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
2.8.1. Momentos y funcin generadora de momentos de una
variable aleatoria . . . . . . . . . . . . . . . . . . . . . 109
2.8.2. Funcin generadora de momentos de una variable aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
2.8.3. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . 123
3. Estimacin puntual
3.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1. Estimacin puntual . . . . . . . . . . . . . . . . .
3.2. Mtodos para construir estimadores . . . . . . . . . . . .
3.2.1. Mtodo por mxima verosimilitud . . . . . . . . .
3.2.2. Mtodo de los Momentos . . . . . . . . . . . . . .
3.3. Propiedades de los estimadores puntuales . . . . . . . . .
3.3.1. Estimadores insesgados . . . . . . . . . . . . . . .
3.3.2. Estimadores insesgados de varianza mnima . . .
3.3.3. Estimadores consistentes . . . . . . . . . . . . . .
3.3.4. Estimadores suficientes . . . . . . . . . . . . . . .
3.4. Propiedades de los estimadores de mxima verosimilitud
3.5. Estimacin puntual bayesiana . . . . . . . . . . . . . . .
3.6. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

127
127
128
129
129
136
141
147
151
157
161
167
168
173

4. Estimacin por intervalos


185
4.1. Interpretacin de un intervalo de confianza . . . . . . . . . . . 185
4.2. Construcin de un intervalo de confianza: Mtodo del pivote . 187
4.3. Intervalo de confianza para la media de una distribucin normal188
4.3.1. Caso en el que la varianza de la poblacin es conocida . 188
FaCyT-Matemticas

NDICE GENERAL

iii

4.4.

4.5.
4.6.
4.7.

4.8.
4.9.

4.3.2. Caso en el que la varianza de la poblacin es desconocida194


Intervalo de confianza para la diferencia de medias de dos poblaciones normales independientes . . . . . . . . . . . . . . . . 196
4.4.1. Caso de ambos varianzas conocidas . . . . . . . . . . . 196
4.4.2. Caso en que las varianzas son desconocidas pero iguales 200
4.4.3. Caso en que las varianzas son desconocidas y distintas 204
Intervalo de confianza para la varianza de una distribucin
normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
Intervalo de confianza para el cociente de las varianzas de dos
distribuciones normales . . . . . . . . . . . . . . . . . . . . . . 209
Intervalo de confianza para el parmetro p cuando se muestra
una distribucin binomial . . . . . . . . . . . . . . . . . . . . 212
4.7.1. Seleccin de la muestra . . . . . . . . . . . . . . . . . . 214
Intervalo de confianza para la diferencias de proporciones . . . 215
Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . 218

5. Prueba de hiptesis sobre los parmetros


5.1. Elementos de una prueba de hiptesis . . . . . . . . . . . . .
5.2. Pruebas para muestras grandes . . . . . . . . . . . . . . . .
5.3. Clculo de probabilidades de error tipo II . . . . . . . . . . .
5.4. Determinacin del tamao muestral para la prueba Z . . . .
5.5. Nivel de significancia alcanzado o valor p . . . . . . . . . . .
5.6. Pruebas de hiptesis sobre la media de una distribucin normal, varianza desconocida . . . . . . . . . . . . . . . . . . .
5.7. Pruebas de hiptesis sobre las medias de dos distribuciones
normales, varianzas desconocidas . . . . . . . . . . . . . . .
5.7.1. Caso 1: x2 = y2 = 2 . . . . . . . . . . . . . . . . . .
5.7.2. Caso 2: x2 6= y2 . . . . . . . . . . . . . . . . . . . . .
5.8. Pruebas de hiptesis sobre la varianza de una distribucin normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.9. Pruebas de hiptesis sobre la varianzas de dos distribuciones
normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.10. Potencia de las pruebas . . . . . . . . . . . . . . . . . . . . .
5.11. Lema de Neyman-Pearson . . . . . . . . . . . . . . . . . . .
5.12. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . .

Universidad de Carabobo

225
. 225
. 233
. 243
. 245
. 247
. 250
. 253
. 253
. 256
. 258
.
.
.
.

263
267
275
280

NDICE GENERAL

iv

FaCyT-Matemticas

Captulo 1
Introduccin a la estadstica

1.1.

Introduccin

La estadstica es una rama de las matemticas que se ocupa de los mtodos


y procedimientos para la recopilacin, clasificacin, presentacin y anlisis
de datos, siempre y cuando la variabilidad e incertidumbre sea una causa
intrnseca de los mismos; con la idea de ayudar en la toma de decisiones y
formular predicciones.
Se puede clasificar la estadstica en:
Descriptiva
Describe, analiza y representa a
los datos con mtodos numricos
y grficas para resumir la informacin contenida en los mismos.

Inferencial
Efecta estimaciones, toma decisiones, predicciones u otras generalizaciones a partir de un conjunto de datos.

El aspecto ms importante de la estadstica es la obtencin de conclusiones


basadas en datos experimentales, este proceso se llama inferencia estadstica;
que no es ms, que la coleccin de tcnicas que permiten formular inferencias
inductivas y que proporcionan una medida del riesgo de stas.
La diferencia entre probabilidad e inferencia estadstica es que dentro del
clculo de probabilidades se pretende calcular la probabilidad de ciertos sucesos a partir de probabilidades calculadas de otros sucesos ms simples. As,
si se supone que un determinado experimento aleatorio se puede modelizar
mediante una variable aleatoria de Bernoulli de parmetro p conocido, la
1

Sec 1.1. Introduccin

probabilidad de que el suceso xito se presente en dos repeticiones consecutivas del experimento es p2 .
En esta lnea, se dice que el clculo de probabilidades utiliza un razonamiento deductivo. As, tras modelizar la incertidumbre mediante la probabilidad,
es posible utilizar dicho razonamiento para llegar a obtener probabilidades
de sucesos ms complicados a partir de las probabilidades de sucesos ms
simples.
En cambio, se puede decir que la inferencia estadstica pretende, dados unos
datos sujetos a incertidumbre, obtener el conocimiento de los parmetros,
en un sentido amplio, del modelo de clculo de probabilidades que aceptablemente se ajuste a dichos datos. En este sentido, la inferencia estadstica
utiliza un razonamiento de tipo inductivo.
Ejemplo 1.1. En un proceso de fabricacin a lo largo del tiempo, puede producir a veces algn elemento defectuoso. Si se denota con p la probabilidad de
que un elemento fabricado sea defectuoso, la cul es desconocida, y supongase
que se extraen de toda la produccin n elementos, entonces con la informacin contenida en la muestra se trata de inferir o estimar el verdadero valor
del parmetro p.

Por lo que se puede decir que, la probabilidad trabaja desde la poblacin
hacia la muestra, mientras la inferencia estadstica trabaja desde la muestra
hacia la poblacin.

Para comprender la naturaleza de la inferencia estadstica, es necesario entender las nociones de poblacin y muestra.

FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

Poblacin: Es un conjunto finito o infinito de individuos u objetos que poseen una caracterstica comn observable. La poblacin representa el estado
de la naturaleza o las formas de las cosas con respecto a un fenmeno aleatorio en particular, mismo que puede identificarse a travs de una caracterstica
medible X.

Una poblacin es un conjunto de elementos que presentan una caracterstica comn. Cadenas (1974)

Ejemplo 1.2. De poblacin


1. Nmero de personas que llegan a la
emergencia de un hospital durante un
da (finita).
2. Nmero de estudiantes de la Universidad de Carabobo (finita).
3. Todos los adultos de Venezuela (finita).

Una poblacin es
un conjunto de todos los elementos
que se est estudiando, acerca de
los cules se intenta sacar conclusiones. Levin & Rubin (1996)


A menudo es imposible o poco prctico observar la totalidad de la poblacin,
sobre todos si esta es muy grande. En lugar de examinar el grupo entero llamado poblacin, se examina una pequea parte del grupo llamada muestra.
Muestra: Uno o mas elementos que son tomados de la poblacin con el
objeto de obtener informacin que ayude de base para tomar una decisin
acerca de una caracterstica de la poblacin.

Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla. Murria R. Spiegel
(1991)
Universidad de Carabobo

Sec 1.1. Introduccin

Ejemplo 1.3. De muestra


El estudio realizado a 50 estudiantes de la
Universidad de Carabobo.


Una muestra es
una coleccin de algunos elementos de
la poblacin, pero
no de todos. Levin
& Rubin (1996)

Una muestra representativa de la poblacin contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal
poblacin.
Una buena inferencia estadstica se basa en la escogencia de una buena
muestra. Una manera de realizar esto resulta cuando el proceso de obtencin
de la muestra proporciona igual oportunidad a cada elemento de la poblacin
de ser incluido en est.
Si la poblacin es de tamao N y se toma una muestra de tamao n, el proceso
de muestreo
 debe asegurar que todas las posibles muestras de tamao n, es
decir, Nn tienen la misma posibilidad de ser seleccionadas. Esto se conoce
como muestreo aleatorio simple.
Ejemplo 1.4. Muestreo aleatorio simple
Supongamos que se tienen 50 hojas de un tamao conveniente y que en las
mismas se escriben 50 nombres (distintos), despus de escribir los nombres se
doblan las hojas de una forma para ser introducidos en una bolsa. Se selecciona a una persona que tenga los ojos vendados y la misma procede a sacar 10
hojas dobladas que posteriormente sern premiadas. Aqu la poblacin consta
de N = 50 elementos y cada elemento de la muestra de tamao n = 10, se
selecciona
 aleatoriamente uno por uno. En este muestreo se pueden seleccio50
nar 10 = muestras de tamao 10 cada una con la misma probabilidad de
ser seleccionada.

Variable estadstica:
Una variable es una caracteristica observable que vara entre los diferentes
individuos o unidades experimentales de una poblacin. La informacin que
se dispone de cada individuo o unidades experimentales es resumida en variables.

FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

Los datos u observaciones:


Los datos son nmeros o denominaciones que se le puede asignar a un individuo o unidades experimentales de la poblacin.
Ejemplo 1.5. Son ejemplos de variables y datos:
1. El nmero de hijos de una persona.
{0, 1, 2, 3, . . .}
2. La respuesta a la pregunta Usted fuma?
{Si, N o}
3. El tipo de sangre.
{A, B, AB, O}
4. La estatura de un trabajador.
{1 62, 1 74, . . .}

Parmetros:
Un parmetro es cualquier caracterstica medible de una poblacin.
Ejemplo 1.6. El ingreso promedio de todos los trabajadores de una determinada empresa es un ejemplo de parmetro, si todos los trabajadores se
consideran como una poblacin.

Estadstico:
Un estadstico es cualquier caracterstica medible de una muestra.
Ejemplo 1.7. La estatura media (x) de los estudiantes de la escuela de ingenieria industrial de la Universidad de Carabobo, es un ejemplo de estadstico.
Son una muestra representativa si se considera la poblacin como todos los
estudiantes de la Universidad de Carabobo?

Universidad de Carabobo

Sec 1.1. Introduccin

Si X alguna caracterstica de inters de poblacin, entonces X es una variable aleatoria que sigue cierta funcin de densidad f (x; ).
Supongas que se tiene un proceso de manufactura y se define la variable aleatoria X como el nmero de artculos defectuosos en una muestra de tamao
n = 45. Bajo ciertas hiptesis que idealizan el experimento (independencia
entre eventos, eventos de Bernoulli,. . .), X tiene una distribucin Binomial
con parmetros n = 45 y p (desconocido).
Si se tiene particular inters, por ejemplo, en calcular la probabilidad de que
X sea menor que 5 u otras caracteristicas asociadas con la distribucin de
probabilidad tales como la media, la varianza,. . ., la respuesta depender del
parmetro p. Tambin se puede tener inters en conocer (estimar, inferir) el
verdadero porcentaje de artculos producidos por el proceso de manutactura,
entre otros. Ests son algunas de las respuesta que nos ofrece la ciencia de
las estadstica en donde cierto nmero de realizaciones (observaciones) de la
variable aleatoria X
x1 , x2 , . . . , xn
es la materia prima para obtener informacin acerca del valor del parmetro
p.
Tipos de variables aleatorias:
Los tipos de variables que comnmente se consideran son:
1. Variables cualitativas o atributos: no toman valores numricos y describen cualidades.
Ejemplo 1.8. En un proceso de manufactura. Una variable aleatoria
X de inters puede ser clasificar una pieza como aceptable o defectuosa.

2. Variables cuantitativas discretas: toman slo valores enteros, en muchos
casos se limita a contar el nmero de veces que ocurre un suceso.
Ejemplo 1.9. En un proceso de manufactura. Una variable aleatoria
X de inters puede ser contar el nmero de piezas clasificadas como
defectuosas en una muestra dada. Entonces X es una variable aleatoria discreta que puede tomar los valores 0, 1, 2, . . . , n en donde n es el
tamao de la muestra.
FaCyT-Matemticas

Cap 1. Introduccin a la estadstica


3. Variables cuantitativas continuas: toman valores en un intervalo, corresponde a medir magnitudes continuas.
Ejemplo 1.10. Sea X una variable aleatoria que representa el tiempo entre llamadas a una oficina de atencin al cliente, entonces X es
una variable aleatoria continua que puede tomar cualquier valor en el
intervalo (0, ).

Existen varias maneras de realizar un muestreo de una poblacin; por ejemplo, se disea un experimento aleatorio y se lleva a cabo para extraer una
muestra de tamao n midiendo una caracterstica X de la poblacin de estudio.
1. Despus de mezclar adecuadamente los elementos de la poblacin, se
extrae uno, se observa la caracterstica, X1 es esta observacin. Se repone el elemento a la poblacin, y esta se vuelve a mezclar y se extrae
un segundo elemento y se anota la segunda observacin, X2 y as sucesivamente se repite el proceso hasta obtener una muestra de tamao
n
X1 , X2 , . . . , Xn
Este proceso de tomar la muestra se llama muestreo con reemplazo.
2. Despus de mezclar adecuadamente los elementos de la poblacin se
seleccionan n elementos, uno despus del otro sin reemplazo.
X1 , X2 , . . . , Xn
Este proceso de tomar la muestra se llama muestreo sin reemplazo.
Ejemplo 1.11. De muestreo sin reemplazo
Si se extrae una muestra de una poblacin de bombillas para estimar
la vida media de las bombillas que la integran, no ser posible medir
ms que una vez la bombilla seleccionada.
Universidad de Carabobo

Sec 1.2. Medidas numricas descriptivas

8


Muestreo con reemplazo


X1 , X2 , . . . , Xn son variables aleatorios cuya funcin de densidad es
igual a la funcin de densidad de
la poblacin.
X1 , X2 , . . . , Xn son variables aleatorias independientes e idnticamente distribuidas porque por el
reemplazo ningn valor se ve afectado por otro.

Muestreo sin reemplazo


X1 , X2 , . . . , Xn son variables aleatorias cuyas distribuciones marginales son iguales a la de la poblacin.
X1 , X2 , . . . , Xn son variables aleatorias dependientes.

Muestreo estratificado:
Se usa cuando se conoce de antemano que la poblacin est dividida en estratos, que son equivalentes a categoras y los cules por lo general no son de
igual tamao. Luego, de cada estrato se saca una muestra aleatoria, usualmente proporcional al tamao del estrato.
Nuestreo por conglomerado (Clusters):
En este caso la poblacin se divide en grupos llamados conglomerados. Luego
se elige al azar un cierto nmero de ellos y todos los elementos de los conglomerados elegidos forman la muestra.
Muestreo sistemtico:
Se usa cuando los datos de la poblacin estn ordenados en forma numrica.
La primera observacin es elegida al azar de entre los primeros elementos de
la poblacin y las siguientes observaciones son elegidas guardando la misma
distancia entre si.

1.2.

Medidas numricas descriptivas

En est seccin se definen algunas medidas numricas que se emplean comnmente para describir conjuntos de datos. Algunas de ests medidas son
utilizadas como base para hacer inferencias sobre los parmetros de una poblacin. Existen dos medidas de inters importantes para cualquier conjunto
de datos:
FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

1. La localizacin de su centro, y
2. La variabilidad
La tendencia central de un conjunto de datos es la disposicin de stos para
agruparse ya sea alrededor del centro o de ciertos valores numricos. La variabilidad de un conjunto de datos es la dispersin de las observaciones en el
conjunto.

1.2.1.

Medidas de localizacin

Existen principalmente tres medidas de tendencia central: la media, la mediana y la moda. Para ejemplificar las definiciones se considera el siguiente
ejemplo:

Ejemplo 1.12. Un ingeniero Industrial desea conocer el comportamiento de


una mquina automtica que deposita un lquido en vasos, para ello seleccion
una muestra aleatoria de 50 de ellos. Al medir el contenido, en onzas, se
obtuvo los siguientes resultados:
8.05
7.97
7.85
8.09
8.21

7.86
7.98
8.05
8.10
7.96

8.10
7.99
8.06
8.10
8.22

8.09
7.99
8.06
7.87
8.24

7.88
8.17
8.06
8.11
8.05

8.07
8.03
7.89
8.11
8.04

7.92
8.03
8.07
8.12

7.94
8.04
8.07
8.16

7.95
8.26
8.08
8.16

8.21
8.05
8.09
8.01

7.97
8.05
7.87
8.19

Se desea obtener informacin relevante a partir de la informacin contenida


en los datos que ayude al ingeniero industrial a mejorar el proceso de llenado.
Por ejemplo, clculo de algunas medidas numricas descriptivas (estadstica
descriptiva) como primera etapa del anlisis de datos y luego hacer uso de alguna metodologa que ayude al ingeniero industrial a tomar decisiones acerca
del proceso de llenado (inferencia estadstica).
Universidad de Carabobo

Sec 1.2. Medidas numricas descriptivas

10

Definicin 1.1. (MEDIA MUESTRAL)


Sea X1 , X2 , . . . , Xn una muestra de tamao n. La media de las realizaciones de las variables aleatorias x1 , x2 , . . . , xn es el promedio aritmtico de stas y se denotar por
n
P

x=

xi

i=1

(1.1)

Ejemplo 1.13. Clculo de la media muestral


Consider los resultados obtenidos en el ejemplo (1.12). Entonces la media
muestral para estos datos viene dada por:
x=

8 05 + 7 86 + 8 10 + + 8 05 + 8 04
= 8 0498
50


La media es una medida apropiada de tendencia central para muchos conjunto de datos. Sin embargo, dado que cualquier observacin en el conjunto
se emplea para su clculo, el valor de la media puede afectarse de manera desproporcionada por la existencia de algunos valores extremos o datos
atpicos1 . Por este motivo se recurre a definir otras medidas de localizacin
que sean ms robustas, es decir menos vulnerables a la presencia de algunos
valores extremos.

Definicin 1.2. (MEDIANA MUESTRAL)


Sea X1 , X2 , . . . , Xn una muestra de tamao n. La mediana de las
realizaciones de las variables aleatorias x1 , x2 , . . . , xn , denotada por
Med, es el valor para el cul, cuando las realizaciones se ordenan de
manera creciente, la mitad de stas es menor que este valor y la otra
mitad mayor.
1

es una observacin que es numricamente distante del resto de los datos.

FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

11

Si el tamao de la muestra aleatoria es impar, la mediana es el valor de la


realizacin de la variable aleatoria que se encuentra a la mitad del conjunto
ordenado. Si es par se considera la mediana como el promedio aritmtico de
las dos realizaciones que se encuentren a la mitad del conjunto ordenado.
Esto es,

si n es impar
x( n+1 ) ,

2
(1.2)
M ed =

x(n/2) +x(1+n/2) , si n es par


2
donde x(1) x(n) es la muestra ordenada.
Ejemplo 1.14. Clculo de la mediana
Consider los datos del ejemplo (1.12). Primero se ordenan las realizaciones
de manera creciente
7.85
7.97
8.05
8.09
8.19

7.86
7.98
8.05
8.09
8.21

7.87
7.99
8.05
8.10
8.21

7.87
7.99
8.06
8.10
8.22

7.88
8.01
8.06
8.10
8.24

7.89
8.03
8.06
8.11
8.26

7.92
8.03
8.07
8.11

7.94
8.04
8.07
8.12

7.95
8.04
8.07
8.16

7.96
8.05
8.08
8.16

7.97
8.05
8.09
8.17

Como el tamao de la muestra (n = 50) es par, la mediana muestral esta


dada por:
x(25) + x(26)
8 05 + 8 06
M ed =
=
= 8 055
2
2

Alternativamente, la mediana puede determinarse a partir de la distribucin
acumulativa, es decir, la mediana es el cuantil de orden 0 50. Esto es:
P (X < M ed) 0 50 y P (X M ed) 0 50
Puesto que la mediana es un valor que se basa en la secuencia ordenada de las
realizaciones de las variables aleatorias, es necesario saber que la existencia
de algunos valores extremos no afectar su valor. Por tanto, si el conjunto de
las realizaciones de las variables aleatorias contiene algunos valores extremos
y el tamao de la muestra aleatoria es muy alto, la mediana puede ser una
medida de tendencia central mucho ms deseable que la media muestral.
Universidad de Carabobo

Sec 1.2. Medidas numricas descriptivas

12

Definicin 1.3. (MEDIA TRUNCADA)


Para una coleccin de realizaciones de variables aleatorias se llama
media truncada de orden con 0 < < 0 5, a la media x de las
realizaciones que quedan de quitar 100 % ms bajo y el 100 % ms
alto de las mismas. Formalmente
x =


1
x([n]+1) + + x(n[n])
n 2 [n]

(1.3)

Las medias truncadas ms usadas son x0 1 y x0 2 . Por [m] se entiende


la parte entera de m.

Ejemplo 1.15. Clculo de la media truncada


Para la coleccin de datos del ejemplo (1.12), la media truncada correspondiente a = 0 2 es
30

x0 2

 241 56
1 X
1
x(11) + + x(40) =
= 8 052
=
x(i) =
30 i=11
30
30

y para = 0 1 la media truncada es


45

x0 1 =

 322 02
1 X
1
x(6) + + x(45) =
= 8 0505
x(i) =
40 i=5
40
40


Definicin 1.4. (MODA)


Sea X1 , X2 , . . . , Xn una muestra de tamao n. La moda de las realizaciones de las variables aleatorias x1 , x2 , . . . , xn , denotada por Mod,
es el valor de la realizacin que ocurre con mayor frecuencia en el
conjunto.

La moda muestra hacia que valor tienden las realizaciones a agruparse. En


tamaos de muestras relativamente pequeos, puede que no exista un par
FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

13

de realizaciones cuyo valor sea el mismo. En esta situacin no es clara la


definicin de moda y se dice que no hay moda. Tambin puede suceder que
la frecuencia ms alta se encuentre compartida por dos realizaciones. En estos
casos, la moda tiene una utilidad limitada como tendencia central y se dice
que la distribucin es bimodal.
Ejemplo 1.16. Clculo de la moda
Consider los datos del ejemplo (1.12). La moda de este conjunto de realizaciones es
M od = 8 05
que se repite 5 veces.


1.2.2.

Medidas de variabilidad

Una medida de localizacin proporciona informacin acerca de ciertos valores


numricos donde tienden agruparse los datos pero no proporciona ninguna
idea de la variabilidad de los datos en dicho conjunto. Por ejemplo, consider
los dos siguientes conjuntos de datos, cada uno de los cuales consiste de
cuatro realizaciones de las variables aleatorias X y Y, respectivamente.
Primer conjunto

0, 25, 75, 100

Segundo conjunto

48, 49, 51, 52

En ambos conjuntos, x = y = M edx = M edy = 50. Estos dos conjuntos son


muy diferentes entre s, esto es, las realizaciones en el primero se encuentra
mucho ms dispersas que las del segundo. Una de las medidas ms tiles
de dispersin o variacin en un conjunto de datos es la varianza muestral.
Esta medida de variabilidad es una de las ms importantes que se debe
tener en cuenta a la hora de utilizar un estadstico2 como estimador de algn
parmetro desconocido de la poblacin, como se ver ms adelante en los
captulos siguientes.
2

ver definicin (2.2)

Universidad de Carabobo

Sec 1.2. Medidas numricas descriptivas

14

Definicin 1.5. (VARIANZA MUESTRAL)


Sea X1 , X2 , . . . , Xn una muestra de tamao n. La varianza del conjunto de realizaciones x1 , x2 , . . . , xn de las variables aleatorias, es el
promedio del cuadrado de las diferencias entre cada observacin y la
media muestral del conjunto de realizaciones. La varianza se denota
por
n
P
(xi x)2
v 2 = i=1
(1.4)
n

Cuando la varianza de la poblacin es desconocida y se usa la expresin (1.4)


para estimarla, V 2 tiende a subestimar el verdadero valor de 2 , por est
razn se prefiere utilizar la varianza muestral corregida definida por

Definicin 1.6. (VARIANZA MUESTRAL CORREGIDA)


n
P

s2 =

(xi x)2

i=1

n1

(1.5)

La varianza es una medida razonablemente buena de la variabilidad debido a


que si muchas de la diferencias son grandes (o pequeas) entonces el valor de
la varianza s2 ser grande (o pequeo). El valor de la varianza puede sufrir
un cambio muy desproporcionado, an ms que la media, por la existencia
de algunos valores extremos o datos atpicos.

Definicin 1.7. (DESVIACIN ESTANDAR MUESTRAL)


la raz cuadrada positiva de s2 recibe el nombre de desviacin estndar
y se denota por
v
uP
u n
u (xi x)2
t
s = i=1
(1.6)
n1

FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

15

A menudo se utiliza la desviacin estndar en relacin con la varianza como


medida de variabilidad, porque est se expresa en las mismas unidades fsicas
de las realizaciones.

Ejemplo 1.17. Clculo de la varianza y desviacin estndar corregida


Con un poco de lgebra, se puede demostrar la siguiente frmula para el
clculo de la varianza corregida:

n
P

s2 =

x2i

n
P

2
xi

i=1

i=1

(1.7)

n1

A continuacin se ilustran los pasos que se deben seguir para el clculo de la


varianza y desviacin estndar corregida, para los datos del ejemplo (1.12).
50
X
i=1
50
X

xi =8 05 + 7 86 + 8 10 + + 8 05 + 8 04 = 402 49
x2i =8 052 + 7 862 + 8 102 + + 8 052 + 8 042 = 3240 479

i=1

se usa la ecuacin (1.7), para obtener la varianza corregida


3240 479
s =
49
2

(402 49)2
50

= 0 0105

y de la ecuacin (1.6) se sigue que la desviacin estndar es


s=

0 0105 = 0 1025


Universidad de Carabobo

Sec 1.2. Medidas numricas descriptivas

16

Definicin 1.8. (DESVIACIN MEDIA)


Sea X1 , X2 , . . . , Xn una muestra de tamao n. La desviacin media
del conjunto de realizaciones x1 , x2 , . . . , xn de las variables aleatorias,
es el promedio de los valores absolutos de las diferencias entre cada
observacin y la media muestral de las observaciones. La desviacin
media est dada por:
n
P
|xi x|
i=1
(1.8)
Dx =
n
Puede verse entonces que, cuanto mayor sea la dispersin existente entre las
observaciones, tanto mayor tender a ser el promedio del valor absoluto de
las diferencias de los datos, respecto de la media muestral.
Ejemplo 1.18. Clculo de la desviacin media
Para los datos del ejemplo (1.12), la desviacin media se calcula a partir de
50
X

|xi x| = |8 05 8 0498| + |7 86 8 0498| + |8 10 8 0498| + + |8 04 8 0498|

i=1

= 3 912

de aqu que:
Dx =

3 912
= 0 0782
50


Definicin 1.9. (DESVIACIN MEDIANA)


Sea X1 , X2 , . . . , Xn una muestra de tamao n. La desviacin mediana
del conjunto de realizaciones x1 , x2 , . . . , xn de las variables aleatorias,
es el promedio de los valores absolutos de las diferencias entre cada
observacin y la mediana de las observaciones. La desviacin mediana
est dada por:
n
P
|xi M ed|
i=1
DM ed =
(1.9)
n
donde M ed representa la mediana de los datos.

FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

17

Ejemplo 1.19. Clculo de la desviacin mediana


Para los datos del ejemplo (1.12), la desviacin media se calcula a partir de
50
X

|xi M ed| = |8 05 8 055| + |7 86 8 055| + |8 10 8 055| + + |8 04 8 055|

i=1

= 3 91

de aqu que:
DM ed =

3 91
= 0 0782
50


Cuando la mediana se emplea como medida de tendencia central con el propsito de disminuir los efectos de la existencia de algunos valores extremos
en el conjunto de observaciones, la desviacin mediana debe preferirse en vez
de la desviacin media como medida de dispersin por la misma razn.
Definicin 1.10. (COEFICIENTE DE VARIACIN)
Es una medida de variabilidad de los datos que se expresa en porcentaje en la cual se compara la desviacin estndar con el respectivo
valor de la media muestral de los datos:
 
s
CV =
100
(1.10)
|x|

Grado de variabilidad de los datos

Coeficiente de variacin

Con variabilidad baja


Con variabilidad moderada
Con alta variabilidad

Menos de 10 %
De 10 % a 30 %
Ms de 30 %

Universidad de Carabobo

Sec 1.3. Tabla y grficas para datos numricos

18

Ejemplo 1.20. Clculo del coeficiente de variacin


Para el ejemplo (1.12), el coeficiente de variacin es:
s
CV =
100
x

0 1025
=
100
8 0498
= 1 27 %
por tanto, los datos tienen poca dispersin.


1.3.
1.3.1.

Tabla y grficas para datos numricos


Distribucin de frecuencias

La distribucin de frecuencias nos ayuda a obtener conclusiones de un conjuntos grandes de datos. Al construir una distribucin de frecuencias, se debe
tener especial atencin en seleccionar el nmero apropiado de agrupaciones
o clases para la tabla de distribucin de frecuencias (tabla que permite organizar los datos de tal manera que sirvan para la toma de decisiones), determinando una amplitud conveniente de las clases y estableciendo los limites
de cada una para evitar que se superpongan entre si.
A la hora de construir una tabla de distribucin de frecuencias se puede seguir el siguiente procedimiento:

Calcular el rango (R)


El rango se define como la diferencia entre el valor mximo y el valor mnimo
de los datos, es decir:
R = Mx(x1 , x2 , . . . , xn ) Mn(x1 , x2 , . . . , xn )
para los datos del ejemplo (1.12), el rango de estos datos es:
R = 8 26 7 85 = 0 41
FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

19

Calcular el nmero de clases o agrupaciones (K)


Para definir el nmero de clases se puede aplicar cualquiera de los mtodos
que se enumeran a continuacin:
1. Fijar K mediante la frmula
K

Ln(n)
Ln(2)

donde Ln() es el logaritmo neperiano y n es el nmero de datos por


agrupar. Para el ejemplo (1.12), el nmero de clase que se utilizara
sera:
Ln(50)
= 5 644 6
K
Ln(2)
2. Definir K mediante la frmula
K 1 + 3 322Log(n)
donde n es el nmero de datos. En este caso el nmero de clases sera:
K 1 + 3 322Log(50) = 6 644 7
3. Seleccionar K, dependiendo del nmero de observaciones en la muestra
Tamao de la muestra
16-31
32-63
64-127
128-255
256-511

Nmero de clases
5
6
7
8
9

Para el ejemplo (1.12), el nmero de datos es n = 50, entonces se puede


tomar a K = 6 como el nmero de clases.
Calcular la Amplitud de Intervalo (A)
La amplitud de la clase esta definida como:
A=
Universidad de Carabobo

R
K

Sec 1.3. Tabla y grficas para datos numricos

20

usando la primera frmula, la amplitud de cada clase para los datos del
ejemplo (1.12) es:
0 41
A=
= 0 0683 0 07
6
Construir los lmites de las clases [Li Ls )
Primer intervalo:
El lmite inferior del primer intervalo es Li = 7 85. Primer valor de los
datos ordenados.
EL lmite superior de primer intervalo es Ls = Li + A = 7 92 .
Segundo intervalo:
El lmite inferior del segundo intervalo es Li = 7 92.
El lmite superior del segundo intervalo Ls = Li + A = 7 99.
y as sucesivamente, hasta que se hallan formado las 6 clases.

Lmites de la clase
[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]

Lmites reales de las clases [LRi LRs )


Los lmites reales inferior y superior de la primera clase se obtienen restando y
sumando media unidad a los lmites inferiores y superiores, respectivamente.
FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

21

La unidad apropiada se selecciona con el uso de la siguiente tabla:


Datos presentados a
Unidad
la unidad mas cercana

Media unidad

Entero
Dcimas
Centesimas
Milesimas
Diezmilesima

0.5
0.05
0.005
0.0005
0.00005

1
0.1
0.01
0.001
0.0001

para el ejemplo (1.12), la unidad correspondiente es 0 005, entonces los lmites


reales inferiores y superiores para la primera clase vienen dado por:
LRi = Li 0 005 = 7 845
y
LRs = Ls + 0 005 = 7 855
respectivamente. Los lmites reales superiores de las otras cinco clases se
obtienen sumando 0 005 a los lmites superiores.
Lmites reales de la clase
[7 845, 7 925)
[7 925, 7 995)
[7 995, 8 065)
[8 065, 8 135)
[8 135, 8 205)
[8 205, 8 275]
Calcular las Marcas de clase o Puntos Medios de clase (ci )
Las marcas de clase o puntos medios se define como la suma del lmite inferior
ms el lmite superior dividido entre 2. En forma de expresin algebraica es:
Li + Ls
2
por ejemplo, para el primer intervalo de clase, la marca de este es:
ci =

c1 =
Universidad de Carabobo

7 85 + 7 92
= 7 885
2

Sec 1.3. Tabla y grficas para datos numricos


Lmites de la clase

Marca de la clase

[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]

7 885
7 955
8 025
8 095
8 165
8 235

22

Frecuencia de la clase
La frecuencia de la clase es simplemente el nmero de observaciones que hay
en est.
Lmites de la clase

Marca de la clase

Frecuencia de la clase

[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]

7 885
7 955
8 025
8 095
8 165
8 235

6
7
12
16
4
5

Distribucin de frecuencias relativas y distribucin de porcentajes


La distribucin de frecuencia relativa se obtiene al dividir las frecuencias de
cada clase de la distribucin de frecuencia por el nmero total de datos. Se
crea una distribucin de porcentajes al multiplicar cada frecuencia relativa
por 100 %. Para los datos del ejemplo (1.12)
Lmites de
la clase

Marca de
la clase

Frecuencia de
la clase

Frecuencia
relativa

Porcentaje

[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]

7 885
7 955
8 025
8 095
8 165
8 235

6
7
12
16
4
5

0 12
0 14
0 24
0 32
0 08
0 1

12
14
24
32
8
10

FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

23

1.3.2.

Grficos

Intuitivamente un grfico es una representacin visual de los datos de una


tabla. Es un complemento importante porque permite leer visualmente las
tendencias, magnitudes y variaciones que pueden presentar los datos.

Histogramas de frecuencias
Los histogramas son grficos que muestran la distribucin de una serie de
observaciones. Para ello, el rango completo de las observaciones se divide en
subrangos menores denominados intervalos de clases de forma que el histograma muestra cuantas observaciones han en cada intervalo. El histograma
es un grfico de barras verticales en el cul el ancho de cada barra se corresponde con la amplitud del intervalo de clase, y la altura de la barra se
corresponde con el nmero de observaciones dentro del intervalo de clases.
En la Figura (1.1) se presenta el histograma de frecuencias para el ejemplo
(1.12) dividiendo el rango completos de las observaciones en seis clase.

Figura 1.1: Histograma de frecuencias


Universidad de Carabobo

Sec 1.3. Tabla y grficas para datos numricos

24

Polgonos
Al igual que con los histogramas de frecuencias, al graficar polgonos el fenmeno de inters se despliega a lo largo del eje horizontal y el eje vertical
representa el nmero, proporcin o porcentaje de observaciones por intervalo
de clases. El polgono de porcentaje se forma permitiendo que el punto medio
de cada clase represente las observaciones de ese intervalo de clase y luego
conectando la sucesin de puntos medios con sus respectivos porcentajes de
clases. En la Figura (1.2) se muestra el histograma y polgono de frecuencias
para el ejemplo (1.12)

Figura 1.2: Histograma y polgono de frecuencias


Distribucin acumulativa
La frecuencia relativa acumulativa es la proporcin de observaciones cuyos
valores son menores o iguales al lmite superior de la clase o, en forma equivalente, menores que el lmite inferior de la siguiente clase. La distribucin
acumulativa u ojiva se obtiene graficando, en el eje vertical, la frecuencia relativa acumulativa de una clase contra el lmite inferior de la siguiente sobre
el eje horizontal y uniendo con segmentos todos los puntos consecutivos. La
FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

25

siguiente tabla muestra las frecuencias relativas acumuladas para el ejemplo


(1.12)
Lmites de
la clase

Frecuencia de
la clase

Frecuencia
relativa

Frecuencia relativa
acumulativa

[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]

6
7
12
16
4
5

0 12
0 14
0 24
0 32
0 08
0 1

0 12
0 26
0 50
0 82
0 90
1

La distribucin de frecuencia relativa acumulativa para el ejemplo (1.12) se


muestra en la Figura (1.3).

Figura 1.3: Distribucin de frecuencia acumulativa para el ejemplo (1.12)


Grfico de caja(box-plot)
Fundamentalmente el grfico de caja es la forma grfica de cinco nmeros: Valor mximo(Mx), Tercer cuartil (Q3 ), Mediana(Med), Primer cuartil
(Q1 ),Valor mnimo(Mn). Es un grfico simple, ya que se realiza bsicamente
con estos cinco nmeros. Se observa de una forma clara la distribucin de los
datos y sus principales caractersticas. Permite comparar diversos conjuntos
de datos simultneamente. Como herramienta visual se puede utilizar para
Universidad de Carabobo

Sec 1.3. Tabla y grficas para datos numricos

26

ilustrar los datos, para estudiar simetra, para estudiar las colas, y supuestos sobre la distribucin, tambin se puede usar para comparar diferentes
poblaciones. Este grfico contiene un rectngulo, usualmente orientado con
el sistema de coordenadas tal que el eje vertical tiene la misma escala del
conjunto de datos. La parte superior y la inferior del rectngulo coinciden
con el tercer cuartl (percentil 75) y el primer cuartl (percentil 25) de los
datos. Esta caja se divide con una lnea horizontal a nivel de la mediana. En
la siguiente Figura se detalla la forma del grfico de caja junto a los cinco
nmeros.

Figura 1.4: Detalles de un diagrama de cajas

FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

27

La siguiente Figura muestra el diagrama de caja para el ejemplo (1.12)

Grfico de tallo y hoja


Este grfico ayuda a mirar de una forma rpida la distribucin de los datos una vez obtenidos los mismos. Tiene como ventaja que es muy fcil de
realizar y puede hacerse a mano, y como desventaja que no permite comparar claramente diferentes poblaciones. Adems, el grfico de tallo y hoja nos
muestra:
1. El centro de la distribucin de los datos.
Universidad de Carabobo

Sec 1.3. Tabla y grficas para datos numricos

28

2. La forma general de la distribucin:


Simtrica: Si las porciones a cada lado del centro son imgenes
espejos de las otras.
Sesgada a la izquierda: Si la cola izquierda (los valores menores)
es mucho ms larga que los de la derecha (los valores mayores)
Sesgada a la derecha: Opuesto a la sesgada a la izquierda
3. Desviaciones marcadas de la forma global de la distribucin.
Outliers: Observaciones individuales que caen muy por fuera del
patrn general de los datos.
Gaps: Huecos en la distribucin de los datos.
A continuacin se presenta el grfico de tallo y hoja para el ejemplo (1.12)
78
79
79
80
80
81
81
82
82

|
|
|
|
|
|
|
|
|

567789
24
5677899
13344
555556667778999
000112
6679
1124
6

Los nmeros que se muestran a la izquierda del carcter | son los dgitos
mas significativos. El punto decimal est ubicado a un dgito a la derecha
del carcter |, en otras palabras la primera lnea 78|567789 se lee como el
primer valor 7 85 (por el 78|5), luego hay 7 86, un 7 87, otro 7 87, un 7 88 y
finalmente un 7 89.
FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

29

1.4.

Medidas numricas para datos agrupados

Definicin 1.11. (MEDIA PARA DATOS AGRUPADOS)


Para calcular la media con base en los datos agrupados, sea K el
nmero de clases y ci el punto medio de la i-sima clase. Entonces el
valor aproximado de la media muestral es
K
P

x=

f i ci

i=1

en donde fi es la frecuencia de la i-sima clase y n =

K
P

fi .

i=1

Ejemplo 1.21. Considrese los datos del ejemplo (1.12) que se presentan
agrupados en K = 6 clases en la siguiente tabla
Lmites de la clase

Marca de la clase ci

Frecuencia de la clase fi

ci fi

[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]

7 885
7 955
8 025
8 095
8 165
8 235

6
7
12
16
4
5

47 31
55 685
96 30
129 52
32 66
41 175

n=

6
P

fi = 50

i=1

6
P

fi ci = 402 65

i=1

por lo tanto, el valor aproximado de la media muestral es:


6
P

x=

f i ci

i=1

50

402 65
= 8 053
50


Universidad de Carabobo

Sec 1.4. Medidas numricas para datos agrupados

30

Definicin 1.12. (MEDIANA PARA DATOS AGRUPADOS)


La mediana para datos agrupados se puede calcular aplicando la siguiente frmula


j
M ed = Lmed + c
fmed

donde:
Lmed es el lmite inferior de la clase donde se encuentra la mediana.
fmed es la frecuencia de esa clase.
c es la amplitud de esa clase.
j es el nmero de observaciones es esta clase, necesarias para completar
un total de n/2.
Ejemplo 1.22. Para el ejemplo (1.12)
Lmites de
la clase

Frecuencia de
la clase

Frecuencia
relativa

Frecuencia relativa
acumulativa

[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]

6
7
12
16
4
5

0 12
0 14
0 24
0 32
0 08
0 1

0 12
0 26
0 50
0 82
0 90
1

La mediana es:

M ed = 7 99 + 0 07

12
12


= 8 06

FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

31

Definicin 1.13. (MODA PARA DATOS AGRUPADOS)


La clase que contiene al mayor nmero de datos se le denomina clase
modal. La moda para datos agrupados se puede estimar aplicando la
siguiente frmula


d1
M = Li + c
d1 + d2

donde: d1 = (fi fi1 ), d2 = (fi fi+1 ) y fi es el valor de la clase con mayor


frecuencia.
Ejemplo 1.23. Para el ejemplo (1.12)
Lmites de
la clase

Frecuencia de
la clase

Frecuencia
relativa

Frecuencia relativa
acumulativa

[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]

6
7
12
16
4
5

0 12
0 14
0 24
0 32
0 08
0 1

0 12
0 26
0 50
0 82
0 90
1

Para este caso d1 = 16 12 = 4, d2 = 16 4 = 12 y c = 0 07, entonces la


moda estimada utilizando las observaciones agrupadas es:




d1
4
M = Li + c
= 8 03 + 0 07
= 8 03 + 0 0175 = 8 0475
d1 + d2
4 + 12

Definicin 1.14. (RANGO MEDIO PARA DATOS AGRUPADOS)
Para datos agrupados en una tabla de frecuencias, el rango medio es
aproximadamente el promedio del lmite inferior de la primera clase
y el lmite superior de la ltima clase.

Universidad de Carabobo

Sec 1.4. Medidas numricas para datos agrupados

32

Ejemplo 1.24. El rango medio aproximado para el ejemplo (1.12) es:


Rango medio =

7 85 + 8 27
= 8 06
2


Definicin 1.15. (VARIANZA PARA DATOS AGRUPADOS)


Para calcular la varianza con base en los datos agrupados, sea K el
nmero de clases y ci el punto medio de la i-sima clase. Entonces el
valor aproximado de la varianza muestral es
K
P

s2 =

fi (ci x)2

i=1

n1

o
K
P

s2 =

K
P

fi c2i

!2
fi c i

i=1

i=1

n1

en donde fi es la frecuencia de la i-sima clase y n =

K
P

fi .

i=1

Ejemplo 1.25. Consider los datos del ejemplo (1.12) que se encuentran
agrupados en K = 6 clases.
Marca de la clase ci
ci

Frecuencia de la clase
fi

c2i

fi c2i

7 885
7 955
8 025
8 095
8 165
8 235

6
7
12
16
4
5

62 173
63 282
64 401
65 529
66 667
67 815

373 038
442 974
772 812
1048 464
266 668
339 075

Total

50

389 867

3243 031

FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

33

Los valores aproximados de la varianza y la desviacin estndar vienen dado


por:
K
P

s2 =

K
P

fi c2i

i=1

!2
fi c i

i=1

n1
2
3243 031 (40250 65)
=
49
3243 031 3242 54
=
49
= 0 01002


Definicin 1.16. (DESVIACIN MEDIA PARA DATOS


AGRUPADOS)
El valor de la desviacin media usando datos agrupados se aproxima
por:
K
P
fi |ci x|
i=1
(1.11)
Dx =
K
P
fi
i=1

en donde fi es la frecuencia de la i-sima clase.


Ejemplo 1.26. El valor aproximado de la desviacin media para los datos
agrupados del ejemplo (1.12) se calcula con la ayuda de la siguiente tabla:
Marca de la clase ci
ci

Frecuencia de la clase
fi

|ci x|

fi |ci x|

7 885
7 955
8 025
8 095
8 165
8 235

6
7
12
16
4
5

|7 885 8 053|
|7 955 8 053|
|8 025 8 053|
|8 095 8 053|
|8 165 8 053|
|8 235 8 053|

1 008
0 686
0 336
0 672
0 448
0 91

Total

6
P

fi = 50

i=1

Universidad de Carabobo

6
P
i=1

fi |ci x| = 4 06

Sec 1.5. Puntos de posicin para datos de una tabla de frecuencia


34
de esta manera, la desviacin media para los datos agrupados del ejemplo
(1.12) es:
K
P

Dx =

fi |ci x|

i=1
K
P

=
fi

4 06
= 0 0812
50

i=1


Definicin 1.17. (DESVIACIN MEDIANA PARA DATOS
AGRUPADOS)
El valor de la desviacin mediana usando datos agrupados se aproxima por:
K
P
fi |ci M ed|
i=1
(1.12)
DM ed =
K
P
fi
i=1

en donde fi es la frecuencia de la i-sima clase.


Ejemplo 1.27. De manera similar (al clculo del valor aproximado de la
desviacin media para datos agrupados), el valor aproximado de la desviacin
mediana para los datos agrupados del ejemplo (1.12) tiene un valor igual al
valor aproximado de la desviacin media de 0 0812.


1.5.

Puntos de posicin para datos de una tabla


de frecuencia

Definicin 1.18. (CLASE DE p-SIMO PUNTO PERCENTIL)


La clase del p-simo punto percentil es la mnima clase cuya frecuencia acumulada es mayor o igual a p %n, siendo n el nmero total de
datos.
FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

35

Definicin 1.19. (p-SIMO PUNTO PERCENTIL)


El p-simo punto percentil puede determinarse como:


p %n F
qp = L p + c
fp

donde:
Lp es el lmite inferior de la clase del p-simo punto percentil.
fp es la frecuencia de esa clase del p-simo punto percentil.
c es la amplitud de la clase del p-simo punto percentil.
F es la frecuencia acumulada de la clase que antecede a la clase del
p-simo punto percentil.
Ejemplo 1.28. El percentil q0 6 es el valor bajo el cul se encuentra el 60 %
de los valores y se estima de la siguiente forma:


60 %50 F
q0 6 = L0 6 + c
f0 6
para este caso es la frecuencia acumulada correspondiente a la tercera clase,
es decir, F = 25
Lmites de
la clase

Frecuencia de
la clase

Frecuencia
acumulada

[7 85, 7 92)
[7 92, 7 99)
[7 99, 8 06)
[8 06, 8 13)
[8 13, 8 20)
[8 20, 8 27]

6
7
12
16
4
5

6
13
25
41
45
50

por lo tanto

q0 6 = 8 06 + 0 07
Universidad de Carabobo

30 25
16


= 8 08

Sec 1.6. Ejercicios propuestos

36

El percentil q0 3 es el valor bajo el cul se encuentra el 30 % de los valores y


se estima por


15 13
q0 30 = 7 99 + 0 07
= 8 00
12


1.6.

Ejercicios propuestos

1. Los siguientes datos indican el nmero de trabajadores que faltan a una


fbrica en 50 das de trabajo:
13
8
3
11
29

5 13 37 10 16 2 11 6 12
19 21 12 11 7 7 9 16 28
11 19 6 15 10 14 10 7 24
3 6 10 4 6 32 9 12 7
12 9 10 8 20 15 5 17 10

Utilice las seis clases: 0 4, 5 9, 10 14, 15 19, 20 24, 25 o mayor


para construir una tabla de frecuencias absolutas y relativas. Dibujar
el histograma. Construir la tabla de frecuencias acumuladas. Encontrar
media muestral, desviacin estndar, moda, mediana y cuartiles.
2. Los siguientes datos son lo nmeros de torsiones requeridas para doce
barras cierta aleacin:
33 24 39 48 26 35 38 54 23 34 29 37
Calcule:
a. Media
b. La varianza corregida, s2
c. La mediana
d. La moda
e. Los cuartiles
FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

37

3. Los siguientes datos son los lapsos, en minutos, necesarios para que 50
clientes de un banco comercial, lleven a cabo una transaccin bancaria:
2.3
3.3
7.8
2.4
4.2

0.2
9.7
6.8
4.6
1.2

2.9
2.5
0.9
3.8
0.5

0.4
5.6
0.4
1.5
6.8

2.8
9.5
1.3
2.7
5.2

2.4
1.8
3.1
0.4
6.3

4.4
4.7
3.7
1.3
7.6

5.8
0.7
7.2
1.1
1.4

2.8
6.2
1.6
5.5
0.5

3.3
1.2
1.9
3.4
1.4

a. Construir una distribucin de frecuencia relativa.


b. Construir una distribucin de frecuencia relativa acumulada.
c. Dibuja el diagrama de barra y el polgono de frecuencias.
d. Con los resultados de la parte b., determine los recorridos intercuantil e interdecil.
e. Con los datos agrupados, calcule la media, mediana, moda, desviacin estndar.
f. Verificar los resultados de la parte e. calculando las mismas medidas para los datos no agrupados.
4. La demanda diaria, en unidades de un producto, durante 30 das de
trabajo es:
38
67
28
49
47

35
63
25
78
66

76
33
36
48
58

58
69
32
42
44

48
53
61
72
44

59
51
57
52
56

a. Construir una distribucin de frecuencia relativa.


b. Construir una distribucin de frecuencia relativa acumulada.
c. Dibuja el diagrama de barra y el polgono de frecuencias.
d. Con los resultados de la parte b., determine los recorridos intercuantil e interdecil.
e. Con los datos agrupados, calcule la media, mediana, moda, desviacin estndar.
Universidad de Carabobo

Sec 1.6. Ejercicios propuestos

38

f. Verificar los resultados de la parte e. calculando las mismas medidas para los datos no agrupados.
5. Los siguientes datos se refieren al dimetro en pulgadas de un engranaje.
6.75
6.50
6.50
6.25
7.25

7.00
6.50
6.50
6.50
6.70

7.00
7.15
6.50
6.65
6.00

6.75
7.00
6.25
7.00
6.75

6.00
6.75
6.75
7.10
7.00

6.70
6.50
6.75
6.25
6.65

6.75
7.10
7.25
6.75
6.25

6.25
7.00
6.75
7.00
7.15

a. Construir una distribucin de frecuencia relativa.


b. Construir una distribucin de frecuencia relativa acumulada.
c. Dibuja el diagrama de barra y el polgono de frecuencias.
d. Con los resultados de la parte b., determine los recorridos intercuantil e interdecil.
e. Con los datos agrupados, calcule la media, mediana, moda, desviacin estndar.
f. Verificar los resultados de la parte e. calculando las mismas medidas para los datos no agrupados.
g. Construir el grfico de tallo y hoja, qu puede decir acerca de la
forma de la distribucin?
6. Demuestre que
n
X

(xi x) = 0

i=1

para una muestra x1 , x2 , . . . , xn .


7. Si los datos se codifican de tal manera que xi = cui + a, demuestre que:
x = cu + a,

sx = csu

para una muestra pareada x1 , x2 , . . . , xn ; u1 , u2 , . . . , un .


FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

39

8. Despus de observar el tiempo de vida de 70 motores, se obtuvieron los


siguientes datos:
Intervalos de aos de funcionamiento

Nmero de motores

[0,1)
[1,2)
[2,3)
[3,4)
4 aos ms

30
23
6
5
6

a. Haga un histograma de frecuencias relativas.


b. En base al histograma de la parte a., qu distribucin sospecha
usted que podra tener la variable aleatoria T = tiempo de vida
de un motor del tipo considerado?
c. Calcule aproximadamente, la media, desviacin y mediana de estos
datos.
9. La evidencia directa de la ley de gravitacin universal de Newton la
obtuvo Henry Cavendish (1731-1810). En el experimento se obtuvo la
densidad (en el tiempo) de la tierra y se construy la siguiente tabla:
5.36
5.44
5.63

5.29
5.34
5.34

5.58
5.79
5.46

5.65
5.10
5.30

5.57
5.27
5.75

5.53 5.62
5.39 5.42
5.68 5.85

5.29
5.47

a. Calcular la media, la media truncada para = 0 1 y = 0 2, y la


desviacin estndar.
b. Calcular los cuartiles, graficar densidad contra tiempo.
c. Hay alguna tendencia obvia?
d. Construir el grfico de tallo y hoja, qu puede decir acerca de la
forma de la distribucin?
10. con los datos del Ejercicio (4), sea xi la demanda del i -simo da para
i = 1, 2, . . . , 30. Transformar los datos por medio de la relacin
ui =
Universidad de Carabobo

xi 51 5
14 17

Sec 1.6. Ejercicios propuestos

40

a. Construir una distribucin de frecuencia relativa para los datos


transformados. Ha ocurrido algn cambio en la naturaleza de
la distribucin de frecuencia cuando sta se compara con la del
ejercicio (4)?.
b. Con los datos transformados ui , calcular la media y la desviacin
estndar; mostrar que son iguales a cero y uno, respectivamente.
11. Las calificaciones obtenidas en una prueba de un examen de seleccin,
por los 1140 candidatos que han acudido a la misma, son los siguientes:
Calificacin

Porcentaje de candidatos

0.5-1.9
2.0-3.4
3.5-4.9
5.0-6.4
6.5-7.9
8.0-9.4

1.754
8.77
33.33
45.61
9.649
0.877

Calcular:
a. Nota media, nota ms frecuente y nota que es superior a la obtenida por la mitad de los candidatos e inferior a la obtenidad por
la otra mitad.
b. Si prescindimos de los 400 candidatos que peor calificacin han
obtenido a partir de que calificacin estar el grupo de seleccionados?
c. En una segunda prueba de seleccin a la que presentaron los 1140
candidatos anteriores, la calificacin media obtenida fue de 3 93
con una varianza de 8 06. Comparar las calificaciones obtenidas
en una y otra prueba e interpretar el significado de las mismas.
d. Si se hubiese exigido una calificacin mnima de 6 para aprobar
cul hubiera sido el nmero de seleccionados?
12. Durante diez das elegidos al azar, se ha observado el nmero de piezas
diarias producidas en tres fbricas A, B y C, obtenindose los siguientes
FaCyT-Matemticas

Cap 1. Introduccin a la estadstica

41
resultados:
Das

10

A
B
C

103
115
92

106
112
97

105
99
103

102
98
89

108
107
106

109
113
108

101
108
116

110
114
87

105
96
128

107
94
130

Si se necesita atender un pedido de 2111 piezas en un plazo de 20 das


cul de las tres fbricas ofrecer mayores garantas de poder responder
a dichos pedidos?
13. Los siguientes datos presentan los porcentajes de rentabilidad de las
acciones de 25 empresas:
30.8
25.6
24.6

20.3
30.8
32.3

24.0
32.9
30.7

29.6
30.3
20.3

19.4
39.5
24.7

38.0 24.5
13.3 28.0
18.7 36.8

21.5
19.9
31.2

Construya un diagrama de tallo y hojas, una tabla de frecuancias agrupadas y con ayuda de esta tabla responda las siguientes preguntas que
se formulan en los siguientes incisos:
a. Qu porcentaje de empresas tienen el porcentaje de rentabilidad
de las acciones mayor que 34 25 %?
b. Cuntas empresas tienen el porcentaje de rentabilidad de las acciones menor que 27 25 % o mayor que 41 25 %?
14. Una empresa de informtica dedicada al anlisis de virus en ordenadores, contabiliza los virus detectados con su producto en 20 ordenadores
de domicilios particulares. Los resultados obtenidos son los siguientes:
46, 29, 35, 61, 54, 37, 53, 57, 52, 51, 43, 67, 66, 31, 53, 51, 48, 59, 55, 47
a. Construir una tabla con las frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas del conjunto de datos.
b. Dibujar un histograma del nmero de virus.
c. Obtener la media, mediana, moda, cuartiles, desviacin tpica,
coeficiente de variacin, percentil del 40 %, el rango.
Universidad de Carabobo

Sec 1.6. Ejercicios propuestos

42

15. Si s es la desviacin estndar de una muestra, se puede demostrar que


 r
n
R
R
s
2(n 1)
2
n1
donde n es el tamao de la muestra y R es el rango. Los siguientes datos
representan los niveles de colesterol en la sangre para una muestra de
ocho personas:
239, 218, 227, 357, 161, 286, 310, 245
a. Encuentre las cotas inferiores y superiores para s.
b. Estime s usando el punto medio del intervalo determinado por el
resultado anterior.
c. Calcule el valor de s y compare el resultado con el valor estimado
del inciso b.
16. Si el histograma es claramente bimodal. Donde se esperara que se
encuentre la media? Dibuje un histograma que justifique su respuesta.
17. Dos tornos se usan para fabricar el mismo tipo de arandelas. El error
para 50 lecturas se muestran en la siguiente tabla para cada mquina.
Use la desviacin estndar corregida s para determinar cul torno es
ms efectivo si la tolerancia permitida es de x 1s .
Errores
(mm)

N o de lecturas
Torno 1

N o de lecturas
Torno 2

0.5-1.0
1.0-1.5
1.5-2.0
2.0-2.5
2.5-3.0
3.0-3.5
3.5-4.0

10
15
12
8
5
0
0

8
10
8
10
5
6
3

18. Consider la cantidad


dad es mnima?

Pn

i=1

(xi a)2 , para que valor de a esta canti-

FaCyT-Matemticas

43

Cap 1. Introduccin a la estadstica

19. Consider la muestra X1 , X2 , . . . , Xn con una media muestral X y una


desviacin estndar muestral S. Sea Zi = (Xi X )/S, i = 1, 2, . . . , n.
Cuals son los valores de la media y la desviacin estndar muestral
de las Zi ?

Universidad de Carabobo

Sec 1.6. Ejercicios propuestos

44

FaCyT-Matemticas

Captulo 2
Distribucin en el muestreo

La Estadstica inferencial comprende los mtodos y procedimientos para deducir propiedades (hacer inferencias) de una poblacin, a partir de una pequea parte de la misma (muestra) que es la materia prima para hacer las
inferencias pertinentes acerca de la poblacin en estudio. Estas inferencias
acerca de la poblacin pueden tomar la forma de respuestas a preguntas si/no
(prueba de hiptesis), estimaciones de caractersticas numricas (estimacin),
pronsticos de futuras observaciones, descripcin de asociacin (correlacin)
o modelamiento de relaciones entre variables (anlisis de regresin).
Por ejemplo, supongase el caso de un fabricante de un cierto producto que
quiere ensayar un nuevo mtodo de produccin que se supone es una importante inversin econmica para su industria. Considera que dicho mtodo
es interesante para la industria si mejora el tiempo medio de produccin en
un cierto nmero de minutos. Para ello, tiene la posibilidad de experimentar
con una muestra de 35 productos elaborados previamente utilizando el nuevo
mtodo.
El inters del fabricante, en un principio, esta en hacer una estimacin del
tiempo medio de produccin de todos los productos que vaya a producir con
el nuevo mtodo, a partir del resultado que le proporcionarn los 35 productos de que dispone.
Adems, al fabricante le gustara tener una idea ms precisa de la proximidad entre el valor estimado y el valor real de la media de la poblacin; est
interesado en obtener un intervalo pequeo, que incluya el valor del tiempo
medio real de fabricacin de los productos con el nuevo mtodo con una probabilidad alta.
45

46

Suponiendo que la muestra le proporciona una duracin media de fabricacin


menor con el nuevo mtodo que con el ya existente, sera muy interesante
saber si la ganancia en minutos obtenidas le permite concluir que los nuevos
productos forman parte de una poblacin cuya tiempo medio de fabricacin
es menor al tiempo medio de la poblacin actual.
Estos objetivos del fabricante se corresponden con las tres categoras de problemas que oborda la Estadstica inferencial :
1. La estimacin de los valores de los parmetros de la poblacin.
2. La determinacin de un conjunto de valores con una confianza alta,
dada, de contener el verdadero valor del parmetro, y
3. La evaluacin de ciertos resultados cuando se cumplen determinados
valores de los parmetros de una poblacin.
El conjunto de mtodos utilizados para la estimacin de un parmetro de
la poblacin a partir de la informacin contenida en los datos de la muestra
constituye la estimacin puntual. La estimacin por intervalos da respuesta
al segundo objetivo planteado. Estos mtodos son el objeto de la estadstica inferencial inductiva, que desarrolla tcnicas para la estimacin de los
parmetros de la poblacin: a partir de los datos dados (mtodos clsicos
de estimacin) o combinando los datos de la muestra con una informacin
previa (mtodos bayesianos).
La respuesta al tercer objetivo del fabricante la proporciona la Estadstica
inferencial hipottico-deductiva, que facilita procedimientos para aceptar o
rechazar una hiptesis sobre los parmetros de una poblacin o sobre la forma funcional de la misma, dando una medida del posible error cometido.
El principal objetivo de este capitulo es deducir las distribuciones muestrales
de ciertas estadsticas que ayudaran a tomar decisiones sobre la poblacin,
con base en la informacin contenida en una muestra aleatoria.
Se comenzar dando unos de los conceptos ms importante de la inferencia
estadstica como es el de muestra aleatoria, y que se define de la siguiente
manera:
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

47

Definicin 2.1. (MUESTRA ALEATORIA)


Si las variables aleatorias X1 , X2 , . . . , Xn tienen
1. la misma funcin (densidad) de probabilidad que la de la distribucin de la poblacin, y
2. su funcin (distribucin) conjunta de probabilidad es igual al
producto de las marginales
entonces X1 , X2 , . . . , Xn forman un conjunto de n variables aleatorias independientes e idnticamente distribuidas (IID) que constituyen una muestra aleatoria.
Siempre que se hable de inferencia estadstica se supondr la existencia de
una muestra aleatoria. Como ejemplo, supongase que se tienen los siguientes
problemas:
1. En la poblacin de personas en el registro electoral.
(parmetro) = verdadero porcentaje de votantes a favor del candidato
A (caracterstica).
2. En un proceso de produccin de botellas de vidrio para un determinado
refresco.
(parmetro) = porcentaje de botellas defectuosas que da una lnea
de produccin (caracterstica).
3. En una linea de armado de una cierta unidad.
(parmetro) = tiempo promedio necesario para terminar una unidad
(caracterstica).
En cada uno de estos ejemplos se mide una variable aleatoria X cuya forma
funcional f (x; ) es conocida, salvo por el valor de uno o varios parmetros de
su distribucin; por ejemplo, para el inciso 1., sea X la variable aleatoria que
representa el nmero de personas que apoyan al candidato A inscritas en el
registro electoral, entonces X sigue una distribucin binomial con parmetros
n (nmero total de personas en el registro electoral) y p (probabilidad de que
una persona vote por el candidato A), esto es:
X B(n, p)
Universidad de Carabobo

48
aqu lo desconocido es p. Entonces para obtener informacin sobre la caracterstica de inters de la poblacin se toma una muestra aleatoria de la
poblacin y con base a est se toma una decisin acerca de la caractersticas
de inters de la poblacin.
Cuando se obtiene una muestra aleatoria X1 , X2 , . . . , Xn se puede calcular
alguna medida que resuma la informacin contenida en la muestra aleatoria,
esta medida se llama estadstico.
Definicin 2.2. (ESTADSTICO)
Sea X1 , X2 , . . . , Xn una muestra aleatoria. Un estadstico es cualquier
funcin de las variables aleatorias que se observan en la muestra aleatoria de manera que esta funcin no contenga ningunas cantidades
desconocidas. Esto es:
T : (X1 , X2 , . . . , Xn ) En T (X1 , X2 , . . . , Xn ) R

Ejemplo 2.1. Estadsticos


Sea X1 , X2 , . . . , Xn una muestra aleatoria tomada de una poblacin. Entonces
las siguientes funciones de variables aleatorias son ejemplos de estadsticos
n
P

T = T (X1 , X2 , . . . , Xn ) =

i=1

T = T (X1 , X2 , . . . , Xn ) =

i=1

Xi

n
n
P
Xi2

=X

n
T = T (X1 , X2 , . . . , Xn ) = Mx(X1 , X2 , . . . , Xn ) Mn(X1 , X2 , . . . , Xn )
T = T (X1 , X2 , . . . , Xn ) = X1 + X2

Todas ests funciones son ejemplos de estadsticos porque se determinan
de manera completa por las variables aleatorias que contiene la muestra
aleatoria. Si X1 , X2 , . . . , Xn son variables aleatorias, entonces el estadstico T = T (X1 , X2 , . . . , Xn ) tambin es una variable aleatoria, y su funcin de
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

49

distribucin depende tanto de la poblacin como del tamao de la muestra


aleatoria n y est se le llama distribucin de muestreo de T.

Definicin 2.3. (DISTRIBUCIN DE MUESTREO DE UN


ESTADSTICO T)
La distribucin de muestreo de un estadstico T es la distribucin de
probabilidad de T que puede obtenerse como resultado de un nmero
infinito de muestras aleatorias independientes, cada una de tamao
n, provenientes de la misma poblacin.

2.1.
2.1.1.

Principales estadsticos.
Media muestral X

Uno de los estadsticos ms importantes es la media de un conjunto de n


variables aleatorias independientes e idnticamente distribuidas. Este estadstico tiene un papel muy importante en problemas de toma de decisiones
para medias poblacionales desconocidas.

Definicin 2.4. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una


poblacin con funcin (densidad) de probabilidad f (x; ), se define la
media muestral o media emprica como:
n
P

X=

Xi

i=1

(2.1)

Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con E [X] = y


V [X] = 2 , entonces:
E [Xi ] = y
Universidad de Carabobo

V [Xi ] = 2 ,

i = 1, 2, . . . , n

Sec 2.1. Principales estadsticos.

50

y
n
P

i=1 Xi

E[ X ] = E
n =
n
P

n
=
n
=

E [Xi ]

i=1

n
P

E [X]

i=1

n
P

i=1

por lo tanto,
E[ X ] =

(2.2)

esto significa que el valor esperado de la media X de las variables aleatorias


X1 , X2 , . . . , Xn o de una muestra de medias X 1 , X 2 , . . . , X n coincide con la
media de la poblacin.
Para una la realizacin x1 , x2 , . . . , xn de una muestra aleatoria X1 , X2 , . . . , Xn
dada, el valor de x puede estar por encima o por debajo del verdadero valor
de la media poblacional debido a las fluctuaciones del muestreo. Estas
fluctuaciones vienen medidas por la varianza muestral de X, la cual viene
dada por:
n

n
P
P
X
i
i=1 i=1 V [Xi ]

V[ X ] = V
n =
n2
n
P

n
P

V [X]

i=1

n2

i=1

n2

n
n2
2
=
n

es decir,
  2
V X =
n

(2.3)
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

51

de la ecuacin (2.3) se puede notar que a medida que el tamao de la muestra


aumenta, la variabilidad de X alrededor de disminuye, lo cul implica
que el estadstico X es ms exacto al usarlo como estimador del parmetro
desconocido , cuando aumenta el tamao muestral.

2.1.2.

Varianza muestral V 2

Otro estadstico importante es la varianza muestral, empleado para formular


inferencias con respecto a las varianzas de la poblacin. Este estadstico es
una medida de la variabilidad e indica la dispersin entre las observaciones.

Definicin 2.5. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con E [X] = y V [X] = 2 , se define la varianza muestral
o emprica como la dispersin promedio de los valores muestrales
con respecto a la media muestral.
V2 =

n
2
1X
Xi X
n i=1

La expresin (2.4) se puede reescribir como:


n

1 X 2
2
Xi 2Xi X + X
V =
n i=1
n
P
Xi
2
n
1X 2
nX
i=1
=
Xi 2X
+
n i=1
n
n
2

1X 2
2
2
=
Xi 2X + X
n i=1
n

1X 2
2
=
Xi X
n i=1
Universidad de Carabobo

(2.4)

Sec 2.1. Principales estadsticos.

52

Definicin 2.6. La raiz cuadrada positiva de la varianza muestral,


se conoce desviacin estndar muestral, esto es:
v
u n
u1 X
2
V =t
(2.5)
Xi X
n i=1

El valor esperado de V 2 viene dado por:


"

E V


2

#
n
1X 2
2
=E
X X
n i=1 i
" n
#
h 2i
1X 2
=E
Xi E X
n i=1
n
P
E [Xi2 ]
h 2i
= i=1
E X
n
n
P
E [X 2 ]
h 2i
= i=1
E X
n

como
 
E X 2 = V [X] + (E [X])2
= 2 + 2
y usando las ecuaciones (2.2) y (2.3), se tiene que:
h 2i
2
E X = V[ X ] + E[ X ]
=

2
+ 2
n
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

53
por tanto,
n
P

E V


2

( 2 + 2 )

i=1

2
2
n

n
n( + 2 ) 2
=

2
n
n
2

= 2 + 2
2
n
(n 1) 2
=
n
2

en consecuencia
  (n 1) 2
E V2 =
n
De este modo, cuando la varianza de la poblacin es desconocida y se usa la
expresin (2.4) para estimarla, V 2 tiende a subestimar el verdadero valor de
2 , por est razn se prefiere utilizar la varianza muestral corregida definida
por:

Definicin 2.7. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una


poblacin con E [X] = y V [X] = 2 , se define la varianza muestral corregida como
n
P

S2 =

Xi X

2

i=1

n1

Con un procedimiento anlogo al anterior se puede demostrar que:


 
E S 2 = 2
Universidad de Carabobo

(2.6)

Sec 2.1. Principales estadsticos.

2.1.3.

54

Proporcin muestral P

Definicin 2.8. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una


distribucin cuya funcin de probabilidad es
(
px (1 p)1x x = 0, 1
p(x; p) =
0
otro caso
es decir, de una poblacin con distribucin de Bernoulli. Entonces,
se define la proporcin muestral como
n
P

P =

Xi

i=1

(2.7)

Notese que el estadstico


Y =

n
X

Xi

i=1

representa el nmero de xitos en n ensayos de Bernoulli, por lo tanto, la


variable aleatoria Y siguen un modelo Binomial con parmetros n y p, esto
es, Y B (n, p), y de aqu se tiene que:
" n
#
X
1
np
E [P ] = E
Xi =
=p
n
n
i=1
y
" n
#
X
1
np(1 p)
p(1 p)
V [P ] = 2 V
Xi =
=
2
n
n
n
i=1

2.1.4.

Estadstico de orden

Sea X1 , X2 , . . . , Xn variables aleatorias continuas e independientes, con funcin de distribucin F (x) y funcin densidad de probabilidad f (x) y supongamos que la muestra se ordena de menor a mayor. Sea X(1) , X(2) , . . . , X(n)
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

55

las variables aleatorias ordenadas Xi , donde


X(1) X(2) X(n)
Aunque X1 , X2 , . . . , Xn son independientes, X(1) , X(2) , . . . , X(n) no son independientes. En particular nos interesa
X(1) = M in (X1 , X2 , . . . , Xn )
y
X(n) = M ax (X1 , X2 , . . . , Xn )
donde X(1) y X(n) denota la mnima y mxima de las variables aleatorias Xi ,
respectivamente.
Las funciones (densidad) de probabilidad para X(1) y X(n) se pueden determinar usando el mtodo de las funciones de distribucin. La funcin de
distribucin de X(1) viene dada por:

F(1) (x) = P X(1) x

= 1 P X(1) > x
= 1 P (X1 > x, X2 > x, . . . , Xn > x)
= 1 [P (X1 > x) P (X2 > x) P (Xn > x)]
= 1 [1 F (x)]n
(2.8)
En consecuencia, si f(1) (x) denota la funcin densidad de probabilidad de
X(1) , al derivar en ambos lados de la expresin (2.8) se tiene que:
f(1) (x) = n [1 F (x)]n1 f (x)
La funcin densidad de probabilidad de X(n) se puede hallar de una manera
similar. La funcin de distribucin de X(n) es

F(n) (x) = P X(n) x
= P (X1 x, X2 x, . . . , Xn x)
= [P (X1 x) P (X2 x) P (Xn x)]
= [F (x)]n
(2.9)
Universidad de Carabobo

Sec 2.1. Principales estadsticos.

56

Si con f(n) (x) se denota la funcin densidad de probabilidad de X(n) , entonces


est se puede obtener derivando en ambos de la ecuacin (2.9), esto es
f(n) (x) = n [F (x)]n1 f (x)
La funcin de densidad del estadstico de k -simo orden se dan en el siguiente
Teorema.
Teorema 2.1. Sean X1 , X2 , . . . , Xn una muestra aleatoria de una
poblacin continua con funcin de distribucin F (x) y funcin de
densidad f (x). Si X(k) denota el estadstico de orden k-simo, entonces la funcin de densidad de X(k) est dada por
f(k) (x) =

n!
[F (x)]k1 [1 F (x)]nk f (x), < x <
(k 1)!(n k)!
(2.10)

Demostracin. Considrese el evento:


x < X(k) x + h
donde h es una constante positiva. Si nicamente una variable aleatoria pertenece al intervalo (x, x + h], se tiene que:
Xi x para k 1 de las variables alatorias Xi
x < Xi x + h para una de las variables alatorias Xi
Xi > x + h para n k de las variables alatorias Xi
El nmero de formas en que las n variables aleatorias pueden ser divididas
en tres de tales clases es:
n!
(k 1)!1!(n k)!
y cada una de las clases tiene probabilidades,
P (Xi x) = F (x)
P (x < Xi x + h) = F (x + h) F (x)
P (Xi > x + h) = 1 F (x + h)
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

57
Por lo tanto,


P x < X(k) x + h =

n!
[F (x)]k1 [F (x + h) F (x)] [1 F (x + h)]nk
(k 1)!1!(n k)!

n!
=
(k 1)!(n k)!

Z

k1 "Z

x+h

f (x)dx

# Z
f (x)dx

nk

f (x)dx
x+h

Por el Teorema del valor medio para integrales, la integral:


Z x+h
f (x)dx = f ()h, donde x x + h
x

Adems, como:

P x < X(k) x + h = F(k) (x + h) F(k) (x)
entonces:

P x < X(k) x + h
F(k) (x + h) F(k) (x)
lm
= lm
h
h
h
h
= f(k) (x)
de esta manera

P x < X(k) x + h
f(k) (x) = lm
h
h
ink
i hR
ik1 hR
hR

x+h
x
n!
f (x)dx
f (x)dx
f (x)dx
(k1)!(nk)!
x+h
x

= lm
h
h
hR
ik1
hR
ink
x

n!
f
(x)dx
f
()h
f
(x)dx
(k1)!(nk)!

x+h
= lm
h
h
nk
Z x
k1
Z
n!
= lm
f (x)dx
f ()
f (x)dx
h (k 1)!(n k)!
x+h

Z x
k1
Z
nk
n!
= lm
f (x)dx
f ()
f (x)dx
h (k 1)!(n k)!

x+h
n!
=
[F (x)]k1 [1 F (x)]nk f (x)
(k 1)!(n k)!
Por tanto:
f(k) (x) =

n!
[F (x)]k1 [1 F (x)]nk f (x)
(k 1)!(n k)!

Universidad de Carabobo

Sec 2.1. Principales estadsticos.

58

Teorema 2.2. Sean X1 , X2 , . . . , Xn una muestra aleatoria de una


poblacin continua con funcin de distribucin F (x) y funcin de
densidad f (x). Si j y k son dos enteros tales que 1 j < k n, la
densidad conjunta de X(j) y X(k) est dada por
f(j)(k) (xj , xk ) =

n!
j1
k1j
[F (xj )]
[F (xk ) F (xj )]
(j 1)!(k 1 j)!(n k)!
nk

[1 F (xk )]

f (xj )f (xk )

< xj < xk <

(2.11)

Ejemplo 2.2. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin


uniforme definida en el intervalo [0,1]. Es decir,
(
1, 0 x 1
f (x) =
0, otro caso
Encuentre la funcin de densidad para el estadstico X(k) . Adems, obtenga
la funcin de densidad conjunta para los estadsticos X(j) y X(k) .
Solucin:
Considre la estadstica de orden
0 < X(1) < X(2) < < X(n) < 1
la funcin de distribucin F (x) de X es
( 0, x < 0
F (x) = x, 0 x 1
1, x > 1
Despus de sustituir las expresiones de la densidad y la distribucin de X en
(2.10), se obtiene la funcin de densidad fk de X(k) :
f(k) (x) =

n!
xk1 (1 x)nk ,
(k 1)!(n k)!

0x1

(2.12)

Utilizando la igualdad:
(r, s) =

(r)(s)
,
(r + s)

para r, s > 0
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

59

donde las funciones y estn definidas por:


Z
tr1 exp{t}dt, r > 0
(r) =
0

y
Z
(r, s) =

tr1 (1 t)s1 dt

Adems, como
(r) = (r 1)(r 1)
entonces, se puede dedcucir que:
(k 1)!(n k)!
(k)(n k + 1)
=
= (k, n k + 1)
n!
(n + 1)
de donde se obtiene:
f(k) (x) =

xk1 (1 x)nk
,
(k, n k + 1)

0x1

(2.13)

que es la densidad de la distribucin Beta de parmetros k y (n k + 1).


En particular, la distribucin de muestreo de X(1) , el valor ms pequeo en
la muestra aleaoria de tamao n, es:
f(1) (x) =

(1 x)n1
= n(1 x)n1 ,
(1, n)

0x1

mientras que la distribucin de muestreo de X(n) , el valor ms grande en una


muestra aleatoria de tamao n, es:
f(n) (x) =

xn1
= nxn1 ,
(1, n)

0x1

La densidad conjunta para los estadsticos X(j) y X(k) se obtiene usando la


expresin (2.11)
f(j)(k) (xj , xk ) =

n!
[F (xj )]j1 [F (xk ) F (xj )]k1j
(j 1)!(k 1 j)!(n k)!

[1 F (xk )]nk f (xj )f (xk )


< xj < xk <
(
n!xj (xk xj )(1 xk ), 0 xj < xk 1
=
0,
otro caso
Universidad de Carabobo

Sec 2.1. Principales estadsticos.

60


Ejemplo 2.3. Considre el ejemplo (2.2), calcular el r-simo momento alrededor del cero de X(k) .
Solucin:
Por definicin1 , el r-simo momento alrededor del cero de X(k) , viene dado
por:
Z 1 r k1
 r 
x x (1 x)nk
E X(k) =
(k, n k + 1)
0
Z 1 r+k1
x
(1 x)nk
=
(k, n k + 1)
0
(r + k, n k + 1)
=
(k, n k + 1)
(r + k)(n + 1)
=
(k)(n + r + 1)
En particular

 (k + 1)(n + 1)
k
E X(k) =
=
(k)(n + 2)
n+1
y
 2  (k + 2)(n + 1)
k(k + 1)
E X(k)
=
=
(k)(n + 3)
(n + 1)(n + 2)
por lo tanto


 2 

2
V X(k) = E X(k)
E X(k)

2
k
k(k + 1)

=
(n + 1)(n + 2)
n+1


k
k+1
k
=

n+1 n+2 n+1





k
1
k
1
=
n+1 n+2
n+1

1

ver definicin (2.12)

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

61

2.2.

Distribuciones lmites

2.2.1.

Desigualdad de chebyshev

Teorema 2.3. Sea X una variable aleatoria con E [X] = y V [X] =


2 finitas. Sea cualquier nmero positivo, entonces:
P (|X | < ) 1

2
2

(2.14)

Una forma equivalente de la desigualdad (2.14) es:


P (|X | )

2
2

En muchas aplicaciones, el valor de se expresa como mltiplo de la desviacin estndar, esto es, = k, de esta forma se tiene que 2 = k 2 2
y
1
2
=
k2
2
lo cual implica que la desigualdad (2.14) se puede expresar como:
P (|X | k)

1
k2

o
P (|X | < k) 1

1
k2

Demostracin. (Caso Discreto)


V [X] =

(X )2 pX (x)

x
M ax(X)<k

(X )2 pX (x) +

Universidad de Carabobo

+k
X
k

(X )2 pX (x) +

X
M in(X)>+k

(X )2 pX (x)

Sec 2.2. Distribuciones lmites

62

La primera suma termina en el valor mximo de X que sea menor que k,


entonces para los X que son menores que k se tiene:
X M ax(X) < k
X < k
X > k
(X )2 > k 2 2
La tercera suma comienza en el valor mnimo de X que sea mayor que +k,
entonces para los X que son menores que k se tiene:
X M in(X) > + k
X > + k
X > k
(X )2 > k 2 2
y el segundo trmino contiene los elementos restantes. En consecuencia,
X
V [X] = 2 =
(X )2 pX (x)
x
M ax(X)<k

(X )2 pX (x) +

(X )2 pX (x)

M in(X)>+k

M ax(X)<k

k 2 2 pX (x) +

k 2 2 pX (x)

M in(X)>+k

M ax(X)<k

= k22

pX (x) +

pX (x)

M in(X)>+k

2 2

= k (P (| X |> k))
La ltima igualdad viene del hecho que:
k

X
x

pX (x) +

pX (x) = P (X < k) + P (X > + k)

+k

= P (X < k) + P (X > k)
= P (|X | > k)
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

63
por lo tanto,

1
k2
con lo cul queda demostrado el Teorema para el caso cuando X sea una
variable aleatoria discreta. Para el caso continuo, la prueba es similar.
P (|X | k)

Ejemplo 2.4. El costo diario por usar una determinada herramienta tiene
una media de 20 bs y una varianza de 4 bs. Qu se puede decir acerca de la
probabilidad de que el costo sea mayor que 16 pero menor que 24?
Solucin:
Sea X la variable aleatoria que representa el costo por usar una determinada
herramienta. Entonces
E [X] = 20

V [X] = 4

Se necesita calcular P (16 < X < 24). Usando la expresin equivalente al


Teorema (2.3), se sabe que para cualquier k 0,
P (|X | < k) 1

1
k2

entonces
P (16 < X < 24) = P
=P
=P
=P

(16 < X < 24 )


(16 20 < X < 24 20)
(4 < X < 4)
(|X | < 4)

como k = 4 y = 2, entonces k = 2. Luego, de acuerdo a la desigualdad,


se tiene que:
P (16 < X < 24) = P (|X | < 4) 1

3
1
=
2
2
4

el costo por usar una determinada herramienta ser entre 16 y 24 con una
probabilidad al menos de 3/4.

Universidad de Carabobo

Sec 2.2. Distribuciones lmites

64

Ejemplo 2.5. Se tiene un lote grande de artculos y se desea estimar la fraccin defectuosa usando muestreo aleatorio simple. Usando la desigualdad de
Chebyshev se quiere encontrar el tamao de la muestra tal que la probabilidad
sea al menos del 95 % de que la fraccin defectuosa difiera de la verdadera
fraccin defectuosa en no ms de 0 10.
Solucin:
Sea X la variable aleatoria que cuenta el nmero de artculos defectuosos en n
pruebas independientes. Entonces X sigue un modelo binomial con parmetros
n y p. La fraccin defectuosa viene dada por:
P =

X
n

y
p(1 p)
n
se quiere encontrar el tamao de la muestra tal que:
E [P ] = p

V [P ] =

P (|P p| < 0 1) 0 95
usando la desigualdad de Chebyshev
P (|X | < ) 1

2
2

se tiene que:
p(1 p)
n2
puede demostrarse que para 0 p 1, p(1 p) alcanza un mximo cuando
p = 1/2. De esta manera
P (|P p| < ) 1

P (|P p| < ) 1

1
4n2

para el problema = 0 1, y
1

1
= 0 95
4n(0 1)2

al resolver para n, se tiene


n=

1
= 500
4(0 05)(0 1)2
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

65

por lo tanto, se requiere tomar una muestra de n=500 artculos para que
la probabilidad de que la fraccin defectuosa difiera de la verdadera fraccin
defectuosa en no ms de 0 10 sea al menos del 95 %.

2.2.2.

Ley de los grandes nmeros

Suponga que X1 , X2 , . . . , Xn es una secuencia arbitraria de variables aleatorias con valores esperadas E [X1 ] , E [X2 ] , . . . , E [Xn ] y supongamos adems
n
P
que para la variable aleatoria Y =
Xi , existe la varianza para cada n
i=1

entero.

n
P

Xi

Teorema 2.4. Si V i=1n 0 y es un nmero positivo,


n

entonces:
P



!
n
1 X



(Xi E [Xi ]) 0

n
n

i=1



!
n
1 X



(Xi E [Xi ]) < 1

n
n

i=1

Demostracin. Para realizar la demostracin de este Teorema se utilizar la


Universidad de Carabobo

Sec 2.2. Distribuciones lmites

66

desigualdad de Chebyshev presentada en el Teorema (2.3)






!
!
n
n
n


1 X
1 X
X
1




(Xi E [Xi ]) = P
Xi
E [Xi ]
P


n
n
n
i=1
i=1
i=1
= P (|Y E [Y ]| )
V [Y ]

2
n

P
Xi
i=1
V n
=
2
 n

P
V
Xi
i=1
=
0
n
n 2 2
con lo que se demuestra el Teorema.

Definicin 2.9 (Convergencia en Probabilidad o en Distribucin). Una secuencia Xn de variables aleatorias converge en probabilidad, en distribucin o en ley a una constante a, si para cada
>0
P (|Xn a| ) 0
n

a
y se denota por Xn

Corolario 2.1. Si E [Xi ] = y V [Xi ] = 2 y si > 0, entonces:



P | X | 0
n

o

P | X | < 1
n

X
n

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

67

Demostracin. Como E [Xi ]) = , i = 1, 2, . . . , n, entonces



n
!

1 X





P
(Xi E [Xi ])) = P X

n
i=1
 
y como V X =

n n

0, entonces por el Teorema (2.4), se tiene que:


P | X | 0
n

X
n

El Corolario anterior es conocido como la ley de los grandes nmeros. Este


nos dice que si se aumenta el tamao de la muestra, aumenta la probabilidad
de que X est cerca de .
Ejemplo 2.6. Considere el proceso de seleccin de una muestra aleatoria
de alguna distribucin que tiene una varianza conocida de 2 = 10 pero con
una media desconocida. Cul debe ser el tamao de la muestra para que
la media Xn se encuentre dentro de un intervalo igual a dos unidades de la
media poblacional, con una probabilidad de por lo menos 0 9?
Solucin:
Se quiere encontrar el tamao de la muestra para el cul



P X n < 2 0 9
Dado que X n es una variable aleatoria, tal que

 2
V Xn =
n
se deduce del Teorema de Chebyshev que



1


P
Xn < k
1 2
k
n

Sea
= k/ n (mximo error admisible entre X n y ), entonces k =
n/, y



2
P X n < 1 2
n


E Xn =

Universidad de Carabobo

Sec 2.3. Distribuciones muestrales de algunos estadsticos


importantes

68

para el problema = 2 y 2 = 10, entonces


1

10
= 0 9
n(2)2

resolviendo para n, se tiene que:


n=

10
= 25
4(0 1)

Por lo tanto, se requiere tomar una muestra de por lo menos n = 25 unidades


de la distribucin para que la probabilidad de que el valor de la media muestral
X n difiera del verdadero valor de la media poblacional a lo sumo en 2
unidades sea por lo menos de 0 9.


2.3.

Distribuciones muestrales de algunos estadsticos importantes

Se denomina distribucin muestral a la funcin (densidad) de probabilidad


de un estadstico, la cual puede depender o no de parmetros desconocidos.

Definicin 2.10. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n de una poblacin con funcin de densidad de probabilidad
f (x; ) donde es un parmetro desconocido o un vector de parmetros desconocidos. La funcin de densidad conjunta de las variables
aleatorias X1 , X2 , . . . , Xn est dada por:
g (x1 , x2 , . . . , xn ; ) =

n
Y

f (xi ; )

i=1

donde L (x1 , x2 , . . . , xn ; ) = g (x1 , x2 , . . . , xn ; ) se le denomina funcin de verosimilitud de la muestra.

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

69

Ejemplo 2.7. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin


que sigue una distribucin de Bernoulli con parmetro p. Calcular su funcin
de verosimilitud.
Solucin:
Como X se distribuye Bernoulli, la funcin de probabilidad es:
(
px (1 p)1x x = 0, 1
f (x; p) =
0
en cualquier otro caso
entonces, la funcin de verosimilitud es:
L (x1 , x2 , . . . , xn ; p) =
=

n
Y
i=1
n
Y
i=1
n
P

f (xi ; p) =

n
Y

P (X = xi )

i=1

pxi (1 p)1xi I{xi =0,1}


xi

= pi=1 (1 p)

n
P
i=1

xi

I{xi =0,1}


Ejemplo 2.8. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin


con funcin de densidad de probabilidad



(x )2
1
< , x <
2
exp
,
f x; , =
2
2
>0
2
2
Calcular su funcin de verosimilitud.
Solucin:
L x1 , x2 , . . . , xn ; ,

n
Y

f xi ; , 2

i=1




= f x1 ; , 2 f x2 ; , 2 f xn ; , 2




1
(x1 )2
1
(xn )2
=
exp

exp
2 2
2 2
2 2
2 2
(
)
n
1
1 X
2
=
exp

(xi )
n/2
n/2
2
2
2
(2) ( )
i=1

Universidad de Carabobo

Sec 2.3. Distribuciones muestrales de algunos estadsticos


importantes

70


La principal utilidad de la funcin de verosimilitud se ver ms adelante


cuando se use est para estimar los parmetros desconocidos de una poblacin.

2.3.1.

Distribucin muestral de X

La estadstica X tiene un papel muy importante en problemas de toma de


decisiones para medias poblacionales desconocidas. Para determinar la distribucin muestral de la estadstica X si la muestra aleatoria proviene de
una distribucin normal se utiliza la propiedad reproductiva que tiene la
distribucin normal y se anuncia en el siguiente Teorema
Teorema 2.5. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin
normal con media y varianza 2 . Entonces la distribucin de la media
muestral X es normal con media y varianza 2 .
Demostracin. Como X1 , X2 , . . . , Xn es una muestra aleatoria de una distribucin normal con media y varianza 2 , entonces las variables aleatorias Xi
(i = 1, 2, . . . , n) siguen una distribucin normal con E [Xi ] = y V [Xi ] = 2 .
Entonces para cada Xi de la muestra aleatoria, la funcin generadora de momentos es:


t2 2
MXi (t) = exp t +
2
por consiguiente, la funcin generadora de momentos de la media muestral
X es:
 
 
 
t
t
t
MX (t) = MX1
MX2
MXn
n
n
n






t t2 2
t t2 2
t t2 2
exp
exp
= exp
+
+
+
n
2n2
n
2n2
n
2n2


t2 2
= exp t +
,
2n
que es la funcin generadora de momentos de una distribucin normal con
media y varianza 2 /n. Por lo tanto, la distribucin de la media muestral
2
X es normal con media X = y varianza X
= 2 /n, es decir, X
2
N (, /n).
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

71

Para determinar la distribucin muestral del estadstico X sin importar la


distribucin original de las variables aleatorias X1 , X2 , . . . , Xn se usa el Teorema central del lmite, el cul nos permite usar la distribucin normal como
la distribucin de la media muestral X cuando n es suficientemente grande.
Teorema 2.6 (Teorema central del lmite). Sea X1 , X2 , . . . , Xn
una muestra aleatoria de tamao n tomada de una poblacin con
media y varianza 2 , entonces la variable aleatoria:
Z=

X P
N (0, 1)
/ n n

Demostracin. Una manera de probar el Teorema central del lmite es encontrando la funcin generadora de momentos de
Z=

/ n

y demostrar que est tiende a la funcin generadora de momentos de una


distribucin normal estndar conforme n . Sean
Zi =

Xi

i = 1, 2, . . . , n,

y
Y =

/ n

entonces

n
P

Xi

X
1
i=1

=
Y =

n
/ n
/ n

1
n n

1
=
n

n
X
i=1
n
X

!
Xi n

Zi

i=1

Universidad de Carabobo

1
=
n

n
X
Xi
i=1

Sec 2.3. Distribuciones muestrales de algunos estadsticos


importantes
de esta manera
1
Y =
n

n
X

72

!
Zi

i=1

Debido a que las Xi son variables independientes e idnticamente distribuidas, Zi , i = 1, 2, . . . , n, son independientes e idnticamente distribuidas con
E [Zi ] = 0 y V [Zi ] = 1. Entonces
n
MP

Zi

(t) = MZ1 (t)MZ2 (t) MZ2 (t)

i=1

= [MZi (t)]n
y

n
MY (t) = M P
i=1

donde

Zi


= MZi

n





tZi
t
= E exp
MZi
n
n
al expandir la expresin (2.15) en una serie de taylor:


t3
tZi
t2 2
t

Zi3 +
exp
Zi + Zi +
=1+
3/2
2n
3!n
n
n


(2.15)

(2.16)

tomando valores esperados a ambos lados de la ecuacin (2.16), se tiene que:







t3
t
tZi
t2 2
3
E exp
Z +
= E 1 + Zi + Zi +
2n
3!n3/2 i
n
n
 3
t
t3
t2  2 

=1+
E
Zi +
E [Zi ] + E Zi +
2n
3!n3/2
n
 3
t2
t3
Zi +
=1+
+
E
2n 3!n3/2
por tanto,

n
 3
t2
t3
MY (t) = 1 +
+
E Zi +
2n 3!n3/2

n

 3
1 t2
t3
= 1+
+ E Zi +
n 2
3! n

n
bn
= 1+
n
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

73
donde

 
t3
t2
bn = + E Zi3 +
2
3! n

Recuerde que si

lm bn = b entonces

lm

bn
1+
n

n
= exp{b}

de esta manera

n
bn
lm MY (t) = lm 1 +
n
n
n
 2
t
= exp
2

(2.17)
(2.18)

ya que todos los trminos en bn , excepto el primero, tienden a cero cuando


n , debido a que todos los trminos tienen potencias positivas de n en sus
denominadores. La expresin (2.17) es la funcin generadora de momentos
para una variable aleatoria normal estndar. Por lo tanto, la distribucin
lmite de
X

Y =
/ n
es la normal estndar para valores grandes de n.
El Teorema central del lmite dice que la media muestral X de una muestra
aleatoria tiende a seguir una distribucin normal, cuando n es suficientemente
grande. En general, el tamao de n depende de la distribucin original de
la variable aleatoria X; para n 30, se aplica la aproximacin normal sin
importar cual sea la distribucin original de X. Para n < 30 la aproximacin
es vlida segn la forma de la distribucin original, esto es, si el modelo de
probabilidad de la poblacin es semejante a la distribucin normal.
Ejemplo 2.9. Una mquina vendedora est programada para que la cantidad
de refrescos que sirve sea una variable aleatoria con media 200 ml y desviacin estndar 15 ml. Cul es la probabilidad de que la media muestral X de
una muestra aleatoria de 36 refrescos sea mayor que 196 ml pero menor que
204 ml?
(a) Realice los clculos usando la desigualdad de Chebyshev y el Teorema
central del lmite.
Universidad de Carabobo

Sec 2.3. Distribuciones muestrales de algunos estadsticos


importantes

74

(b) Cul es el error mximo que se est dispuesto a aceptar en la estimacin de la media poblacional si se especifica una probabilidad de 0 95?
(c) Cul debe ser el tamao de la muestra de tal forma que el error mximo que se cometa en la estimacin de la media sea de 4 ml con una
probabilidad de por lo menos 0 95?
Solucin:
Sea X la variable aleatoria que representa la cantidad de refresco que sirve
la mquina, entonces
E [X] = 200 ml

V [X] = 225 ml2

Si X es la media de la muestra aleatoria de 36 refrescos, por la expresiones


(2.2) y (2.3), se tiene que:
 
E X = 200 ml

  225
V X =
ml2
36

(a) Usando la desigualdad de chebyshev:




P 196 X 204 = P 196 200 X 204 200

= P 4 X 4



= P X 4

como kX = 4 y X = 5/2, entonces k = 8/5, de esta manera






P 196 X 204 = P X 4
1
64
1 2 =1
k
25
39
=
64
= 0 6094
Usando el Teorema central del lmite:


225
X N 200,
36
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

75
entonces:



P 196 X 204 = P 196 200 X 204 200

= P 4 X 4


6
6
= P 4 Z 4
15
15
= P (1 6 Z 1 6)
= 1 2P (Z 1 6)
= 0 8904
Con la desigualdad de Chebyshev donde no se hace ninguna suposicin
sobre la distribucin de X, la probabilidad es al menos de 0 6094 y
usando el Teorema central del lmite se tiene que la probabilidad es
aproximadamente 0 8904.
b) Se quiere determinar el error tal que:



P X = 0 95
entonces




P X = P X


6
6
=P Z
15
15


6
= 1 2P Z
= 0 95
15
esto implica que:

P

6
Z
15


= 0 025

por lo tanto:

y de aqu, = 4 9 ml.
Universidad de Carabobo

6
= 1 96
15

Sec 2.4. Distribuciones muestrales relacionadas con la distribucin


normal
76



c) P X < 4 0 95




P X < 4 = P 4 < X < 4


4
4
<Z<

=P
15/ n
15/ n


4

0 95
= 1 2P Z <
15/ n
y esto implica que:

P Z<

15/ n


0 025

y tomando 0 025 como la probabilidad mxima, se tiene que:


4
= 1 96
15/ n
y despejando a n de la ltima expresin se tiene que n 54. De esta
manera, si selecciona una muestra que contenga por lo menos 54 observaciones de la distribucin, el valor de la media muestral se encontrar
dentro de un intervalo con longitud de 4 ml con respecto a la media
poblacional con una probabilidad no menor de 0 95.

2.4.

Distribuciones muestrales relacionadas con


la distribucin normal

En esta seccin se estudiarn algunos modelos probabilsticos, que si bien no


aparecen en la realidad de una forma emprica, surgen asociados a ciertos
estadsticos importantes.
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

77

2.4.1.

Distribucin chi-cuadrado de Pearson

Definicin 2.11. Una variable aleatoria X se dice que se distribuye


chi-cuadrado con grados de libertad, lo cual se denota por X 2 ,
si su funcin de densidad de probabilidad est dada por:
(
1
x/21 exp {x/2} x > 0
/2
f (x; ) = 2 (/2)
0
x0

Esta distribucin es un caso particular de la distribucin Gamma con = /2


y = 2. La distribucin se encuentra caracterizada por slo un parmetro,
, conocido como los grados de libertad. La distribucin chi-cuadrada juega
un papel importante en la inferencia estadstica para hacer inferencias con
respecto a la varianza poblacional. En la Figura (2.4.1) se muestran distintas
grficas de la funcin de densidad de una variable aleatoria chi-cuadrada para
distintos valores de .

Figura 2.1: Grfica de la distribucin chi-cuadrado


Si X 2 , entonces
E [X] =
V [X] = 2

3 (X) = 4/ 2


4
4 (X) = 3 1 +

y la funcin generadora de momentos viene dada por:


MX (t) = (1 2t)/2 ,
Universidad de Carabobo

0 t < 1/2

Sec 2.4. Distribuciones muestrales relacionadas con la distribucin


normal
78
2
Aproximacin: Si la variable aleatoria X sigue una
distribucin , y es
suficientemente grande, entonces la variable
Y = 2X, sigue aproximadamente una distribucin normal con media 2 1 y varianza 1.

Teorema 2.7. Sea Z una variable normal estndar, entonces la distribucin de la variables aleatoria Y = Z 2 es una distribucin chicuadrado con un grado de libertad, esto es, Y = Z 2 21 .
Demostracin. La funcin generadora de momentos de Y viene dada por:

 
MY (t) = E [exp {tY }] = E exp tZ 2
Z

exp tZ 2 f (z)dz
=



Z
 2 1
Z2
dz
exp tZ exp
=
2
2


 
Z
1
1
exp
=
t
Z 2 dz
2
2


Z

1
1
2
exp (2t + 1) Z dz
=
2
2

)
(
Z
Z2
1
 dz
exp
=
1
2 12t
2
la ltima integral representa el kernel de una distribucin normal con media
cero y varianza (1 2t)1 . Para hacer el integrando igual a una distribucin
normal con media cero y varianza (1 2t)1 , se multiplica tanto numerador
como el denominador por la desviacin estndar (1 2t)1/2 , esto es:
(
)
Z
(1 2t)1/2 1
Z2
 dz

MY (t) =
exp
1
(1 2t)1/2 2
2 12t
(
)
Z
1
1
Z2
 dz

=
exp
1
(1 2t)1/2 2(1 2t)1/2
2 12t
|
{z
}
= (1 2t)1/2
de esta manera,
MY (t) = (1 2t)1/2 ,

0 t < 1/2
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

79

La funcin generadora de momentos de Y = Z 2 es idntica a la de la distribucin chi-cuadrado con = 1 grados de libertad. En consecuencia, si
Z N (0, 1) entonces Y = Z 2 21 .

Teorema 2.8. Si Z1 , Z2 , . . . , Zn son variables aleatorias independientes e idnticamente distribuidas normal estndar, entonces la variable
aleatoria
Y = Z12 + Z22 + + Zn2
sigue una distribucin chi-cuadrado con n grados de libertad.

Demostracin. Del Teorema anterior Zi2 definen n variables aleatorias independientes chi-cuadrada con un grado de libertad para toda i = 1, 2, . . . , n,
entonces
MY (t) = E [exp {tY }]


 
= E exp t Z12 + Z22 + + Zn2



= E exp tZ12 + tZ22 + + tZn2



 
= E exp tZ12 exp tZ22 exp tZn2

  
 

 
= E exp tZ12 E exp tZ22 E exp tZn2
= (1 2t)1/2 (1 2t)1/2 (1 2t)1/2
= (1 2t)n/2
de esta forma se tiene que:
MY (Y ) = (1 2t)n/2 ,

0 t < 1/2

que es la funcin generadora de momento de una variable aleatoria chicuadrado con n grados de libertad. Por tanto,
Y = Z12 + Z22 + + Zn2 2n

Universidad de Carabobo

Sec 2.4. Distribuciones muestrales relacionadas con la distribucin


normal
80
Teorema 2.9. Si X1 , X2 , . . . , Xk son k variables aleatorias independientes y cada una tiene una distribucin chi-cuadrado con
1 , 2 , . . . , n grados de libertad, respectivamente, entonces la variable
aleatoria
Y = X1 + X 2 + + X k
sigue una distribucin chi-cuadrado con = 1 + 2 + + n grados
de libertad.

Demostracin.
MY (t) = E [exp {tY }]
= E [exp {t (X1 + X2 + + Xn )}]
= E [exp {tX1 + tX2 + + tXn }]
= E [exp {tX1 } exp {tX2 } exp {tXn }]
= E [exp {tX1 }] E [exp {tX2 }] E [exp {tXn }]
= (1 2t)1 /2 (1 2t)2 /2 (1 2t)n /2
= (1 2t)(1 +2 ++n )/2 ,

0 t < 1/2

que es la funcin generadora de momentos de una variable aleatoria chicuadrado con = 1 + 2 + + n grados de libertad. De esta manera,
Y = X1 + X2 + + Xk 2
donde: = 1 + 2 + + n .

Teorema 2.10. Si X1 y X2 son variables aleatorias, donde X1 sigue


una distribucin chi-cuadrado con 1 grados de libertad y es independiente de Y = X1 + X2 cuya distribucin de Y es chi-cuadrado con
grados de libertad tal que > 1 , entonces X2 tambin sigue una
distribucin chi-cuadrado con 1 grados de libertad.

Demostracin. Sea Y = X1 + X2 , entonces la funcin generadora de momenFaCyT-Matemticas

Cap 2. Distribucin en el muestreo

81
tos de Y viene dada:

MY (t) = E [exp {tY }]


= E [exp {t (X1 + X2 )}]
= E [exp {tX1 + tX2 }]
= E [exp {tX1 }] E [exp {tX2 }]
= MX1 (t) MX2 (t)
donde
MY (t) = (1 2t)/2

MX1 (t) = (1 2t)1 /2

Por lo tanto
(1 2t)/2 = (1 2t)1 /2 MX2 (t)

(2.19)

multiplicando ambos lados de la ecuacin (2.19) por (1 2t)1 /2 , se tiene que:


(1 2t)/2 (1 2t)1 /2 = MX2 (t)
de esta forma la funcin generadora de momentos de X2 es:
MX2 (t) = (1 2t)(1 )/2
La funcin generadora de momentos de X2 es idntica a la de una distribucin
chi-cuadrado con 1 grados de libertad. Por lo tanto, X2 tambin sigue
una distribucin chi-cuadrado con 1 grados de libertad.

Teorema 2.11. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n tomada de una poblacin normal con media y varianza 2 ,
entonces la estadstica
2
n
2
X
X

X
(n

1)S
i
2 =
=
2
2
i=1
tiene una distribucin chi-cuadrado con = n 1 grados de libertad.

Universidad de Carabobo

Sec 2.4. Distribuciones muestrales relacionadas con la distribucin


normal
82
Demostracin.
n
n
X
X


2
2
(Xi ) =
Xi X + X
i=1

i=1
n
X

Xi X

2

2

+2 X

i=1

i=1
n
X

n
X

Xi X

2

n
X

Xi X

2

i=1

+n X

2

i=1

al dividir cada trmino de la igualdad entre 2 y sustituir (n 1)S 2 por


n
2
P
Xi X , se obtiene que:
i=1
n
P

(Xi )2

2
(n 1)S 2 n X
=
+
(2.20)
2
2
2
La expresin del lado izquierdo de la ecuacin (2.20), es una variable aleatoria
chi-cuadrado con n grados de libertad, ya que es la suma de n variables
aleatoria independientes normal estndar al cuadrado, esto es:
i=1

n
P

(Xi )2

i=1

=
=

2
n 
X
Xi
i=1
n
X

Zi2 2n

i=1

el segundo trmino del lado derecho de la ecuacin (2.20) es el cuadrado de


una variable normal estndar, ya que X es una variable normal con media
y varianza 2 /n, esto es
2 
2
n X
X

=
2
/ n
= Z 2 21
Adems se puede demostrar que las dos variables chi-cuadrado
n
P

(Xi )2

i=1

n X
2

2

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

83

son independientes. Por el Teorema (2.10), la variable aleatoria


(n 1)S 2
2
tambin es una variable aleatoria chi-cuadrado con n 1 grados de libertad.
Ejemplo 2.10. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n tomada de una poblacin normal con media y varianza 2 . Encontrar la
varianza de
n
2
1 X
2
S =
Xi X
n 1 i=1
Solucin:
2
, entonces por el Teorema (2.11), Y sigue una distribucin
Sea Y = (n1)S
2
chi-cuadrada con n 1 grados de libertad, de esta manera, se tiene que:
 2 
 2
Y
V S =V
n1
4
V [Y ]
=
(n 1)2
2(n 1) 4
=
(n 1)2
2 4
=
n1
por lo tanto,


V S

2 4
=
n1


Ejemplo 2.11. Suponga que el espesor de un componente para un semiconductor es una caracterstica crtica. El proceso de produccin de esta caracterstica se distribuye normalmente con = 0 6 milsimas de pulgadas. Para
controlar el proceso se toman muestras peridicas de 20 piezas y se define un
lmite central en base a una probabilidad de 0 01 de que la varianza muestral
exceda dicho lmite, si el proceso est bajo control. Qu se puede concluir si
para una muestra dada la desviacin estndar muestral es 0 84 milsima de
Universidad de Carabobo

Sec 2.4. Distribuciones muestrales relacionadas con la distribucin


normal
84
pulgada?
Solucin:
Sea X la variable aleatoria que representa el espesor del semiconductor, de
esta manera X N (, 0 36). Sea a el lmite central, entonces

(n 1)S 2
(n 1)a
>
2

2


19a
= P 2n1 >
(0 6)2


19a
2
= P 19 >
= 0 01
(0 6)2


P S >a =P

por lo tanto
19a
= 36 19
(0 6)2
de aqu implica que el lmite central es a = 0 6857. Con base a la evidencia
muestral se obtuvo que s2 = (0 84)2 = 0 7056; como este valor supera el
limite central se puede concluir que la muestra no proviene de un proceso con
desviacin estndar de 0 60.

Ejemplo 2.12. Un fabricante de bateras para automviles garantiza que sus
bateras durarn, en promedio, tres aos con una desviacin estndar de un
ao. Si cinco de estas bacterias bateras tienen duraciones de 1 9, 2 4, 3 0,
3 5 y 4 2 aos. Puede asegurarse que la duracin de las bateras tienen una
desviacin estndar de un ao?. Suponga que la duracin de las bateras siguen una distribucin normal.
Solucin:
Con base a la evidencia muestral se tiene que:
s2 = 0 815
Entonces
2 =

(4)(0 815)
(n 1)s2
=
= 3 26
2

1
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

85

en un valor de una distribucin chi-cuadrado con 4 grados de libertad. Como


el 95 % de los valores de 2 con 4 grados de libertad caen entre 0 484 y 11 143,
el valor calculado con 2 = 1 es razonable y por tanto el fabricante no tiene
razn para sospechar que la desviacin estndar es diferente de un ao.

2.4.2.

Distribucin t de Student

Se sabe que cuando se muestrea una distribucin normal con media y


varianza conocida 2 , la distribucin de

Z=

/ n

(2.21)

es normal estndar. La expresin (2.21) nos permitir, en los captulos siguientes, formular inferencias con respecto a la media de la poblacin. Sin
embargo para calcular Z se requiere que 2 sea conocido; si la varianza es
desconocida y dada la disponibilidad de una muestra aleatoria tomada de la
poblacin se puede reemplazar por su estimacin s, esto es:

T =

S/ n

(2.22)

Desafortunadamente, la distribucin de la expresin (2.22) no sigue de manera exacta una distribucin normal estndar. Por lo tanto, se necesita una
distribucin para el caso en que sea desconocido y sea reemplazado por su
estimacin s. Como se ver, la expresin (2.22) sigue una distribucin t de
Student con n 1 grados de libertad. El principal objetivo de esta seccin es
mostrar los aspectos tericos de la distribucin t de Student
Universidad de Carabobo

Sec 2.4. Distribuciones muestrales relacionadas con la distribucin


normal
86
Teorema 2.12. Si X y Z son dos variables aleatorias independientes,
y adems X sigue una distribucin chi-cuadrada con grados de
libertad y Z es una variable aleatoria normal estndar, entonces la
distribucin de la variable aleatoria
Z
T =q

sigue una distribucin t de Student con grados de libertad y una


funcin de densidad de probabilidad dada por:

+1
1
1
2

f (t; ) =
< t < , > 0

1 + t2  +1
2
2

Demostracin. Por hiptesis las variables aleatorias X y Z son independientes, por tanto la densidad conjunta de las variables aleatorias X y Z viene
dada por:
f (x, z) = f (x)f (z)
donde f (x) es la funcin de densidad de una variable aleatoria chi-cuadrada
con grados de libertad y f (z) es la densidad de una variable normal estndar. En consecuencia
 2
n xo 1

z
1
1
 x 2 exp
exp
f (x, z) =

2
2
22 2
2
Haciendo el cambio de variable
r
Z=T

y x=w

entonces el jacobiano de la transformacin es:


p
 1
w

T 12 w 2 1

J =
0
1


r

= w

de esta manera se tiene que:


g(t, w) =

22

 2 r
n wo 1

t w
w
2 1 exp


exp

2
2

2
2

< t < ,

w>0

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

87
o
w
g(t, w) =

1
2

n 
 o
1
t2
w exp 2 1 + w

,

2+1 2
1
2

< t < ,

w>0

Integrando g(t, w) con respecto a w, se obtiene la distribucin marginal de


la variable aleatoria T
 o
n 
Z w 2 1 w 21 exp 1 1 + t2 w
2

g(t) =
dw

2+1 2
0
n 
 o
1
t2
1
Z w +1
2
exp

1
+
w
2

1
dw
=
+1
(/2) 0
2 2
Haciendo el siguiente cambio de variable




t2
t2
dm
= 1+
m= 1+
w y

dw

Adems, si
w = 0 m = 0
w = m =

Por lo tanto,
1
g(t) =
(/2)

1
=
(/2)

+1
1
2

n 
exp 21 1 +
2

0
+1

1+

Z
t2

 o
w
dw

m 2 1
 +1
1
t2
2

=
(/2) 1 +

+1
2

t2

 +1
1
2

n m o dm

exp
t2
+1
2
1
+
2 2



+1
m 2 1 exp m2
dm
+1
2 2

La ltima integral representa el kernel de una distribucin gamma con parmetros = ( + 1)/2 y = 2. Entonces, Multiplicando tanto numerador y
Universidad de Carabobo

Sec 2.4. Distribuciones muestrales relacionadas con la distribucin


normal
88

, se tiene que:
denominador por +1
2
g(t) =

+1
2

(/2) 1 +

+1
2

Z
t2

 +1
1
2

+1
1
2



exp m2
 +1 dm
+1
2 2
2
{z
}
1

(/2) 1 +

t2

,
 +1
1
2

< t <

En consecuencia, la funcin de densidad de probabilidad de T es:



+1
2
,
< t <
g(t; ) =
 +1
1
t2
2
(/2) 1 +

La distribucin de probabilidad de t se public por primera vez en 1908 en


un artculo de W. S. Gosset. En esa poca, Gosset era empleado de una cervecera irlandesa que desaprobaba la publicacin de investigaciones de sus
empleados. Para evadir esta prohibicin, public su trabajo en secreto bajo
el nombre de Student. En consecuencia, la distribucin t normalmente se
llama distribucin t de Student, o simplemente distribucin t.
La funcin de densidad es simtrica con respecto al origen, y su forma es
muy parecida a la de la normal estndar. En la Figura (2.4.2) se presentan
varias grficas de la distribucin t de Student para distintos valores de y
la grfica de la normal estndar.

Figura 2.2: Comparacin de las funciones de densidad normal estndar y t


FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

89

De la Figura (2.4.2) se puede ver que cuando crece, entonces la distribucin


t de Student tiende a una normal estndar. Adems, se puede demostrar que
el valor esperado de T es:
E [T ] = 0,

>1

y la varianza est dada por:


V [T ] =

,
2

>2

La varianza de T es ligeramente mayor que 1, esto implica que la distribucin


t de Student tiene colas ms pesadas que la distribucin normal estndar. La
funcin generadora de momentos para esta distribucin no esta definida.

Teorema 2.13. Si X y S 2 son la media y la varianza de una muestra


aleatoria de tamao n tomada de una poblacin normal con media
y varianza 2 , entonces la variable aleatoria
T =

S/ n

sigue una distribucin t de Student con n 1 grados de libertad.

Demostracin. Como X1 , X2 , . . . , Xn es una muestra aleatoria tomada de


una poblacin normal con media y varianza 2 , entonces:
X
N (0, 1)
/ n
y
(n 1)S 2
2n1
2

dado que se puede demostrar que X y S 2 son independientes, del Teorema


Universidad de Carabobo

Sec 2.4. Distribuciones muestrales relacionadas con la distribucin


normal
90
(2.12) se desprende que la distribucin de

T =q

/ n

(n1)S 2 1
2
n1

n(X)
X

/ n

q =
S
2
S

S/ n

es la distribucin t con n 1 grados de libertad.


En los captulos siguientes se usar esta funcin de los estadsticos X y S para
construir intervalos de confianza y hacer pruebas de hiptesis con respecto a
la media de una distribucin normal cuando la varianza de la poblacin sea
desconocida.
Ejemplo 2.13. Un fabricante de cigarrillos afirma que su producto tiene un
contenido promedio de nicotina de 1 83 mg. Si una muestra aleatoria de 8
cigarrillos tiene un contenido de nicotina de 2 0, 1 7, 2 1, 1 9, 2 2, 2 1, 2 0,
1 6 Qu tan cierto es lo que afirma el fabricante? Suponga que la cantidad
de nicotina sigue una distribucin normal.
Solucin:
Con base a la evidencia muestral, se tiene que x = 1 95, s = 0 2070 y n = 8.
Entonces para la muestra obtenida, si = 1 83, entonces:
t0 =

1 95 1 83
= 1 6393
0 2070/ 8

es un valor de una distribucin t de Student con 7 grados de libertad. Como el


95 % de los valores de t7 caen entre 2 365 y 2 365, el valor calculado t0 con
= 1 83 es razonable y por lo tanto la afirmacin del fabricante es cierta.

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

91

2.5.

Distribucin de la diferencia de medias muestrales


Supongamos que X N (x , x2 ) y Y N y , y2 son dos variables aleatorias independientes. Sean X1 , X2 , . . . , Xnx y Y1 , Y2 , . . . , Yny muestras aleatorias independientes de X y Y , respectivamente. El inters radica en comparar
x y y a travs de la diferencia X Y , por lo tanto, se necesita obtener la
distribucin de X Y cuando el muestreo se lleva a cabo sobre dos poblaciones normales e independientes.
Se sabe que:


x2
X N x ,
nx
y


y2
Y N y ,
ny
luego, para la variable aleatoria X Y , el valor esperado y la varianza vienen
dadas por:


 
 
E X Y =E X E Y
= x y

 
 

V X Y =V X +V Y
x2 y2
=
+
nx ny
respectivamente. Para conocer la distribucin exacta que sigue la variable
aleatoria X Y se debe saber si las varianzas poblacionales son conocidas o
desconocidas, y si son desconocidas se desea saber si son iguales o no.

2.5.1.

Distribucin de la diferencia de medias cuando se


conocen las varianzas

Si x2 y y2 son conocidas, entonces la distribucin exacta de la variable aleatoria X Y es normal con media = x y y varianza 2 = x2 /nx + y2 /ny ,
Universidad de Carabobo

Sec 2.5. Distribucin de la diferencia de medias muestrales

92

esto es:


x2 y2
X Y N x y ,
+
nx ny
en consecuencia, la distribucin exacta de
Z=

X Y (x y )
q
y2
x2
+
nx
ny

(2.23)

es normal estndar. Como caso particular, si x2 = y2 = 2 , la expresin


(2.23) se puede escribir como:
Z=

X Y (x y )
q
n1x + n1y

(2.24)

La expresin (2.23) se puede usar para hacer inferencia con respecto a la diferencia de medias poblacionales de dos distribuciones normales con varianzas
conocidas.
Ejemplo 2.14. Se toma una muestra aleatoria de tamao 16 de una poblacin normal que tiene una media de 75 y una desviacin estndar de 8.
De otra poblacin normal independiente se toma una muestra aleatoria de
tamao 9, esta poblacin tiene una media de 70 y una desviacin estndar
de 12. Sean X y Y las medias de cada muestra aleatoria, respectivamente.
Encuentre:
(a) La probabilidad de que X Y sea mayor que 4, y
(b) La probabilidad de que X Y este entre 3 5 y 5 5
Solucin:
Si se denota con X y Y la primera y segunda poblacin, respectivamente.
Entonces:




X N 75, 64/ 16
y Y N 70, 144/ 9
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

93

a) La probabilidad de que X Y sea mayor que 4, se puede calcular de la


siguiente manera:


X Y (1 2 )
4 (1 2 )
q 2
q 2
>
P X1 X2 > 4 = P
22
2
1
1
+ n2
+ n22
n1
n1

4 (75 70)
= P Z > q
2
82
+ 129
16


1
=P Z>
4 47
= P (Z > 0 22)
= 1 P (Z 0 22)
= 0 587
b) La probabilidad de que X Y este entre 3 5 y 5 5, viene dada por:

3 5 (1 2 )
5 5 (1 2 )
P (3 5 X Y 5 5) = P q 2
Z q 2
2
1

1
2
+ n22
+ n22
n1
n1

3 5 (75 70)
5 5 (75 70)
Z q
=P q
2
2
82
82
+ 129
+ 129
16
16
= P (0 33 Z 0 11)
= P (Z 0 11) P (Z 0 33)
= 0 5438 0 3707
= 0 731

Ejemplo 2.15. La elasticidad de un polmero es afectada por la concentracin de un reactivo. Cuando se utiliza una concentracin baja la elasticidad
promedio verdadera es 55, mientras que cuando se emplea una concentracin
alta la elasticidad promedio verdadera es 60. La desviacin estndar de la
elasticidad es 4 sin importar cul es la concentracin.Si se toman dos muestras aleatorias de tamao 16, calcule: P X Y > 2 .

Universidad de Carabobo

Sec 2.5. Distribucin de la diferencia de medias muestrales

94

Solucin:
Si se denota con X la elasticidad con concentracin alta y con Y la elasticidad
con concentracin baja, entonces:
x = 60
x = 4
nx = 16

y = 55
y = 4
ny = 16

Entonces



X N 60, 16/ 16



y Y N 55, 16/ 9

Por lo tanto


2 (60 55)
X Y (x y )
q
P X Y >2 =P
> q
1
1
n1x + n1y
4 16
+ 16
= P (Z > 2 1213)
= 1 P (Z 2 1213)
= 0 983


2.5.2.

Distribucin de la diferencia de medias cuando


las varianzas son desconocidas pero iguales

Para el desarrollo de
Z=

X Y (x y )
q
n1x + n1y

Se supuso que la varianzas para las dos distribuciones eran conocidas. Sin
embargo, es poco probable conocer el valor de las varianzas para cada una
de las distribuciones en una situacin real. Se puede obtener la distribucin
exacta de X Y cuando el muestreo se lleve a cabo sobre dos poblaciones
normales independientes con varianzas desconocidas pero iguales. Para cada
una de las dos muestras aleatorias, pueden definirse las varianzas muestrales
Sx2 y Sy2 . Dado que:
(nx 1)Sx2
2nx 1
2
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

95
y

(ny 1)Sy2
2ny 1
2

y como X es independiente de Y , entonces por el Teorema (2.9) la distribucin de


(nx 1)Sx2 (ny 1)Sy2
W =
+
2
2
tambin es chi-cuadrada con n1 + n2 2 grados de libertad. Por lo tanto el
cociente de
X Y (x y )
q
Z=
n1x + n1y
y la raz cuadrada de W dividida entre sus grados de libertad tiene una
distribucin t de Student con n1 + n2 2 grados de libertad. Es decir,

T =r

XY (x y )
q
n1 + n1
x

2
2
(ny 1)Sy
(nx 1)Sx
+
2
2

nx +ny 2

=r

X Y (x y )

(nx 1)Sx2 +(ny 1)Sy2
1
+
nx +ny 2
nx

1
ny

o
T =
en donde
Sp2 =

X Y (x y )
q
Sp n1x + n1y

(2.25)

(nx 1)Sx2 + (ny 1)Sy2


nx + ny 2

es un estimador ponderado de la varianza poblacional comn desconocida.


La expresin (2.25) se puede usar para hacer inferencia con respecto a la
diferencia de medias poblacionales de dos distribuciones normales cuando las
varianzas son desconocidas pero iguales.

Ejemplo 2.16. La resistencia a la rotura por traccin de un alambre es una


caracteristica de calidad fundamental. Esta resistencia se distribuye normalmente de media y varianza desconocida. Una modificacin en el proceso de
fabricacin que disminuye los costos puede producir una variacin en la resistencia. Se tomaron dos muestras independientes, una antes de la modificacin
Universidad de Carabobo

Sec 2.5. Distribucin de la diferencia de medias muestrales

96

de tamao 6 de la se obtuvo una media de 452 42 Kg y una desviacin estndar de 5 2 Kg. y otra despus de la modificacin de tamao 12 de la que se
determin la media de 460 63 Kg. y una desviacin estndar de 4 5 Kg. Se
puede considerar que la media de la resistencia se ha modificado?
Solucin:
Si se denota con A el proceso antes de la modificacin y con D el proceso
despus de la modificacin, entonces se tiene:
nA = 6
xA = 452 42
sA = 5 2

nD = 12
xD = 460 63
sD = 4 5

Supongamos que las varianzas del proceso antes y despus de la modificacin


son desconocidas pero iguales, entonces
T =

X A X D (A D )
q
tnA +nD 2
Sp n1A + n1D

donde
(nA 1)s2A + (nD 1)s2D
nA + nD 2
2
5(5 2) + 11)(4 5)2
=
16
357 95
=
16
= 22 3719

s2p =

y de aqu,
sp = 4 7299
Para los datos obtenidos, si A D = 0, entonces
t0 =

452 42 460 63 0
q
1
(4 7299) 16 + 12

8 21
2 36495
= 3 4715
=

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

97

es un valor de la distribucin t de Student con 16 grados de libertad. La


probabilidad
P (T16 3 4715) < 0 005
Es decir, si el valor verdadero de la diferencia A D es cero, la probabilidad
de observar un valor de T no mayor a 3 4715 es menor de 0 005. Por lo
tanto, se ha observado algo que tiene muy poca posibilidad de ocurrir o la
verdadera diferencia A D 6= 0. Para esta situacin se prefiere elegir que
A D 6= 0. De esta manera, la resistencia a la rotura por traccin de un
alambre se ha modificado.


2.5.3.

Distribucin de la diferencia de medias cuando


las varianzas son desconocidas y distintas

En muchas situaciones no es razonable suponer que x2 = y2 . Sin embargo la


variable aleatoria
X Y (x y )
q
(2.26)
T =
Sy2
Sx2
+
nx
ny
tiene, de manera aproximada, una distribucin t de Student con grados de
libertad dados por:
2
s2x /nx + s2y /ny
=
2 2
(s2y /ny )
(s2x /nx )2
+ ny 1
nx 1
La expresin (2.26) se puede usar para hacer inferencia con respecto a la
diferencia de medias poblacionales cuando las varianzas son desconocidas y
distintas.
Ejemplo 2.17. Un especialista en adquisiciones compra 25 resistores del
vendedor A y 30 del vendedor B. con base a la evidencia muestral la media
y desviacin estndar para los resistores del vendedor A fueron 100 y 1 5
, respectivamente. Para el vendedor B la media y la desviacin estndar
result ser 105 y 2 0 , respectivamente. Existe alguna razn para creer
que las resistencia promedio reales para los resistores del vendedor A y del
vendedor B son distintas?

Universidad de Carabobo

Sec 2.5. Distribucin de la diferencia de medias muestrales

98

Solucin:
Si se denota con 1 los resistores del vendedor A, se tiene
x1 = 100
s1 = 1 5
n1 = 25

x2 = 105
s2 = 2 0
n2 = 30

Para las muestras obtenidas, si 1 2 = 0, entonces:


t0 =

x1 x2 (1 2 )
100 105
q 2
=q
= 10 58
2
s1
s2
1 52
2 02
+
+ n2
25
30
n1

es un valor de la distribucin t de Student con grados de libertad dados por:



 2
s2y 2
sx
+ ny
nx
=  2 2  2 2 2
sx
nx

nx 1


=

1 52
+
25

2 2

1 5
25

251

Sy
ny

ny 1
2
2 02
30
 2 2

2 0
30

301

0 0498
2
=
0 0095
= 50 39
= 50

como
P (T52 10 58) < 0 0005
esto quiere decir que, si el verdadero valor de la diferencia 1 2 = 0, la
probabilidad de observar un valor T no mayor de 10 58 es menor a 0 0005.
En cualquier caso, se ha observado algo que tiene muy poca posibilidad de
ocurrir, o el verdadero valor de la diferencia 1 2 6= 0. Para esta situacin
es preferible elegir la segunda. Por lo tanto, hay razn suficiente para asegurar
que las resistencia promedio reales para los resistores del vendedor A y del
vendedor B son distintas.

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

99

2.5.4.

Distribucin de la diferencia de medias cuando las


varianzas son desconocidas y tamaos de muestras grandes

Se sustituye en (2.23) cada varianza poblacional que es desconocida, por la


correspondiente varianza muestral, considerando que en virtud de los elevados tamaos muestrales ambas estn suficientemente prximas a las varianzas poblacionales para proceder como si fuesen conocidas. de este modo, la
variable aleatoria
X Y (x y )
q
Z=
(2.27)
Sy2
Sx2
+
nx
ny
tiene una distribucin, de manera aproximada, normal estndar.

2.6.

Distribucin F de Snedeer

La idea ahora es tratar de comparar las varianzas de dos distribuciones normales independientes con base a cada muestras aleatorias.

Teorema 2.14. Sean X y Y dos variables aleatorias independientes


chi-cuadrada con 1 y 2 grados de libertad, respectivamente. Entonces, la variable aleatoria F definida como:
F =

X/1
Y /2

tiene una distribucin F con funcin de densidad de probabilidad dada


por:
+ 1 /2 2 /2
2
( 1 2 2 )1 2 f 122 ( + f ) 1 +
2
f >0
1
2
2
1

(
)
(
)
g(f ; 1 , 2 ) =
2
2
0
f 0
(2.28)
Si una variable aleatoria F tiene funcin de densidad dada por (2.28), entonces la variable aleatoria F sigue una distribucin f de Snedeer con 1 y 2
Universidad de Carabobo

Sec 2.6. Distribucin F de Snedeer

100

grados de libertad en el numerador y denominador, respectivamente, lo que


se denota por:
F f21
Si F f21 , puede demostrarse que el valor esperado de F es
E [F ] =

2
2 2

2 > 2

y la varianza
22 (22 + 21 4)
V [F ] =
1 (2 2)2 (2 4)

2 > 4

En la Figura (2.6) se muestran distintas grficas de la funcin de densidad


de una variable aleatoria F para distintos valores de 1 y 2 .

Figura 2.3: Grfica de la distribucin F

Es una densidad asimtrica positiva, pero la asimetra va disminuyendo a


medida que 1 y 2 van aumentando. La funcin generadora de momentos
para esta distribucin no esta definida.
La aplicacin principal para la cual se desarroll la distribucin F es la
comparacin de varianzas de dos poblaciones normales.
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

101

Teorema 2.15. Si S12 y S22 son las varianzas muestrales de dos variables aleatorias independienes de tamao n1 y n2 , tomadas de poblaciones normales con varianzas 12 y 22 , entonces:
F =

S12 /12
S22 /22

sigue una distribucin F con (n1 1) grados de libertad en el numerador y (n2 1) grados de libertad en el denominador.

Demostracin. Se sabe que:


(n1 1)S12
W1 =
12
y
W2 =

(n2 1)S22
22

tienen distribuciones chi-cuadradas independientes con 1 = (n1 1) y 2 =


(n2 1) grados de libertad, respectivamente. Entonces por el Teorema (2.14)
implica que:
F =

S12 /12
[(n1 1)S12 /12 ] /(n1 1)
W1 /1
=
=
W2 /2
[(n2 1)S22 /22 ] /(n2 1)
S22 /22

tiene una distribucin F con (n1 1) grados de libertad en el numerador y


(n2 1) grados de libertad en el denominador.
En el caso de que 12 = 22 entonces:
F =

S12
fn1 1,n2 1
S22

Ejemplo 2.18. En una prueba sobre la efectividad de dos tipos distintos de


pldoras para dormir, A y B, se utilizan dos grupos independientes de personas con insomnio. Al grupo 1 de tamao 40 se le administr la pldora
A y al otro grupo 2, de tamao 60, se le administr la B, registrndose el
nmero de horas de sueo de cada individuo participante en el estudio. Si se
Universidad de Carabobo

Sec 2.7. Ejercicios propuestos

102

supone que el nmero de horas de sueo de quienes usan cada tipo de pldora
se distribuye normalmente con 12 y 22 . Determine si es cierto que 12 = 22 ,
sabiendo que la desviacin estndar muestral de los grupos 1 y 2 en estudio
es de 3h y 2h, respectivamente.
Solucin:
Sea X la variable aleatoria que representa las horas de sueo del grupo 1 y Y
la variable aleatoria que representa las horas de sueo del grupo 2, entonces:
X N (1 , 12 ) y Y N (2 , 22 )
y
n1 = 40
s1 = 3h

n2 = 60
s2 = 2h

Para las muestras obtenidas, si 12 = 22 , entonces:


F0 =

s2x
32
=
= 2 25
s2y
22

es un valor de una distribucin F con 39 grados de libertad en el numerador y


59 grados de libertad en el denominador. Como el 95 % de los valores de una
distribucin F con 39 y 59 grados de libertad en el numerador y denominador,
respectivamente, caen entre 0 5507 y 1 7541, el valor calculado F0 suponiendo
que 12 = 22 es poco probable de que ocurra. Por lo tanto, no es cierto suponer
que las varianzas sean iguales.


2.7.

Ejercicios propuestos

1. Un fabricante de llantas desea calcular un intervalo de rendimiento en


millas que excluya no ms de 10 % del rendimiento de las llantas que
l vende. Todo lo que sabe es que, parar un gran nmero de llantas
probadas, la media de rendimiento fue de 25 000 y que la desviacin
estndar fue de 4000 millas. Qu intervalo sugerira usted?
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

103

2. Una mquina empleada para llenar cajas de cereal despacha, en promedio, onzas por caja. El fabricante desea que las X onzas reales
despachadas no rebasen por ms de 1 onza a , al menos 75 % del
tiempo. Cul es el mximo valor de , la desviacin estndar de X,
que se puede tolerar si las metas del fabricante han de satifacerse?
3. Cul debe ser el valor ms pequeo de k en el Teorema de Chebyshev
para el que la probabilidad de que una variable aleatoria asuma un
valor entre k y + k sea
a. al menos 0 95
b. al menos 0 99
4. El nmero de licencias de matrimonio expedida en cierta ciudad durante
el mes de junio se puede considerar como una variable aleatoria con
= 124 y = 7 5. De acuero con el Teorema de Chebyshev, con
que probabilidad se puede afirmar que all se emitarn entre 64 y 184
licencias de matrimonio durante el mes de junio?
5. Un estudio del valor alimenticio de cierta clase de pan muestra que la
cantidad de tiamina (vitamina B1 ) en una rebanada se puede considerar
como una variable aleatoria con = 0 260 miligramos y = 0 005
miligramos. De acuerdo al Teorema de Chebyshev, entre que valores
debe estar el contenido de tiamina de
a. al menos 35/36 de todas las rebanadas de este pan?
b. al menos 143/144 de todas las rebanadas de este pan?
6. Un distribuidor minorista vende tres marcas de automviles. Para la
marca A, su utilidad X por venta, est distribuida normalmente con
parmetros (1 , 12 ); para la marca B su utilidad Y por venta est
distribuida normalmente con parmetros (2 , 22 ); para la marca C, su
utilidad W por venta est distribuida normalmente con parmetros
(3 , 32 ). Para un ao, dos quintas partes de las ventas del distribuidor
son de la marca A, un quinto de la marca B y los quintos restantes de
la marca C. Sea U el verdadero promedio de utilidad por ventas para
el ao. Encuentre la media, la varianza y la funcin de densidad de
probabilidad para U. Suponga que X, Y y W son independientes.
Universidad de Carabobo

Sec 2.7. Ejercicios propuestos

104

7. De cada una de dos poblaciones normales con medias idnticas y con


desviaciones estndar de 6 4 y 7 20, se toman muestras aleatorias independientes de 64 observaciones. Encuentre la probabilidad de que
la diferencia entre las medias de las muestras exceda de 0 6 en valor
absoluto.
8. Si X tiene una distribucin exponencial con media , demuestre que
U = 2X/ tiene una distribucin chi-cuadrado con 2 grados de libertad.
9. El coeficiente de variacin (CV) para una muestra aleatoria X1 , X2 , . . . , Xn
est definido por
S
CV =
X
Esta cantidad, que suministra la desviacin estndar como una proporcin de la media, en ocasiones es informativa. Denote con X1 , X2 , . . . , X10
una muestra aleatoria de tamao 10 tomada de una distribucin normal
con media 0 y varianza 2 . Use los siguientes pasos para determinar el
nmero c tal que


S
c = 0 95
P c
X
a. Determinar la distribucin de
U=

10X
S2

b. Determinar la distribucin de
W =

S2
10X

c. Use los resultados al inciso b para determinar la constante c.


10. La filtracin de agua por el suelo depende, entre otras cosas, de la
porosidad (porporcin de huecos por volumen) del suelo. Para comparar
dos tipos de suelo arenoso, se han de tomar n1 = 50 mediciones de la
porosidad del suelo A y n2 = 100 mediciones del suelo B. A partir
de las mediciones se obtuv que 12 = 0 01 y 22 = 0 02. Encuentre la
probabilidad de que la diferencia entre las medias muestrales est a no
ms de 0 05 unidades de la diferencia entre las medias poblacionales
1 2 .
FaCyT-Matemticas

105

Cap 2. Distribucin en el muestreo

11. Para el ejercicio propuesto (10). Suponga que n1 = n2 = n, y encuentre


el valor de n que permita que la diferncia entre las medias muestrales
sea no mayor que 0 04 unidades de 1 2 con probabilidad 0 90.
12. Para un determinado nivel de ingresos, el departamento de Hacienda
sabe que las cantidades declaradas por concepto de deducciones mdicas (X1 ), contribuciones caritativas (X2 ) y gastos varios (X3 ), son
variables aleatorias independientes normalmente distribuidas con medias 400 Bs, 800 Bs y 100 Bs y desviaciones estndar 100 Bs, 250 Bs
y 40 Bs, respectivamente. Cul es la probabilidad de que la cantidad
total declarada por concepto de estas tres deducciones, no sea mayor
de 1600 Bs?
13. Un contratista piensa comprar una gran cantidad de lmparas de alta
intensidad a cierto fabricante. ste asegura al contratista que la duracin promedio de las lmparas es de 1000 horas con una desviacin
estndar igual a 80 horas. El contratista decide comprar las lmparas
slo si una muestra aleatoria de 64 de stas da como resultado una vida
promedio de por lo menos 1000 horas. Cul es la probabilidad de que
el contratista adquiera las lmparas?
14. Un inspector federal de pesos y medidas visita una planta de empacado
para verificar que el peso neto de las cajas sea el indicado en stas. El
gerente de la planta asegura al inspector que el peso promedio de cada
caja es de 750 gr con una desviacin estndar de 5 gr. El inspector
selecciona, al azar, 100 cajas y encuentra que el peso promedio es de
748 gr. Bajo estas condiciones, qu tan probable es tener un peso de
748 gr o menos? Qu actitud debe tomar el inspector?
15. En la fabricacin de cojinetes para motores, se sabe que el dimetro
promedio es de 5cm con una desviacin estndar igual a 0 005cm. El
proceso es vigilado en forma peridica mediante la seleccin aleatoria de
64 cojinetes, midiendo sus correspondientes dimetros. El proceso no se
detiene mientras la probabilidad de que la media muestral se encuentre
entre dos lmites especificados sea de 0 95. Determinar el valor de estos
lmites.
16. En la produccin de cierto material para soldar se sabe que la desviacin
estndar de la tensin de ruptura de este material es de 25 libras. Cul
Universidad de Carabobo

Sec 2.7. Ejercicios propuestos

106

debe ser la tensin de ruptura promedio del proceso si, con base en una
muestra aleatoria de 50 especmenes, la probabilidad de que la media
muestral tenga un valor mayor de 250 libras es de 0 95?
17. Para un gerente de planta es muy importante controlar la variacin
en el espesor de un material plstico. Se sabe que la distribucin del
espesor del material es normal con una desviacin estndar de 0 01 cm.
Una muestra aleatoria de 25 piezas de este material da como resultado
una desviacin estndar de 0 015 cm. Si la varianza de la poblacin es
(0 01)2 cm2 , cul es la probabilidad de que la varianza muestral sea
igual o mayor que (0 015)2 cm2 ? Por lo tanto, qu puede usted concluir
con respecto a la variacin de este proceso?
18. Si se obtiene una muestra aleatoria de n = 16 de una distribucin
normal con media y varianza desconocidas, obtener P (S 2 / 2 6 2 041).
19. Si se obtiene una muestra aleatoria de n = 21 de una distribucin
normal con media y varianza desconocidas, obtener P (S 2 / 2 6 1 421).
20. un fabricante de cigarrillos asegura que el contenido promedio de nicotina, en una de sus marcas, es de 0 6 mg por cigarrillo. una organizacin
independiente mide el nivel de nicotina de 16 cigarrillos de esta marca y
encuentra que el promedio y la desviacin estndar muestral es de 0 75
y 0 175 mg, respectivamente, de nicotina. Si se supone que la cantidad
de nicotina en estos cigarrillos es una variable aleatoria normal, qu
tan probable es el resultado muestral dado el dato proporcionado por
el fabricante?
21. Durante los 12 meses pasados el volumen diario de ventas de un restaurante fue de 2000 Bs. El gerente piensa que los prximos 25 das sern
tpicos con respecto al volumen de ventas normal. Al finalizar los 25
das, el volumen de ventas y su desviacin estndar promedio fueron
de 1800 Bs y 200 Bs, respectivamente. Supngase que el volumen de
ventas diario es una variable aleatoria normal. Si usted fuese el gerente,
tendra alguna razn para creer, con base en este resultado, que hubo
una disminucin en el volumen de ventas promedio diario?
22. El gerente de una refinera piensa modificar el proceso para producir
gasolina a partir de petrleo crudo. El gerente har la modificacin
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

107

slo si la gasolina promedio que se obtiene por este nuevo proceso (expresada como un porcentaje del crudo) aumenta su valor con respecto
al proceso en uso. Con base en un experimento de laboratorio y mediante el empleo de dos muestras aleatorias de tamao 12, una para
cada proceso, la cantidad de gasolina promedio del proceso en uso es
de 24 6 con una desviacin estndar de 2 3, y para el proceso propuesto
fue de 28 2 con una desviacin estndar de 2 7. El gerente piensa que
los resultados proporcionados por los dos procesos con variables aleatorias independientes normalmente distribuidas con varianza iguales.
Con base en esta evidencia:
a. Debe adoptarse el nuevo proceso?
b. Existe alguna razn para creer que las varianzas son iguales?
23. Una organizacin independiente est interesada es probar la distancia
de frenado a una velocidad de 50 mph para dos marcas distintas de automviles. Para la primera marca se seleccionaron nueve automviles y
se probaron en un medio controlado. La media muestral y la desviacin
estndar fueron de 145 pies y 8 pies, respectivamente. Para la segunda
marca se seleccionaron 12 automviles y la distancia promedio result
ser de 132 pies y una desviacin estndar de 10 pies. Con base en esta
evidencia, existe alguna razn para creer que la distancia de frenado
para ambas marcas, es la misma? Supngase que las distancias de frenado son variables aleatorias independientes normalmente distribuidas
con varianzas iguales.
24. La variacin en el nmero de unidades diarias de cierto producto, el
cual manejan dos operadores A y B, debe ser la misma. Con base en
muestras de tamao nA = 16 das y nB = 21 das, el valor calculado de
las desviaciones estndar muestrales es de SA = 8 2 unidades y SB = 5 8
unidades. Si el nmero de stas, manejadas por los dos operadores,
por da, son dos variables aleatorias independientes que se encuentran
aproximadas, en forma adecuada, por distribuciones normales, existe
alguna razn para creer que las varianzas son iguales?
25. Un supervisor de una planta se interesa en presuponer los costos semanales de reparacin para un determinado tipo de mquina. Estos costos
de reparacin, se han determinado que siguen una distribucin exponencial negativa con = 20 unidades monetarias para cada mquina
Universidad de Carabobo

Sec 2.7. Ejercicios propuestos

108

que se estudi. Sean X1 , . . . , X5 los costos de reparacin de cinco de


ests mquinas para una semana dada. Determinar un nmero C tal
que
!
5
X
P
Xi > C = 0 05
i=1

si se supone que las mquinas trabajan en forma independientes.


26. Supongamos que el tiempo de vida de un caucho por kilometraje de
utilizacin, es una variable aleatoria con distribucin normal con media
0 = 30 000 Km. y desviacin estndar de 5000 Km. El fabricante
afirma que un nuevo proceso de fabricacin de los cauchos incrementa
el tiempo de vida del caucho y para probarlo debe tomar una muestra
tamao n que desea determinar. Si la probabilidad de que la media de
una muestra de tamao n sea mayor que un valor dado C es 0 01 se
rechazar la afirmacin de que la media es 30 000 Km. Para asegurarse
de tomar la decisin correcta, el fabricante quiere que la probabilidad
de que la media de la muestra sea menor o igual que C sea 0 02 cuando
el tiempo de vida promedio realmente sea 1 = 35 000 Km. Calcular el
tamao de la muestra y el valor de C para que los requerimientos de
probabilidad del fabricante se cumplan.
27. Sea X la media de una muestra aleatoria de tamao n, seleccionada
con reemplazo, de la poblacin discreta
x
P (X = x)

2
1/3

3
1/3

7
1/3

y si Y es la media de una muestra aleatoria de tamao m, seleccionada


con reemplazo, de la poblacin discreta
y
P (Y = y)

1
2/3

3
1/3

Si se sacan con reemplazo muestras independientes de tamao n = 125


y m = 100, Cul es la probabilidad de que X Y sea mayor que 1 84
pero menor que 2 63?
28. Sean X1 , X2 , . . . , X5 una muestra aleatoria de una distribucin normal
estndar y X la media muestral de dicha muestra. Sea X6 otra observacin independiente de la misma poblacin. Se pide:
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

109

P
a. Cul es la distribucin de W = 5i=1 Xi2 ? Por qu?
2
P
b. Cul es la distribucin de U = 5i=1 Xi X ? Por qu?
2
P
c. Cul es la distribucin de 5i=1 Xi X + X62 ? Por qu?

d. Cul es la distribucin de 5X6 / W ? Por qu?

e. Cul es la distribucin de 2X6 / U ? Por qu?


29. Se tienen 3 poblaciones X, Y, W normalmente distribuidas e independientes con medias 20, 40, y 80 y varianzas 16, 45, y 64 respectivamente.
Si se extraen sendas muestras aleatorias de tamao 30, 45, y 50 respectivamente. Determine el valor de k en cada caso:
a.
P

18

30
X

Xj X

2

j=1

b.

20
X

(Yj Y ) > k

j=1

<k

50
X

!
(Wj W )2

= 0 01

j=1

45
X

!1/2
(Yj Y )2

= 0 95

j=1

30. Sea Y una variable aleatoria con distribucin Gamma con parmetro
de forma = 7 5 y escala = 2 y W una variable aleatoria con
distribucin Gamma con parmetro de forma = 7/2 y escala = 5/8.
Calcule


7Y
0 9109
P
16W

2.8.
2.8.1.

Complemento
Momentos y funcin generadora de momentos de
una variable aleatoria

Momentos estadsticos de una variable aleatoria


Los momentos estadsticos de una variable aleatoria X es el valor esperado
de una potencia de la variable aleatoria X o de una funcin de dicha variable.
Estos forman una coleccin de medidas descriptivas que pueden emplearse
Universidad de Carabobo

Sec 2.8. Complemento

110

para caracterizar la distribucin de probabilidad de X. Aunque puede hablarse de momento estadstico respecto a cualquier punto, existen dos momentos
con significado especial, que son los ms utilizados en probabilidades y estadsticas:
1. El momento alrededor del cero de la variable aleatoria, y
2. El momento alrededor de la media de la variable aleatoria
Todas las proposiciones siguientes con respecto a los momentos se encuentran
sujetas a la existencia de las sumas o integrales.

Definicin 2.12. Sea X una variable aleatoria. El k-simo momento


de X alrededor del cero se define por:
  X k
0k = E X k =
x pX (x),
si X es discreta, o
 
0k = E X k =

Zx

xk fX (x),

si X es continua

Definicin 2.13. Sea X una variable aleatoria. El momento central


de X o el k-simo momento de X alrededor de la media de X se define
por:
h
i X
k = E (X )k =
(x )k pX (x),
si X es discreta, o
x

h
i Z
k
k = E (X ) =

(x )k fX (x),

si X es continua

En la siguiente tabla se muestran los momentos de orden k ms importantes


que contienen informacin acerca de la distribucin de probabilidad de X
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

111
k

0k

0
1
2
3
4

00
01
02
03
04

k
= E [X 0 ] = 1
= E [X 1 ] = X
= E [X 2 ]
= E [X 3 ]
= E [X 4 ]

0
1
2
3
4


= E (X
= E (X
= E (X
= E (X
= E (X


)0  = 1
)1  = E [X] X = 0
2
)2  = X
)3 
)4

Relaciones y equivalencias entre algunos momentos


1. El segundo momento alrededor de la media de X
El segundo momento alrededor de la media es la varianza de la variable aleatoria X y se puede expresar en funcin de los dos primeros
momentos alrededor del origen.




2 = E (X )2 = E X 2 2X + 2
 
 
= E X 2 2E [X] + E 2
 
 
= E X 2 2 + 2 = E X 2 2
= 02 2
(2.29)
2
= X
La raiz cuadrada positiva de la varianza recibe el nombre de desviacin
estndar y se denota por X .
2. El tercer momento alrededor de la media de X
El tercer momento alrededor de la media de X esta relacionado con
la asimetra de la distribucin de probabilidad de X. Al igual que la
varianza, el tercer momento alrededor de la media se puede expresar en
trminos de los tres primeros momentos alrededor del origen; de hecho,
cualquier momento alrededor de la media puede expresarte en trminos
de los momentos alrededor del origen.




3 = E (X )3 = E X 3 3X 2 + 3X2 3
 
 
 
= E X 3 3E X 2 + 3E [X] 2 E 3
 
 
= E X 3 3E X 2 + 32 3
 
 
= E X 3 3E X 2 + 23
= 03 302 + 23
(2.30)
Universidad de Carabobo

Sec 2.8. Complemento

112

3. El cuarto momento alrededor de la media de X


El cuarto momento alrededor de la media de X esta relacionado con la
curtosis de la distribucin de probabilidad de X.




4 = E (X )4 = E X 4 4X 3 + 6X 2 2 4X3 + 4
 
 
 
 
= E X 4 4E X 3 + 62 E X 2 43 E [X] + E 4
 
 
 
= E X 4 4E X 3 + 62 E X 2 43 + 4
 
 
 
= E X 4 4E X 3 + 62 E X 2 34
= 04 403 + 62 02 34
(2.31)
Aplicaciones de los momentos
1. Coeficiente de asimetra
Mide el grado de asimetra de la distribucin de probabilidad de X.
Definicin 2.14. El coeficiente de asimetra (CA) se obtiene a
partir del segundo y tercer momento alrededor de la media:
CA =

(2.32)

(2 ) 2

Si la distribucin de probabilidad es simtrica el CA es 0; en caso


contrario, se puede concluir a partir de la siguiente relacin:
( > 0 Asimtrica positiva
CA

= 0 Simtrica
< 0 Asimtrica negativa

En la siguiente Figura se presentan las grficas tpicas de distribuciones


asimtrica positiva, simtrica y asimtrica negativa.

Figura 2.4: a) asimtrica positiva, b) simtrica, c) asimtrica negativa


FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

113

2. Coeficiente de Curtosis
Mide el grado de que tan puntiaguda es la distribucin de probabilidad
de la variable aleatoria X.

Definicin 2.15. El coeficiente de curtosis (CC) se obtiene a


partir del segundo y cuarto momento alrededor de la media:
CC =

4
(2 )2

(2.33)

Si la distribucin de probabilidad de X es mesocrtica (apuntamiento


moderado), su coeficiente de curtosis es 3; en caso contrario, se puede
concluir a partir de la siguiente relacin:
( > 3 Curva leptocrtica
CC

= 3 Curva mesocrtica
< 3 Curva platicrtica

En la siguiente Figura se presentan las grficas tpicas de distribuciones


leptocrtica, mesocrtica y platicrtica.

Figura 2.5: a) leptocrtica, b) mesocrtica, c) platicrtica


Ejemplo 2.19. Considrese la siguiente distribucin de una variable aleatoria X
x
P (X = x)

10
0 3

11
0 2

12
0 1

Universidad de Carabobo

13
0 15

14
0 1

15
0 05

16
0

17
0 05

18
0 05

19
0

Sec 2.8. Complemento

114

Calcular la media, varianza y los factores de forma.


Solucin:
Con base en la definicin (2.12), los primeros cuatro momentos de X alrededor del cero son:
01 =

19
X

xP (X = x) = (10)(0 3) + (11)(0 2) + + (18)(0 05) + (19)(0) = 12 25

x=10

02 =

19
X

x2 P (X = x) = (10)2 (0 3) + (11)2 (0 2) + + (18)2 (0 05) + (19)2 (0) = 155 45

x=10

03 =

19
X

x3 P (X = x) = (10)3 (0 3) + (11)3 (0 2) + + (18)3 (0 05) + (19)3 (0) = 2048 95

x=10

04 =

19
X

x4 P (X = x) = (10)4 (0 3) + (11)4 (0 2) + + (18)4 (0 05) + (19)4 (0) = 28083 65

x=10

La media de la variable aleatoria X es:


E [X] = 12 25
Usando la expresin (2.29), la varianza de X es:
V [X] = 155 45 (12 25)2 = 5 3875
por la expresin (2.30), el tercer momento central es:
3 = 2048 95 3(12 25)(155 45) + 2(12 25)3 = 12 6937
y por la expresin (2.31), el cuarto momento es:
4 = 28083 65 4(12 25)(2048 95) + 6(12 25)2 (155 45) 3(12 25)4 = 92 1320
Entonces, los dos factores de forma de la distribucin de probabilidad de X se
obtienen empleando las expresiones (2.32) y (2.33), respectivamente, y son
CA =

12 6937
3

(5 3875) 2

= 1 015

y
92 1320
= 3 1742
(5 3875)2
La distribucin de probabilidad de X es asimtrica positiva y leptocrtica.
CC =

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

115


Ejemplo 2.20. Sea X una variable aleatoria con funcin de densidad de
probabilidad
(
 x
x
exp
2 , x > 0
fX (x) = 4
0,
otro caso
Analice su asimtria y su curtosis mediante los coeficientes respectivos.
Solucin:
Los primeros cuatro momentos de X alrededor del cero son:
Z
0
xfX (x)dx
1 = E [X] =
0
Z
n xo
1 2
x exp
=
4 0
2
=4

02

03

04

=E X =
xfX (x)dx
0
Z
n xo
1
x3 exp
=
4 0
2
= 24
Z

=E X =
xfX (x)dx
0
Z
n xo
1 4
x exp
=
4 0
2
= 192
Z

=E X =
xfX (x)dx
0
Z
n xo
1 5
=
x exp
4 0
2
= 1920

Universidad de Carabobo

Sec 2.8. Complemento

116

Entonces:
E [X] = 4
V [X] = 24 42 = 8
y
3 = 03 302 + 23 = 192 3(4)(24) + 2(4)3 = 32
4 = 04 403 + 62 02 34 = 1920 4(4)(192) + 6(4)2 (24) 3(4)4 = 348
Los coeficientes de asimtria y curtosis de la distribucin de X son:
CA =
=

3
3

(2 ) 2
32
3

82

= 2>0

Como el coeficiente de asimtria CA es mayor a cero, nos permite concluir


que la distribucin de probabilidad dada es asimtrica positiva. Por otra parte,
4
(2 )2
348
= 2
8
= 6 6 > 3

CC =

El valor de CC nos indica que la distribucin de probabilidad dada es de


apuntamiento pronunciado o leptocrtica.


2.8.2.

Funcin generadora de momentos de una variable


aleatoria

Hasta ahora se ha calculado los momentos de una variable aleatoria a partir


de la definicin (2.12), pero existe un procedimiento alternativo que con
frecuencia es til y que hace uso de una funcin matemtica.
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

117

Definicin 2.16. La funcin generadora de momentos (FGM) de la


variable aleatoria X es el valor esperado de exp{tX} y se denota por
MX (t). Esto es,
P
exp{tx}fX (x), caso discreto
MX (t) = E [exp{tX}] = Rx

exp{tx}fX (x), caso continuo

donde t es una variable real tal que h < t < h, h > 0.

La funcin generadora de momentos MX (t) existe slo si la suma o integral en


la definicin anterior converge. Si la MX (t) existe, entonces puede emplearse
para obtener todos los momentos alrededor del cero de la variable aleatoria.

Teorema 2.16. Sea X una variable aleatoria con funcin generadora


de momentos MX (t). Entonces,
0r =

r MX (t)

tr
t=0

Demostracin. Usando la serie de taylor para exp{tX}, se tiene que:


(tX)2 (tX)3
exp{tX} = 1 + tX +
+
+
2!
3!
por lo tanto,
MX (t) = E [exp{tX}]


(tX)2 (tX)3
= E 1 + tX +
+
+
2!
3!
t2   t3  
= 1 + tE [X] + E X 2 + E X 3 +
2!
3!
2
3
t
t
= 1 + t01 + 02 + 03 +
2!
3!
Universidad de Carabobo

Sec 2.8. Complemento

118

De aqu se desprende que


r MX (t)
=

tr
t=0

0r

Ejemplo 2.21. Dado que X tiene la funcin de probabilidad


0
1/8

x
P (X = x)

1
3/8

2
3/8

3
1/8

Determine la funcin generadora de momentos de esta variable aleatoria y


utilicela para determinar el E [X] y V [X].
Solucin:
Por definicin
MX (t) = E [exp{tX}] =

exp{tx}fX (x)

3
1
1 3
= + exp{t} + exp{2t} + exp{3t}
8 8
8
8
1
= [1 + 3 exp{t} + 3 exp{2t} + exp{3t}]
8
1
= (1 + exp{t})3
8
por lo tanto,
MX (t) =

1
(1 + exp{t})3
8

Usando el Teorema (2.16), se tiene





MX (t)
3

2
E [X] =
= (1 + exp{t}) exp{t}

t
8
t=0

=
t=0

3
2

y

 2  2 MX (t)
E X =

t2
t=0


6
3

=
(1 + exp{t})2 exp{2t} + (1 + exp{t})2 exp{t}

8
8

t=0

=3
FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

119
de esta manera,

E [X] =

3
2

y
 
V [X] = E X 2 (E [X])2
 2
3
9
=3
=3
2
4
3
=
4

Ejemplo 2.22. Sea X una variable aleatoria exponencial con funcin de
densidad de probabilidad
n o
(
1
exp x , x > 0
fX (x) =
0,
otro caso
Halle la funcin generadora de momentos, la esperanza y la varianza de X.
Solucin:
Por definicin
Z

exp{tx}fX (x)dx


1
x
=
exp{tx} exp

0


Z b
1
x
= lm
exp + tx
b 0




Z b
1
1
= lm
exp x
t
dx
b 0




(1 t)
=
lm exp x
dx
(1 t) b

= (1 t)1 , t < 1/

MX (t) = E [exp{tX}] =

por lo tanto
MX (t) = (1 t)1 , t <
Universidad de Carabobo

Sec 2.8. Complemento

120

a partir de MX (t), se tiene que:


E [X] =


MX (t)

= (1 t)2
t
t=0
t=0
=

y

 2  2 MX (t)
2
3
E X =
= 2 (1 t)
t2
t=0
t=0
= 2 2
dando como resultado que:
 
V [X] = E X 2 (E [X])2
= 2 2 2
= 2

Propiedades de la funcin generadora de momentos de una variable
aleatoria
La funcin generadora de momentos no siempre existe, pero cuando lo hace identifica de manera completa y unvoca la distribucin de la variable
aleatoria respectiva, por lo que:
Teorema 2.17. Si X y Y son dos variables aleatorias con funcin generadora de momentos MX (t) y MY (t), respectivamente, y
MX (t) = MY (t), entonces X y Y siguen la misma distribucin de
probabilidad.

Teorema 2.18. Si X es una variable aleatoria y a es una constante,


entonces
MX+a (t) = exp {at} MX (t)

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

121
Demostracin.

MX+a (t) = E [exp{t (X + a)}]


= E [exp{tX + at}]
= E [exp{tX} exp{at}]
= exp{at}E [exp{tX}]
= exp {at} MX (t)

Teorema 2.19. Si X es una variable aleatoria y a es una constante,


entonces
MaX (t) = MX (at)

Demostracin.
MaX (t) = E [exp{t (aX)}]
= E [exp{(ta) X}]
= MX (at)

Teorema
2.20. Si X1 , X2 , . . . , Xn son variables aleatorias independientes con funciones generadoras de momentos
MX1 (t) , MX2 (t) , . . . , MXn (t), respectivamente, y si
Y = a1 X1 + a2 X2 + + an Xn
entones la funcin generadora de momento de Y es:
MY (t) = MX1 (a1 t) Ma2 X2 (t) Man Xn (t)

Universidad de Carabobo

Sec 2.8. Complemento

122

Demostracin.
MY (t) = E [exp{t (a1 X1 + a2 X2 + + an Xn )}]
= E [exp{ta1 X1 + ta2 X2 + + tan Xn }]
= E [exp{ta1 X1 } exp{ta2 X2 } exp{tan Xn }]
= E [exp{ta1 X1 }] E [exp{ta2 X2 }] E [exp{tan Xn }]
= MX1 (a1 t) Ma2 X2 (t) Man Xn (t)

Ejemplo 2.23. Considrese el ejemplo (2.22). Encuentre la funcin generadora de momentos de cada una de las siguientes variablea aleatorias
a) V = 5X
b) W = X + 5
c) Y = X1 +X2 + +Xn , donde X1 , X2 , . . . , Xn es una muestra aleatoria
tomada de esa poblacin.
Solucin:
Solucin a)
Como la funcin generadora de momentos de X es:
MX (t) = (1 t)1 , t <

Entonces, por el Teorema (2.19), la funcin generadora de momentos de V


es:
MV (t) = MX (5t)
= (1 5t)1 , t <

1
5

Solucin b)
por el Teorema (2.18), la funcin generadora de momentos de W es:
MW (t) = exp {5t} MX (t)
= exp {5t} (1 t)1 , t <

FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

123

Solucin c)
Como X1 , X2 , . . . , Xn es una muestra aleatoria tomada de esa poblacin y
por el Teorema (2.17), la funcin generadora de momentos de cada Xi , (i =
1, 2, . . . , n), es:
MXi (t) = (1 t)1 , t < 1/

(i = 1, 2, . . . , n)

Por el Teorema (2.20), la funcin generadora de momentos de Y es:


MY (t) = MX1 (a1 t) Ma2 X2 (t) Man Xn (t)
= (1 t)1 (1 t)1 (1 t)1
= (1 t)n
de esta manera,
MY (t) = (1 t)n , t <

Teorema 2.21. Sea X una variable aleatoria con funcin (densidad)


de probabilidad f (x) y g(X) una funcin de X. Entones la funcin
generadora de momentos para g(X) es:
Z
Mg(X) (t) = E [exp{tg(X)}] =
exp{tg(x)}f (x)dx

2.8.3.

Ejercicios propuestos

1. Una variable aleatoria continua X tiene la distribucin de probabilidad


siguiente:
(
4xe2x , x > 0
f (x) =
0 en otro caso
a. Encuentre la funcin generadora de momentos de X.
b. Encuentre la media y la varianza de X.
c. Calcule el coeficiente de asimtria y curtosis. Que concluye?
Universidad de Carabobo

Sec 2.8. Complemento

124

2. Sean X1 , X2 , . . . , Xn variables aleatorias independientes exponenciales


con parmetro .
a. Encuentre la funcin generadora de momentos de Y = X1 + X2 +
+ Xn .
b. Cul es la distribucin de la variable aleatoria Y ?
3. Sea X una variable aleatoria cuya funcin de densidad de probabilidad
es
  
x 2
1
exp
,
< x <
f (x) =
4(1/2)
4
a. Encuentre la funcin generadora de momentos de
Y = X2
b. Halle, a partir de la funcin generadora de momentos, E [Y ] y
V [Y ].
c. Encuentre la funcin generadora de momentos de
U=

Y
8

d. Halle, a partir de la funcin generadora de momentos, E [U ] y


V [U ].
4. Sea Y una variable aleatoria de una distribucin con funcin de densidad de probabilidad
n 2o
(
y
y
2
, si y > 0.
2 exp
2
2

f (y; ) =
0
otro caso,
a. Encuentre la funcin generadora de momentos de
g(Y ) = Y 2
b. Calcule a partir de la FGM E [g(Y )], V [g(Y )], CA y CC.
5. Sea X una variable aleatoria cuya funcin de densidad viene dada por
f (x) = exp{(x )2 },

< x < ; < <


FaCyT-Matemticas

Cap 2. Distribucin en el muestreo

125

a. Encuentre la funcin generadora de momentos de X.


b. Encuentre la media y la varianza de X.
c. Calcule el coeficiente de asimtria y curtosis. Que concluye?
6. Dada W = 3X + 5, donde X se distribuye as:
f (x) = exp{x};

x>0

Halle la funcin generadora de momentos, la media y la varianza de W.


7. Sean X y Y variables aleatorias estadisticamente independientes, con
MX (t) =

1
1
,t <
2
(1 3t)
3

MY (t) =

1
1
,t <
5
(1 2t)
2

sean U = 2X 3, V = 3Y + 5 y Z = U + V . Halle MZ (t).


8. Sea Z una variable aleatoria normalmente distribuida con media 0 y
varianza 1. Determinar la distribucin de Z 2 .
9. Suponga que X1 y X2 son variables aleatorias normales estndar e
independiente. Encuentre la funcin generadora de momentos de U =
X12 + X22 .
10. Suponga que X tiene una distribucin gamma con parmetro y . Use
el mtodo de las funciones generadoras de momentos para demostrar
que W = 2X/ tiene una distribucin 2 con 2 grados de libertad.
11. Sean X1 , X2 , . . . , Xn variables aleatorias independientes tales que cada
Xi tiene una distribucin gamma con parmetros i y . Esto es, las
distribuciones de las X podran tener diferentes , pero todas tienen
el mismo valor para . Demuestre que U = X1 + X2 + + Xn tiene
una distribucin gamma con parmetros 1 + 2 + + n y .
12. Sean X1 , X2 , . . . , Xn n variables aleatorias independientes de Poisson
con parmetros 1 , 2 , . . . , n , respectivamente. Mediante el empleo de
la funcin generadora de momentos, demostrar que la suma de estas
variables tambin es una variable aleatoria de Poisson con parmetros
1 + 2 + + n .
Universidad de Carabobo

Sec 2.8. Complemento

126

13. Sean X1 y X2 dos variables aleatorias independientes binomial con


parmetros n1 y p, y n2 y p, respectivamente. Demostrar que la suma
de X1 y X2 es una variable aleatoria binomial con parmetros n1 + n2
y p.
14. Sean X1 y X2 dos variables aleatorias independientes distribuidas exponencialmente con el mismo parmetro . Demostrar que la suma de
X1 y X2 es una variable aleatoria gamma con parmetro de forma 2 y
parmetro de escala .

FaCyT-Matemticas

Captulo 3
Estimacin puntual

3.1.

Introduccin

La inferencia estadstica est relacionada con los mtodos y procedimientos


para obtener conclusiones o generalizaciones acerca de una poblacin. Estas
conclusiones sobre la poblacin pueden estar relacionadas con la forma funcional de la distribucin de la poblacin o con los valores de uno o varios
parmetros de la misma.
El estudio de la inferencia estadstica se divide en dos grandes campos: por un
lado se tiene el problema de estimacin de los parmetros de la distribucin
de la poblacin, y por el otro, las pruebas de hiptesis. A su vez el problema
de la estimacin se puede dividir en dos reas: la estimacin puntual y la
estimacin por intervalos de confianza.
En forma similar, en el campo de las pruebas de hiptesis se pueden considerar dos reas: pruebas de hiptesis sobre los parmetros de la distribucin
de la poblacin y pruebas de bondad de ajuste

puntual

Estimacin intervalos de confianza


(
Inferencia Estadstica

sobre parmetros

Prueba de hiptesis bondad de ajuste


En este captulo se tratar el problema de estimacin del o los parmetros
desconocidos de una distribucin de probabilidad, y en los captulos siguientes
se estudiar el campo de pruebas de hiptesis.
127

Sec 3.1. Introduccin

3.1.1.

128

Estimacin puntual

Definicin 3.1 (ESTIMADOR PUNTUAL). Si X es una variable aleatoria con funcin de densidad de probabilidad f (x; ), caracterizada por el parmetro desconocido y si X1 , X2 , . . . , Xn es
una muestra aleatoria de tamao n de X, entonces la estadstica
= g(X1 , X2 , . . . , Xn ) correspondiente a se llama estimador puntual de o funcin de decisin.
Se suele denominar estimador de a la estadstica de los valores de la muestra aleatoria X1 , X2 , . . . , Xn y se habla de estimacin de al valor que toma
dicha estadstica cuando se obtienen las realizaciones de las n variables aleatorias que constituyen la muestra aleatoria.
Ejemplo 3.1. Estimador de un parmetro desconocido
1. Cuando se usa la media muestral X para estimar la media de una
poblacin.
2. Cuando se usa la proporcin muestral P para estimar el parmetro de
una distribucin binomial p.

Ejemplo 3.2. Estimacin de un parmetro desconocido
Considrese el ejemplo (3.1), item (1), supngase que
x1 = 3 42, x2 = 3 61, x3 = 2 91, x4 = 5 10, x5 = 5 99,
x6 = 4 44, x7 = 3 59, x8 = 5 55, x9 = 6 82, x10 = 6 37
son las realizaciones de 10 variables aleatorias que constituyen una muestra aleatoria de una poblacin con media desconocida. Si se usa X como
estimador del parmetro desconocido , entonces una estimacin para es:
10
P

x=

xi

i=1

10

47 8
= 4 78
10
FaCyT-Matemticas

Cap 3. Estimacin puntual

129


Como los estimadores son variables aleatorias, uno de los principales problemas de la estimacin puntual es estudiar sus distribuciones muestrales.
Por ejemplo, cuando se calcula la varianza muestral corregida sobre la base de una muestra aleatoria, difcilmente se puede esperar de que el valor
de s2 que se obtiene sea realmente igual a la varianza de la poblacin 2 ,
pero ayudara saber si se puede esperar de que el valor de s2 sea en forma
aproximado igual a la varianza de la poblacin. Asimismo, si se debe decidir
si se utiliza la mediana Med o la media muestral x de una muestra aleatoria para determinar el valor de la media de una poblacin, sera importante
saber, entre otros datos, si x o Med tiene mayor probabilidad de producir
un valor que sea realmente aproximado al valor de la media de una poblacin.
Bsicamente el problema de estimacin puntual es: encontrar una estadstica = g(X1 , X2 , . . . , Xn ) que proporcione la mejor estimacin de . Sin
embargo, no existe una regla nica que permite construir estos estimadores.
Por ejemplo, la media y la mediana de una distribucin simtrica son iguales,
pero la media muestral y la mediana muestral (cuyos valores no son iguales
en general) son ambas estimaciones posibles para la media poblacional. En
este caso, cul es el mejor estimador para la media poblacional?
Para elegir entre varios estimadores de un mismo parmetro hay que definir
criterios de comparacin. Se empezar por presentar dos mtodos clsicos
para la obtencin de estimadores: el mtodo por mxima verosimilitud y el
mtodo de los momentos, y a continuacin algunas propiedades deseables
para decidir si un estimador es bueno.

3.2.
3.2.1.

Mtodos para construir estimadores


Mtodo por mxima verosimilitud

Se sabe que la funcin de verosimilitud de una muestra de n variables aleatorias X1 , X2 , . . . , Xn independientes e idnticamente distribuidas se define
como la funcin de densidad conjunta de dichas variables. Si se denota por
L (x1 , x2 , . . . , xn ; ) la verosimilitud de la muestra como funcin de , donde
= (1 , 2 , . . . , p ) es el vector de parmetros desconocidos de la distribucin
Universidad de Carabobo

Sec 3.2. Mtodos para construir estimadores

130

de la poblacin, entonces se tiene que:


L (x1 , x2 , . . . , xn ; ) = f (x1 , x2 , . . . , xn ; )
= f1 (x1 ; ) f2 (x2 ; ) fn (xn ; )
n
Y
=
fi (xi ; )
i=1

Luego el estimador de mxima verosimilitud (EMV) de , es aquel vector


b que maximiza la funcin de verosimilitud. Por lo tanto para encontrar

estos estimadores se debe derivar la funcin de verosimilitud con respecto a


cada uno de los parmetros a estimar, igualar a cero y despejar el respectivo
parmetro, es decir:
L (x1 , x2 , . . . , xn ; )
= 0 j = 1, 2, . . . , p
i

(3.1)

Como generalmente la funcin de verosimilitud es compleja, y debido a la


naturaleza de est, se escoge por lo comn, mximizar el logarimo neperiano
de la funcin de verosimilitud, y esto se debe a la relacin biunvoca existente
entre una funcin y su logaritmo. Entonces maximizar L (x1 , x2 , . . . , xn ; ) es
equivalente a maximizar Ln (L (x1 , x2 , . . . , xn ; )). Por lo tanto, la ecuacin
(3.1) queda de la siguiente forma:
Ln (L (x1 , x2 , . . . , xn ; ))
= 0 j = 1, 2, . . . , p
i
Ejemplo 3.3. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una variable
aleatoria X de Bernoulli. Obtener el estimador de mxima verosimilitud del
parmetro p.
Solucin:
Como X se distribuye Bernoulli, la funcin de probabilidad es:
(
px (1 p)1x
f (x; p) =
0

x = 0, 1
en cualquier otro caso

donde p es el parmetro por estimar. La funcin de verosimilitud de la muesFaCyT-Matemticas

Cap 3. Estimacin puntual

131
tra aleatoria de tamao n es:

L (x1 , x2 , . . . , xn ; p) = f (x1 ; p) f (x2 ; p) f (xn ; p)


= px1 (1 p)1x1 px2 (1 p)1x2 pxn (1 p)1xn
n
Y
=
pxi (1 p)1xi
i=1
n
P

=p

xi

i=1

(1 p)

n
P

xi

i=1

El logaritmo neperiano de la funcin de verosimilitud es:


!
!
n
n
X
X
Ln (L (x1 , x2 , . . . , xn ; p)) =
xi Ln(p) + n
xi Ln(1 p)
i=1

i=1

Derivando la funcin de verosimilitud con respecto a p, se tiene:


n
n
P
P
xi n
xi
Ln (L (x1 , x2 , . . . , xn ; p))
i=1
i=1
=

p
p
1p
Al igualar a cero la expresin anterior
n
n
P
P
xi n
xi
i=1
i=1

=0
pb
1 pb
n
P
y resolvindola para pb, se tiene que pb = (1/n) xi . Para probar que pb es el
i=1

valor que maximiza el logaritmo neperiano de la funcin de verosimilitud se


debe calcular la segunda derivada con respecto a p y evaluarla en pb:
n
n
P
P

x
+
2p
xi np2
i
2 Ln (L (x1 , x2 , . . . , xn ; p))
i=1
= i=1
p2
[p(1 p)]2
y

2 Ln (L (x1 , x2 , . . . , xn ; p))


p2

n
P

p= i=1n

xi

n2

=
n
P
i=1

Universidad de Carabobo

xi 1

n
P

xi

i=1

Sec 3.2. Mtodos para construir estimadores


como (1/n)
(1/n)

n
P

n
P
i=1

132

xi < 1, la segunda derivada es negativa, por lo tanto pb =

xi es el valor que maximiza el Ln (L (x1 , x2 , . . . , xn ; p)). En conse-

i=1

cuencia, el estimador de mxima verosimilitud de p es:


n
P

PbM V =

Xi

i=1

Para un ejemplo especifico, si se observan 20 xitos en 25 ensayos de Bernoulli, la estimacin de mxima verosimilitud de p es 10/25 = 0 8.

Ejemplo 3.4. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin
normal con una funcin de densidad de probabilidad
f x; ,



(x )2
< x, <
exp
,
=
2
>0
2
2 2
1

Determine los estimadores de y 2 usando el mtodo de mxima verosimilitud.


Solucin:
Ya que y 2 son los parmetros desconocidos de esta distribucin, entonces
el vector de parmetros desconocidos es = (1 , 2 ) = (, 2 ). La funcin de
verosimilitud est dada por:




L x1 , x2 , . . . , xn ; , 2 = f x1 ; , 2 f x2 ; , 2 f xn ; , 2




(x1 )2
1
(xn )2
1

exp

exp

=
2 2
2 2
2 2
2 2
(
)
n
1
1 X
2
=
exp

(xi )
n/2
n/2
2
2
2 i=1
(2) ( )

Luego, el logaritmo neperiano de la funcin de verosimilitud viene dado por:


Ln L x1 , x2 , . . . , xn ; , 2



n

1 X
n
n
(xi )2
= Ln (2) Ln 2 2
2
2
2 i=1

FaCyT-Matemticas

Cap 3. Estimacin puntual

133

Derivando con respecto a y con respecto a 2 , se tiene que:


n
Ln (L (x1 , x2 , . . . , xn ; , 2 ))
1 X
= 2
(xi )

i=1
n
n
1 X
Ln (L (x1 , x2 , . . . , xn ; , 2 ))
=

+
(xi )2
2
2 2 2 ( 2 )2 i=1

Igualando a cero ambas ecuaciones:


n
1 X

(xi
b) = 0
b2

(3.2)

n
X
n
1

+  2
(xi
b)2 = 0
2
b
2
2 b2 i=1

(3.3)

i=1

De la ecuacin (3.2) se despeja el estimador del parmetro


n
n
X
1 X

(xi
b) = 0
(xi
b) = 0
b2
i=1

i=1
n
X

xi nb
=0

i=1
n
P

b=

xi

i=1

b=x
Luego sustituyendo el valor de
b en la ecuacin (3.3) y despejando el esti2
mador de , se tiene que:

n
P

(xi x)2
n
X
i=1
2
b
= 0 n +
(xi x)2 = 0
 2
i=1
2 b2

nb2 +

n
P

b2 =
Universidad de Carabobo

(xi x)2

i=1

Sec 3.2. Mtodos para construir estimadores

134

Por tanto, los estimadores de mxima verosimilitud de y 2 , son:

bM V = X
y
n
P

b2 M V =

Xi X

2

i=1

respectivamente.

En el ejemplo anterior no se verific que los valores de
bM V y b2 M V son los
que realmente maximizan la funcin de verosimilitud, es decir, que son los
estimadores de mxima verosimilitud de y 2 , respectivamente. Esto se
debe a la siguiente observacin:
Observacin 3.1. Dado que una funcin de verosimilitud es el producto,
ya sea de probabilidades o de densidades, stas generalmente se encuentran
acotadas y son continuas en los parmetros. En consecuencia, el resultado es
que la solucin de la primera derivada proporcionar el valor para el cul la
funcin de verosimilitud es mxima.
Ejemplo 3.5. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una variable
aleatoria distribuida uniformemente en el intervalo (0, ), con desconocido.
Utilice el mtodo de mxima verosimilitud para estimar el valor del parmetro a partir de la muestra aleatoria.
Solucin:
Como X U (0, ), entonces la funcin de densidad de esta variable aleatoria
est dada por:
(
1
si 0 x
f (x) =
0 en cualquier otro caso
Por lo tanto, la funcin de verosimilitud de la muestra aleatoria de tamao
n, viene dada por:
L (x1 , x2 , . . . , xn ; ) = f (x1 ; ) f (x2 ; ) f (xn ; )
(
1
si 0 xi i = 1, 2, . . . , n
n
=
0 en cualquier otro caso
FaCyT-Matemticas

Cap 3. Estimacin puntual

135

Luego el logaritmo de la funcin de verosimilitud es:


Ln (L (x1 , x2 , . . . , xn ; )) = nLn ()
Derivando con respecto al parmetro e igualando a cero, se tiene que:
n
Ln (L (x1 , x2 , . . . , xn ; ))
= =0

b
No se puede encontrar de manera directa el valor de que maximiza la funcin de verosimilitud L (x1 , x2 , . . . , xn ; ) = 1n . Debido a que la funcin de
verosimilitud es una funcin montona decreciente, esto implica que el mximo de la funcin de verosimilitud se presenta en el extremo izquierdo del
intervalo (0, ) y como 0 xi , para todo i = 1, 2, . . . , n, entonces el
estimador de mxima verosimilitud de es bM V = M ax (X1 , X2 , . . . , Xn ).

Una propiedad til de los estimadores de mxima verosimilitud es la de
invarianza que se anuncia en el siguiente Teorema.
Teorema 3.1. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin
con funcin (densidad) de probabilidad f (x; ). Si b es el estimador de mb
xima verosimilitud de , y si g() es una funcin uno a uno, entonces g()
es el estimador mxima verosimilitud de la imagen de bajo la funcin g.
Este principio de invarianza de los estimadores mxima verosimilitud se puede enunciar de manera ms general de la siguiente forma:
Teorema 3.2. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin
con funcin
 (densidad) de probabilidad f (x; ), donde = (1 , 2 , . . . , p ).
b = b1 , b2 , . . . , bp es el estimador mxima verosimilitud de , y si
Si
g() = (g1 (), g2 (), . . . , gl ()), 1 l k, entonces el estimador de mxima
verosimilitud de la imagen de bajo g es


b g2 (),
b . . . , gl ()
b
g1 (),
Ejemplo 3.6. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin
normal con media y varianza 2 (ambos desconocidos). Determine los estimadores de mxima verosimilitud de 3, 2 y 1/.

Universidad de Carabobo

Sec 3.2. Mtodos para construir estimadores

136

Solucin:
Del ejemplo (3.4), dado que, el estimador de mxima verosimilitud de es:

bM V = X
entonces, por la propiedad de invarianza de los estimadores de mxima verosimilitud, se tiene que el estimador de mxima verosimilitud de 3, 2 y 1/
son:
c M V = 3X
3
2
b2 M V = X
d
1/
= 1/X
MV

respectivamente.


3.2.2.

Mtodo de los Momentos

Histricamente uno de los mtodos de estimacin ms antiguos; consiste en


igualar un determinado nmero de momentos apropiados de la distribucin
de la poblacin con los correspondientes momentos muestrales, con lo cul
se obtienen tantas ecuaciones, segn se necesiten, para resolver y obtener los
estimadores de los parmetros desconocidos de la poblacin.

Definicin 3.2. El k-simo momento alrededor del cero de una muestra aleatoria X1 , X2 , . . . , Xn de tamao n de una distribucin con funcin (densidad) de probabilidad f (x; ), es la media de sus k-simas
potencias y se denota por medio de Mk ; en forma simblica, se tiene
que:
n
1X k
Mk =
X
n i=1 i
Sea X1 , X2 , . . . , Xn una muestra aleatoria con funcin de densidad f (x; ),
donde = (1 , 2 , . . . , p ) es el vector de parmetros (desconocidos), entonces
FaCyT-Matemticas

Cap 3. Estimacin puntual

137

los estimadores de 1 , 2 , . . . , p bajo el mtodo de los momentos, se encuentran resolviendo simultneamente, las ecuaciones que resultan de igualar los
momentos tericos apropiados con los momentos muestrales o empricos.
n
P

M1 =

i=1

M2 =

i=1

Xi

n
n
P
Xi2
n

= E [X]
 
= E X2

..
.
..
.
n
P

Mp =

Xip

i=1

= E [X p ]

Ejemplo 3.7. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin


normal con media y varianza 2 . Obtenga, por el mtodo de los momentos,
los estimadores de los parmetros y 2 .
Solucin:
Como son dos parmetros los que se necesitan estimar, se igualan los dos
primeros momentos poblacionales con sus respectivos momentos muestrales,
esto es:
n
P

M1 =

i=1

M2 =

i=1

Xi

n
n
P
Xi2
n

= E [X]
 
= E X2

Los primeros momentos poblacionales estn dados por:


E [X] =
 
E X 2 = V [X] + {E [X]}2 = 2 + 2
Universidad de Carabobo

Sec 3.2. Mtodos para construir estimadores

138

Por lo tanto:
n
P

Xi

i=1

n
n
P

(3.4)

= 2 + 2

(3.5)

Xi2

i=1

n
De la ecuacin (3.4), se tiene:

n
P

bM M =

Xi

i=1

=X

y de la ecuacin (3.5), se tiene:


n
P

b2 =

i=1

i=1

Xi2

n
n
P
Xi2

1
=
n

b2
X

n
X

!
Xi2 nX

i=1

n
2
1X
=
Xi X
n i=1

por lo tanto,
n
2
1X
b2 M M =
Xi X
n i=1

De lo anterior se puede concluir que el estimador por el mtodo de los momentos de la media poblacional es la media muestral X, mientras que el
estimador por el mtodo de los momentos de la varianza poblacional 2 no
es la varianza muestral corregida S 2 , sino que es la varianza muestral V 2 .

FaCyT-Matemticas

Cap 3. Estimacin puntual

139

Observacin 3.2. En este ejemplo, los estimadores por el mtodo de los


momentos conciden con los estimadores que se obtuvieron con el mtodo por
mxima verosimilitud (ver ejemplo (3.4)). En general, no necesariamente son
iguales.
Ejemplo 3.8. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n de
una distribucin uniforme (0, ) con desconocido. Utilice el mtodo de los
momentos para estimar .
Solucin:
En este caso se iguala el primer momento poblacional con el primer momento
muestral, ya que se quiere estimar un slo parmetro, esto es:
n
P
Xi
i=1
= E [X]
M1 =
n
Como X U (0, ), entonces, la funcin de densidad de probabilidad viene
dada por:
(
1
si 0 x
f (x; ) =
0 en cualquier otro caso
por lo que, el valor esperado de X se obtiene como:
Z
E [X] =
xf (x; ) dx
0
Z
x
dx
=
0

x2
=
2
0

=
2
Luego:
n
P

Xi

i=1

2X
b =
Xi = 2X
n i=1

Por lo tanto, el estimador de por el mtodo de los momentos es:


bM M = 2X
Universidad de Carabobo

Sec 3.2. Mtodos para construir estimadores

140


Ejemplo 3.9. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin


uniforme en el intervalo (, ). Determinar por el mtodo de los momentos
el estimador de .
Solucin:
Igualando el primer momento poblacional con el primer momento muestral
se tiene que:
n
P
Xi
i=1
= E [X]
M1 =
n
Como X U (, ), entonces, la funcin de densidad de probabilidad viene
dada por:
(
1
si x
f (x; ) = 2
0 en cualquier otro caso
Por lo que, el valor esperado de X se obtiene como:
Z

E [X] =

xf (x; ) dx

x
dx
2


x2
=
4

=0
Como el primer momento poblacional no tiene ninguna informacin sobre
, se plantea en igualar el segundo momento poblacional con el segundo momento muestral
n
P
Xi2
 
M2 = i=1
= E X2
n
FaCyT-Matemticas

Cap 3. Estimacin puntual

141

Calculando el segundo momento poblacional:


Z
 2
x2 f (x; ) dx
E X =

x2
dx
2

Z
=


x
=
6
3

Por lo tanto, E [X 2 ] = 2 /3, as que:


M2 = 2 /3

b =

p
3M2

por consiguiente, el estimador por el metodo de los momentos de es:


v
u n
u3 X
bM M = t
X2
n i=1 i


3.3.

Propiedades de los estimadores puntuales

El valor de un estimador una vez obtenida la muestra, generalmente difiere


del valor del parmetro que se pretende estimar, o sea que es poco probable
que sus valores coincidan. La diferencia entre ambas magnitudes se denomina error de estimacin. La magnitud de este error se podra calcular si
se estuviese el valor del parmetro; pero ste por lo general es desconocido,
razn por lo cul se trata de estimar (aproximar). Obviamente un buen estimador b para ser aquel que tenga una diferencia b lo ms pequea
posible. Pero como esta diferencia es aleatoria se espera que sea pequea con
alta probabilidad. Adems por ser el estimador de un parmetro una funcin
de las variables de la muestra aleatoria, es evidente que se pueden escoger
distintos estimadores para un mismo parmetro, puesto que se puede elegir
arbitrariamente la funcin que se va a utilizar. Por ejemplo, supngase que
Universidad de Carabobo

Sec 3.3. Propiedades de los estimadores puntuales

142

se desea estimar la media de una poblacin y se toma una muestra aleatoria X1 , X2 , . . . , Xn de tamao n de dicha poblacin; se pueden elegir como
estimador de la media las siguientes estadsticas:
b1 = X
b2 = X1
b3 = Xn
X1 + Xn
b4 =
2
b5 = M
b6 = Mx (Xi )

media muestral
el primer valor de la muestra
el ltimo valor de la muestra

el promedio del primer y ltimo valor de la muestra

mediana muestral

mximo de la muestra

Es decir, para cada parmetro desconocido se pueden elegir muchos, prcticamente infinitos, estimadores. Es evidente que se debera tener algn tipo
de criterio para juzgar si un estimador elegido, es un buen estimador, o si
uno es mejor que otro; es decir, algn criterio que indique la eficacia de nuestra eleccin. Al buscar el mejor estimador se har uso de una cantidad muy
importante que recibe el nombre de error cuadrtico medio de un estimador.

Definicin 3.3. (ERROR CUADRTICO MEDIO DE UN


ESTIMADOR) Sea b cualquier estimador de un parmetro desconocido . Se define el error cuadrtico medio de b como el valor
esperado del cuadrado de la diferencia entre b y . Para culquier
b se denotar el error cuadrtico medio por ECM ();
b de
estimador ,
esta forma

 
2 
b
b
ECM = E
(3.6)

El error cuadrtico medio de un estimador b puede expresarse como la suma


de dos componentes no negativas:
b y
La varianza del estimador ,
El cuadrado del sesgo del mismo.
FaCyT-Matemticas

Cap 3. Estimacin puntual

143
En efecto,


 
2 
ECM b = E b
 

2
2
b
b
= E 2 +
  
h i
2
= E b
2E b + 2
    h i
 h i2
h i
2
2
= E b
E b
+ E b
2E b + 2
h i  h i
2
= V b + E b
h i
 2
b
= V + B b

(3.7)

De la ecuacin (3.7) se puede comprender la razn del por qu el error cuadrtico medio es una cantidad muy importante para evaluar a los posibles
estimadores de . Estas dos componentes estn relacionadas con las propiedades deseables de un estimador. De manera especifica, la varianza de un
estimador debe ser lo ms pequea posible mientras que la distribucin de
muestreo del estimador debe concentrarse alrededor del valor del parmetro.

Observacin 3.3. Generalmente no existe ningn estimador que minimice


el error cuadrtico medio para todos los posibles valores de . Es decir, un
estimador puede tener un error cuadrtico medio mnimo para algunos valores
de , mientras que otro estimador tendr la misma propiedad, pero para otros
valores de .
Ejemplo 3.10. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao 10 de
alguna distribucin tal que E [X] = y V [X] = 2 . Considerese las estadsticas:
b1 = X
y
n
P

b2 =
Universidad de Carabobo

Xi

i=1

n+1

Sec 3.3. Propiedades de los estimadores puntuales

144

como posibles estimadores de . Obtener los errores cuadrticos medios de


b1 y b2 . Cul de los dos estimadores es mejor?
Solucin:
Primero se calcula el error cuadrtico medio de cada uno de los estimadores
propuestos, pues el que lo tenga menor, ser el mejor estimador para .
ECM (b1 ) = V [b1 ] + B (b1 )2

n
P

X
i=1 i
 

E [b1 ] = E X = E
n
n

1X
1X
E [Xi ] =
E [X]
=
n i=1
n i=1
n
=
n
=
por lo tanto, B (b1 ) = E [b1 ] = 0, y

V [b1 ] = V X

n
P

i=1 Xi

= V
n

n
n
1 X
1 X
= 2
V [Xi ] = 2
V [X]
n i=1
n i=1

n 2
n2
2
=
n
=

de este modo, el error cuadrtico medio de b1 es:


ECM (b1 ) = V [b1 ] + B (b1 )2 =

2
n

De manera similar,
FaCyT-Matemticas

Cap 3. Estimacin puntual

145

ECM (b2 ) = V [b2 ] + B (b2 )2


n

P
n
n
i=1 Xi
1 X
1 X

E [b2 ] = E
E [Xi ] =
E [X]
=
n + 1 n + 1 i=1
n + 1 i=1
=

n
n+1

n
P

n
n
X
X
i=1 Xi
1
1

V [b2 ] = V
V [Xi ] =
V [X]
=
n + 1 (n + 1)2 i=1
(n + 1)2 i=1

n 2
(n + 1)2

por lo tanto,
ECM (b2 ) = V [b2 ] + B (b2 )2

2
n
n 2
+

=
(n + 1)2
n+1

2
n 2
n (n + 1)
=
+
(n + 1)2
n+1

2

n 2
+
=
(n + 1)2
n+1
2
n
2
=
+
(n + 1)2 (n + 1)2
n 2 + 2
=
(n + 1)2
Como puede apreciarse los errores cuadrticos medios, o al menos uno de
ellos, dependen del parmetro , que es desconocido, y por lo tanto para compararlos es instructiva su representacin grfica considerando como abscisa.
Al no depender del parmetro, la grfica del ECM (b1 ) es una recta paralela
al eje de las abscisas. En cambio ECM (b2 ) es un polinomio de segundo grado
Universidad de Carabobo

Sec 3.3. Propiedades de los estimadores puntuales

146

ECM
 
ECM b2
 
ECM b1

Figura 3.1: Grfica de los errores cuadrticos medios de ambos estimadores.


en por lo que su grfica es una parbola que, evidentemente, no posee puntos
de corte con el eje de abscisas, pues n 2 + 2 = 0 no tiene soluciones reales,
y cuyo vrtice se encuentra en el punto


n 2
0,
(n + 1)2
y abre haca arriba, ya que el coeficiente de 2 es positivo. En la representacin conjunta de ambas grficas de la Figura (3.1) es evidente que el menor
error cuadrtico medio se presenta a un estimador para unos valores de , y
al otro para los dems valores.
En general, como no es conocido el valor del parmetro, es imposible pronunciarse sobre cul de los estimadores es mejor, la situacin ideal sera la
de que un estimador tuviese el menor error cuadrtico medio para cualquier
valor del parmetro, es decir que tuviese menor error cuadrtico medio de
manera uniforme.

Es por esta razn que se deben examinar criterios adicionales para la seleccin
de los estimadores de , an a pesar de que el error cuadrtico medio de un
estimador sea un concepto muy importante. A continuacin se presentarn
algunos criterios para comparar estimadores de un parmetro desconocido .
FaCyT-Matemticas

Cap 3. Estimacin puntual

147

De manera especifica se estudiarn las propiedades deseables de los estimadores: insesgabilidad, consistencia, insesgado de varianza mnima, eficientes
y suficientes.

3.3.1.

Estimadores insesgados

Como no hay ningn estimador perfecto que de siempre la respuesta correcta


debera, por lo menos, hacerlo en promedio, es decir, que el valor esperado de
un estimador sea igual al parmetro que trata de estimar. Si ste es el caso,
se dice que el estimador es insesgado; formalmente:

Definicin 3.4. Sea b un estimador de , se dice que b es un estimador insesgado de si y slo si


h i
E b =

Sino se cumple esto, se dice que el estimador b es un estimador sesgado de .

Definicin 3.5. (SESGO DE UN ESTIMADOR PUNTUAL)


El sesgo de un estimador puntual n se define como
b = E()
b
Bn ()

(3.8)

Ejemplo 3.11. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin


normal con E [X] = y V [X] = 2 . Comprobar si los estimadores de mxima verosimilitud de y 2 son estimadores insesgados.
Solucin:
Los estimadores de mxima verosimilitud de y 2 , son:
n
P

bM V = X
Universidad de Carabobo

b2 M V =

Xi X

i=1

2

Sec 3.3. Propiedades de los estimadores puntuales

148

respectivamente. Primero se comprobar si


bM V = X es un estimador insesgado para el parmetro ,

n
P
i=1 Xi
 

E [b
M V ] = E X = E
n
n
P

n
P

E [Xi ]

i=1

n
n
=
=
n

E [X]

i=1

por tanto,
bM V es un estimador insesgado para . Ahora se comprobar si
2
b
M V es un estimador insesgado para 2 ,
n
2
P
" n
#
i
h
X
i=1 Xi X 1
2
= E
E b2 M V = E
Xi X

n
n
i=1
#
" n
n
h 2i
X
1
1 X  2
2
= E
Xi2 nX =
E Xi E X
n
n i=1
i=1
n
   
 2 
1X
=
V [Xi ] + (E [Xi ])2 V X + E X
n i=1
n
  
 2 
1X
2
=
V [X] + (E [X]) V X + E X
n i=1
 2

n

1X 2

2
2
=
+
+
n i=1
n
 2
1
2
2
= n +
2
n
n
2

= 2 + 2
2
n


1
2
= 1
n
(n 1) 2
=

n
FaCyT-Matemticas

Cap 3. Estimacin puntual

149

h
i
Como E b2 M V 6= 2 , entonces el estimador de mxima verosimilitud de 2
es un estimador sesgado para 2 . El sesgo del estimador es:


h
i
2
(n 1) 2
2 =
S b2 M V = E b2 M V 2 =
n
n
Pero si el estimador est dada como en la definicin (2.6), se puede comprobar que S 2 es un estimador insesgado para 2 . En efecto,

n
P

i=1
 
E S2 = E

Xi X
n1

2
" n
#
X

2
1
=
Xi X
n 1E
i=1

" n
#
n
h 2i
X
1 X  2
1
2
2
E
Xi nX =
=
E Xi E X
n1
n 1 i=1
i=1
n
  
 2 
1 X
2
=
V [Xi ] + (E [Xi ]) V X + E X
n 1 i=1
n
 2 
   
1 X
=
V [X] + (E [X])2 V X + E X
n 1 i=1
 2

n

1 X 2

2
2
=
+
+
n 1 i=1
n
 2
1
n 2 + 2
2
n1
n
2
= 2 + 2
2
n


1
2
= 1
n
(n 1) 2
=

n1
= 2
=

Por tanto, S 2 es un estimador insesgado para 2 .



Universidad de Carabobo

Sec 3.3. Propiedades de los estimadores puntuales

150

Ejemplo 3.12. Sea X1 , X2 , X3 una muestra aleatoria de una distribucin


con funcin de densidad de probabilidad
(
 x
1
exp
, x > 0
f (x; ) =
0,
sino
Considere los siguientes estimadores para
X 1 + X2
b2 =
, b3 = X
2
verificar cules de los estimadores anteriores son insesgados.
b1 = X1 ,

Solucin:
El valor esperado de la poblacin se obtiene como:
Z
n xo
1
E [X] =
x exp
dx

0
Z b
n xo
1
x exp dx
= lm
b 0

b
Z b

n
o
o
n
x
1
x
exp dx
= lm x exp + lm
b 0
b

0
Z b
n xo
= lm
exp dx
b 0


n x o b

= lm exp
b

0

=
Ahora se calculan el valor esperado para cada estimador a fin de verificar
cules
h i son insesgados:
E b1 = E [X1 ] = , entonces b1 es un estimador insesgado para .
h i


2
E b2 = E X1 +X
= 12 (E [X1 ] + E [X2 ]) = 2
= , entonces b2 es un esti2
2
mador insesgado para .
h i
 
2 +X3 ]
2 ]+E[X3 ]
E b3 = E X = E[X1 +X
= E[X1 ]+E[X
= 3
= , entones b3 es
3
3
3
un estimador insesgado para .
FaCyT-Matemticas

Cap 3. Estimacin puntual

151


Definicin 3.6. Sea b un estimador de , se dice que b es un estimador asintticamente insesgado de si al aumentar el tamao
de la muestra, su media tiende a coincidir con el parmetro , y por
lo tanto, su sesgo tiende a cero. Esto es,
h i
lm E b =
n

Ejemplo 3.13. Considrese el ejemplo (3.11). Demuestre que el estimador


de mxima verosimilitud de 2 es un estimador asintticamente insesgado
para 2 .
Solucin:
Como

i (n 1)
2
b
2
E MV =
n
h

y
i
h
(n 1) 2
2
b
lm E M V = lm
= 2
n
n
n
Entonces, b2 M V es un estimador asintticamente insesgado para 2 .


3.3.2.

Estimadores insesgados de varianza mnima

La varianza de un estimador insesgado es la cantidad ms importante para


decidir que tan bueno es el estimador para estimar un parmetro . Si se tienen varios estimadores insesgados de un parmetro, por lo general se escoge
el que tenga la menor varianza.
En muchos casos resulta prohibitivo determinar las varianzas de todos los
estimadores insesgados de y seleccionar el estimador que tenga la varianza
ms pequea. Entonces, Cmo obtener el estimador insesgado de varianza
mnima, si existe?. Para dar una respuesta a la pregunta anterior se usa un
resultado que recibe el nombre de cota inferior de Cramr-Rao, el cul se
presenta en el siguiente Teorema:
Universidad de Carabobo

Sec 3.3. Propiedades de los estimadores puntuales

152

Teorema 3.3. Sea X1 , X2 , . . . , Xn una muestra aleatoria de ua distribucin con funcin (densidad) de probabilidad f (x; ). Si b es un
estimador insesgado de , entonces la varianza de b debe satisfacer
la siguiente desigualdad
h i
1

V b
(3.9)
2 
Ln(f (X;))
nE

El Teorema anterior establece un limite inferior para la varianza de un estimador insesgado de . Para un estimador insesgado cuya varianza alcance la
cota de Cramr-Rao, se tiene la siguiente definicin:
Definicin 3.7. Si b es un estimador insesgado de y
h i
1

V b =
2 
Ln(f (X;))
nE

entonces se dice que b es un estimador eficiente de .


Ejemplo 3.14. Demostrar que X es un estimador eficiente para la media
de una poblacin normal.
Solucin:
En el ejemplo (3.4) se demostr que X es un estimador insesgado para ;
luego, slo faltara probar que la varianza de X alcanza la cota de CramrRao. Dado que la funcin de densidad de probabilidad de una distribucin
normal est dada por:



1
(x )2
< x, <
2
f x; , =
exp
,
2
2
>0
2
2
entonces, el logaritmo neperiano de f (x; , 2 ) es:
Ln f x; , 2




= Ln




 (x )2
(x )2
2
exp
=
Ln
2
2 2
2 2
2 2
1

FaCyT-Matemticas

Cap 3. Estimacin puntual

153

y, derivando parcialmente con respecto a se tiene que:


Ln (f (x; , 2 ))
x
=

2
Entonces,
"
E

Ln (f (X; , 2 ))

2 #

"

2 #
X
=E
2

1 
= 4 E (X )2

V [X]
2
=
=
4
4
1
= 2

Por consiguiente, se tiene:


1
nE
 
y como V X =
eficiente para .

2
n



Ln(f (X;, 2 ))

2  =

1
n

1
2

=

2
n

(ver Seccin (2.1.1)), se deduce que X es un estimador


Como se ha indicado, los estimadores insesgados suelen compararse en trminos de sus varianzas, de esto se presenta la siguiente definicin:

Definicin 3.8. Si b1 y b2 son dos estimadores insesgados de un parmetro


de b1 es menor que la varianza de b2 , es decir,
h i y la
h varianza
i
V b1 V b2 , cumplindose la desigualdad en el sentido estricto
para algn valor de . Entonces se dice que b1 es relativamente ms
eficiente que b2 .

Universidad de Carabobo

Sec 3.3. Propiedades de los estimadores puntuales

154

Algunas veces es comn utilizar el cociente


h i
V b1
h i
V b2
para determinar la eficiencia relativa de b2 con respecto a b1 .
Si los estimadores son sesgados, se emplean sus errores cuadrticos medios
para determinar las eficiencias relativas, teniendo para este caso la siguiente
definicin:

Definicin 3.9. Un estimador b2 de se denomina inadmisible si


existe otro estimador b1 tal que
 
 
para todo
ECM b1 ECM b2
cumplindose la desigualdad en el sentido estricto para algn valor
de .

Es decir, un estimador b2 es inadmisible si existe otro estimador b1 que es


al menos igual de bueno que b2 para todo posible valor del parmetro y lo
supera para algn valor de . Se dice tambin que b1 domina a b2 uniformemente en .
Un estimador es admisible cuando no es inadmisible, es decir, cuando no
existe otro que lo domine uniformemente en .
Ejemplo 3.15. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con media y varianza 2 (ambos desconocidos). Consider los
siguientes estimadores para 2 :
n
P

b12 = i=1

Xi X

2

n
FaCyT-Matemticas

Cap 3. Estimacin puntual

155
y
n
P

Xi X

b22 = i=1

2

n1

demuestre que b22 es un estimador inadmisible.


Solucin:
Para demostrar que b22 es un estimador inadmisible, se debe probar que la
desigualdad
 
 
ECM b12 ECM b22
es cierta para todos los valores de 2 en el espacio parametral y se cumple en
el sentido estricto para algn valor de 2 .
Si X1 , X2 , . . . , Xn es una muestra aleatoria de una distribucin normal con
media y varianza 2 , entonces la variable aleatoria
n
P

Y =

Xi X

i=1

2
2n1

 
h i
 2
2
2
b
b
ECM 1 = V 1 + B b12

n
P

h i
i=1
E b12 = E

n
2
2
P
2
Xi X
Xi X

= E i=1

n
n 2
n
P

2
i=1
E

(n 1) 2
n

Universidad de Carabobo

2
Xi X
2
= E [Y ]

2
n

Sec 3.3. Propiedades de los estimadores puntuales

156

n
P

h i
i=1
V b12 = V

Xi X
n
n
P

4
i=1
V

2
n

2(n 1) 4
n2

n
2
2
P
2
X

= V i=1

n 2

2
Xi X
4
= V [Y ]

2
n

por tanto,

h i
 2
 
2
2
b
b
ECM 1 = V 1 + B b12

2
2(n 1) 4
(n 1) 2
2
=
+

n2
n
 2
2
n 2 n 2
2(n 1) 4
+
=
n2
n
4
4
2(n 1)

=
+ 2
2
n
n
2n 4 4
2n 4 2 4 + 4
=
=
n2
n2
4
(2n 1)
=
n2
de una manera similar, se puede demostrar que:

 
ECM b22 =

2 4
(n 1)
FaCyT-Matemticas

Cap 3. Estimacin puntual

157
Entonces,

 
 
ECM b12 ECM b22
(2n 1) 4
n2
(n 1)(2n 1) 4
(2n2 n 2n + 1) 4
2n2 4 3n 4 + 4 2n2 4

2 4
(n 1)
2n2 4
2n2 4
0

4 3n 4

1
3

por tanto, si n 1/3 el error cuadrtico medio de b12 es de manera


uniformemente menor que el error cuadrtico medio de b22 . Por lo tanto b22 es un estimador inadmisible para 2 .

3.3.3.

Estimadores consistentes

Es razonable esperar que un estimador mejore a medida que se aumenta el


tamao de la muestra y cuando este tamao sea muy grande los estimadores
tomen valores muy prximos a los parmetros respectivos. Los estimadores
bn asociados a una muestra aleatoria de tamao n constituyen sucesiones de
variables aleatorias; un buen estimador debera converger en algn sentido
haca . Este concepto se generalizar mediante la siguiente definicin de
consistencia.

Definicin 3.10. Se dice que un estimador bn de un parmetro


es un estimador consistente para cuando converge en probabilidad
hacia , es decir, si y slo si para cualquier > 0 se cumple que:


b
lm P |n | < = 1
n+

Universidad de Carabobo

Sec 3.3. Propiedades de los estimadores puntuales

158

Ejemplo 3.16. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con media y varianza 1. Demuestre que
n

1X
bn = X n =
Xi
n i=1
es un estimador consistente para .
Solucin:
Para demostrar que bn = X n es un estimador consistente para , ntese que:



P |bn | < = P | X n | <

= P < X n <

= P < Xn < +
Como X1 , X2 , . . . , Xn es una muestra aleatoria de una distribucin N (, 1),
se tiene que:
#
" n
n
n
n


1X
1X
1X
1X
1
Xi =
E [Xi ] =
E [X] =
= (n) =
E Xn = E
n i=1
n i=1
n i=1
n i=1
n
y
#
n
n
n
n
1 X
1
1X
1 X
1 X
n
Xi = 2
=V
V [Xi ] = 2
V [X] = 2
1= 2 = ,
n i=1
n i=1
n i=1
n i=1
n
n
"

V Xn

por lo tanto,

Xn N

1
,
n

por consiguiente,


P < Xn < + =

n n
o
1
p
exp (xn )2 dxn
2
2 1/n
(3.10)

haciendo el cambio de variable y = xn , se tiene que dy = dxn . Cuando


xn = , y = , y cuando xn = + , y = . Sustituyendo estos cambios
FaCyT-Matemticas

Cap 3. Estimacin puntual

159
en la ecuacin (3.10), se tiene que:
Z

P < Xn < + =

n n o
n
exp y 2 dy
2
2

aplicando nuevamente un cambio de variable, esto es, z =


el mismo anlisis anterior, se tiene que:

P < Xn < + =

ny, y haciendo

 2
1
z
exp
dz,
2
2

esto implica que:

 Z
b
P |n | < =


 2
1
z
exp
dz,
2
2

y por consiguiente,

n+

 2
1
z
exp
dz

n n
2
2
 2
Z
z
1
exp
=
dz
2
2

= 1,

Z

b
lm P |n | < = lm


por ser la funcin de densidad de probabilidad de una variable aleatoria normal con media 0 y varianza 1. Por tanto, bn = X n es un estimador consistente para .

En general no es necesario realizar todos estos clculos para verificar si un
estimador es consistente, se puede usar las siguientes condiciones suficientes
(a pesar de no ser condiciones necesarias) que son una consecuencia inmediata
de la desigualdad de Chebyshev y son enunciadas en el siguiente Teorema.
Universidad de Carabobo

Sec 3.3. Propiedades de los estimadores puntuales

160

Teorema 3.4. La estadstica b es un estimador consistente del parmetro si:


1. b es un estimador insesgado
h i
2. lm V b = 0
n

Demostracin. Por hiptesis se tiene que b es un estimador insesgado para


, por lo tanto:
h i
E b =
Usando la desigualdad de Chebyshev, se tiene que:
r h i!
1
P |bn | k V b 2 para algun k > 0
k
r h i
Sea = k V b > 0, esto implica que k =



P |bn |

q ,
V[b]

y por tanto:

h i
V b
2

y


lm P |bn | lm

de esta manera

h i
V b
2

=0



lm P |bn | = 0


b
lm P |n | < = 1

por consiguiente, bn es un estimador consistente para .


Observacin 3.4. Para demostrar que ests condiciones no son necesarias,
slo se debe probar que un estimador puede ser consistente sin ser insesgado.
FaCyT-Matemticas

Cap 3. Estimacin puntual

161

Ejemplo 3.17. Suponga que X1 , X2 , . . . , Xn es una muestra aleatoria de una


distribucin normal, con E [X] = y V [X] = 2 . Demuestre que:
n
2
1 X
Xi X
S =
n 1 i=1
2

es un estimador consistente para 2 .


Solucin:
En el ejemplo (3.11) se demostr que S 2 es un estimador insesgado para ,
faltara comprobar el segundo tem del Teorema (3.4), es decir, probar que:
 
lm V S 2 = 0
n

El Teorema (2.11) nos dice que


(n 1) S 2
2n1
2

y por el ejemplo (2.10) se tiene que:


 
2 4
V S2 =
n1
Por lo tanto:

2 4
=0
n
n+ n 1
En consecuencia, S 2 es estimador consistente para 2 .
 
lm V S 2 = lm

3.3.4.

Estimadores suficientes

Considrese una muestra aleatoria X1 , X2 , . . . , Xn tomada de una poblacin


con funcin (densidad) de probabilidad f (x; ). Como se sabe la muestra
aleatoria X1 , X2 , . . . , Xn quedar reducida a un determinado estadstico b
llamado estimador de . Cunta informacin se pierde al resumir la muestra
b Si b es suficiente para entonces no hay prdida de inforaleatoria en ?
macin. Entonces, de manera intuitiva, una estadstica b es un estadstico
suficiente para un parmetro si resume toda la informacin contenida en
la muestra aleatoria con respecto a .
Universidad de Carabobo

Sec 3.3. Propiedades de los estimadores puntuales

162

Definicin 3.11. La estadstica b es una estadstica suficiente


del parmetro si y slo si la distribucin conjunta de la muestra
b es independiente de , es decir,
aleatoria X1 , X2 , . . . , Xn , dado ,



 f x1 , x2 , . . . , xn , b
 
f x1 , x2 , . . . , xn |b =
g b
no dependa de .

La utilidad de un estadstico suficiente recae en el hecho de qu si un estimador insesgado de un parmetro es una funcin de una estadstica suficiente,
entonces tendr la varianza ms pequea de entre todos los estimadores insesgados de que no se encuentran basados en una estadstica suficiente. De
hecho, si existe el estimador eficiente de , est ser un estadstico suficiente.

Ejemplo 3.18. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin de Poisson cuya funcin de probabilidad es

f (x; ) =

x exp {}
x!

x = 0, 1, 2, . . .

b = X para es una estadstica suficiente.


Demostrar que el estimador
Solucin:
b=X
Como la distribucin de Poisson es discreta, entonces para probar que
es una estadstica suficiente para se debe demostrar que la distribucin
b es independiente de .
conjunta de X1 , X2 , . . . , Xn , dado ,
FaCyT-Matemticas

Cap 3. Estimacin puntual

163




f x1 , x2 , . . . , xn |b = P X1 = x1 , X2 = x2 , . . . , Xn = xn |X = x

P X 1 = x1 , . . . , X n = x n , X = x

=
P X=x
P
P (X1 = x1 , . . . , Xn = xn , ni=1 Xi = nx)
P
=
P ( ni=1 Xi = nx)
Pn1 
P X1 = x1 , . . . , Xn1 = xn1 , Xn = nx i=1
Xi
Pn
=
P ( i=1 Xi = nx)
Pn1 
xi
P (X1 = x1 ) P (Xn1 = xn1 ) P Xn = nx i=1
Pn
=
P ( i=1 Xi = nx)
Pn1

x1 exp{}xn1 exp{}nx i=1


Pn1
x1 !xn1 !(nx i=1
xi ) !

exp{}

(n)(nx) exp{n}
(nx)!
Pn1

xi

exp{n}x1 xn1 nx i=1


Pn1
x1 !xn1 !(nx i=1
xi )!

xi

(n)(nx) exp{n}
(nx)!

(nx)!
Pn1 
xi !
n(nx) x1 ! xn1 ! nx i=1

Evidentemente la anterior probabilidad condicional no depende de , de donde


se concluye que X es una estadstica suficiente para . Utilizando un razon
P
namiento anlogo, se puede demostrar que
Xi tambin es una estadstica
i=1

suficiente.

Ejemplo 3.19. Demuestre que la estadstica Y = 16 (X1 + 2X2 + 3X3 ) no es
suficiente para estimar el parmetro p de la poblacin de Bernoulli.
Solucin:
Se debe demostrar que:
f (x1 , x2 , x3 |Y ) =
Universidad de Carabobo

f (x1 , x2 , x3 , y)
g (Y )

Sec 3.3. Propiedades de los estimadores puntuales

164

no es independiente de p para algunos valores de X1 , X2 y X3 . Por lo tanto,


consider el caso en particular donde X1 = 1 ,X2 = 1 y X3 = 0, de manera
que:
P (X1 = 1, X2 = 1, X3 = 0, Y = 1/2)
P (Y = 1/2)
P (X1 = 1) P (X2 = 1) P (X3 = 0)
=
P (Y = 1/2)

f (x1 , x2 , x3 |y) =

Como X1 , X2 , X3 se distribuye Bernoulli, entonces


f (xi ; p) = pxi (1 p)1xi

x = 0, 1

de manera que:
P (X1 = 1) = p,

P (X2 = 1) = p,

P (X3 = 0) = 1 p

y
P (Y = 1/2) = P (X1 = 1) P (X2 = 1) P (X3 = 0) + P (X1 = 0) P (X2 = 0) P (X3 = 1)

en consecuencia,
p2 (1 p)
p2 (1 p)
f (x1 , x2 , x3 |Y = 1/2) = 2
=
p (1 p) + p(1 p)2
p(1 p)[p + 1 p]
=p
que depende de p. Por lo tanto, la estadstica Y = 16 (X1 + 2X2 + 3X3 ) no es
una estadstica suficiente para p.

ya que puede ser muy tedioso probar con la definicin (3.11) si una estadstica
es un estimador suficiente para un parmetro dado, usualmente es ms fcil
utilizar el siguiente Teorema, llamado Teorema de factorizacin de Neyman
para tal fin. Adems, este Teorema sirve para construir estadsticas suficientes
para un parmetro desconocido .
FaCyT-Matemticas

Cap 3. Estimacin puntual

165

Teorema 3.5 (Teorema de factorizacin de Neyman). Sea


X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin con una
funcin de densidad de probabilidad f (x, ). Se dice que la estadstica b es un estimador suficiente para si y slo si la funcin de
verosimilitud puede factorizarse de la siguiente forma:
 
b g (x1 , x2 , . . . , xn )
L (x1 , x2 , . . . , xn ; ) = h ,
 
b en donde h ,
b depende slo de y b
para cualquier valor b de ;
y g (x1 , x2 , . . . , xn ) no contiene al parmetro desconocido .
Ejemplo 3.20. Supongase que X1 , X2 , . . . , Xn es una muestra aleatoria de
una distribucin exponencial con parmetro , cuya funcin de densidad de
probabilidad es:
(
 x
1
exp
, x > 0
f (x; ) =
0,
sino
Demostrar que X es un estimador suficiente para .
Solucin:
La funcin de verosimilitud es:
L (x1 , x2 , . . . , xn ; ) = f (x1 ; ) f (x2 ; ) f (xn ; )
n
n
n xo
Y
Y
1
i
=
f (xi ; ) =
exp

i=1
)
( i=1 n
 n
1
1X
xi
=
exp

1=1

n
P

 n
xi
n

1
i=1
=
exp

 n


1
nx
=
exp

= h (x, ) g (x1 , x2 , . . . , xn )
Universidad de Carabobo

Sec 3.3. Propiedades de los estimadores puntuales


donde h (x; ) =


1 n

166

n
o
exp nX
y g (x1 , x2 , . . . , xn ) = 1. Por el Teorema

(3.5), X es un estimador suficiente para .



Ejemplo 3.21. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin Poisson cuya funcin de probabilidad es
f (x; ) =

exp {} x
x!

Encontrar si es posible un estadstico suficiente para .


Solucin:
La funcin de verosimilitud es:
L (x1 , x2 , . . . , xn ; ) = f (x1 ; ) f (x2 ; ) f (xn ; )
exp {} xn
exp {} x1 exp {} x2

=
x1 !
x2 !
xn !
n
P

exp {n} i=1


=
n
Q
xi !

xi

i=1
n
P

xi
1
exp {n} i=1
= Q
n
xi !
i=1

= g (x1 , x2 , . . . , xn ) h

n
X

!
xi ;

i=1

donde g (x1 , x2 , . . . , xn ) =
Teorema (3.5),

n
P

1
n
Q
xi !


y h

n
P

n
P


xi ;

= exp {n}

1=1

xi

. Por el

i=1

i=1

Xi es un estadstico suficiente para .

1=1


Con la Definicin (3.11) y el Teorema (3.5) se han presentado dos formas de
cerciorarnos de si una estadstica b es un estimador suficiente para un parmetro desconocido . Por lo general el Teorema de factorizacin de Neyman
FaCyT-Matemticas

Cap 3. Estimacin puntual

167

nos conduce a la solucin ms sencilla; pero para demostrar que b no es suficiente, casi siempre es ms simple proceder por medio de la definicin (3.11).

Teorema 3.6. Cualquier funcin uno a uno de una estadstica suficiente, tambin es suficiente.

Ejemplo 3.22. Considrese el ejemplo (3.21). Si se define el estimador para

b=X

Es un estimador suficiente?
Solucin:
n
b = X es una funcin uno a uno de la estadstica suficiente P Xi ,
Como
1=1

b = X tambin es una estadstica suficiente.


entonces por el Teorema (3.6),
De esta manera, el estimador
b=X

es un estimador suficiente para .




3.4.

Propiedades de los estimadores de mxima


verosimilitud

Cuando existe, el estimador de mxima verosimilitud tiene algunas propiedades interesantes:


Generalmente es consistente.
Es asintticamente normal.
No es siempre insesgado, pero lo es asintticamente.
Es funcin de un estadstico suficiente, siempre y cuando el estimador
de mxima verosimilitud sea nico.
Universidad de Carabobo

Sec 3.5. Estimacin puntual bayesiana

168

Entre todos los estimadores asintticamente insesgados, tiene la varianza asintticamente ms pequea, es decir, es eficiente.
Si el estimador de mxima verosimilitud es un estadstico suficiente,
entonces es un estadstico minimal, es decir, no se puede encontrar otro
estadstico suficiente que haga una mejor reduccin de los datos.

3.5.

Estimacin puntual bayesiana

En el problema de estimacin de un parmetro de una distribucin de funcin


de probabilidad (densidad) f (x; ), es frecuente tener algunas ideas sobre los
valores que puede tomar . En este caso conviene tomar en cuenta este conocimiento o creencia que se puede traducir en una distribucin de probabilidad
sobre el espacio de parmetros, llamada distibucin a priori. Es decir que
ahora no es un parmetro constante, sino una variable aleatoria, la cul se
denotar por y a la realizacin de por .
Definicin 3.12. Sea una variable aleatoria definida de manera
tal que sus valores representan las posibles opciones en que puede ocurrir un fenmeno aleatorio antes de llevar a cabo un experimento. El
grado de creencia con respecto a estas posibilidades se encuentra expresado por una funcin de distribucin (), denominada funcin
de distribucin a priori de .

la especificacin de la forma de () depende de la conviccin que se tenga


con respecto a los valores de antes de que la informacin de la muestra se
encuentre disponible; por tanto, esta distribucin no depende de los valores
muestrales.
Cuando la informacin a priori con respecto a los valores de se combina
con la informacin que proporcion la muestra, el resultado es un conjunto
de informacin modificada con respecto a la variable aleatoria . En otras
palabras, la combinacin de la distribucin a priori y de la funcin de verosimilitud origina una distribucin condicional para , dado el resultado
muestral, que se conoce como la distribucin a posteriori de . Esta combinacin se hace de acuerdo al Teorema de Bayes.
FaCyT-Matemticas

Cap 3. Estimacin puntual

169

Definicin 3.13. Sea () la distribucin a priori de y sea


L (x1 , x2 , . . . , xn |) la funcin de verosimilitud, condicional a un valor
particular de . Entonces la distribucin a posteriori de dada
la evidencia muestral x1 , x2 , . . . , xn , es:
(|x1 , x2 , . . . , xn ) = R

L (x1 , x2 , . . . , xn |) ()
L (x1 , x2 , . . . , xn |) () d

(3.11)

Es interesante notar que el denominador de la ecuacin


(3.11) es la funcin de
R
densidad de probabilidad marginal de X y como L (x1 , x2 , . . . , xn |) () d
no depende de , entonces:
(|x1 , x2 , . . . , xn ) L (x1 , x2 , . . . , xn |) ()

(3.12)

La funcin de distribucin a posteriori resume la informacin total, despus


de haber observado la muestra L (x1 , x2 , . . . , xn |) e incluir la informacin
externa ().
Una vez obtenida la distribucin a posteriori de , se puede estimar el verdadero valor de de diferentes formas, por ejemplo dando un valor. La estimacin puntual bayesiana consiste por lo general en tomar como estimacin
del parmetro la moda, la media, la mediana, la varianza, entre otros; de la
distribucin a posteriori de .
Definicin 3.14. Una funcin de densidad de probabilidad de una
variable aleatoria X tpicamente tiene la forma Cg(x; ). El proposito de C es hacer que la funcin de densidad de probabilidad integre
uno, la proporcin restante es llamada el kernel de la funcin de
densidad de probabilidad.
Ejemplo 3.23. Si X G (, ), entonces la funcin de densidad de probabilidad de X esta dada por
(
1
1
exp{ x }, si x > 0, , > 0
x
f (x; , ) = ()
0,
cualquier otro caso
Universidad de Carabobo

Sec 3.5. Estimacin puntual bayesiana

170

en donde () es la funcin gamma. El kernel de esta funcin es x1 exp{ x }


y C = 1/() .

Ejemplo 3.24. Si X N (, 2 ), entonces la funcin de densidad de probabilidad de X esta dada por



1
(x )2
2
exp
f x; , =
2 2
2 2
si el inters recae en , el kernel de la funcin es


(x )2
1
exp
y C=
2
2
2 2
en caso de que el inters sea sobre y 2 , el kernel de la funcin es


1
(x )2
1

exp
y
C
=

2 2
2

Ejemplo 3.25. Si X exp (), entonces su funcin de densidad de probabilidad es:
(
exp{x}, si x > 0, > 0
f (x; ) =
0,
otro caso
a) Si la distribucin a priori para es 1, es decir, () = 1. Hallar la
distribucin a posteriori para y un estimador para .
b) Si () = exp{}. Hallar la distribucin a posteriori para y un
estimador para .
Solucin:
a) La distribucin a posteriori de viene dada por la expresin (3.12), la
cul es:
(|x1 , x2 , . . . , xn ) L (x1 , x2 , . . . , xn |) ()
FaCyT-Matemticas

Cap 3. Estimacin puntual

171

La funcin de verosimilitud viene dada por:


L (x1 , x2 , . . . , xn |) = f (x1 |) f (x2 |) f (xn |)
= exp {x1 } exp {x2 } exp {xn }
( n
)
X
n
= exp
xi
(
n

i=1
n
X

= exp

)
xi

i=1

por tanto, la distribucin a posteriori de viene dada por:


(|X) L (x1 , x2 , . . . , xn |) ()
(
)
n
X
= n exp
xi
(i=1
= n+11 exp

n
X

)
xi

(3.13)

i=1

la expresin (3.13) representa el kernel de una distribucin gamma con


n
P
parmetro de forma n + 1 y escala 1/ xi , es decir
i=1

|x1 , x2 , . . . , xn G
n
+
1,
n

P
xi
i=1

Luego se puede tomar como estimador puntual para , la esperanza de


la distribucin a posteriori:
n+1
E [|x1 , x2 , . . . , xn ] = P
n
xi
i=1

b) Y si la distribucin a priori para viene dada por () = exp{},


la distribucin a posteriori de viene dada por:
Universidad de Carabobo

Sec 3.5. Estimacin puntual bayesiana

172

(|x1 , x2 , . . . , xn ) L (x1 , x2 , . . . , xn |) ()
(
)
n
X
n
= exp
xi exp {}
(i=1
=

n+11

exp

n
X

!)
xi + 1

(3.14)

i=1

la expresin (3.14) nuevamente representa el kernel de una distribucin


n
P
gamma con parmetro de forma n + 1 y escala 1/(1 +
xi ), es decir
i=1

|x1 , x2 , . . . , xn G
n + 1,

1+

1
n
P

xi

i=1

Luego se puede tomar como estimador puntual para , la esperanza de


la distribucin a posteriori:
E [|x1 , x2 , . . . , xn ] =

n+1
n
P
1+
xi
i=1


Ejemplo 3.26. Si X Bernoulli (), entonces su funcin de densidad de
probabilidad es:
(
x (1 )1x , si x = 1, 0
f (x; ) =
0,
otro caso
Hallar la distribucin a posteriori de y un estimador para el mismo, si la
distribucin a priori para es beta con parmetros y , es decir, si la
funcin de densidad de probabilidad de es:
(
(+) 1
(1 )1 , si 0 < x < 1, , > 0
() = ()()
0,
otro caso
FaCyT-Matemticas

Cap 3. Estimacin puntual

173

Solucin:
Se calcula la funcin de verosimilitud condicionada a :
n
Y

L (x1 , x2 , . . . , xn |) =

i=1
n
Y

f (xi |)
xi (1 )1xi

i=1
n
P

xi

= i=1 (1 )

n
P

xi

i=1

Luego la distribucin a posteriori de viene dada por:


(|x1 , x2 , . . . , xn ) L (x1 , x2 , . . . , xn |) ()
n
P

xi

= i=1 (1 )
n
P

i=1

xi +1

n
P

xi

i=1

(1 )

( + ) 1
(1 )1
() ()
n
P

xi +1

(3.15)

i=1

la expresin (3.15) representa el kernel de una distribucin beta. Por lo tanto,


!
n
n
X
X
(|x1 , x2 , . . . , xn ) BET A
xi + , n
xi +
i=1

i=1

Tomando como estimador puntual para la esperanza de la distribucin a


posteriori, nos queda:
n
n
P
P
xi +
xi +
i=1
i=1
E [(|x1 , x2 , . . . , xn )] = P
=
n
n
P
n++
xi + + n
xi +
i=1

i=1

3.6.

Ejercicios Propuestos

1. Suponga que se tiene una muestra aleatoria de tamao 2n tomada de


una poblacin X, tal que E [X] = y V [X] = 2 . Sean
2n

X1 =

1 X
Xi
2n i=1

Universidad de Carabobo

X2 =

1X
Xi
n i=1

Sec 3.6. Ejercicios Propuestos

174

dos estimadores de . cul es el mejor estimador de ? Explique su


eleccin.
2. Sea X1 , X2 , . . . , X7 una muestra aleatoria de una poblacin que tiene
media y varianza 2 . Considere los siguientes estimadores de :
T1 =

X1 + X 2 + + X 7
7

T2 =

2X1 X6 + X4
2

a. Alguno de estos estimadores es insesgado?


b. Cul estimador es el mejor? En qu sentido es mejor?
3. Calcule la eficiencia relativa de los estimadores del ejercicio anterior.
4. Suponga que T1 y T2 son estimadores del parmetro . Se sabe que
E [T1 ] = , E [T2 ] = /2, V [T1 ] = 10, V [T2 ] = 4. Qu estimador es
mejor? En qu sentido lo es?
5. Suponga que T1 , T2 y T3 son estimadores de . Se sabe que E [T1 ] =
E [T2 ] = , E [T3 ] 6= , V [T1 ] = 12, V [T2 ] = 10 y E [(T3 )2 ] = 6.
Haga una comparacin de estos tres estimadores. Cul prefiere? Por
que?
6. Sea X una variable aleatoria normal con media = 0 y varianza 2 y
X1 , X2 , . . . , Xn una muestra aleatoria de X. Demostrar que
n
P

Xi2

i=1

n
es un estimador insesgado de 2 .
7.

a. Demuestre que
n
X
V =
(Xi X )2 /n
2

i=1

es un estimador sesgado de 2 .
b. Determine la magnitud del sesgo en el estimador.
FaCyT-Matemticas

Cap 3. Estimacin puntual

175

c. Qu sucede con el sesgo a medida que aumenta el tamao n de


la muestra?
8. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n.
2

a. Demuestre que X es un estimador sesgado de 2 .


b. Determine la magnitud del sesgo en este estimador.
c. Qu sucede con el sesgo a medida que aumenta el tamao n de
la muestra?
d. Verifique si el estimador es asintticamente insesgado.
9. Supngase que X es una variable aleatoria con media y varianza 2 .
Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n tomada de una
poblacin representada por X. Demuestre que la media muestral X y
la varianza muestral
n
P
(Xi X )2
i=1
S2 =
n1
son estimadores insesgados de y 2 , respectivamente.
10. De una poblacin que tiene media y varianza 2 , se toman tres muestras aleatorias de tamaos n1 = 20, n2 = 10 y n3 = 8. Sean S12 , S22 , S32
las varianzas muestrales. Demuestre que
S2 =

20S12 + 10S22 + 8S32


38

es un estimador insesgado de 2 .
11. Si X es una variable aleatoria binomial y
T1 =

X
n

T2 =

X +1
n+2

son estimadores del parmetro p,


a. Son insesgados?
b. Si alguno no es insesgado, determine el sesgo del estimador.
Universidad de Carabobo

Sec 3.6. Ejercicios Propuestos

176

c. Obtenga el error cuadrtico medio de T1 y T2 . Comente sobre el


ECM de estos estimadores para p(1 p) = 0,25 y n = 5, 10, 30, 50
y 100. Que concluye?
12. Si X 1 es la media de una muestra aleatoria de tamao n tomada de
una poblacin normal con media y varianza 12 , y X 2 la media de
una muestra aleatoria de tamao n tomada de una poblacin normal
con media y varianza 22 , demuestre que
a. T = wX 1 +(1w)X 2 , donde 0 w 1, es un estimador insesgado
de .
b. Para qu valores de w, la varianza del estimador T es un mnimo?
c. Si los tamaos de las muestras son diferentes, pero las varianzas
son iguales Para qu valor de w la varianza del estimador T es
mnimo?
13. Suponga que se tiene una muestra aleatoria de tamao 2n de una poblacin denotada por X, y E [X] = y V [X] = 2 . Sean
2n

X1 =

1 X
Xi
2n i=1

X2 =

1 X
Xi
n 1 i6=3

dos estimadores de . Determine si dichos estimadores son insesgados,


calcule el ECM de cada estimador y diga cul es al mejor estimador
de . estudie adems la consistencia de ambos estimadores.
14. Obtenga el estimador de mxima verosimilitud del parmetro p de una
distribucin geomtrica.
15. Sea X una variable aleatoria con la siguiente distribucin de probabilidad:
(
( + 1)x , 0 < x < 1
f (x) =
0 en otro caso
Encuentre el estimador mxima verosimilitud de , con base en una
muestra aleatoria de tamao n.
16. Una variable aleatoria X tiene la siguiente funcin densidad de probabilidad
(
exp {(x )} , x >
f (x) =
0 en otro caso
FaCyT-Matemticas

Cap 3. Estimacin puntual

177

Qu puede decirse sobre el estimador mxima verosimilitud de ?


17. Una empresa se dedica al envasado de legumbres, y dispone una mquina, para rellenar los paquetes cuya etiqueta indica 1 kg, que cuando sta
perfectamente regulada vierte aproximadamente esa cantidad, errando
unas veces por exceso y otras por defecto, pero siempre una cantidad
insignificante. A causa de un accidente, la llenadora se ha desequilibrado y se desconoce la cantidad promedio que deposita en cada paquete.
A partir de una muestra aleatoria de 12 paquetes, se han propuestos
dos estimadores para la misma:
12

1 X
Xi

b=
12 i=1

12

1 X
=
Xi ,
13 i=1

donde Xi denota el peso del i-simo paquete de la muestra. En esas


condiciones, cul de los dos estimadores es mejor estudiando su ECM?
18. Sea X1 , X2 , . . . , X16 una muestra aleatoria de una poblacin con funcin
de probabilidad
(
p(x; n, p) =

n!
px (1 p)nx , x = 0, 1, 2, . . . , n
(n x)!x!
0,
0p1

Estime por el mtodo de mxima verosimilitud el parmetro p.


19. Consideremos una poblacin sobre la que se est estudiando cierta caracterstica representada por la variable aleatoria X, cuya funcin de
probabilidad viene definida as:
P (X = x) = (1 )x1

x = 1, 2, 3, . . .

con 0 1

Determine el estimador mxima verosimilitud del parmetro poblacional (suponga que mediante muestreo aleatorio simple se ha efectuado
n observaciones).
20. Determine el estimador del parmetro de una distribucin exponencial
que se obtiene por el mtodo de mxima verosimilitud. Compruebe las
propiedades de insesgadez, suficiencia, eficiencia y consistencia de tal
estimador.
Universidad de Carabobo

Sec 3.6. Ejercicios Propuestos

178

21. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con funcin


de probabilidad
( 1
 x
2
x
exp
, x > 0, > 0
f (x; ) =
23
0,
para cualquier otro valor
Si E(X) = 3 y V ar(X) = 32 .
(a) Demostrar que b = X/3 es un estimador insesgado, eficiente, consistente, y suficiente para .
(b) Hallar el estimador por el mtodo de mxima verosimilitud para
.
22. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin exponencial, es decir,
f (x; ) = exp {x} ,

x > 0, > 0,

Prubese que la cota de Cramer-Rao para estimadores insesgados de


es 2 /n.
23. La vida til de un aparato de aire acondicionado sigue una distribucin
de Rayleigh, cuya funcin de densidad obedece a la formula:


x2
x
2
x>0
f (x; ) = 2 exp 2 ,

2
Obtenga la estimacin por el mtodo de mxima verosimilitud del parmetro desconocido 2 . Es sta una estadstica para 2 . A partir de
una muestra aleatoria de 10 aparatos que han durado funcionando 750,
215, 520, 853, 1042, 911, 876, 924, 978, y 413 das respectivamente.
24. Sea X una variable aleatoria que se distribuye segn la siguiente funcin
de densidad:
(
k
,
xk y >1
f (x; ) =
x+1
0,
otro caso
Obtenga los estimadores mxima verosimilitud.
FaCyT-Matemticas

Cap 3. Estimacin puntual

179

25. Sea X1 , X2 , X3 , X4 y X5 una muestra aleatoria de una poblacin cuya


distribucin es normal con media y varianza 2 . Considrese las estadsticas T1 = (X1 +X2 + +X5 )/5 y T2 = (X1 +X2 +2X3 +X4 +X5 )/6
como estimadores de . Identificar la estadstica que posee la varianza
ms pequea.
26. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin cuya distribucin es normal con media y varianzas 2 (ambos desconocidos).
De las siguientes, cules son estadsticas?
a.

n
P

Xi

i=1

b. X1 + X2
c. Xi , i = 1, 2, . . . , n
d. X12 + X22 exp(X3 )
e. Xi /, i = 1, 2, . . . , n
n
2
P
f.
Xi X
i=1

27. Verifique si el siguiente estimador del parmetro p de la distribucin


Binomial es insesgado, asintticamente insesgado o sesgado

X + n/2

pb =
n+ n
28. Sea X1 , X2 , . . . , X4 , una muestra aleatoria de una poblacin con distribucin exponencial negativa, cuya funcin de densidad es
n o
(
1
exp
x ,

f (x; ) =
0,
otro caso
Considrese los siguientes estimadores para
2)
4)
3 +4X4 )
T1 = X1 , T2 = (X1 +X
+ (X3 +X
, T2 = (X1 +2X2 +3X
y T4 = X
6
3
5
a. Cules son estimadores insesgados de ?
b. Entre los estimadores insesgados, Cul tiene la varianza ms pequea?
Universidad de Carabobo

Sec 3.6. Ejercicios Propuestos

180

29. Sea X1 , X2 , . . . , Xn una muestra aleatoria de la funcin de densidad de


probabilidad
(
( + 1)y , 0 < y < 1 > 1
f (x; ) =
0
otro caso
Encuentre un estimador para por el mtodo de los momentos y el por
le mtodo de mxima verosimilitud.
30. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con funcin
de densidad de probabilidad uniforme en el intervalo (0, ) donde es
desconocida. Use el mtodo de momentos para estimar el parmetro
. Demuestre que el estimador encontrado es un estimador consistente
para .
31. Si X1 , X2 , . . . , Xn denotan una muestra aleatoria de la distribucin normal con media conocida = 0 y varianza desconocida 2 , encuentre el
estimador de 2 por el mtodo de los momentos.
32. Sea X1 , X2 , . . . , Xn una muestra aleatoria de la funcin de densidad de
probabilidad dada por
(
2
( y), 0 y
2
f (x; ) =
0,
otro caso
Encuentre un estimador para usando el mtodo de momentos.
33. Sea X1 , X2 , . . . , Xn de la funcin de densidad de probabilidad dada por
(
(2) 1
(1 x)1 , 0 y 1,
2x
[()]
f (x; ) =
0
otro caso
Encuentre un estimador para usando el mtodo de momentos.
1
Ayuda: E [X] = 12 y V [X] = 4(2+1)
.
34. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin uniforme
con funcin de densidad de probabilidad f (xi ; ) = 1/. Encuentre el
estimador de mxima verosimilitud para .
FaCyT-Matemticas

Cap 3. Estimacin puntual

181

35. La funcin de verosimilitud L (x1 , x2 , . . . , xn ; ) toma valores diferentes dependiendo de los argumentos (x1 , x2 , . . . , xn ). Un mtodo para
deducir un estadstico suficiente mnimo desarrollado por Lehmann y
Scheff usa la relacin entre las verosimilitudes evaluadas en dos puntos
(x1 , x2 , . . . , xn ) y (y1 , y2 , . . . , yn ):
L (x1 , x2 , . . . , xn ; )
L (y1 , y2 , . . . , yn ; )
Muchas veces es posible hallar una funcin g (x1 , x2 , . . . , xn ) tal que
esta relacin no tenga parmetros desconocidos si y slo si
g (x1 , x2 , . . . , xn ) = g (y1 , y2 , . . . , yn )
Si se puede hallar esa funcin g, entonces g (X1 , X2 , . . . , Xn ) es un estadstico suficiente mnimo para .
a. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin de
Bernoulli. De acuerdo con el mtodo de Lehmann y Scheff, cul
es el estadstico suficiente mnimo para p?
b. Sea X1 , X2 , . . . , Xn una muestra aleatoria de la funcin de densidad de Weibull, dada por
n 2o
(
2x
exp x , x > 0

f (x; ) =
0,
otro caso
De acuerdo con el mtodo de Lehmann y Scheff, cul es el estadstico suficiente mnimo para ?
36. Sea X1 , X2 , . . . , X2n+1 una muestra aleatoria de una distribucin normal.
a. Pruebe que la media muestral y la mediana son estimadores insesgados para .
b. cul es la eficiencia de la mediana con relacin a la media? cul
de los dos estimadores prefiere?
37. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin Gamma
con parmetros de forma y escala (ambos desconocidos). Obtenga
por el mtodos de los momentos los estimadores para y .
Universidad de Carabobo

Sec 3.6. Ejercicios Propuestos

182

38. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin binomial


negativa con parmetros p y k. Estimar por el mtodos de los momentos
los parmetros p y k.
b no es igual a
39. Demuestre que si b es un estimador insesgado de y V[]
2
2
b no es un estimador insesgado de .
cero, entonces ()
2

40. Demuestre que X es un estimador asintticamente insesgado de 2 .


41. Supngase que se utiliza el valor ms grande de una muestra aleatoria
de tamao n (es decir, el estadstico de orden n X(n) ) para estimar el
parmetro de la poblacin
(
1
, 0<x<

f (x; ) =
0, otro caso
Verifique se este estimador es
a. Un estimador insesgado
b. Un estimador consistente.
42. Dada una muestra aleatoria de tamao n tomada de una poblacin que
tiene la funcin de densidad
(
1
exp{ (x)
}, x >

f (x; ) =
0,
otro caso
donde < < y 0 < < , obtenga estimaciones simltaneas
de mxima verosimilitud para y .
43. Una mquina produce diariamente un lote de piezas. Un criterio basado
sobre normas de calidad vigente permite clasificar cada pieza fabricada como defectuosa o no defectuosa. El cliente aceptara el lote si la
proporcin de piezas defectuosas contenidas en el lote no sobrepasa
el valor 0 . El fabricante tiene que controlaar entonces la proporcin
de piezas defectuosas contenidas en cada lote que fabrica. Pero si la
cantidad de piezas N de cada lote es muy grande, no podr examinar
cada una para determinar el valor de . El fabricante efecta entonces
el control de calidad de una muestra aleatoria pequa con n piezas. Se
FaCyT-Matemticas

Cap 3. Estimacin puntual

183

define la variable aleatoria X que toma el valor 1 si la pieza es defectuosa y 0 en el caso contrario. Sean X1 , X2 , . . . , Xn una muestra aleatoria
tomada del lote. Obtener el estimador de mxima verosimilitud de .
44. Sea X N (, 1) y la distribucin a priori N (0, 10).
a. Obtenga la distribucin a posteriori para .
b. Cul es la moda y la media de la distribucin a posteriori para
?

Universidad de Carabobo

Sec 3.6. Ejercicios Propuestos

184

FaCyT-Matemticas

Captulo 4
Estimacin por intervalos

Una estimacin por intervalos de un parmetro desconocido es un intervalo


de la forma
lu
donde los puntos extremos l y u dependen de la estimacin b de para
b
una muestra aleatoria en particular, y de la distribucin de muestreo de .
b
Puesto que muestras diferentes producen estimaciones distintas de y, en
consecuencia, valores diferentes de los puntos extremos l y u, estos puntos
son valores de variables aleatorias, por ejemplo, L y U, respectivamente. De
b es posible determinar los valores de L y U
la distribucin de muestreo de
tales que la siguiente proposicin probabilstica sea verdadera:
P (L U ) = 1
donde 0 < < 1. Por lo tanto, se tiene una probabilidad de 1 de seleccionar una muestra aleatoria que produzca un intervalo que contenga el
valor verdadero de .
El intervalo resultante
lu
se conoce como intervalo de confianza del 100(1 ) % para el parmetro
desconocido . Las cantidades l y u reciben el nombre de lmite de confianza
inferior y superior, respectivamente, y 1 es el coeficiente de confianza.

4.1.

Interpretacin de un intervalo de confianza

La interpretacin de un intervalo de confianza radica en un sentido en una


probabilidad a largo plazo; es decir, si se recopila un nmero infinito de mues185

Sec 4.1. Interpretacin de un intervalo de confianza

186

tras aleatorias y se calcula un intervalo de confianza del 100(1 ) % para


, para cada una de las muestras, entonces el 100(1 ) % de esos intervalos
contienen el valor verdadero de .
Esta situacin se ilustra en la Figura (4.6), la cul presenta varios intervalos
de confianza del 100(1 ) % para el parmetro .

Figura 4.1: Construccin repetida de un intervalo de confianza para


Ntese que uno de los 20 intervalos no contiene el valor verdadero de . Si
el intervalo de confianza fuera del 95 %, esto significara que en una corrida
larga slo el 5 % de los intervalos no contendran a .
En la prctica, se obtiene slo una muestra aleatoria y se calcula un intervalo
de confianza del 100(1 ) %
lu
Este intervalo de confianza no es ms que una realizacin del intervalo aleatorio
[L, U ]
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

187

con base en los datos de una sola muestra, en el que la estimacin de


b Dado que el valor de probabilidad de 100(1 ) % se refiere slo al
es .
intervalo aleatorio [L, U ], es incorrecto decir que la probabilidad de que se
encuentre contenido en el intervalo [l, u] es de 1 , es decir, no es razonable
asociar un nivel de probabilidad a este evento especifico. Esta proposicin
tiene una interpretacin de frecuencia; esto es, no se sabe si es correcta para
la muestra en particular, pero el mtodo utilizado para obtener el intervalo
[l, u] proporciona proposiciones correctas el 100(1 ) % de las veces. As,
cuando se escriba
P (l u) = 1
no se esta formulando ninguna proposicin probabilstica en el sentido clsica,
sino ms bien expresa un grado de confianza.

4.2.

Construcin de un intervalo de confianza:


Mtodo del pivote

Este mtodo consiste en determinar una cantidad que acte como pivote y
que posea las dos caracteristicas siguientes:
1. Que sea una funcin de una estadstica suficiente T y del parmetro
desconocido , donde sea la nica cantidad desconocida,
X = f (T, )
2. Que su distribucin de probabilidad no dependen del parmetro .
Como la probabilidad del evento del evento (a X b) no resulta afectada
por un cambio de escala o una translacin de X. Entonces se seleccionan dos
valores x1 y x2 tales que
P (x1 X x2 ) = 1
mediante una manipulacin algebraica se puede modificar el contenido entre
parntesis y expresarlo como
P (L (T ) U (T )) = 1
Universidad de Carabobo

Sec 4.3. Intervalo de confianza para la media de una distribucin


normal
188
en donde L (T ) y U (T ) son funciones de la estadstica T y de esta forma
variables aleatorias.
Sustituyendo los estimadores calculados a partir de la muestra aleatoria en
L (T ) y U (T ), se obtiene el intervalo
lu
que recibe el nombre de intervalo de confianza bilateral, ya que se especifican los limites inferior y superior de . En algunas ocasiones puede ser til
construir intervalos de confianza unilaterales, de la forma:
P (L (T ) ) = 1
o
P ( U (T )) = 1
el primero es un intervalo de confianza unilateral inferior para , y el segundo
es un intervalo de confianza unilateral superior.

4.3.

Intervalo de confianza para la media de


una distribucin normal

4.3.1.

Caso en el que la varianza de la poblacin es conocida

Sea X una variable aleatoria y supngase que la distribucin de probabilidad


de dicha variable es normal con media (desconocida) y varianza 2 conocida.
Dada una muestra aleatoria X1 , X2 , . . . , Xn se utilizar como estimador puntual la media muestral X. Se sabe que la distribucin muestral de X es
normal con media y varianza 2 , es decir,

X N , 2 /n
En consecuencia, la variable aleatoria
Z=

/ n
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

189

sigue una distribucin normal estndar. Dicha variable se utilizar como cantidad pivote para calcular el intervalo de confianza para . Entonces, de la
figura (4.2)

Figura 4.2: P z 2 Z z1 2 = 1


P z 2 Z z1 2 = 1


X
z1 2 = 1
P z 2
/ n
 




P z2
X z1 2
=1
n
n




 

X =1
P z 2 X z1 2
n
n






P X z 2
X z1 2
=1
n
n






P X z1 2
X z 2
=1
n
n

Como z 2 = z1 2 , se tiene que








P X z1 2
X + z1 2
=1
n
n

(4.1)

es el intervalo aleatorio para . La probabilidad de que este intervalo de


confianza contenga el valor de la media es 1 . Si se sustituye la variable
aleatoria X en (4.1) por el estimado x calculado a partir de las realizaciones de
las variables aleatorias que constituyen la muestra aleatoria X1 , X2 , . . . , Xn ,
Universidad de Carabobo

Sec 4.3. Intervalo de confianza para la media de una distribucin


normal
190
se obtiene un intervalo de confianza estimado del 100(1 ) % para :





x z1 2
x + z1 2
n
n
en donde:

l = x z1 2

es el lmite de confianza inferior

y

u=x+z

1
2

es el lmite de confianza superior

Ejemplo 4.1. La nota de una prueba de aptitud siguen una distribucin normal con desviacin estndar 28 2. Una muestra aleatoria de nueve alumnos
arroja los siguientes resultados:
n = 9,

n
X
i=1

xi = 1098 y

n
X

x2i = 138148

i=1

a. Hallar un intervalo de confianza del 90 % para la media poblacional .


b. Razonar sin hacer clculos si la longitud de un intervalo del 95 % ser
menor, mayor o igual que la del obtenido en el item anterior.
c. Cul ser el tamao de la muestra mnimo necesaria para obtener un
intervalo del 90 % de nivel de confianza, con longitud 10? (la longitud
del intervalo es la diferencia entre sus extremos).
Solucin:
Solucin a.
Sea X la variable aleatoria que representa la nota del alumno, entonces X sigue una distribucin normal con media (desconocida) y desviacin estndar
= 28 2; el intervalo de confianza para es



x z1 2
n
donde z1 2 es el valor de la distribucin normal estndar que verifica


P Z z1 2 = 1
2
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

191

es decir, el valor que deja un rea igual a 1

a la izquierda.

Para los datos dados,


n
P

x=

xi

i=1

1098
= 122
9

como 1 = 0 9, entonces = 0 1 y
z1 2 = z1 0 1 = z0 95 = 1 95
2

por el enunciado se sabe que = 28 2. Entonces el intervalo de confianza


estimado para , es:


28 2
, o bien, 122 9 4
122 1 95
9
es decir,
106 6 137 5
Solucin b.
Observando el intervalo de confianza estimado para



x z1 2
n
para un coeficiente de confianza grande, el valor cuantil incrementa dando
como resultado un intervalo de confianza ms amplio.
Otra forma de justificar esto es recurriendo a la frmula del intervalo, que
nos dice que su longitud viene dado por:


 



Lo = x + z1 2
x z1 2
n
n
o

Lo = 2z1 2
(4.2)
n
Ahora, si y n permanecen fijos, para estudiar como vara Lo al cambiar
basta ver como vara el cuantil. Al intervalo del 95 % le corresponde:
1 = 0 95,
Universidad de Carabobo

entonces = 0 05

Sec 4.3. Intervalo de confianza para la media de una distribucin


normal
192
entonces disminuye. Por lo tanto, la cantidad z1 2 aumenta. En consecuencia, de la expresin (4.2) se ve que Lo aumenta.
Solucin c.
Ahora se pregunta por el valor de n para un y una longitud Lo dadas. De
la expresin (4.2), se tiene que



Lo = 2z1 2
n
de aqu

n = 2z1 2

 
Lo

y

 2
n = 2z1 2
Lo
as que,


n = 2z1 2

2
 2 
28 2
= 2(1 65)
= 86 60
Lo
10

Ntese que el valor de n, por su significado, debe ser un nmero natural; as


que en este caso el tamao muestral mnimo es n = 87.

Seleccin del tamao muestral
Supngase que se especifica que el muestreo se efecta sobre una poblacin
que tiene una distribucin normal con media desconocida y varianza 2
conocida. Se desea estimar el tamao necesario de la muestra que, con probabilidad 1, la media muestral X se encuentre en un intervalo de confianza
igual a unidades de . Se tiene que:






P X z1 2
X + z1 2
=1
n
n
entonces

P | X |< = 1
en donde:


= z1 2

FaCyT-Matemticas

Cap 4. Estimacin por intervalos

193
y
n=

 z1 2
2

Ejemplo 4.2. Qu tan grande se debe tomar una muestra en el ejemplo


(4.1), si se requiere tener 90 % de confianza de que nuestra estimacin x de
difiera a lo sumo de 2 5 del verdadero valor de .
Solucin:
n=

 z1 2
2

Como
= 2 5,

z1 2 = z0 95 = 1 65 y

= 28 2

entonces

n=

(1 65)(28 2)
2 5

2
= 346 41

por lo tanto, el tamao muestral ha de ser, como mnimo, de tamao n = 347


alumnos. Esto es, se puede tener una confianza del 90 % de que una muestra
aleatoria de tamao 347 alumnos proporcionar una estimacin x que difiera
de por una cantidad menor que 2 5.

Intervalos de confianza unilaterales
Un intervalo de confianza inferior estimado del 100(1 ) % para es:

x z1

mientras que el intervalo de confinza superior estimado del 100(1 ) % para


es:



x + z1
n
Universidad de Carabobo

Sec 4.3. Intervalo de confianza para la media de una distribucin


normal
194

4.3.2.

Caso en el que la varianza de la poblacin es desconocida

Con frecuencia se intenta estimar la media de una poblacin cuando se desconoce la varianza de la poblacin. De la Seccin (2.4.2) se sabe que si se tiene
una muestra aleatoria X1 , X2 , . . . , Xn de una distribucin normal, entonces
la variable aleatoria
X

T =
S/ n
tiene una distribucin t de Student con n 1 grados de libertad. Aqu S es
la desviacin estndar de la muestra aleatoria. Entonces, si la varianza 2 de
la poblacin es desconocida se puede utilizar T como cantidad pivote para
construir un intervalo de confianza estimado para del 100(1 ) %. De la
figura (4.3),

Figura 4.3: P t 2 ,n1 T t1 2 ,n1 = 1


se puede asegurar que

P t 2 ,n1 T t1 2 ,n1 = 1
donde: t1 2 ,n1 es el valor de t con n 1 grados de libertad, para el cul
deja un rea igual a 1 2 a la izquierda. Al sustituir por T, en la expresin
anterior


X
t1 2 ,n1 = 1
P t 2 ,n1
S/ n
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

195

Al multiplicar cada trmino en la desigualdad por S/ n, despus restar X


de cada trmino y multiplicar por 1, se obtiene





S
S
X t 2 ,n1
=1
P X t1 2 ,n1
n
n
como t 2 ,n1 = t1 2 ,n1 , se tiene el intervalo aleatorio:





S
S
P X t1 2 ,n1
X + t1 2 ,n1
=1
n
n
Para una muestra aleatoria particular de tamao n, se calcula la media x y
la desviacin estndar s y se obtiene el intervalo de confianza estimado del
100(1 ) % para




s
s
x t1 2 ,n1
x + t1 2 ,n1
n
n
Ejemplo 4.3. El contenido de siete contenedores similares de cido sulfrico con 9 8, 10 2, 10 4, 9 8, 10, 10 2 y 9 6 litros. Encuentre un intervalo de
confianza del 95 % para la media de todos los contenedores si se supone una
distribucin aproximadamente normal.
Solucin:
La media muestral y la desviacin estndar muestral para la muestra de tamao n = 7 son:
x = 10 y s = 0 283
Adems, el coeficiente de confianza es:
1 = 0 95 entonces

= 0 05 y

= 0 025
2

entonces, t1 2 ,n1 = t0 975,6 = 2 447. De aqu es intervalo de confianza estimado del 95 % para es:




0 283
0 283
10 (2 447)
10 + (2 447)
7
7
que se reduce a
9 74 10 26

Universidad de Carabobo

Sec 4.4. Intervalo de confianza para la diferencia de medias de dos


poblaciones normales independientes
196
Intervalos de confianza unilaterales
Un intervalo de confianza inferior estimado del 100(1 ) % para es:


s
x t1,n1

n
mientras que el intervalo de confinza superior estimado del 100(1 ) % para
es:


s
x + t1,n1
n

4.4.

Intervalo de confianza para la diferencia de


medias de dos poblaciones normales independientes

Supngase que se necesita comparar el rendimiento medio de dos procesos


diferentes de fabricacin, la calidad media de dos marcas diferentes de un
mismo artculo, la capacidad media de dos candidatos a un puesto de trabajo . . ., tales problemas pueden abordarse mediante el clculo de un intervalo
de confianza para la diferencias de medias de rendimientos, calidades, capacidades . . ., que son evaluadas por variables cuya distribucin pueda suponerse
normal.

4.4.1.

Caso de ambos varianzas conocidas

Sean X1 , X2 , . . . , Xn y Y1 , Y2 , . . . , Ym dos muestras aleatorias de dos distribuciones normales independientes, con medias x y y y varianzas x2 y y2
(conocidas), respectivamente. Si
n
P

X=

i=1

Xi

m
P

Yi

i=1

y Y =
n
m
son las medias muestrales para las muestras aleatorias de X y Y , respectivamente. Entonces, de la seccin (2.5), la variable aleatoria
Z=

X Y (x y )
q
y2
x2
+
n
m

(4.3)

FaCyT-Matemticas

Cap 4. Estimacin por intervalos

197

tiene una distribucin normal estndar. La expresin (4.3) se puede usar como
cantidad pivote para construir un intervalo de confianza para la diferencia
x y . De la figura (4.2), se puede asegurar que:

(4.4)
P z1 2 Z z1 2 = 1
Sustituyendo (4.3) en (4.4)

X Y (x y )
q
z1 2 = 1
P z1 2
y2
x2
+m
n
Multiplicando por
r

x2 y2
+
n
m
restando la diferencia de medias muestrales X Y y, finalmente, multiplicando por 1 en todos sus miembros, se tiene que
!
r
r
x2 y2
x2 y2
+
x y X Y + z1 2
+
= 1
P X Y z1 2
n
m
n
m
Para muestras aleatorias particulares de tamaos n y m, se calculan los
valores de x y y y se obtiene el intervalo de confianza del 100(1 ) % para
x y
r
r
x2 y2
x2 y2
+
x y x y + z1 2
+
x y z1 2
n
m
n
m
en donde el valor cuantil z1 2 , es tal que:


P Z z1 2 = 1
2
Ejemplo 4.4. Construya un intervalo de confianza del 94 % para la diferencia real entre las duraciones de dos marcas de bombillo, si una muestra
aleatoria de 40 bombillos tomada de la primera marca tuv una duracin media de 418 horas y una muestra aleatoria de 50 bombillos de la segunda marca
dieron una duracin media de 402 horas. Las desviaciones estndar de las
dos poblaciones son 26 y 22 horas, respectivamente. Qu se puede concluir?

Universidad de Carabobo

Sec 4.4. Intervalo de confianza para la diferencia de medias de dos


poblaciones normales independientes
198
Solucin:
Si se denota con 1 y 2, la primera y segunda marca, respectivamente, entonces
x1 = 418 h
1 = 26 h
n1 = 40

x2 = 402 h
2 = 22 h
n2 = 50

como 1 = 0 94, entonces = 0 06 y 2 = 0 03. Entonces un intervalo de


confianza estimado del 94 % para la diferencia de las medias 1 2 viene
dado de la siguiente manera:
l 1 2 u
donde:
r

x2 y2
+
nr m
262 222
+
=418 402 z0 97
40
50
=16 1 88(5 16)
=16 9 7
=6 3 h

l =x y z1 2

y
r

x2 y2
+
nr m
262 222
=418 402 + z0 97
+
40
50
=16 + 1 88(5 16)
=16 + 9 7
=25 7 h

l =x y + z1 2

Por consiguiente, un intervalo de confianza del 94 % para la diferencia real


en la duracin promedio de las marcas de los bombillos es:
6 3 h 1 2 25 7 h
como el intervalo de confianza estimado no incluye al cero y contiene valores
positivos, implica que la duracin promedio de los bombillos de la primera
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

199

marca 1 es mayor a la duracin promedio de los bombillos de la segunda


marca 2 . Por tanto, este resultado nos permite afirmar, con el nivel de
confianza de 0 94, que la primera marca tiene mayor duracin media (mayor
media) que los bombillos de la segunda marca.

Seleccin del tamao de la muestra
Si los tamaos de las dos muestras aleatorias son iguales (nx = ny = n),
entonces puede determinarse el tamao requerido de la muestra de modo
que se tenga una confianza del 100(1 ) % en que el error de estimacin de
x y por x y sea menor que , esto es:

P | X Y (x y )| < = 1
(4.5)
como

r
P

| X Y (x y )| < z1 2

a partir de (4.5) y (4.6), se tiene que:


r
= z1 2

x2 y2
+
n
m

!
=1

(4.6)

x2 y2
+
n
m

resolviendo para n la ecuacin anterior, el tamao muestral necesario de


ambas muestras para alcanzar una cota de error con un nivel de confianza
dado es:
 z1 2

2
n=
x2 + y2

Ejemplo 4.5. Un experimentador desea comparar la efectividad de dos mtodos de capacitacin para obreros que van a realizar una operacin de ensamble. los obreros seleccionados han de dividirse en dos grupos de igual
tamao, el primero para recibir el mtodo A de capacitacin y el segundo el
mtodo B de capacitacin. Despus de la capacitacin cada obrero realizar
la operacin de ensamble y se registrar el tiempo que le tome hacerlo. La
variabilidad de cada mtodo de ensamble es aproximadamente de 2 = 4. Si
la estimacin de la diferencia en los tiempos promedio de ensamble debe ser
correcta con una variacin de no ms de 1 minuto con probabilidad de 0 95,
Universidad de Carabobo

Sec 4.4. Intervalo de confianza para la diferencia de medias de dos


poblaciones normales independientes
200
cuntos trabajadores deben incluirse en cada grupo?
Solucin:
Si se puede suponer normalidad en los tiempos de ensamble para cada mtodo
y como el tamao de la muestra es la misma para ambos grupos, entonces el
tamao de trabajadores que debe incluirse en cada grupo viene dada por la
siguiente expresin
 z1 2

2
A2 + B2
n=

donde 1 = 0 95, entoces = 0 05 y /2 = 0 025. Por lo tanto


z
2
0 975
n=
(4 + 4) = 8(1 96)2 = 30 73
1
de esta manera, se deben incluir al menos 31 trabajadores en cada grupo para
tener una confianza del 95 % en que el error de estimacin de la diferencia
A B por xA xB ser menor que 1 minuto.

Intervalos de confianza unilaterales
Un intervalo unilateral superior del 100(1 ) % de confianza para x y
es:
r
x2 y2
+
x y x y + z1
n
m
mientras que un intervalo unilateral inferior del 100(1 ) % de confianza
es:
r
x2 y2
x y z1
+
x y
n
m

4.4.2.

Caso en que las varianzas son desconocidas pero


iguales

Sean X1 , . . . , Xn y Y1 , . . . , Ym dos muestras aleatorias de dos poblaciones


normales independientes con medias x y y ambas con igual varianzas 2 ,
desconocida. Si
n
m
n
2
P
P
P
Xi
Yi
Xi X
X = i=1 , Y = i=1 , Sx2 = i=1
n
m
n1
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

201
n
P

Sy2 =

Yi Y

2

i=1

Sp2 =

m1
Entonces, de la Seccin (2.5), la variable
T =

(n 1)Sx2 + (m 1)Sy2
n+m2

X Y (x y )
q
Sp n1 + m1

(4.7)

tiene una distribucin t de Student con n + m 2 grados de libertad. La expresin (4.7) se puede usar como cantidad pivote para construir un intervalo
de confianza estimado del 100(1 ) % para la diferencia x y cuando las
varianzas de ambas poblaciones son desconocidas pero iguales. De la figura
(4.3), se puede asegurar que

(4.8)
P t1 2 ,n+m2 T t1 2 ,n+m2 = 1
sustituyendo (4.7) en (4.8), se tiene que:

X Y (x y )
q
P t1 2 ,n+m2
t1 2 ,n+m2 = 1
1
1
Sp n + m
Multiplicando por
r
Sp

1
1
+
n m

restando la diferencia de medias muestrales X Y y, finalmente, multiplicando por 1 en todos sus miembros, se tiene que
r
P

X Y t1 2 ,n+m2 Sp

1
1
+
x y X Y + t1 2 ,n+m2 Sp
n
m

1
1
+
n
m

!
= 1

Si x, y, s2x y s2y son las medias y las varianzas de dos muestras aleatorias
de tamaos n y m, respectivamente, tomadas de dos poblaciones normales e
independientes con varianzas desconocidas pero iguales, entonces un intervalo
de confianza estimado del 100(1 ) % para la diferencia entre las medias
x y es:
r
r
1
1
1
1
x y t1 2 ,n+m2 sp
+
x y x y + t1 2 ,n+m2 sp
+
n m
n m
Universidad de Carabobo

Sec 4.4. Intervalo de confianza para la diferencia de medias de dos


poblaciones normales independientes
202
donde:

(n 1)s2x + (m 1)s2y
n+m2
es el estimador combinado de la desviacin estndar comn de la poblacin,
y t1 2 ,n+m2 es el valor cuantil tal que:


P T t1 2 ,n+m2 = 1
2
Ejemplo 4.6. Para alcanzar la mxima eficiencia al realizar una operacin
de ensamble en una planta manufacturera, obreros nuevos requieren aproximadamente un periodo de capacitacin de 1 mes. Se sugirieron un nuevo
mtodo de capacitacin y se realiz un examen para comparar el nuevo mtodo contra el procedimiento estndar. Dos grupos de nueve obreros nuevos
cada unos fueron capacitados durante 3 semanas, un grupo usando el nuevo mtodo y el otro siguiendo el procedimiento estndar de capacitacin. El
tiempo (en minutos) requerido por cada obrero para ensamblar el dispositivo
se registr al final del periodo de 3 semanas. Las mediciones resultantes son
las que se muestran en la siguiente tabla
sp =

Estndar
Nuevo

32
35

37
31

35
29

28
25

41
34

44
40

35
27

31
32

34
31

Calcule la diferencia real de la medias E N con un coeficiente de confianza


de 0 95. Suponga que los tiempos de ensamble estn distribuidos normalmente en forma aproximada, que las varianzas de los tiempos de ensamble son
aproximadamente iguales para los dos mtodos y que las muestras son independientes.
Solucin:
Para los datos de la tabla
xE = 35 22 h
sE = 24 445 h
nE = 9

xN = 31 56 h
sN = 20 027 h
nN = 9

Como 1 = 0 95, entonces = 0 05 y 2 = 0 025. Entonces, un intervalo


de confianza del 95 % para la diferencia de las medias E N viene dado
de la siguiente manera:
l E N u
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

203
donde:

r
l =x y t1 2 ,n+m2 sp

1
1
+
n m
r

=35 22 31 56 t0 975,16 (4 716)


r
2
=3 66 (2 120)(4 716)
9
=3 66 4 71
= 1 05

1 1
+
9 9

y
r
u =x y + t1 2 ,n+m2 sp

1
1
+
n m
r

=35 22 + 31 56 t0 975,16 (4 716)


r
2
=3 66 + (2 120)(4 716)
9
=3 66 + 4 71
=8 37

1 1
+
9 9

por consiguiente, un intervalo de confianza del 95 % para la diferencia E N


es:
1 05 E N 8 37
Como el intervalo de confianza estimado del 95 % contiene valores positivos y
negativos, se puede decir que ninguno de los mtodos de capacitacin produce
un tiempo medio de ensamble que difiera uno del otro.

Intervalos de confianza unilaterales
Un intervalo de confianza superior estimado del 100(1 ) % para x y
es:
r
1
1
x y x y + t1,n+m2 sp
+
n m
Universidad de Carabobo

Sec 4.4. Intervalo de confianza para la diferencia de medias de dos


poblaciones normales independientes
204
mientras que el intervalo de confianza estimado superior del 100(1 ) %
para x y es:
r
1
1
+
x y
x y t1,n+m2 sp
n m

4.4.3.

Caso en que las varianzas son desconocidas y distintas

De la seccin (2.5.3), se sabe que la variable:


T =

X Y (x y )
q
Sy2
Sx2
+
nx
ny

(4.9)

tiene, de manera aproximada, una distribucin t de Student con grados de


libertad dados por:
2
Sx2 /nx + Sy2 /ny
=
(4.10)
2 2
(Sy2 /ny )
(Sx2 /nx )2
+ ny +1
nx +1
Por tanto, se puede usar la expresin (4.9) como cantidad pivote para construir un intervalo de confianza del 100(1 ) % para x y . De la figura
(4.3), se tiene que:

(4.11)
P t1 2 T t1 2 1
El intervalo de confianza para x y puede obternerse si se sustituye T en
la expresin (4.9) y se despeja el trmino x y entre las desigualdades.
Si x, y, s2x y s2y son las medias y las varianzas de dos muestras aleatorias de
tamaos nx y ny , respectivamente, tomadas de dos poblaciones normales e
independientes con varianzas desconocidas y distintas, entonces un intervalo
de confianza estimado del 100(1 ) % para la diferencia entre las medias
x y es:
s
s
s2y
s2x
s2x
sy
x y t1 2 ,
+
x y x y + t1 2 ,
+
nx ny
nx ny
donde: est dada por la expresin (4.10) y t1 2 , es el valor cuantil tal que


P T t1 2 , = 1
2
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

205

Ejemplo 4.7. Se piensa que la concentracin del ingrediente activo de un


detergente lquido para ropa, es afectada por el tipo de catalizador utilizado en
el proceso de fabricacin. Se realizan 10 obervaciones con cada catalizador, y
se obtienen los datos siguientes:

Catalizador 1
Catalizador 2

57 9
66 4

66 2
71 7

65 4
70 3

65 4
69 3

65 2
64 8

62 6
69 6

67 6
68 6

63 7
69 4

67 2
65 3

71
68 8

Encuentre un intervalo de confianza del 95 % para las diferencias de las concentraciones activas promedio, suponiendo que las varianzas no son iguales.
Solucin:
Para los datos de la Tabla
x1 = 65 22
s1 = 3 44
n1 = 10

x2 = 68 42
s2 = 2 22
n2 = 10

Como 1 = 0 95, entonces = 0 05 y

2

s1
n1

s2
2
n2

s21
s2
+ n22
n1
 2 2

n1 1

2

= 0 025 y

2
(3 44)2
(2 22)2
+
10
10




2 2
2 2


n2 1

(3 44)
10

101

(2 22)
10

101

(1 68)
2 82
=
0 16 + 0 03
0 19
= 14 84 14

Un intervalo de confianza del 95 % para la diferencia de las concentraciones


activas promedio suponiendo que las varianzas no son iguales, viene dado
por:
l 1 2 u
Universidad de Carabobo

Sec 4.4. Intervalo de confianza para la diferencia de medias de dos


poblaciones normales independientes
206
donde:
s

s2
s21
+ 2
n1 n1
r
(3 44)2 (2 22)2
= 65 22 68 42 t0 975,14
+
10
10
= 3 2 (2 14)(1 29) = 3 2 2 76
= 5 96

l = x1 x2 t1 2 ,

y
s

s21
s2
+ 2
n1 n1
r
(3 44)2 (2 22)2
= 65 22 68 42 + t0 975,14
+
10
10
= 3 2 + (2 14)(1 29) = 3 2 + 2 76
= 0 44

u = x1 x2 + t1 2 ,

de esta manera, el intervalo de confianza estimado del 95 % para 1 2 es:


5 96 1 2 0 44
Observe que el intervalo de confianza no contiene el cero, entonces la concentracin promedio del ingrediente activo si se ve afectada por el tipo de
catalizador utilizado.

Intervalos de confianza unilaterales
Un intervalo de confianza superior estimado del 100(1 ) % para x y
es:
s
s2y
s2x
+
x y x y + t1,
nx ny
mientras que el intervalo de confianza inferior estimado del 100(1) % para
x y es:
s
s2y
s2x
x y t1,
+
x y
nx ny
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

207

4.5.

Intervalo de confianza para la varianza de


una distribucin normal

Supngase que se desea obtener un intervalo de confianza estimado del 100(1


) % para la varianza 2 de una poblacin normal. Si X1 , X2 , . . . , Xn es una
muestra aleatoria de tamao n tomada de esta poblacin normal, y si S 2 es
la varianza muestral, entonces, de la seccin (2.4) se sabe que si la poblacin
es normal, la variable
(n 1)S 2
(4.12)
X=
2
sigue una distribucin chi-cuadrada con n 1 grados de libertad. La expresin (4.12) se puede usar como cantidad pivote para construir un intervalo
de confianza del 100(1 ) % para la varianza 2 de una poblacin normal.
De la figura (4.4)

Figura 4.4: P 2 ,n1 X 21 ,n1 = 1


2

Se nota que:


,n1
2

21 ,n1
2

=1

Sustituyendo (4.12) en (4.13), se tiene que:




(n 1)S 2
2
2
1 ,n1 = 1
P ,n1
2
2
2
La expresin anterior se puede escribir de la siguiente manera:
!
2
(n 1)S 2
(n

1)S
P
=1
2
21 ,n1
2 ,n1
2

Universidad de Carabobo

(4.13)

Sec 4.5. Intervalo de confianza para la varianza de una


distribucin normal

208

Si s2 es la varianza muestral de una muestra aleatoria tomada de una distribucin normal con varianza desconocida 2 , entonces un intervalo de confianza
estimado del 100(1 ) % para 2 es:
(n 1)s2
(n 1)s2
2

21 ,n1
2 ,n1
2

donde: ,n1 y
2

21 ,n1
2

son los valores cuantiles tales que




2
P X ,n1 =
2
2



P X 21 ,n1 = 1
2
2

respectivamente.
Ejemplo 4.8. Un experimentador desea comprobar que la variabilidad de
mediciones obtenidas al usar un equipo diseado para medir el volumen de
una fuente de audio. Doces mediciones independientes registradas por este
equipo para la misma fuente de sonido fueron
4 1
10 2

3 9 3 8 5 2 4 3
7 1 6 7 8 8 9 7

4
5 9

Determine un intervalo de confianza para 2 del 90 %.


Soluccin:
Para los datos n = 12 y s2 = 5 5481. Si se puede suponer normalidad en las
mediciones registradas por este equipo, entonces un intervalo de confianza
estimado para 2 del 90 %, viene dado por:
(n 1)s2
(n 1)s2
2

21 ,n1
2 ,n1
2

donde:
l=

(n 1)s2
21 ,n1
2

(11)(5 5481)
61 0291
=
2
0 95,11
19 6752

= 3 1018
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

209
y
l=

(n 1)s2
2 ,n1
2

61 0291
(11)(5 5481)
=
=
2
0 05,11
4 5748
= 13 3402
de esta manera
3 1018 2 13 3402

Intervalos de confianza unilaterales
Un intervalo de confianza superior estimado del 100(1 ) % para 2 es:
2

(n 1)S 2
2,n1

mientras que el intervalo de confianza inferior estimado del 100(1) % para


2 es:
(n 1)s2
2
2
1,n1

4.6.

Intervalo de confianza para el cociente de


las varianzas de dos distribuciones normales

Supngase que se tienen dos poblaciones normales e independientes con


varianzas desconocidas x2 y y2 , respectivamente. Sean X1 , X2 , . . . , Xnx y
Y1 , Y2 , . . . , Yny dos muestras aleatorias de tamaos nx y ny , respectivamente;
si Sx2 y Sy2 son las varianzas nuestrales, entonces, de la seccin (2.6) se sabe
que la variable
S 2 / 2
(4.14)
F = x2 x2
Sy /y
Universidad de Carabobo

Sec 4.6. Intervalo de confianza para el cociente de las varianzas de


dos distribuciones normales
210
sigue una distribucin F con nx 1 y ny 1 grados de libertad en el numerador y denominador, respectivamente. La expresin (4.14) se puede usar
como cantidad pivote para encontrar un intervalo de confianza estimado del
100(1 ) % para y2 /x2 . De la figura (4.5)

Figura 4.5: P f 2 ,nx 1,ny 1 F f1 2 ,nx 1,ny 1

se observa que:

P f 2 ,nx 1,ny 1 F f1 2 ,nx 1,ny 1 = 1

(4.15)

Sustituyendo la expresin (4.14) en (4.15), se tiene




Sx2 /x2
P f 2 ,nx 1,ny 1 2 2 f1 2 ,nx 1,ny 1 = 1
Sy /y
Por consiguiente,

 2
y2
Sy2
Sy
f ,n 1,ny 1 2 2 f1 2 ,nx 1,ny 1 = 1
P
Sx2 2 x
x
Sx
Si s2x y s2y son las varianzas muestrales de las dos muestras aleatorias de
tamaos nx y ny , respectivamente, tomadas de dos poblaciones normales e
independientes con varianzas desconocidas x2 y y2 , entonces un intervalo de
confianza estimado del 100(1 ) % para y2 /x2 es:
y2
s2y
s2y

f1 2 ,nx 1,ny 1
,n 1,ny 1
s2x 2 x
x2
s2x
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

211

donde f 2 ,nx 1,ny 1 y f1 2 ,nx 1,ny 1 son los valores cuantiles tale que:

P F f 2 ,nx 1,ny 1 =
2
y


P F f1 2 ,nx 1,ny 1 = 1
2
respectivamente.
Ejemplo 4.9. Considere el ejemplo (4.7), construya un intervalo de confianza del 95 % para el cociente de las varianzas poblacionales 12 /22 . Parece
razonable concluir que las varianzas no son iguales?
Solucin:
Si se puede suponer normalidad en los datos obtenidos por cada catalizador,
entonces un intervalo de confianza estimado del 95 % para el cociente de las
varianzas poblacionales 12 /22 , viene dado por:
12
s21
s21

f1 2 ,n2 1,n1 1
,n
1,n
1
1
s22 2 2
22
s22
donde:
s21
f ,n 1,n2 1
s22 2 1
(3 44)2
f0 025,9,9 = (2 4)(0 248)
=
(2 22)2
= 0 5952

l=

y
s21
f1 2 ,n1 1,n2 1
s22
(3 44)2
=
f0 025,9,9 = (2 4)(4 026)
(2 22)2
= 9 6624

u=

entonces, el intervalo de confianza estimado del 95 % para el cociente de las


varianzas poblacionales 12 /22 es:
0 5952
Universidad de Carabobo

12
9 6624
22

Sec 4.7. Intervalo de confianza para el parmetro p cuando se


muestra una distribucin binomial
212
Como el intervalo de confianza contiene el uno, no es razonable suponer que
las varianzas no son iguales.

Intervalos de confianza unilaterales
Un intervalo de confianza superior estimado del 100(1 ) % para y2 /x2 es:
y2
s2y

f1,nx 1,ny 1
x2
s2x
mientras que el intervalo de confianza inferior estimado del 100(1) % para
y2 /x2 es:
s2y
y2
f,nx 1,ny 1 2
s2x
x

4.7.

Intervalo de confianza para el parmetro p


cuando se muestra una distribucin binomial

Supongase que se necesita calcular un intervalo de confianza para el parmetro p desconocido de una distribucin binomial. Dada una muestra aleatoria
de tamao n, se estima p mediante la proporcin muestral
X
Pb =
n
en donde, X sigue una distribucin binomial con parmetros n y p. Cuando
el tamao muestral es suficientemente grande, la distribucin de
Pb p
Z=q

(4.16)

p(1p)
n

puede considerarse aproximadamente normal con media cero y varianza uno.

FaCyT-Matemticas

213

Cap 4. Estimacin por intervalos

Mediante un proceso idntico al seguido para obtener (4.1) resulta el intervalo


de confianza para p. Sea z1 2 el valor cuantil de una distribucin normal de
media cero y varianza uno. Entonces se verifica que:

b
P p
P z1 2 q
z1 2 ' 1
(4.17)
p(1p)
n

Si en las desigualdades de (4.17) se multiplica por


r
p(1 p)
n
se resta la proporcin muestral Pb, y se multiplica por 1 en todos sus miembros, queda el intervalo aleatorio
!
r
r
p(1

p)
p(1

p)
P Pb z1 2
p Pb + z1 2
'1
(4.18)
n
n
Observe, que los lmites inferior y superior del intervalo de confianza obtenidos a partir de la expresin (4.18) contienen el parmetro desconocido p.
Sin embargo, una solucin a este problema es remplazar p por Pb, lo que da
como resultado
s
s

b
b
b
b
P (1 P )
P (1 P )
p Pb + z1 2
' 1 (4.19)
P Pb z1 2
n
n
De esta forma, un intervalo de confianza aproximado del 100(1 ) % para
el parmetro de proporcin p, es
r
r
pb(1 pb)
pb(1 pb)
pb z1 2
p pb + z1 2
(4.20)
n
n
en donde el estimador pb = x/n se obtiene de la muestra aleatoria de tamao
n.
Ejemplo 4.10. En una muestra aleatoria de 85 soportes para el cigueal de
un motor de automvil, 10 tienen un terminado que es ms rugoso de lo que
las especificaciones permiten. Determine un intervalo de confianza estimado
Universidad de Carabobo

Sec 4.7. Intervalo de confianza para el parmetro p cuando se


muestra una distribucin binomial
214
del 95 % para la verdadera proporcin p de soportes en la poblacin que exceden las especificaciones de rigosidad.
Solucin:
La estimacin puntual de la proporcin de soportes en la poblacin que exceden las especificaciones de rigosidad es
pb =

10
x
=
= 0 12
n
85

un intervalo de confianza estimado para p viene dado por:


r
r
pb(1 pb)
pb(1 pb)
pb z0 025
p pb + z0 025
n
n
o
r
r
0 12(0 88)
0 12(0 88)
0 12 1 96
p 0 12 + 1 96
85
85
lo cual se reduce a
0 05 p 0 19

(4.21)

(4.22)

4.7.1.

Seleccin de la muestra

Cuando sea posible seleccionar el tamao de la muestra, puede escogerse


a n de modo que exista una confianza del 100(1 ) % de que el error de
estimacin es menor que algn valor especificado . De la expresin (4.18), se
tiene una confianza aproximadap
del 100(1) % de que el error de estimacin
b
= |P p| es menor que z1 2 p(1 p)/n. Igualando
r
= z1 2

p(1 p)
n

y se resuelve para n, el tamao de la muestra es:


n=

 z1 2
2

p(1 p)

(4.23)

Notes que para utilizar la ecuacin (4.23) se requiere conocer el valor del
parmetro desconocido p. Una manera de resolver el problema es siendo
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

215

conservador y elegir p de manera que el valor de p(1 p) sea un mximo


(0 p 1), esto es, seleccionar n utilizando el hecho de que el tamao de
la muestra obtenido en la ecuacin (4.23) siempre es mximo para p = 0 5, y
esto se puede usar para obtener una cota superior sobre n. Entonces, se tiene
una confianza del 100(1 ) % de que el error de estimacin de p por pb sea
menor que si el tamao de la muestra es
n=

 z1 2
2

(0 25)

(4.24)

Ejemplo 4.11. Considere el Ejemplo (4.10). Qu tan grande debe ser el


tamao de la muestra si se desea tener una confianza del 95 % de que el error
al utilizar pb como estimacin de p sea menor que 0 05?
Solucin:
Utilizando la ecuacin (4.24), el tamao de la muestra es:

2
2
z
1 96
0 025
n=
(0 25) ' 385
(0 25) =

0 05

Intervalos de confianza unilaterales
Un intervalo de confianza inferior estimado del 100(1 ) % para p es:
r
pb(1 pb)
pb z1
p
(4.25)
n
y, un intervalo de confianza superior estimado del 100(1 ) % para p es:
r
pb(1 pb)
p pb + z1
(4.26)
n

4.8.

Intervalo de confianza para la diferencias


de proporciones

Supongase que se necesita construir un intervalo de confianza para la diferencias de proporciones p1 p2 de dos distribuciones binomiales. Dadas dos
Universidad de Carabobo

Sec 4.8. Intervalo de confianza para la diferencias de proporciones


216
muestras aleatorias de tamao n1 y n2 , la variable aleatoria
Pb1 Pb2 (p1 p2 )
Z=q
b
Pb1 (1Pb1 )
Pb2 )
+ P2 (1
n1
n2

(4.27)

puede considerarse aproximadamente normal con media cero y varianza uno.


Mediante un proceso idntico al seguido para obtener (4.1) resulta el intervalo
de confianza para p. Sea z1 2 el valor cuantil de una distribucin normal de
media cero y varianza uno. Entonces se verifica que:

b
b
P1 P2 (p1 p2 )
z1 2 ' 1
(4.28)
P z1 2 q
Pb1 (1Pb1 )
Pb2 (1Pb2 )
+
n1
n2
Si en las desigualdades de (4.28) se multiplica por
s
Pb1 (1 Pb1 ) Pb2 (1 Pb2 )
+
n1
n2
se resta la diferencias de proporciones muestrales Pb1 Pb2 , y se multiplica por
1 en todos sus miembros, queda el intervalo aleatorio

P Pb1 Pb2 z1
2

Pb1 (1 Pb1 )
Pb2 (1 Pb2 )
+
p1 p2 Pb1 Pb2 + z1
2
n1
n2

Pb1 (1 Pb1 )
Pb2 (1 Pb2 )
+
n1
n2
(4.29)

que es, de forma aproximada 1 para n grande. De esta forma, un intervalo


de confianza aproximado del 100(1 ) % para el parmetro de proporcin
p, es
r
pb1 pb2 z

1
2

pb1 (1 pb1 )
pb2 (1 pb2 )
+
p1 p2 pb1 pb2 + z1 2
n1
n2

pb1 (1 pb1 )
pb2 (1 pb2 )
+
n1
n2
(4.30)

en donde el estimador pb1 = x1 /n1 y pb2 = x2 /n2 se obtiene de las muestras


aleatorias de tamao n1 y n2 , respectivamente.
Ejemplo 4.12. Considere el proceso de fabricacin de soportes para cigueales del Ejemplo (4.10). Supngase que se hace una modificacin al proceso de
acabado de la superficie y que, de manera subsecuente, se toma una segunda
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

217

muestra aleaoria de 85 ejes. El nmero de ejes defectuosos es esta segunda


muestra es 8. Determine un intervalo de confianza estimado del 95 % para
la diferencia de proporciones de los soportes defectuosos por ambos procesos.
Qu concluye sobre los cambios hechos al proceso de acabado de la superficie?
Solucin:
Como n1 = 85, pb1 = 0 12, n2 = 85, pb2 = 0 09. Un intervalo de confianza
estimado del 95 % para la diferencia p1 p2 , se puede obtener de la expresin
(4.30), de la siguiente manera:
r
pb1 pb2 z0 025

pb1 (1 pb1 )
pb2 (1 pb2 )
+
p1 p2 pb1 pb2 + z0 025
n1
n2

o
r
0 120 091 96

0 12(0 88)
0 09(0 91
+
p1 p2 0 120 09+1 96
85
n2

pb1 (1 pb1 )
pb2 (1 pb2 )
+
n1
n2
(4.31)

0 12(0 88)
0 09(0 91
+
85
n2
(4.32)

lo cual se reduce
0 06 p1 p2 0 12
Como este intervalo de confianza incluye al cero, con base en los datos muestrales, parece poco probable que los cambios hechos en el proceso de acabado de
la superficie hayan reducido el nmero de soportes defectuosos para cigueal
producidos por el proceso.

Intervalos de confianza unilaterales
Un intervalo de confianza inferior estimado del 100(1 ) % para p1 p2 es:
s
pb1 pb2 z1

pb1 (1 pb1 ) pb2 (1 pb2 )


+
p1 p2
n1
n2

(4.33)

y, un intervalo de confianza superior estimado del 100(1 ) % para p1 p2


es:
s
pb1 (1 pb1 ) pb2 (1 pb2 )
p1 p2 pb1 pb2 z1
+
(4.34)
n1
n2
Universidad de Carabobo

Sec 4.9. Ejercicios Propuestos

4.9.

218

Ejercicios Propuestos

1. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin Poisson con


parmetro , cuando n es relativamente grande, la media muestral X
es aproximadamente normal con media y varianza /n.
a. Cul es la distribucin (aproximada) de la siguiente variable?
X
p
/n
b. Utilice los resultados del inciso a. para encontrar un intervalo de
confianza del 100(1 ) % para .
2. Se supone que la duracin de una pila elctrica para calculadora de
bolsillo tiene distribucin normal. Se prueba una muestra aleatoria de
10 pilas hasta el agotamiento, y se obtienen las duraciones siguientes:
25 5 h 26 1 h
26 8
23 2
24 2
28 4
25 0
27 8
27 3
25 7
Determine un intervalo de confianza bilateral al 90 % para la duracin
media.
3. Con los datos del Ejercicio anterior, fije un lmite inferior de confianza
al 95 % para la duracin media.
4. Una variable aleatoria distribuida normalmente tiene una media desconocida , y varianza conocida 2 = 16. Encuentre el tamao muestral
necesario para establecer un intervalo de confianza bilateral al 95 %
para , con una amplitud total de 1.
5. Considere los datos del Ejercicio (2). Determine un intervalo de confianza bilateral al 90 % para la varianza de la duracin de las pilas.
Convierta este intervalo en un intervalo de confianza correspondiente
para la desviacin estndar de la duracin de las pilas.
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

219

6. Se supone que el voltaje de salida de una fuente de energa tiene distribucin normal. Enseguida se presentan 16 observaciones de voltaje.

10 35 9 30
11 65 12 00
11 54 9 95
10 44 9 25

10 00
11 25
10 28
9 38

9 96
9 58
8 37
10 85

a. Determine un intervalo de confianza bilateral al 95 % para .


b. Determine un intervalo de confianza bilateral al 95 % para 2 .
c. Determine un intervalo superior de confianza bilateral al 95 % para
2.

7. Se investiga el dimetro de las varillas de acero fabricadas en dos diferentes mquinas de extrusin. Para ello se toman dos muestras aleatorias de tamaos n1 = 15 y n2 = 18; las medias y las varianzas muestrales son x1 = 8 73, s21 = 0 35, x2 = 8 68 y s22 = 0 40, respectivamente.
Suponga que 12 = 22 . Construya un intervalo de confianza bilateral del
95 % para la diferencia en el dimetro promedio de varilla.

8. Se toman dos muestras aleatorias de tamaos n1 = 15 y n2 = 10 de


dos termocoples diferentes. Las medias y la varianzas muestrales son
x1 = 300, s21 = 16, x2 = 305 y s22 = 49, respectivamente. Suponga
que 12 6= 22 . Construya un intervalo de confianza bilateral del 95 %
para 1 2 . Qu conclusin puede obtenerse sobre las lecturas de
temperatura promedio de los dos termocoples?

9. El administrador de un lote de automviles prueba dos marcas radiales.


Para ello asigna al azar una llanta de cada marca a las dos ruedas
posteriores de ocho automviles, y luego corre los automviles hasta que
las llantas se desgastan. Los datos obtenidos (en kilometros) aparecen
Universidad de Carabobo

Sec 4.9. Ejercicios Propuestos

220

en la siguiente tabla

Automvil Marca 1 Marca 2


1
2
3
4
5
6
7
8

36925
45300
36240
32100
37210
48360
38200
33500

34318
42280
35500
31950
38045
47800
37810
33215

Encuentre un intervalo de confianza del 99 % para la diferencia en el


tiempo promedio de duracin. Con base en estos clculos, qu llanta
es la que usted preferira?

10. Se usan dos mquinas para llenar botellas de vidrio con gaseosa. Los
procesos de llenado tienen desviaciones estndares conocidas 1 = 0 010
L y 2 = 0 015 L, respectivamente. Una muestra aleatoria de n1 = 25
botellas de la maquina 1, y una muestra aleatoria de n2 = 20 botellas de la mquina 2, dan como resultado contenidos medios netos de
x1 = 2 04 L y x1 = 2 07 L, respectivamente. Determine un intervalo
de confianza de 95 % para la diferencia en volumen medio de llenado. Concluira, con base en los resultados de este clculo, que ambas
mquinas producen el mismo volumen de llenado?.

11. Dos tcnicos de control de calidad miden el acabado de la superficie de


una pieza metlica, obteniendo los resultados siguientes. Suponga que
FaCyT-Matemticas

Cap 4. Estimacin por intervalos

221

las mediciones se distribuyen normalmente


Tcnico 1 Tcnico 2
1 45
1 37
1 21
1 54
1 48
1 29
1 34

1 54
1 41
1 56
1 37
1 20
1 31
1 27
1 35

a. Fije un intervalo de confianza al 95 % para la diferencia media


de las mediciones de acabado de superficie, suponiendo que las
varianzas son iguales.
b. Obtenga una estimacin para el cociente de las varianzas del error
de las medicin de los tcnicos, mediante un intervalo de confianza
al 95 %.
c. Determine un intervalo de confianza al 95 % para la varianza de
las mediciones del tcnico 2.
12. Se ha estudiado de manera extensa un sistema operativo para computadoras personales, y se sabe que la desviacin estndar del tiempo de
respuesta de un comando en particular es = 8 milisegundos. Se instalauna nueva versin del sistema operativo, y se desea estimar el tiempo
de respuesta promedio para el nuevo sistema de modo que pueda asegurarse que el intervalo de confianza del 95 % para tiene una longitud
a lo ms de cinco milisegundos. Si puede suponerse que el tiempo de
respuesta tiene una distribucin normal y que = 8 para el nuevo
sistema, que tamao de muestra recomendara utilizar?
13. Se investiga la resistencia a la tensin de ruptura del hilo proporcionado
por dos fabricantes. De la experiencia con los procesos de los fabricantes, se sabe que 1 = 5 psi y 2 = 4 psi. Una muestra aleatoria de
20 especmenes de prueba provenientes de cada fabricante arroja como
resultados x1 = 88 psi y x2 = 91 psi, respectivamente. Encuentre un
intervalo de confianza del 90 % para la diferencia entre las medias de la
Universidad de Carabobo

Sec 4.9. Ejercicios Propuestos

222

tensin de ruptura. Existe alguna evidencia que apoye la afirmacin


de que el hilo del fabricante 2 tiene una mayor resistencia media?
14. En el ejercicio (13), supngase que se desea construir un intervalo de
confianza del 90 % para 1 2 , de modo que el error al estimar esta
cantidad sea menor que 1 5 psi. Cul es el tamao de la muestra que
debe tomarse de cada pobalcin?
15. Se utilizan dos procesos diferentes de templado, uno con agua salada y
otro con aceite, en muestras de un tipo particular de aleacin metlica.
Los resultados se muestran a continuacin. Considere que la dureza (o
grado de temple) est distribuida normalmente.
Templado de agua salada

Templado en aceite

145
150
153
148
141
152
146
154
139
148

152
150
147
155
140
146
158
152
151
143

a. Fije un intervalo de confianza al 95 % para la diferencia en dureza,


suponiendo que las varianzas son iguales.
b. Construya un intervalo de confianza al 95 % para la razn 12 /22 .
16. Una muestra aleatoria de 200 tarjetas de circuitos impresos contiene
25 piezas defectuosas. Estime la fraccin de disconformes del proceso.
Determine un intervalo de confianza bilateral al 90 % para la verdadera
fraccin de disconformes en el proceso de fabricacin.
17. Una muestra aleatoria de 500 piezas contiene 75 disconformes. Estime
la fraccin de disconformidades del proceso. Fije un intervalo superior
de confianza al 95 % para la verdadera fraccin de disconformes del
proceso.
FaCyT-Matemticas

223

Cap 4. Estimacin por intervalos

18. Se usan dos procesos para fabricar piezas forjadas que se utilizan en el
montaje de un ala de avin. De 200 piezas, seleccionadas del proceso
1, se tiene que 30 no cumplen con las especificaciones de resistencia,
mientras que 300 piezas, seleccionadas del proceso 2, 40 no estn conformes. Calcule la fraccin de disconformes para cada proceso. Determine
un intervalo de confianza al 90 % para la diferencia en la fraccin de
disconformes de los dos procesos.
19. Se analiza la fraccin de productos defectuosos producidos por dos lneas de produccin. Una muestra aleatoria de 100 unidades provenientes de la lnea 1 contiene 10 que son defectuosas, mientras que una
muestra aleatoria de 120 unidades de la lnea 2 tiene 25 que son defectuosas. Encuentre un intervalo de confianza del 99 % para la diferencia
en fracciones de productos defectuosos producidos por las dos lneas.

Universidad de Carabobo

Sec 4.9. Ejercicios Propuestos

224

FaCyT-Matemticas

Captulo 5
Prueba de hiptesis sobre los parmetros

5.1.

Elementos de una prueba de hiptesis

El objetivo de una prueba estadstica es probar una hiptesis con respecto


a los valores de uno o ms parmetros poblacionales. Por lo general se tiene
una teora, es decir una hiptesis de investigacin, acerca del o los parmetros que se desea apoyar.
Por ejemplo, un fabricante asegura, a una compaa que le compra un producto en forma regular, que el porcentaje de productos defectuosos no es
mayor del 5 %. Un ingeniero de control de calidad que no cree en la afirmacin del fabricante, podra buscar apoyar la hiptesis de investigacin de que
el fabricante no est dicindole la verdad a la compaa.
El apoyo para est hiptesis de investigacin, tambin llamada hiptesis alternativa, se obtiene mostrando (usando los datos muestrales como evidencia)
que lo contrario a la hiptesis alternativa, llamado hiptesis nula, es falso.
Por lo tanto, una teora se comprueba demostrando que no hay evidencia que
sustente la teora opuesta; en cierto sentido, una prueba por contradiccin.
Como el ingeniero de control de calidad busca apoyo para la hiptesis alternativa de que la afirmacin por el fabricante es falsa, la hiptesis alternativa
es que el valor de p es mayor que 0 05.
Ha : p > 0 05
Si el ingeniero puede demostrar que los datos apoyan el rechazo de la hiptesis nula H0 : p = 0 05 en favor de la hiptesis alternativa Ha : p > 0 05, se
ha alcanzado el objetivo de investigacin. An cuando es comn hablar de
225

Sec 5.1. Elementos de una prueba de hiptesis

226

probar una hiptesis nula, el objetivo de investigacin suele ser demostrar


apoyo para la hiptesis alternativa, si dicho apoyo se justifica.
Una pregunta natural que surge al tratar de apoyar una hiptesis estadstica
es,
Cmo se usan los datos muestrales para decidir entre la hiptesis nula y la
hiptesis alternativa?
Por ejemplo, suponga que el ingeniero de control de calidad selecciona aleatoriamente n = 15 productos del inventario y se registra el nmero de productos
defectuosos X que hay en la muestra. Si todos los productos en la muestra
estn defectuosos, es decir, X = 15
Qu concluira el ingeniero acerca de la afirmacin del fabricante?
Si el fabricante en realidad dice la verdad (el porcentaje de productos defectuosos no es mayor del 5 %), no es imposible observar que X = 15 productos
estn defectuosos en la muestra de tamao n = 15, pero es altamente improbable. Es mucho ms probable que se observe X = 15 productos defectuosos
en la muestra de tamao n = 15 si la hiptesis alternativa fuera cierta. Entonces, se rechazara la hiptesis nula H0 : p = 0 05 en favor de la hiptesis
alternativa Ha : p > 0 05. Si se observan X = 14 productos defectuosos en la
muestra de tamao n = 15 (o cualquier otro valor grande de X ), un razonamiento anlogo nos llevara a la misma conclusin.
Cualquier prueba de hiptesis estadstica funciona exactamente de la misma
forma y est compuesta de los mismos elementos.

Elementos de una prueba estadstica


1. Hiptesis nula, H0
2. Hiptesis alternativa, Ha
3. Estadstico de prueba
4. Regin de rechazo

FaCyT-Matemticas

227

Cap 5. Prueba de hiptesis sobre los parmetros

Definicin 5.1. Hiptesis nula


La hiptesis nula es la hiptesis a ser probada y se denota por H0 .
Para el ejemplo, la hiptesis nula es
H0 : p = 0 05
Definicin 5.2. Hiptesis alternativa
La hiptesis alternativa (o investigacin) es la hiptesis a ser aceptada
en caso que H0 sea rechazada y se denota por Ha .
Por lo general la hiptesis alternativa es la que se quiere probar con base en
la informacin contenida en la muestra; as, para el ejemplo,
Ha : p > 0 05
Una hiptesis puede ser sencilla o compuesta. Si una hiptesis estadstica
asigna valores particulares a todos los parmetros desconocidos e identifica
la forma funcional de la distribucin de inters, recibe el nombre de hiptesis
sencilla o simple; de otra forma, se le conoce como hiptesis compuesta. Para
el ejemplo, si X sigue un modelo binomial con parmetros n = 15 y p,
entonces la hiptesis nula H0 es sencilla y la hiptesis alternativa Ha es una
hiptesis compuesta.
Definicin 5.3. Estadstico de prueba
Es una funcin de las variables aleatorias que se observaron en la
muestra en las que la decisin estadstica estar basada.
En el ejemplo, X que representa el nmero de productos defectuosos que hay
en la muestra de tamao n = 15 es el estadstico de prueba.
Definicin 5.4. Regin de rechazo (RR)
La regin de rechazo especifica los valores del estadstico de prueba
para el cul la hiptesis nula H0 ha de ser rechazada en favor de la
hiptesis alternativa Ha . Se denota como RR.

Universidad de Carabobo

Sec 5.1. Elementos de una prueba de hiptesis

228

Si, para una muestra particular, el valor calculado del estadstico de prueba
cae en la regin de rechazo RR, se rechaza la hiptesis nula H0 y se acepta
la hiptesis alternativa Ha . Si el valor del estadstico de prueba no cae en la
regin de rechazo RR, se acepta H0 .
Para el ejemplo, valores grandes de X conduce al rechazo de la hiptesis nula
H0 , entonces una regin de rechazo que se puede considerar es el conjunto
de todos los valores de X mayores o iguales a 5. Dicho de otra forma,
RR = {x : x 5}
Como se ha dicho valores grandes de X son favorables para la hiptesis
alternativa Ha : p > 0 05 y contradictorio para la hiptesis nula H0 : p = 0 05.
Entonces de manera intuitiva se puede seleccionar la regin de rechazo como
RR = {x : x k}
Pero surge una pregunta,
Qu valor se debe escoger para k?
En forma general, se busca algunos criterios objetivos para decidir cul valor
de k especifica una buena regin de rechazo de la forma {x : x k}.
Para cualquier regin de rechazo fija (determinada para un valor particular
de k ), existen dos tipos de errores que pueden cometerse al llegar a una
decisin. Se puede decidir a favor de la hiptesis alternativa Ha cuando H0
es verdadera (error tipo I), o se puede decidir a favor de H0 cuando Ha es
en realidad verdadera (error tipo II). La siguiente tabla muestra las distintas
alternativas con los posibles resultados:
H0 es cierta

H1 es cierta

Acepta H0

Decisin correcta

Error tipo II

Rechazar H0

Error tipo I

Decisin correcta
FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

229

Definicin 5.5. Error tipo I


Se comete un error tipo I si H0 es rechazada cuando H0 es verdadera.
La probabilidad de rechazar H0 , dado que H0 es cierta, se define como
la probabilidad del error tipo I y se denota por . El valor de se
denomina nivel de la prueba o nivel de significancia. Esto es:
= P (rechazar H0 | H0 es cierta)

Definicin 5.6. Error tipo II


Se comete un error tipo II si H0 es aceptada cuando Ha es verdadera. La probabilidad de no poder rechazar H0 , dado que H0 es falsa, se
define como la probabilidad del error tipo II y se denota por . Esto
es:
= P (no poder rechazar H0 | H0 es falsa)
Ejemplo 5.1. Para el ejemplo en que se muestrearon n = 15 productos. Se
desea probar

H0 : p = 0 05
vs

Ha : p > 0 05
El estadstico de prueba es X, el nmero de productos defectuosos. Calcule
si se selecciona RR = {x 5} como la regin de rechazo.
Solucin:
Por definicin,
= P (Error tipo I )
= P (rechazar H0 | H0 es verdadera)
= P (valor del estadstico de prueba est en RR |H0 es verdadera)
= P (X 5 | p = 0 05)
= 1 FB (4; 15, 0 05)
= 1 0 9994
= 0 0006
Universidad de Carabobo

Sec 5.1. Elementos de una prueba de hiptesis

230

Entonces, si se decide usar la regin de rechazo RR = {x 5}, se asume


un riesgo muy pequeo ( = 0 0006) de concluir que el fabricante no tiene
razn cuando en realidad el porcentaje de productos defectuosos no es mayor
del 5 %.

Ejemplo 5.2. En el ejemplo (5.1), La prueba es tan buena como para evitar concluir que el fabricante tiene la razn si en realidad el porcentaje de
productos defectuosos es mayor al 5 %? Suponga que p = 0 1, cul es la
probabilidad de que la muestra errneamente nos lleve a concluir que H0
es verdadera y que el fabricante tiene la razn?
Solucin:
Por definicin,
= P (Error tipo II ) = P (00 Aceptar00 H0 | Ha es verdadera)
= P (el valor del estadstico de prueba no est en RR | Ha es verdadera)
= P (X 4 | p = 0 1) = FB (4; 15, 0 1)
= 0 9873
Si se usa la regin de rechazo RR = {x 5}, la prueba por lo general
nos llevar a concluir que el fabricante tiene la razn en su afirmacin (con
probabilidad = 0 9873), an cuando p = 0 1.

Ejemplo 5.3. En el ejemplo (5.1), calcule el valor de si p = 0 3 y p = 0 5.
Solucin:
(0 3) = P (X 4 | p = 0 3) = FB (4; 15, 0 3) = 0 5155
y
(0 5) = P (X 4 | p = 0 5) = FB (4; 15, 0 5) = 0 0592

Observacin 5.1. El valor de depende del valor del parmetro p. Cuando
mayor sea la diferencia entre p y el valor hiptetico (nulo) de p = 0 05, menor
es la probabilidad de que no se rechace la hiptesis nula.
FaCyT-Matemticas

231

Cap 5. Prueba de hiptesis sobre los parmetros

Ejemplo 5.4. Para las regiones de rachazo RR = {x 2} y RR = {x 6},


calcule el nivel de la prueba y calcule si p = 0 1, p = 0 3 y p = 0 5.
Compare estos resultados con los valores obtenidos en los ejemplos anteriores donde RR = {x 5}.
Solucin:
Para la regin de rechazo RR = {x 2}:
= P (Error tipo I )
= P (rechazar H0 | H0 es verdadera)
= P (X 2 | p = 0 05)
= 1 FB (1; 15, 0 05)
= 1 0 8290
= 0 171
y la probabilidad del error tipo II para p = 0 1, p = 0 3 y p = 0 5 son:
(0 1) = P (X 1 | p = 0 1) = FB (1; 15, 0 1) = 0 5490
(0 3) = P (X 1 | p = 0 3) = FB (1; 15, 0 3) = 0 0353
(0 5) = P (X 1 | p = 0 5) = FB (1; 15, 0 5) = 0 0005
De la misma manera, para la regin de rechazo RR = {x 6}, la probabilidad
del error tipo I es:
= P (Error tipo I )
= P (rechazar H0 | H0 es verdadera)
= P (X 6 | p = 0 05)
= 1 FB (5; 15, 0 05)
= 1 0 9999
= 0 0001
y la probabilidad del error tipo II para p = 0 1, p = 0 3 y p = 0 5 son:
(0 1) = P (X 5 | p = 0 1) = FB (5; 15, 0 1) = 0 9978
(0 3) = P (X 5 | p = 0 3) = FB (5; 15, 0 3) = 0 7216
(0 5) = P (X 5 | p = 0 5) = FB (5; 15, 0 5) = 0 1509
Universidad de Carabobo

Sec 5.1. Elementos de una prueba de hiptesis

232


Observacin 5.2. Si se cambia la regin de rechazo para aumentar , entonces disminuir. Del mismo modo, si el cambio en la regin de rechazo
resulta en una disminucin en , entonces aumentar de manera uniforme.
Por tanto, y estn relacionados de manera inversa.
Para casi todas las pruebas estadsticas, si est fija en algn valor aceptablemente pequeo, disminuye cuando se aumenta el tamao muestral.
Ejemplo 5.5. Ahora si se muestrean n = 20 productos. Calcule la probabilidad del error tipo I y la probabilidad del error tipo II si p = 0 1,
p = 0 3 y p = 0 5 para cada una de las regiones de rechazo RR = {x 2},
RR = {x 5} y RR = {x 6}. Compare los resultados con los obtenidos
cuando se muestrearon n = 15 productos.
Solucin:
Sea X el nmero de productos defectuosos en la muestra de tamao n = 20.
Entonces:
Para la regin de rechazo RR = {x 2} la probabilidad del error tipo
I viene dada por:
= P (Error tipo I ) = P (X 2 | p = 0 05)
= 1 FB (1; 20, 0 05) = 1 0 7358
= 0 2642
Para la regin de rechazo RR = {x 2}, la probabilidad del error tipo
II si p = 0 1, p = 0 3 y p = 0 5 vienen dadas por:
(0 1) = P (X 1 | p = 0 1) = FB (1; 20, 0 1) = 0 3912
(0 3) = P (X 1 | p = 0 3) = FB (1; 20, 0 3) = 0 0076
(0 5) = P (X 1 | p = 0 5) = FB (1; 20, 0 5) = 0 0000
Para la regin de rechazo RR = {x 5} la probabilidad del error tipo
I viene dada por:
= P (Error tipo I ) = P (X 5 | p = 0 05)
= 1 FB (4; 20, 0 05) = 1 0 9974
= 0 0026
FaCyT-Matemticas

233

Cap 5. Prueba de hiptesis sobre los parmetros


Para la regin de rechazo RR = {x 5}, la probabilidad del error tipo
II si p = 0 1, p = 0 3 y p = 0 5 vienen dadas por:
(0 1) = P (X 4 | p = 0 1) = FB (4; 20, 0 1) = 0 9568
(0 3) = P (X 4 | p = 0 3) = FB (4; 20, 0 3) = 0 2375
(0 5) = P (X 4 | p = 0 5) = FB (4; 20, 0 5) = 0 0059
Para la regin de rechazo RR = {x 6} la probabilidad del error tipo
I viene dada por:
= P (Error tipo I ) = P (X 6 | p = 0 05)
= 1 FB (5; 20, 0 05) = 1 0 9997
= 0 0003
Para la regin de rechazo RR = {x 6}, la probabilidad del error tipo
II si p = 0 1, p = 0 3 y p = 0 5 vienen dadas por:
(0 1) = P (X 5 | p = 0 1) = FB (5; 20, 0 1) = 0 9887
(0 3) = P (X 5 | p = 0 3) = FB (5; 20, 0 3) = 0 4164
(0 5) = P (X 5 | p = 0 5) = FB (5; 20, 0 5) = 0 0207


5.2.

Pruebas para muestras grandes

Supngase que se desea probar un conjunto de hiptesis respecto a un parmetro con base en una muestra aleatoria X1 , X2 , . . . , Xn . En est seccin
se desarrollarn procedimientos de prueba de hiptesis que estn basados
en un estimador b que tiene una distribucin muestral normal (aproximadamente) con media y error estndar b, es decir, estimadores de tales que
b N (, 2b).
La tabla siguiente muestra algunos estimadores puntuales b para el parmetro
objetivo cuya distribucin muestral para tamao(s) de muestra(s) grandes
siguen de manera aproximada una distribucin normal con media y error
estndar b
Universidad de Carabobo

Sec 5.2. Pruebas para muestras grandes

234

Parmetro
objetivo

tamao(s)
muestral(es)

Estimador
puntual b

 
E b

Error
estndar b

X
Pb =
n

s
1 2

n1 y n2

X1 X2

n1 y n2

c1 P
c2
P

1 2

r
p1 p2

p1 p2

p(1p)
n

12
+
n1

22
n2

p1 (1 p1 )
+
n1

p2 (1p2 )
n2

Si 0 es un valor especifico de , se puede, por ejemplo, probar

H0 : = 0
vs

Ha : > 0
La siguiente figura (5.1) contiene una grfica que ilustra las distribuciones
muestrales de b para varios valores de

Figura 5.1: distribuciones muestrales del estimador b para varios valores de


FaCyT-Matemticas

235

Cap 5. Prueba de hiptesis sobre los parmetros

De manera intuitiva, si la realizacin del estimador b esta cerca a 0 , parece


razonable aceptar H0 . Pero, si en realidad > 0 , es ms probable que b sea
ms grande. En consecuencia, valores grandes de b (valores mayores a 0 en
una cantidad apropiada) favorecen al rechazo de H0 : = 0 y una aceptacin
de Ha : > 0 . Esto es, las hiptesis nula y alternativa, el estadstico de
prueba y la regin de rechazo son:
H0 : = 0
vs
Ha : > 0
Estadistico de prueba : b


RR = b > k para alguna seleccin de k
El valor real de k en la regin de rechazo RR se determina al fijar la probabilidad del error tipo I (el nivel de la prueba o significancia) y escoger k de
manera que


b
= P > k | = 0
Si H0 es verdadera, b tiene una distribucin normal con media 0 y error
estndar b. Por tanto
= P (rechazar H0 | H0 es verdadera)


= P b > k | = 0


k 0
=P Z>
b


k 0
=1P Z
b

y


k 0
P Z
=1
b
de la figura (5.2)
Universidad de Carabobo

Sec 5.2. Pruebas para muestras grandes

236

Figura 5.2: Regin de rechazo de muestra grande de cola superior

implica que:
k 0
= z1
b
y de aqu se tiene que:
k = 0 + z1 b

(5.1)

Entonces, si se desea probar una prueba al nivel de significancia , el valor


de k dado por la expresin (5.1), es la seleccin apropiada para k. De esta
manera la regin de rechazo viene dada por:
o n b
n
o
0
RR = b : b > 0 + z1 b = b :
> z1
b
Si
Z0 =

b 0
b

se usa como estadstico de prueba, la regin de rechazo tambin se puede


escribir como:
RR = {z0 > z1 }
Por lo tanto, una forma equivalente de la prueba de hiptesis, con un nivel
FaCyT-Matemticas

237

Cap 5. Prueba de hiptesis sobre los parmetros

de significancia , es la siguiente:
H0 : = 0
vs
Ha : > 0
Estadistico de prueba : Z0 =


RR = z0 > z1

b 0
b

Ejemplo 5.6. El vicepresidente de ventas de una gran empresa afirma que


los vendedores estn promediando no ms de 15 contactos de ventas por semana (le gustara aumentar esta cantidad). Como prueba de su afirmacin,
aleatoriamente se seleccionan n = 36 vendedores y se registra el nmero de
contactos hechos por cada uno para una sola semana seleccionada al azar.
La media y la varianza de las 36 mediciones fueron 17 y 9, respectivamente.
La evidencia contradice lo dicho por el vicepresidente? Use una prueba con
un nivel de significancia = 0 05.
Solucin:
El parmetro de inters es el nmero medio de contactos por semana, . Por
lo tanto,

H0 : = 15
vs

Ha : > 15
Se sabe que para n lo suficientemente grande, la media muestral X es un estimador puntual de que est distribuida normalmente en forma aproximada
con

y
X =
X =
n
de esta manera, el estadstico de prueba es:
Z0 =

X 0
X 0

=
X
/ n

y, la regin de rechazo es:


RR = {z0 > z1 }
Universidad de Carabobo

Sec 5.2. Pruebas para muestras grandes

238

como = 0 05, entonces z10 05 = z0 95 = 1 645, y


RR = {z0 > 1 645}
La varianza poblacional 2 no se conoce, pero puede estimarse de manera
muy precisa (n = 36 es suficientemente grande) con la varianza muestral
s2 = 9. El valor observado del estadstico de prueba es aproximadamente
x 0
17 15
=

=4
z0 =
s/ n
3/ 36
Debido a que valor observado de z0 se encuentra en la regin de rechazo, se
rechaza H0 : = 15. Entonces, al nivel de significancia = 0 05, la evidencia
es suficiente para indicar que la afirmacin del vicepresidente es incorrecta y
que el nmero promedio de contactos de venta por semana es mayor que 15.

Ejemplo 5.7. Se usan dos procesos para fabricar piezas forjadas que se utilizan en el montaje de un ala de avin. Un anlista de calidad afirma que
la fraccin de piezas forjadas defectuosas para el proceso 1 es mayor al del
proceso 2. De 200 piezas, seleccionadas del proceso 1, se tiene que 30 no
cumplen con las especificaciones de resistencia, mientras que de 300 piezas,
seleccionadas del proceso 2, 40 estn defectuosas. Los datos muestrales apoyan la afirmacin del anlista de calidad? Use una prueba con un nivel de
significancia = 0 01.
Solucin:
Si X1 y X2 denota el nmero de piezas defectuosas en las muestras de tamao
200 y 300, tomadas de los procesos 1 y 2, respectivamete. Entoces X1 y X2 son
variables aleatorias binomiales, con p1 y p2 denotando la probabilidad de que
la pieza seleccionada al azar del proceso 1 y 2 sea defectuosa, respectivamente.
En consecuencia, se desea probar la hiptesis nula

H0 : p1 p2 = 0
vs

Ha : p1 p2 > 0
El estadstico de prueba, est dado por:
Z=r

c1 P
c2 (p1 p2 )
P
p1 (1 p1 ) p2 (1 p2 )
+
n1
n2
FaCyT-Matemticas

239

Cap 5. Prueba de hiptesis sobre los parmetros

Como se esta considerendo la distribucin de Z bajo H0 , entonces p1 = p2 =


p. De esta manera
c1 P
c2
P
Z0 = r
p(1 p) p(1 p)
+
n1
n2
Ya que el valor de p no se conoce, se combina la informacin de las dos
muestras para obtener el estimador combinado
X1 + X2
Pb =
n1 + n2
Por lo tanto, el estadstico de prueba es:
Z0 = s

c1 P
c2
P
Pb(1 Pb) Pb(1 Pb)
+
n1
n2

Como P (Z 2 33) = 0 99, la regin de rechazo es


RR = {z0 2 33}
El valor observado del estadstico de prueba bajo H0 es:
z0 = r

30/200 40/300

70/500(1 70/500) 70/500(1 70/500)


+
200
300
0 0167
=
0 0318
= 0 5252

Como el valor observado de Z no est en la regin de rechazo, por lo tanto


no se puede rechazar la hiptesis nula en favor de la hiptesis alternativa.
En trminos de su aplicacin, se concluye que en el nivel de significancia de
= 0 01, la evidencia no apoya la afirmacin del anlista de calidad.

Universidad de Carabobo

Sec 5.2. Pruebas para muestras grandes

240

La prueba de

H0 : = 0
vs

Ha : < 0
se hace de modo anlogo, excepto que ahora se rechaza H0 para valores de b
que sean mucho menores que 0 . El estadstico de prueba sigue siendo
Z0 =

b 0
b

pero para un nivel de significancia fijo se rechaza la hiptesis nula cuando


z0 z . La figura (5.3) muestra la regin de rechazo

Figura 5.3: Regin de rechazo de muestra grande de cola inferior


Se llama Ha : < 0 una cola inferior alternativa y a RR = {z0 z } una
regin de rechazo de cola inferior. Al probar

H0 : = 0
vs

Ha : 6= 0
se rechaza H0 si b es mucho menor o mucho mayor que 0 . El estadstico de
prueba sigue siendo:
b 0
Z0 =
b
pero la regin de rechazo est ubicada simtricamente en las dos colas de la
distribucin de probabilidad para Z como se ilustra en la figura (5.4)
FaCyT-Matemticas

241

Cap 5. Prueba de hiptesis sobre los parmetros

Figura 5.4: Regin de rechazo de muestra grande de cola inferior


Entonces, se rechaza H0 si z0 z/2 o z0 z1/2 . De un modo equivalente,
se rechaza H0 si |z0 | z1/2 .
Resumen de las pruebas de hiptesis de nivel para muestras grandes
Pruebas de hiptesis de nivel para muestras grandes
H0 : = 0

> 0
Ha : < 0

6= 0

(alternativa de cola superior)


(alternativa de cola inferior)
(alternativa de dos colas)
b 0
Estadstico de prueba: Z0 =
b

(RR de cola superior)


{z0 > z1 }
Regin de rechazo : {z0 < z }
(RR de cola inferior)

{|z0 | > z1 2 } (RR de dos colas)

Como dicidir cul hiptesis alternativa usar para una prueba? La respuesta
depende de la hiptesis que se quiera apoyar. Por ejemplo, si se quiere detectar un aumento en el tiempo de armado promedio de un artculo, se debe
localizar la regin de rachazo en la cola superior de la distribucin normal.
Universidad de Carabobo

Sec 5.2. Pruebas para muestras grandes

242

Por otra manera, en un proceso de manucfactura si se quiere detectar un


cambio en la media de una caracteristica de calidad de un artculo, se debe localizar la regin de rechazo en ambas colas de la distribucin normal
estndar y emplear una prueba de dos colas.
Ejemplo 5.8. Una compaia petrolera pronto tendr que cambiar una gran
parte de su produccin de una frmula que contiene tetraetil-plomo a una
frmula sin plomo. Una caracteristica de calidad importante de la gasolina
es el ndice de octano en carretera. Si se usa gasolina con ndice demasiado
bajo para la comprensin del motor, habr golpeteo excesivo. La compaia ha
formulado el producto libre de plomo de manera que su ndice de octano en
carretera sea idntico al ndice del producto anterior, con plomo. Se realiza un
experimento en el cul se hacen 50 observaciones independientes del ndice
octnico en carretera para cada una de las formulaciones. Los resultados se
presentan en la siguiente tabla
Formulacin 1 (con plomo) Formulacin 2 (sin plomo)
n1 = 50
x1 = 90 70
s21 = 1 35

n2 = 50
x1 = 90 80
s22 = 1 06

Los datos presentan evidencia para sugerir una diferencia entre el ndice
octnico medio para la formulacin 1 (con plomo) y el ndice octnico medio
para la formulacin 2 (sin plomo). Use un nivel de significancia de 0 01.
Solucin:
Como se desea probar la hiptesis de que las media difieren, se debe probar

H0 : 1 2 = 0
vs

Ha : 1 2 6= 0
Como las muestras son independientes y ambas son grandes, el estadstico de
prueba est dado por
Z0 =

X 1 X 2 (1 2 )
q 2
1
2
+ n22
n1
FaCyT-Matemticas

243

Cap 5. Prueba de hiptesis sobre los parmetros

donde 12 y 22 son las respectivas varianzas poblacionales. La regin de rechazo de dos colas viene dada por:
RR = {|z0 | z1/2 }
donde = 0 01 y /2 = 0 01/2 = 0 005. Como P (Z 2 58) = 0 995,
entonces, la regin de rechazo es:
RR = {|z0 | 2 58}
Para muestras grandes, las varianzas muestrales dan buenas estimaciones
de sus correspondientes varianzas poblaciones. En consecuencia, el valor del
estadstico de prueba bajo H0 es:
z0 =

90 70 90 80 0
q
= 0 46
1 35
1 06
+
50
50

Este valor no est en la regin de rechazo, por lo tanto, no se puede rechazar


H0 . En consecuencia, en el nivel = 0 01, se concluye que no hay suficiente evidencia estadstica para sugerir una diferencia entre el ndice octnico
medio para la formulacin 1 (con plomo) y el ndice octnico medio para
la formulacin 2 (sin plomo). Como aplicacin, la compaa puede cambiar
gran parte de su producin por la nueva frmula sin plomo.


5.3.

Clculo de probabilidades de error tipo II

Considrese la prueba

H0 : = 0
vs

Ha : > 0
Supngase que en realidad = a donde (a > 0 ). La regin de rechazo es
de la forma:
RR = {b : b > k}
Universidad de Carabobo

Sec 5.3. Clculo de probabilidades de error tipo II

244

donde k = 0 + z1 b. Dado que la probabilidad del error tipo II es igual a


la probabilidad de no rechazar H0 cuando est es verdadera, entonces:
= P (Error tipo II) = P (No poder rechazar H0 | Ha es verdadera)
= P (el valor del estadstico de prueba no cae en la RR | Ha es verdadera)


= P b k | = a


= P b 0 + z1 b | = a


z1 b + 0 a
(5.2)
=P Z
b
Al sustituir cualquier valor a de la hiptesis alternativa en la expresin
anterior, se puede calcular el correspondiente valor de la probabilidad del
error tipo II. Para una muestra fija de tamao n, el valor de depende de
la distancia entre a y 0 . Si a est cerca de 0 , el valor de a es difcil de
detectar, y la probabilidad de no poder rechazar H0 cuando esta es falsa
tiende a ser grande. En cambio, si a est lejos de 0 , el valor de a es fcil de
detectar y la probabilidad de no poder rechazar H0 cuando esta es falsa es
mucho menor. Como se observ en la Seccin (5.1), para un valor especificado
de , la probabilidad de no poder rechazar H0 cuando esta es falsa puede
hacerse menor si se escoge un tamao muestral n grande. Para los otros casos,
se pueden desarrollar expresiones similares a (5.2).
Ejemplo 5.9. Considere el ejemplo (5.6). Si realmente = 16, cul es la
probabilidad de que la prueba no detecte este valor? es decir, la probabilidad
de que la prueba no pueda rechazar H0 dado que esta es falsa.
Solucin:
= P (Error tipo II ) = P (no poder rechazar H0 | Ha es verdadera)
= P (el valor del estadstico de prueba no este en RR | Ha es verdadera)

= P X k | = 16
donde

3
k = 0 + z0 95 = 15 + 1 645
n
36
= 15 8225
FaCyT-Matemticas

245

Cap 5. Prueba de hiptesis sobre los parmetros

y

= P X 15 8225 | = 16


15 8225 16

=P Z
3/ 36
= P (Z 0 36)
= 0 3594
En la figura (5.5) se ilustra la regin de rechazo, la probabilidad del error tipo
I y la probabilidad del error tipo II .

Figura 5.5: Regin de rechazo para el ejemplo (5.9) (k = 15 8225)




5.4.

Determinacin del tamao muestral para


la prueba Z

Supngase que se desea probar

H0 : = 0
vs

Ha : > 0
Para y fijos, se tiene que:
= P X > k | = 0
Universidad de Carabobo

k 0

Z>
/ n


=

Sec 5.4. Determinacin del tamao muestral para la prueba Z 246


de aqu, se tiene que:
k 0
= z1
/ n



k = 0 + z1
n

(5.3)

de la misma forma
= P X k | = a



v k a

P Z
=
/ n

de aqu:
k a
= z
/ n
y



k = a + z
n
igualando las ecuaciones (5.3) y (5.4),





= a + z
0 + z1
n
n

(5.4)

y despejando n, se tiene que:


n=

(z1 z )2 2
(a 0 )2

(5.5)

es el tamao muestral para satisfacer el nivel de significancia y la probabilidad del error tipo II .
Se obtendra exactamente la misma expresin (5.5) para el tamao muestral
n ( y fijos), para probar

H0 : = 0
vs

Ha : < 0
En el caso en que se desea obtener el tamao muestral n para probar

H0 : = 0
vs

Ha : 6= 0
FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

247

se podra utilizar un procedimiento semejante al que se acaba de emplear


para obtener la frmula para n, la cul viene dada por:
n=

(z1/2 z )2 2
(a 0 )2

(5.6)

Ejemplo 5.10. Suponga que el vicepresidente del ejemplo (5.6), desea probar

H0 : = 15
vs

Ha : = 16
con = = 0 05. Determine el tamao muestral que asegura esta precisin.
Suponga que 2 es aproximadamente 9.
Solucin:
Como = = 0 05, se deduce que z1 = z0 95 = 1 645 y z = z0 05 =
1 645. Entonces
(z1 + z )2 2
(1 645 + 1 645)2 (9)
n=
=
(a 0 )2
(16 15)2
= 97 4
Por lo tanto, deben usarse n = 98 observaciones para satisfacer que = =
0 05.


5.5.

Nivel de significancia alcanzado o valor p

Definicin 5.7. Si W es un estadstico de prueba, el valor p denotado


por vp , o nivel de significancia alcanzado, es el nivel ms pequeo de
significancia para el cual la informacin observada indica que la
hiptesis nula debe ser rechazada.
Dado que el valor p depende del estadstico de prueba, entonces esta cantidad
Vp es un estadstico que representa el valor ms pequeo de para el cul
Universidad de Carabobo

Sec 5.5. Nivel de significancia alcanzado o valor p

248

se puede rechazar la hiptesis nula. Cuanto ms pequeo sea el vp , es ms


fuerte la evidencia de que la hiptesis nula debe ser rechazada. Por lo tanto,
si:
vp > la hiptesis nula no puede ser rachazada.
vp la hiptesis nula es rechazada para ese valor de .
Ejemplo 5.11. Considere el ejemplo (5.1) donde se muestrearon n = 15
productos. Se desea probar

H0 : p = 0 05
vs

Ha : p > 0 05
El estadstico de prueba es X, el nmero de productos defectuosos en la muestra de tamao n = 15, cul es el valor p si X = 4? Interprete el resultado.
Solucin:
Como H0 debera ser rechazada para valores grandes de X. Entonces, el valor
p para est prueba est dado por
P (X 4)
donde X tiene una distribucin binomial con n = 15 y p = 0 05. Entonces,
vp = P (X 4)
= 1 P (X 3)
= 1 FB (3; 15, 0 05)
= 1 0 9945
= 0 0055
Por tanto, vp = 0 0055 representa el valor ms pequeo de para el cul la
hiptesis nula es rechazada, en consecuencia, si se especifica cualquier valor
de 0 0055 sera llevado a rechazar H0 y concluir que el fabricante no
tiene la razn acerca de su afirmacin.

FaCyT-Matemticas

249

Cap 5. Prueba de hiptesis sobre los parmetros

El ejemplo (5.11) indica el mtodo general para calcular valores p. Si se quiere


rechazar H0 en favor de Ha y RR = {w k}, el valor p relacionado con un
valor observado w0 de W est dado por
vp = P (W w0 | H0 es cierta)
De la misma manera, si se quiere rechazar H0 en favor de Ha y RR = {w
k}, el valor p relacionado con un valor observado w0 de W est dado por
vp = P (W w0 | H0 es cierta)
Para una alternativa de dos colas el clculo del valor p se ilustra en el siguiente
ejemplo
Ejemplo 5.12. Considere el ejemplo (5.8). Encuentre el valor p para el estadstico de prueba.
Solucin:
El valor del estadstico de prueba, calculado a partir de los datos observados,
fue z0 = 0 46. Como esta es una prueba de dos colas, el valor p viene dado
por:
vp = P (Z 0 46 Z 0 46)
= P (Z 0 46) + P (Z 0 46)
= 2P (Z 0 46) = 2 [1 P (Z 0 46)]
= 2[1 0 6772) = 2(0 3228]
= 0 6456
Por lo tanto, si = 0 01, un valor menor que vp = 0 6456, no se puede
rechazar H0 .

En resumen, para las pruebas de distribuciones normales, si z0 es el valor
calculado del estadstico de prueba, entonces el valor p viene dado por:

2[1 P (Z |z0 |)] para una prueba de dos colas


vp = 1 P (Z z0 )
para una prueba de cola superior

P (Z z0 )
para una prueba de cola inferior
Universidad de Carabobo

Sec 5.6. Pruebas de hiptesis sobre la media de una distribucin


normal, varianza desconocida
250
Es muy til presentar los resultados de una prueba de hiptesis en trminos
del valor p, ya que esto conlleva mucha ms informacin para el experimentador que la simple proposicin rechazar H0 o no se puede rechazar H0 . Es
decir, el rechazo de H0 con un nivel de significancia 0 05 tiene un significado
mayor si el valor del estadstico de prueba esta bien ubicado en la regin
crtica, excediendo por ms del 5 % al valor crtico, que si apenas excede este
valor.

5.6.

Pruebas de hiptesis sobre la media de una


distribucin normal, varianza desconocida

Supngase que X1 , X2 , . . . , Xn es una muestra aleatoria de tamao n de una


distribucin normal con media y varianza 2 (ambas desconocidas). De la
seccin (2.4.2), se sabe que la variable:

T =

S/ n

tiene una distribucin t de Student con n 1 grados de libertad.


Como la distribucin t de Student es simtrica, la regin de rechazo para
una prueba de hiptesis H0 : = 0 con muestras pequeas, se determina
de forma semejante a la empleada con el estadstico Z de una muestra grande.
Por analoga con la prueba Z, la regin de rechazo para la alternativa de cola
superior Ha : > 0 viene dada por:
RR = {t0 > t1,n1 }
donde t1,n1 es el valor tal que P (T < t1,n1 ) = 1 para una distribucin t de Student con n 1 grado de libertad.
Resumen de las pruebas de hiptesis de nivel para muestras pequea para

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

251

Prueba para muestras pequea para (varianza


desconocida)
Suposiciones: X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con media
H0 : = 0

> 0
Ha : < 0

6= 0

(alternativa de cola superior)


(alternativa de cola inferior)
(alternativa de dos colas)

X 0

Estadstico de prueba: T0 =
S/ n

(RR de cola superior)


{t0 t1,n1 }
Regin de rechazo : {t0 t,n1 }
(RR de cola inferior)

{|t0 | t1 2 ,n1 } (RR de dos colas)

Ejemplo 5.13. Un ingeniero que trabaja para una fabricante de llantas investiga la duracin promedio de un compuesto nuevo de caucho. Para ello,
construye 16 llantas y las prueba en una carretera hasta alcanzar el fin de la
vida til de stas. Los datos, en Km, obtenidos son los siguientes:

60613
60545

59836
60257

59554
60000

60252
59997

59784
69947

60221
60135

60311
60220

50040
60523

al ingeniero le gustara demostrar que la vida til promedio de las nuevas


llantas exceden los 60 mil km. Proponga y pruebe la hiptesis apropiadas.
Obtenga una conclusin con = 0 05.
Solucin:
Supngase que el tiempo de duracin de las nuevas llantas tiene una distriUniversidad de Carabobo

Sec 5.6. Pruebas de hiptesis sobre la media de una distribucin


normal, varianza desconocida
252
bucin normal. Se desea probar

H0 : = 60000
vs

Ha : > 60000
El estadstico de prueba es:
T0 =

X 0

S/ n

y la regin de rechazo es:


RR = {t0 t1,n1 } = {t0 t0 95,15 } = {t0 1 721}
Puesto que x = 60139 69 y s2 = 13292850 y n = 16, el valor del estadstico
de prueba bajo H0 es:
t0 =

x 0
60139 69 60000
=

= 0 153
s/ n
3645 936/ 16

Dado que t0 = 0 153 < 1 721, no se puede rechazar H0 al nivel de significancia


de = 0 05. De este modo, no se tiene evidencia fuerte que permita concluir
que la vida til promedio de las nuevas llantas exceden los 60 mil km.

Ejemplo 5.14. Cul es el valor p relacionado con el estadstico de prueba
del ejemplo (5.13)?
Solucin:
Como la hiptesis nula debe ser rechazada si t0 es grande, el valor mnimo
de para el cul la hiptesis nula puede ser rechazada es el valor p, esto es:
vp = P (T 0 153)
donde T tiene una distribucin t de Student con n1 = 15 grados de libertad.
Por lo tanto, el valo p viene dado por:
vp = P (T15 0 153) = 1 P (T15 < 0 153)

FaCyT-Matemticas

253

Cap 5. Prueba de hiptesis sobre los parmetros

por interpolacin lineal, se tiene que P (T15 < 0 153) 0 553, de esta manera
el valor p es:
vp = 1 P (T15 < 0 153) 1 0 553 = 0 447
Como vp > 0 05, no se puede rechazar H0 al nivel de significancia de =
0 05.


5.7.

Pruebas de hiptesis sobre las medias de


dos distribuciones normales, varianzas desconocidas

Supngase que se necesita probar hiptesis que compara las medias de dos
distribuciones normales donde las varianzas x2 y y2 son desconocidas. Para
probar ests hiptesis se utilizar la distribucin t de Student. Se pueden
suponer dos casos. En el primer caso, se supondr que las varianzas de las
dos distribuciones son desconocidas pero iguales. En el segundo, se supondr
que x2 y y2 son desconocidas y distintas.

5.7.1.

Caso 1: x2 = y2 = 2

Supngase que X1 , X2 , . . . , Xnx y Y1 , Y2 , . . . , Yny son muestras aleatorias independientes seleccionadas de dos distribuciones normales con media x y
varianza 2 , y media y y varianza 2 , respectivamente. De la subseccin
(2.5.2), se sabe que la variable:
T =

donde:
Sp2 =

X Y (x y )
q
Sp n1x + n1y

(nx 1)Sx2 + (ny 1)Sy2


nx + ny 2

tiene una distribucin t de Student con nx ny 2 grados de libertad. Si se


desea probar la hiptesis nula H0 : x y = D0 para algn valor fijo D0 ,
Universidad de Carabobo

Sec 5.7. Pruebas de hiptesis sobre las medias de dos


distribuciones normales, varianzas desconocidas

254

contra alternativas de cola superior, cola inferior, y de dos colas se puede


proceder de la misma forma que en la prueba de muestras grandes, excepto
que se utiliza el estadstico t y las tablas de las distribuciones t de Student.
Resumen de las pruebas de hiptesis de nivel para muestras pequeas para
x y

Prueba para muestras pequeas para x y


Suposiciones: muestras independientes de distribuciones normales
con x2 = y2
H0 : x y = D0

x y > D0
Ha : x y < D0

6= D
x

(alternativa de cola superior)


(alternativa de cola inferior)
(alternativa de dos colas)

Estadstico de prueba: T0 =

Regin de rechazo :

(nx 1)Sx2 + (ny 1)Sy2


X Y D0
q
, donde Sp2 =
nx + ny 2
Sp n1x + n1y

{t0 t1,nx +ny 2 }

(RR de cola superior)

{t0 t,nx +ny 2 }


(RR de cola inferior)

{|t | t
0
1 2 ,nx +ny 2 } (RR de dos colas)

Ejemplo 5.15. Dos distintos tipos de botellas de vidrio son adecuados para
su utilizacin en una embotelladora de bebidas gaseosas. La resistencia a la
presin interna de un envase es una caracterstica de calidad importante. De
una muestra aleatoria de n1 = 12 botellas del tipo 1, la resistencia media y
desviacin son x1 = 175 8 psi y s1 = 3 4 psi, respectivamente. Mientras que
una muestra aleatoria de n2 = 10 botellas del tipo 2, la resistencia media y
desviacin son x2 = 181 3 psi y s2 = 3 8 psi, respectivamente. La compaa
no utilizar el diseo de la botella 2 a no ser que su resistencia a la presin
exceda la del diseo 1 en, por lo menos, 5 psi. Suponga que la resistencia a
la presin interna es una variable normal para ambos diseos. Utilizar el
diseo 2, con base en los datos muestrales? Utilice = 0 01.

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

255

Solucin:
Se desea probar la hiptesis de que la resistencia a la presin interna de las
botellas del diseo 2 excede a la presin interna de las botellas del diseo 1
en, por lo menos, 5 psi. Por lo tanto,

H0 : 2 1 = 5
vs

Ha : 2 1 > 5
Suponiendo que 12 = 22 , el estadstico de prueba es:
T0 =

X 2 X 1 D0
q
Sp n11 + n11

donde:
Sp2 =

(n1 1)S12 + (n1 1)S12


n1 + n1 2

La regin de rechazo viene dada por:


RR = {t0 t1,n1 +n1 2 } = {t0 t0 99,20 }
donde t0 99,20 es el valor cuantil tal que
P (T20 t0 99,20 ) = 0 99
De la tabla (**), se tiene que t0 99,20 = 2 528. Por lo tanto,
RR = {t0 2 528}
Para los datos muestrales, la estimacin para la varianza comn es:
(n1 1)s21 + (n1 1)s21
11(3 4)2 + 9(3 8)2
=
n1 + n1 2
20
257 12
=
20
= 12 86

s2p =

Universidad de Carabobo

Sec 5.7. Pruebas de hiptesis sobre las medias de dos


distribuciones normales, varianzas desconocidas

256

y el estadstico de prueba bajo H0 es:


t0 =

X 1 X 2 D0
181 3 175 8 5
q
q
=
1
1
1
1
sp n1 + n1
(3 59) 12
+ 10

0 5
1 54
= 0 325

Ya que t0 = 0 325 < 2 528 no se puede rechazar H0 . Al nivel de significancia


de = 0 01, no hay evidencia suficiente para utilizar el diseo de la botella
2.


5.7.2.

Caso 2: x2 6= y2

Algunas veces no es razonable suponer que las varianzas desconocidas x2 y


y2 sean iguales. En este caso no existe una estadstica t exacta para probar
H0 : x y = D0 . Sin embargo, de la seccin (2.5.3), la variable aleatoria
T =

X Y (x y )
q
S2
Sx2
+ nyy
nx

(5.7)

tiene, de manera aproximada, una distribucin t de Student con grados de


libertad dados por:
2
Sx2 /nx + Sy2 /ny
=
2 2
(Sy2 /ny )
(Sx2 /nx )2
+ ny 1
nx 1
Si se desea probar la hiptesis nula H0 : x y = D0 para algn valor fijo D0 ,
contra alternativas de cola superior, cola inferior, y de dos colas se prueban
de la misma forma que cuando x2 = y2 , excepto de que ahora se emplea
T como estadstico de prueba, con el reemplazo de n1 + n2 2 por para
determinar el nmero de grados de libertad.
Ejemplo 5.16. Dos compaas fabrican un material de caucho para su uso
en aplicaciones automovilsticas. La pieza estar sujeta a un desgaste abrasivo en el campo de aplicacin, as que se decide comparar en una prueba el
FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

257

material producido por cada compaa. Para ello se toman 15 muestras de


material producido por cada compaa y se someten a una prueba de abrasin,
donde se observa el desgaste despus de 1000 ciclos. Para la compaa 1, la
media y la desviacin estndar muestral del desgaste es x1 = 20 mg/1000
ciclos y s1 = 6 mg/1000 ciclos, mientras que para la compaa 2, la media
y la desviacin estndar muestral del desgaste es x2 = 15 mg/1000 ciclos
y s2 = 15 mg/1000 ciclos. Los datos apoyan la afirmacin de que ambas
compaas producen material que tienen el mismo desgaste promedio? Utilice = 0 05 y suponga que las varianzas desconocidas son distintas.
Solucin:
Los parmetros de inters es el desgaste promedio 1 y 2 de las compaas 1
y 2, respectivamente. La hiptesis nula y alternativa para esta situacin son:

H0 : 2 1 = 0
vs

Ha : 2 1 6= 0
El estadstico de prueba es
X Y
T0 = q 2
Sy2
Sx
+
nx
ny
La regin de rechazo es
RR = {|t0 | t1/2,v }
donde
=

s2x /nx + s2y /ny


(s2x /nx )2
nx 1

2
2

(s2y /ny )

2=

ny 1

(62 /15 + 152 /15)


(62 /15)2
151

(152 /15)2
151

2 = 18 99 18

como = 0 05, se rechaza H0 si RR = {|t0 | t0 975,18 = 2 101} Para los


datos obtenidos en la muestra, se tiene que:
xy
20 15
5
t0 = q 2
=
= 1 199
=q
2
sy
sx
4
1713
62
152

+ ny
+ 15
nx
15
Puesto que 2 101 < t0 < 2 101, no se puede rechazar H0 con el nivel de
significancia = 0 05. No hay evidencia fuerte que indique que el desgaste
abrasivo promedio sea diferente para las dos compaas.
Universidad de Carabobo

Sec 5.8. Pruebas de hiptesis sobre la varianza de una


distribucin normal

258


5.8.

Pruebas de hiptesis sobre la varianza de


una distribucin normal

Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con


media desconocida y varianza 2 desconocida. Se sabe del Teorema (2.11)
que:
(n 1)S 2
2 =
2
tiene una distribucin chi-cuadrado con = n1 grados de libertad. Suponga
que se necesita probar H0 : 2 = 02 para algn valor fijo 02 contra Ha : 2 >
02 . Se puede usar
(n 1)S 2
20 =
02
como el estadstico de prueba, pero cmo se debe seleccionar la regin de
rechazo RR?
De manera intuitiva, valores grandes de S 2 (que estima el verdadero valor
de 2 ) con respecto a 02 , ms fuerte es la evidencia que apoye la hiptesis
H0 : 2 > 02 . Observe que S 2 es grande con respecto a 02 si y slo si
20 =

(n 1)S 2
02

es grande. Entonces, una regin de rechazo para probar H0 : 2 = 02 contra


Ha : 2 > 02 puede ser de la forma RR = {20 k} para una constante k
apropiada. Si se desea una prueba para la cual la probabilidad de un error
tipo I es , se usa la regin de rechazo
RR = {2 21,n1 }
donde 21,n1 es el valor cuantil tal que

P 2 21,n1 = 1
Si se desea probar H0 : 2 = 02 contra Ha : 2 < 02 un razonamiento anlogo
lleva a una regin de rechazo ubicada en la cola inferior de la distribucin
FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

259

2 . Por otra parte, se puede probar H0 : 2 = 02 contra Ha : 2 6= 02 para el


cul la regin de rechazo se ubica en las dos colas de la distribucin 2 .
Resumen de las pruebas de hiptesis de nivel para 2
Prueba de hiptesis para la varianza poblacional 2
Suposiciones: X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con media y varianza 2 .
H0 : 2 = 02

2
2

> 0
Ha : 2 < 02

2 6= 2
0

(alternativa de cola superior)


(alternativa de cola inferior)
(alternativa de dos colas)

(n 1)S 2
Estadstico de prueba: 20 =
02

2
2

{0 1,n1 }

Regin de rechazo :

{20

{2
0

2,n1 }
21 ,n1
2

(RR de cola superior)


(RR de cola inferior)
20

21 ,n1 }
2

(RR de dos colas)

Ejemplo 5.17. Se inserta un remache en un agujero. Si la desviacin estndar del dimetro del agujero es mayor que 0 01 mm, entonces existe una
probabilidad inaceptablemente grande de que el remache no entre en el agujero. Se toma una muestra aleatoria de n = 15 piezas, y se mide el dimetro del
agujero. La desviacin estndar muestral de las mediciones de estos dimetros es s = 0 008 mm existe evidencia fuerte que indique que la desviacin
estndar del dimetro del agujero es mayor que 0 01 mm? Utilice = 0 01.
Solucin:
Se desea probar la hiptesis de que la desviacin estndar del dimetro de
remache es mayor que 0 01 mm. Por tanto,

2
2

H0 : = (0 01)
vs

Ha : 2 > (0 01)2
Universidad de Carabobo

Sec 5.8. Pruebas de hiptesis sobre la varianza de una


distribucin normal

260

El estadstico de prueba es:


20 =

(n 1)S 2
02

y la regin de rechazo, viene dada por:


RR = {20 21,n1 } = {20 20 99,14 }
De la tabla (**), se tiene que 20 99,14 = 29 17. Por lo tanto, la regin de
rechazo es:
RR = {20 29 17}
Para los datos muestrales, el valor del estadstico de prueba bajo H0 es:
(n 1)S 2
14(0 008)2
=
02
(0 01)2
= 8 96

20 =

Como 20 = 8 96 < 29 17 no se puede rechazar H0 . Al nivel de significancia de


= 0 01, no hay evidencia suficiente que indique que la desviacin estndar
del dimetro del remache es mayor que 0 01 mm.

Ejemplo 5.18. Considere el ejemplo (5.17). Encuentre el valor p de esta
prueba.
Solucin:
El valor p es la probabilidad de que una variable aleatoria 2 con 14 grados
de libertad sea mayor que el valor observado de 8 96. Entonces,

vp = P 2 8 96

= 1 P 2 8 96
De la figura (5.18)
FaCyT-Matemticas

261

Cap 5. Prueba de hiptesis sobre los parmetros

Figura 5.6: Valor p para el ejemplo (5.17)


el rea sombreada excede de 0 01, y entonces el valor p es mayor que 0 01.
Por lo tanto, no se puede rechazar H0 .
Para obtener un valor aproximado del valor p se puede utilizar interpolacin
o extrapolacin lineal. De la tabla (***), se ve que, para 14 grados de libertad
20 1 = 7 79 y 20 9 = 21 07. Entonces, se deduce que

0 1 < P 2 8 96 < 0 9
Usando interpolacin lineal se obtiene que:

P 2 8 96 0 1705
y de esta manera, el valor p (aproximado) para la prueba es:
vp 1 0 1705
= 0 8295

Ejemplo 5.19. Un fabricante de pernos o esprragos esta convencido de que
esta produciendo pernos con varianzas en los dimetros de 0 01. Con propsitos de control de calidad, se obtuvo una muestra de 25 pernos de una lnea
de produccin para estimar la varianza de todos los dimetros, la cul result
ser s2 = 0 009 mm2 Los datos contradicen la afirmacin del fabricante de
pernos? Determine el valor p para la prueba. Qu concluira si se elige un
nivel de significancia de 0 05?

Universidad de Carabobo

Sec 5.8. Pruebas de hiptesis sobre la varianza de una


distribucin normal

262

Solucin:
Se requiere una prueba de dos colas,

H0 : = 0 01
vs

Ha : 2 6= 0 01
El valor del estadstico de prueba bajo H0 es:
24(0 009)
(n 1)s2
=
2
0
0 01
= 21 6

20 =

Como se tiene una alternativa de dos colas y la distribucin chi-cuadrado es


asimtrica, entonces para el clculo del valor p, no se puede proceder de la
misma forma que en las pruebas de la distribucin normal o la distribucin t
de Student que son distribuciones simtricas. En consecuencia, se tiene que
aproximar el valor p para esta prueba. De la tabla (***), se tiene que para
24 grados de libertad 20 025 = 12 40 y 20 975 = 39 38. Como indica la figura
(5.7)

Figura 5.7: Valor p para el ejemplo (5.17)


El valor del estadstico de prueba se encuentra ms cerca del valor crtico del
extremo izquierdo de la distribucin chi-cuadrado con 24 grados de libertad.
Por lo tanto, se calcula P (2 21 6) y como se debe incluir un rea correspondiente igual en la cola superior, entonces el valor p de la prueba viene
dado por

vp = 2P 2 21 6
Como para 24 grados de libertad 20 1 = 15 66 y 20 9 = 33 20, usando interpolacin lineal, se tiene que:

P 2 21 6 0 3709
FaCyT-Matemticas

263

Cap 5. Prueba de hiptesis sobre los parmetros

y de esta forma el valor p (aproximado) de la prueba es:


vp 2(0 3709) = 0 7418
Ya sea que se use los valores crticos obtenidos de la tabla (**) o el valor p
obtenido (es evidente que = 0 05 es menor que el valor p), por lo tanto
no se puede rechazar la afirmacin del fabricante de pernos en el nivel de
= 0 05.


5.9.

Pruebas de hiptesis sobre la varianzas de


dos distribuciones normales

Supngase que X1 , X2 , . . . , Xnx y Y1 , Y2 , . . . , Yny son muestras aleatorias independientes seleccionadas de dos distribuciones normales con media x y
varianza x2 , y media y y varianza y2 , respectivamente, donde las varianzas
x2 y y2 son desconocidas. Si Sx2 y Sy2 son las varianzas muestrales, entonces
del Teorema (2.15), se tiene que:
F =

y2 Sx2
Sx2 /x2
=
Sy2 /y2
x2 Sy2

sigue una distribucin F con (nx 1) grados de libertad en el numerador


y (ny 1) grados de libertad en el denominador. Supngase que se desea
probar la hiptesis nula H0 : x2 = y2 contra la alternativa H0 : x2 > y2 .
Como las varianzas muestrales Sx2 y Sy2 estiman las respectivas varianzas
poblacionales, de manera intuitiva, se rechaza H0 en favor de Ha si Sx2 es
mucho mayor que Sy2 . Por lo tanto, la forma de la regin de rechazo es:
RR = {Sx2 /Sy2 k}
en donde k se elige de modo que la probabilidad de cometer un error tipo
I sea . El valor apropiado de k depende de la distribucin de probabilidad
del estadstico Sx2 /Sy2 bajo H0 . De esta manera,

= P Sx2 /Sy2 k | x2 = y2
Universidad de Carabobo

Sec 5.9. Pruebas de hiptesis sobre la varianzas de dos


distribuciones normales

264

Dada la hiptesis nula que x2 = y2 , se deduce que F = Sx2 /Sy2 y la regin de


rechazo RR dada antes es equivalente a
RR = {F k} = {F f1 }
en donde f1 es el valor cuantil de la distribucin F con v1 = nx 1 y v2 =
ny 1 grados de libertad en el numerador y denominador, respectivamente,
tal que
P (F f1 ) = 1
Para la prueba de la hiptesis nula H0 : x2 = y2 contra la alternativa
H0 : x2 < y2 o la prueba de la hiptesis nula H0 : x2 = y2 contra la alternativa H0 : x2 6= y2 se puede proceder de una forma anloga para obtener
la regin de rechazo para un tamao del error tipo I . Para la hiptesis
alternativa de cola inferior, se rechaza H0 en favor de Ha si Sx2 es mucho
menor que Sy2 y para la hiptesis alternativa de dos colas se rechaza H0 en
favor de Ha si Sx2 es suficientemente diferente de Sy2 . En la siguiente tabla se
presenta un resumen de las pruebas de hiptesis de nivel sobre la varianzas
de dos distribuciones normales
Prueba de hiptesis para x2 = y2
Suposiciones: muestras independientes de poblaciones normales.
H0 : x2 = y2

2
2

x > y
Ha : x2 < y2

2
x 6= y2

(alternativa de cola superior)


(alternativa de cola inferior)
(alternativa de dos colas)

s2
Estadstico de prueba bajo H0 : f0 = x2
sy

(RR de cola superior)


{f0 f1,nx 1,xy 1 }
RR : {f0 f,nx 1,xy 1 }
(RR de cola inferior)

{f0 f1 2 ,nx 1,xy 1 o f0 f 2 ,nx 1,xy 1 } (RR de dos colas)

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

265

Ejemplo 5.20. Consider el ejemplo (5.15) en donde se asumi que las varianzas eran iguales al comparar la resistencia a la presin interna de dos
tipos de botellas Existe alguna evidencia que indique una diferencia en las
varianzas poblacionales? Utilice = 0 1.
Solucin:
Se desea probar

2
2

H0 : 1 = 2
vs

Ha : 12 6= 22
El estadstico de prueba bajo H0 es:
F0 =

S12
S22

Dado que n1 = 12, n2 = 10 y = 0 1, la regin de rechazo es:


RR = {f0 f1 2 ,n1 1,x2 1 o f0 f 2 ,n1 1,x2 1 }
= {f0 f0 95,11,9 o f0 f0 05,11,9 }
De la tabla (***), se tiene que f0 95,11,9 = 3 10 y f0 05,11,9 = 1/f0 95,9,11 =
1/2 90 = 0 35. De esta manera, la regin de rechazo es:
RR = {f0 3 10 o f0 0 35}
Dado que s21 = (3 4)2 y s22 = (3 8)2 , el valor de estadstico de prueba bajo H0
es:
s2
11 56
= 0 80
f0 = 12 =
s2
14 44
Como f0 05,11,9 = 0 35 < 0 80 < f0 95,11,9 = 3 10, no se puede rechazar H0 con
el nivel de significancia = 0 1. Por lo tanto, no hay evidencia fuerte que
indique una diferencia en las varianzas poblacionales.

Ejemplo 5.21. Considere el ejemplo (5.20). Encuentre el valor p de esta
prueba.

Universidad de Carabobo

Sec 5.9. Pruebas de hiptesis sobre la varianzas de dos


distribuciones normales

266

Solucin:
Dado que el valor calculado esta ms prximo a la cola inferior de la distribucin F que a la cola superior (ver figura (***)), entonces se calcula la
probabilidad de que una variable aleatoria F con 11 y 9 grados de libertad en
el numerador y denominador, respectivamente, sea menor que 0 80 es , esto
es:

Figura 5.8: Valor p para el ejemplo (5.20)

P (F 0 80)
dado que es arbitrario el hecho de cul poblacin sea identificada como la
uno, el valor del estadstico de prueba bajo H0 tambin pud calcularse
como
14 44
s2
= 1 25
f0 = 22 =
s1
11 56
La probabilidad de que una variable aleatoria F con 9 y 11 grados de libertad
en el numerador y denominador, respectivamente, sea mayor que 1 25 es,
esto es:
P (F 1 25) = 1 P (F 1 25)
1
De esta manera, el valor p del estadstico de prueba es la suma de las dos
probabilidades
vp =
Como vp > 0 1 no es posible rechazar la hiptesis nula H0 .

FaCyT-Matemticas

267

5.10.

Cap 5. Prueba de hiptesis sobre los parmetros

Potencia de las pruebas

La calidad de una prueba es medida por y , las probabilidades de errores


tipo I y tipo II, respectivamente. Por lo general, el valor de (mxima probabilidad del error tipo I que se puede tolerar) se fija y se determina la regin
de rechazo. Un concepto relacionado muy til para evaluar el desempeo de
una prueba recibe el nombre de potencia de la prueba.

Definicin 5.8. Potencia de la prueba


Suponga que W es el estadstico de prueba y RR es la regin de rechazo para
una prueba de una hiptesis estadstica que involucra el valor de un parmetro
. Entonces, la potencia de la prueba es la probabilidad de que la prueba lleve
al rechazo de H0 cuando el valor real del parmetro es , y se denota por p().
Esto es:
p() = P (W este en la RR cuando el cuando el valor real del parmetro es )

Dado que () es la probabilidad de que un valor de la estadstica de prueba


no se encuentre en la regin de rechazo RR cuando H0 es falsa, entoces
1 () representa la probabilidad de que un valor de la estadstica de
prueba se encuentre en la regin de rechazo RR cuando H0 es falsa. De esta
manera,

si H0 es cierta

p() =

1 () si Ha es cierta
Si el valor del parmetro de Ha es cierto, entonces la potencia de una prueba
es la probabilidad de detectar que H0 es, en forma verdadera, falsa.
Se sabe que para un fijo y una hiptesis alternativa dada, para cualquier
valor de a partir de Ha , puede disminuirse la probabilidad del error tipo II
si se incrementa el tamao de la muestra. De este hecho, se desprende que la
funcin potencia aumentar conforme aumente el tamao de la muestra, es
decir, aumenta la capacidad de la prueba para detectar que la hiptesis nula
es en forma verdadera, falsa.
Universidad de Carabobo

Sec 5.10. Potencia de las pruebas

268

Ejemplo 5.22. Considere el ejemplo (5.8). Si el verdadero valor de 2 es


2 = 1 1,cul sera la probabilidad de que la prueba detecte este valor?
Solucin:
Como la diferencia 1 2 = 1 esta bajo la hiptesis alternativa, entonces la
probabilidad de que la prueba detecte este valor es la potencia de la prueba,
es decir,
p (1 2 ) = P (rechazar H0 | H0 es falsa)
dado que se tiene una hiptesis alternativa de dos colas, entonces la forma
de regin de rechazo viene dada por:

RR = {X 1 X 2 k1 o X 1 X 2 k2 }

donde k1 y k2 son los valores crticos con respecto a la distribucin de muestreo de X 1 X 2 . En consecuencia, la probabilidad de que la prueba detecte
esta diferencia es:

p (1) = P X 1 X 2 k1 o X 1 X 2 k2 | 1 2 = 1

Dado que = 0 01, los valores crticos se pueden determinar y de esta manera
especificar la regin de rechazo, de manera tal que

P X 1 X 2 k1 o X 1 X 2 k2 | 1 2 = 0 = 0 01

bajo H0 y dado que las muestras son grandes, la distribucin de muestreo de


X 1 X 2 tiene una distribucin normal (aproximada) con:

E X1 X2 = 0 y V X1 X2

12 22
=
+
n1 n2
FaCyT-Matemticas

269

Cap 5. Prueba de hiptesis sobre los parmetros

Entonces

0 01 = P X 1 X 2 k1 o X 1 X 2 k2 | 1 2 = 0


= P X 1 X 2 k1 | 1 2 = 0 + P X 1 X 2 k2 | 1 2 = 0

k1 0
k2 0
= P Z q 2
+ P Z q 2
2

2
1
1
+ n22
+ n22
n1
n1

k1
+ P Z q k2

= P Z q
1 06
1 06
1 35
1 35
+ 50
+ 50
50
50
|
{z
} |
{z
}
0 005

0 005

Dado que se pueden determinar el valor cuantil z0 005 de la normal estndar


tales que
P (Z z0 005 ) = 0 005
se tiene que:
k2
q

1 35
50

1 06
50

= z0 005

y de aqu
r

1 35 1 06
+
50
50
r
2 41
= 2 58
50
= 0 56

k1 = z0 005

por simtria, se tiene que k2 = 0 56. De esta manera, la probabilidad pedida


Universidad de Carabobo

Sec 5.10. Potencia de las pruebas

270

viene dada por:



X 1 X 2 0 56 o X 1 X 2 0 56 | 1 2 = 1


= P X 1 X 2 0 56 | 1 2 = 1 + P X 1 X 2 0 56 | 1 2 = 1

0 56 1
0 56 1
+ P Z q
= P Z q
1 35
1 06
1 35
1 06
50 + 50
50 + 50

p(1) = P

= P (Z 7 10) + P (Z 2)
= P (Z 7 10) + 1 P (Z 2) = 0 + 1 0 0228
= 0 9772

De esta forma, la probabilidad de que la prueba detecte la diferencia entre


las medias 1 2 = 1 es 0 9772.

Ejemplo 5.23. Considere el ejemplo (5.17). Supngase que si la verdadera
desviacin estndar del dimetro excede el valor 0 01 mm en un 25 % cul
es la probabilidad de que la prueba nos lleve a rechazar la hiptesis nula?
Solucin:
La potencia de la prueba para un valor a2 que esta en la hiptesis alternativa
es:
p(a2 ) = P (rechazar H0 | H0 es falsa)
donde a = 0 01 + 0 01(0 25) = 0 0125. Dado que se tiene una alternativa de
cola derecha, la forma de la regin de rechazo viene dada por:
RR = {S 2 k}
Dado que = 0 01, el valor de k se obtiene de la siguiente manera:
0 01 = P (rechazar H0 | H0 es cierta)

= P S 2 k | 2 = (0 01)2


14k
2
= P 14
(0 01)2
De aqu que:

P 214

14k
(0 01)2


= 0 99
FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

271

Dado que se puede determinar el valor cuantil 20 99,14 de la distribucin chicuadrada con 14 grados de libertad tal que

P 2 20 99,14 = 0 99
se tiene que:
14k
= 20 99,14
2
(0 01)
despejando a k de la expresin anterior
(0 01)2
14
(0 01)2
= 29 17
14
= 0 00020

k = 20 99,14

Por consiguiente,
p((0 0125)2 ) = P S 2 0 00020 | a2 = (0 0125)2


14(0 00020)
2
= P 14
(0 0125)2

= P 214 17 92

= 1 P 214 17 92

Como los valores cuantiles 20 1,14 = 7 79 y 20 9,14 = 21 07, entonces (por


interpolacin lineal)

P 214 17 92 0 7102
de esta manera, si la verdadera varianza del dimetro es 2 = (0 0125)2 , la
probabilidad de que la prueba nos lleve a rechazar la hiptesis nula es:
p(0 0125)2 ) 1 0 7102 = 0 2898

Si se tiene una hiptesis alternativa compuesta, la probabilidad del error
tipo II y la potencia de la prueba varan para los diferentes valores de bajo
la hiptesis alternativa Ha . A la funcin (), se le conoce como funcin
caracteristica de operacin y cuando se grfica () para diversos valores de
de Ha , se obtiene una curva caracteristica de operacin y a la funcin p()
se le conoce como funcin potencia y cuando se grfica p() para diversos
valores de de Ha , se obtiene la curva de potencia de la prueba.
Universidad de Carabobo

Sec 5.10. Potencia de las pruebas

272

Ejemplo 5.24. La cantidad promedio que se coloca en un recipiente en un


proceso de llenado se supone que es de 20 litros. En forma peridica, se
escogen al azar 25 recipientes y el contenido de cada uno de stos se pesa.
Se desea probar

H0 : = 20
vs

Ha : 6= 20
El proceso se juzga como fuera de control cuando la media muestral X es
menor o igual a 19 8 o mayor o igual a 20 2 litros. Se supone que la cantidad
que se vaca en cada recipiente se encuentra de forma aproximada por una
distribucin normal con una desviacin estndar de 0 5 litros.
a. Obtener la probabilidad del error tipo I.
b. Obtener y graficar la funcin de potencia para los siguientes valores
medios de llenado: 19 5, 19 6, 19 7, 19 8, 19 9, 20, 20 1, 20 2, 20 3, 20 4,
20 5.
c. Como una prueba alternativa, considrese el rechazo de H0 cuando X
19 75 o X 20 25. Si el tamao del error tipo I es de 0 05, cul de
las dos pruebas es la mejor?
Solucin:
Solucin a.
Bajo la hiptesis nula H0 , la distribucin de X es de forma aproximada
2
= 0 25/25. Por lo tanto, la probanormal con media X = 20 y varianza X
bilidad del error tipo I es:
= P (rechazar H0 | H0 es cierta)

= P X 19 8 o X 20 2 | = 20


= P X 19 8 | = 20 + P X 20 2 | = 20




19 8 20
20 2 20

=P Z
+P Z
0 5/ 25
0 5/ 25
= P (Z 2) + P (Z 2)
por simetra
= 2P (Z 2) = 2(0 0228)
= 0 0456
FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

273

Solucin b.
Por definicin, la potencia de la prueba viene dada por:
p() = P (Rechazar H0 cuando el valor del parmetro es )
de esta manera, si = 19 5 la potencia de la prueba es:

p(19 5) = P X 19 8 o X 20 2 | = 19 5


= P X 19 8 | = 19 5 + P X 20 2 | = 19 5




20 2 19 5
19 8 19 5

+P Z
=P Z
0 5/ 25
0 5/ 25
= P (Z 3) + P (Z 7)
= P (Z 3) + 1 P (Z 7) = 0 9987 + 1 1
= 0 9987
De la misma forma se puede continuar el proceso de calcular la potencia de
la prueba para los otros valores medios de llenado. En la siguiente tabla se
presenta los resultados obtenidos.

19 5

19 6

19 7

19 8 19 9

20

20 1 20 2

20 3

20 4

20 5

p() 0 9987 0 9772 0 8413 0 5 0 16 0 0456 0 16 0 5 0 8413 0 9772 0 9987

Solucin c.
La probabilidad del error tipo I es:
= P (rechazar H0 | H0 es cierta)

= P X 19 75 o X 20 25 | = 20


= P X 19 75 | = 20 + P X 20 25 | = 20




19 75 20
20 25 20

+P Z
=P Z
0 5/ 25
0 5/ 25
= P (Z 2 5) + P (Z 2 5)
por simetra
= 2P (Z 2 5) = 2(0 0062)
= 0 0124
Ya que ambas pruebas tienen valores de menores al tamao mximo que
puede tolerarse del error tipo I, se compararn sus funciones de potencia para
Universidad de Carabobo

Sec 5.10. Potencia de las pruebas

274

decidir cul es la mejor de las dos. La potencia de la prueba para = 19 5


viene dada por:

p(19 5) = P X 19 75 o X 20 25 | = 19 5


= P X 19 75 | = 19 5 + P X 20 25 | = 19 5




19 75 19 5
20 25 19 5

=P Z
+P Z
0 5/ 25
0 5/ 25
= P (Z 2 5) + P (Z 7 5)
= P (Z 2 5) + 1 P (Z 7 5) = 0 9938 + 1 1
= 0 9938
En la siguiente tabla se dan las potencias de la prueba para los distintos
valores medios de llenado.

19 5

19 6

19 7

19 8

19 9

20

20 1

20 2

20 3

20 4

20 5

p() 0 9938 0 9332 0 6915 0 3085 0 0670 0 0124 0 0670 0 3085 0 6915 0 9332 0 9938

De las tablas anteriores se observa que para cualquier valor de , la potencia


de la prueba del item b es mayor que la prueba del item c. De acuerdo con
lo anterior, la prueba del item b es la mejor prueba a utilizar para probar las
hiptesis indicadas. La figura (1.8) muestra las grficas de la funcin potencia
para la prueba del item b y c. La curva punteada es la funcin potencia de la
prueba del item c.

Figura 5.9: Grficas de las funcin potencia del item b y c



FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

275

5.11.

Lema de Neyman-Pearson

Supngase que se desea probar una hiptesis nula


H0 : = 0
contra una hiptesis alternativa simple
Ha : = a
Como se est interesado slo en dos valores particulares de (0 y a ), se
desea escoger una regin de rechazo RR para que = p(0 ) sea un valor fijo
y p(a ) sea tan grande como sea posible. Es decir, se busca la ms potente
prueba de nivel . El siguiente Teorema, conocido como Teorema de NeymanPearson, proporciona la forma de la regin de rechazo. La regin de rechazo
real depende del valor especificado para .

Teorema 5.1. (Teorema de Neyman-Pearson) Supngase que


se desea probar la hiptesis nula simple H0 : = 0 contra la hiptesis alternativa simple Ha : = a , con base en una muestra aleatoria
X1 , X2 , . . . , Xn de tamao n de una poblacin cuya funcin (densidad) de probabilidad es f (x; ). Sea L (x1 , x2 , . . . , xn ; ) la funcin de
verosimilitud de la muestra aleatoria cuando el valor del parmetro
es . Entonces, para un dado, la prueba que maximiza la potencia
en a tiene una regin de rechazo, RR, determinada por
L (x1 , x2 , . . . , xn ; 0 )
k
L (x1 , x2 , . . . , xn ; a )

interior a RR,

L (x1 , x2 , . . . , xn ; 0 )
k
L (x1 , x2 , . . . , xn ; a )

exterior a RR,

Ejemplo 5.25. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n de


una distribucin normal con media desconocida y varianza 2 conocida.
Universidad de Carabobo

Sec 5.11. Lema de Neyman-Pearson

276

Determinar la mejor regin crtica de tamao para probar

H0 : = 0
vs

Ha : = a
en donde a > 0 .
Solucin:
La funcin de verosimilitud es:
L (x1 , x2 , . . . , xn ; )

1
(2)n/2 ( 2 )n/2

n
1 X
(xi )2
exp 2
2 i=1

Bajo H0 la funcin de verosimilitud es:


L (x1 , x2 , . . . , xn ; 0 )

1
(2)n/2 ( 2 )n/2

n
1 X
exp 2
(xi 0 )2
2 i=1

y bajo Ha esta es:


L (x1 , x2 , . . . , xn ; a )

1
(2)n/2 ( 2 )n/2

n
1 X
exp 2
(xi a )2
2 i=1

Entonces, por el Teorema (5.1), la mejor regin crtica es aquella para la cual


n
P
2
1
exp 22
(xi 0 )
i=1

 k
n
P
2
1
exp 22
(xi a )
i=1

por propiedades de potenciacin, esta desigualdad se puede escribir como


(
" n
#)
n
X
X
1
exp
(xi a )2
(xi 0 )2
k
2
2 i=1
i=1
tomando logaritmo neperiano en ambos lados de la desigualdad y multiplicando por 2 2 , se tiene que:
n
X
i=1

(xi a )2

n
X

(xi 0 )2 2 2 ln(k)

(5.8)

i=1

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

277

desarrollando y simplificando el lado izquierdo de (5.8), se tiene que:


n
X
i=1

(xi a )

n
X

n
X

(xi 0 ) =

i=1

x2i 2a

i=1

n
X

xi + n2a

i=1

n
X

x2i + 20

i=1

= n(2a 20 ) 2(a 0 )

n
X

n
X

xi n20

i=1

xi

i=1

sustituyendo en (5.8), se tiene que:


n(2a

20 )

2(a 0 )

n
X

xi 2 2 ln(k)

i=1

o
2(a 0 )

n
X

xi 2 2 ln(k) n(2a 20 )

i=1

puesto que a > 0 , la cantidad 2(a 0 ) es negativa; de esta forma


n
X

xi

i=1

o
x

n(2a 20 2 2 ln(k))
2(a 0 )

n(2a 20 ) 2 2 ln(k)
2n(a 0 )

(5.9)

La expresin (5.9) define la forma de la mejor regin crtica para probar

H0 : = 0
vs

Ha : = a
en donde a > 0 . Es decir, la mejor regin crtica es el extremo derecho de
la distribucin de muestreo de X bajo la hiptesis nula.
Para un dado, el valor crtico c se puede determinar de manera tal que:

P X c | = 0 =
Ya que bajo H0 ,

X N 0 , 2 /n
Universidad de Carabobo

Sec 5.11. Lema de Neyman-Pearson

278

entonces
= P X c | = 0


= 1 P X c | = 0



c 0
= 0
=1P Z
/ n
y



c 0
= 0 = 1
P Z
/ n
de esta manera:
o

c 0
= z1
/ n

c = z1 + 0
n

por lo tanto, se rechaza H0 : = 0 en favor de la hiptesis alternativa


Ha : = a cuando el valor de X sea mayor o igual a n z1 +0 . Entonces,
la prueba de nivel que tiene el mximo valor posible para la potencia de la
prueba p(a ) est basada en el estadstico X y la regin de rechazo RR =
{x n z1 + 0 }.

Observese que ni el estadstico de prueba ni la regin de rechazo dependen del
valor particular asignado a a siempre que a > 0 . Esto es, para cualquier
valor de a mayor que 0 , se obtiene la misma regin de rechazo. Por lo
tanto, la prueba de nivel con la regin de rechazo dada anteriormente
tiene el mximo valor posible para la potencia p(a ) para toda a > 0 .
Es la prueba uniformemente ms potente para probar H0 : = 0 contra la
hiptesis alternativa Ha : > a .
Ejemplo 5.26. Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamao n de
una distribucin de Poisson con parmetro desconocido. Determinar la
mejor regin crtica de tamao para probar

H0 : = 0
vs

Ha : = a
FaCyT-Matemticas

279

Cap 5. Prueba de hiptesis sobre los parmetros

donde a > 0 .
Solucin:
La funcin de verosimilitud bajo H0 y bajo Ha son:
n
P

xi

exp{n0 }i=1
0
L(x1 , . . . , xn ; 0 ) =
n
Q
xi !
i=1

y
n
P

xi

exp{na }i=1
a
L(x1 , . . . , xn ; a ) =
n
Q
xi !
i=1

respectivamente. De est manera, la mejor regin crtica es aquella para la


cul
L(x1 , . . . , xn ; 0 )
k
L(x1 , . . . , xn ; a )
o
n
P

exp{n0 }i=1
0
n
Q
xi !
i=1
n
P
exp{na }i=1
a
n
Q
xi !
i=1

o


0
a

xi

k
xi

n
P
xi
i=1

exp{n(a 0 )} k

Tomando logaritmo neperiano, se tiene que:


ln(0 /1 )

n
X

xi + n(a 0 ) ln(k)

i=1

o
ln(0 /1 )

n
X
i=1

Universidad de Carabobo

xi ln(k) n(a 0 )

Sec 5.12. Ejercicios propuestos

280

Pero si a > 0 , entonces 0 < 0 /a < 1 y el nmero neperiano de un


nmero entre 0 y 1 es negativo. Por lo tanto,
n
X
i=1

xi

ln(k) n(a 0 )
ln(0 /1 )

(5.10)

La expresin (5.10) define la forma de la mejor regin crtica para probar


H0 : = 0 contra H0 : = a > 0 .
Dado que Y =

n
P

Xi tambin es una variable aleatoria de Poisson con par-

i=1

metro n0 bajo H0 , el valor crtico se escoge de manera tal que


!
n
X
P
Xi c =
i=1

Debido a que Y es una variable discreta, es ms difcil determinar el valor


crtico c de manera tal que
!
n
X
P
Xi c
i=1

sea exactamente igual a la probabilidad del error tipo I . Lo que se hace


para esta situacin es escoger el valor crtico c cuya rea deber ser lo ms
cercana al tamao del error tipo I que pueda tolerarse.


5.12.

Ejercicios propuestos

1. Un fabricante de automviles importante ha tenido que retirar varios


modelos de su lnea 2009 debido a problemas de control de calidad
que no fueron descubiertos con los procedimientos finales de inspeccin
aleatoria. ste es un ejemplo de:
a. Error tipo I.
b. Error tipo II.
c. Error tipo I y error tipo II.
FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

281

d. Ningn tipo de error.


2. Si se dice que = 0 10 para una prueba de hiptesis dada, entonces se
esta diciendo que:
a. 10 % es nuestro estndar mnimo para una probabilidad aceptable.
b. 10 % es el riesgo que se corre de rechazar una hiptesis que es
cierta.
c. 10 % es el riesgo que se corre de aceptar una hiptesis que es falsa.
d. a. y b. solamente.
e. a. y c. solamente.
3. Suponga que se realiza una prueba de hiptesis para un proceso en el
que un error tipo I puede ser muy costoso, pero un error tipo II puede
resultar relativamente barato y sin importancia. Cul de los siguientes
sera la mejor eleccin para en esta prueba?
a. 0 01.
b. 0 10.
c. 0 25.
d. 0 50.
e. Ninguno de los anteriores.
4. Se esta interesado en probar si una moneda est o no balanceada, con
base en el nmero de caras X en 36 tiros de la moneda.
a. Enuncie las hiptesis nula y alternativa para esta situacin.
b. Si se usa la regin de rechazo, RR = {|x 18| 4}, cul es el
valor de ? cul es el valor de si p = 0 7?
5. Los salarios por hora en una industria particular estn distribuidos
normalmente con media de $13 20 y desviacin estndar de $2 5. Una
compaa en esta industria emplea 40 trabajadores, pagndoles un promedio de $12 20 por hora. Esta compaa puede ser acusada de pagar
salarios abajo del estndar? Use una prueba de nivel 0 01.
Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

282

6. El ndice Rockwell de dureza para acero se determina al presionar una


punta de diamante en el acero y medir la profundidad de la penetracin.
Para 50 especmenes de una aleacin de acero, el ndice Rockwell de
dureza promedio es 62 con desviacin estndar de 8. El fabricante dice
que esta aleacin tiene un ndice de dureza promedio de al menos 64.
Hay suficiente evidencia para refutar lo dicho por el fabricante con un
nivel de significancia de 1 %?
7. Un fabricante asegura que al menos 20 % del pblico prefiri su producto. Se toma una muestra de 100 personas para comprobar su afirmacin.
Con = 0 05, qu tan pequeo necesitara ser el porcentaje muestral
antes de que la aseveracin pueda ser refutada legtimamente?
8. Un politlogo cree que la fraccin p1 de republicanos es mayor que
la fraccin p2 de demcratas que estn a favor de la pena de muerte.
l adquiri muestras aleatorias de 200 republicanos y 200 demcratas
y encontr 46 republicanos y 34 demcratas a favor de la pena de
muerte. Esta evidencia proporciona apoyo estadstico para la creencia
del investigador? Use = 0 05.
9. Consulte el ejercicio (6). El acero es suficientemente duro para satisfacer
los requisitos de uso si la dureza media Rockwell no cae por debajo de
60. Usando la regin de rechazo encontrada en el ejercicio (6), encuentre
la probabilidad de que la prueba no pueda rechazar H0 cuando la media
real es = 60.
10. Consulte el ejercicio (6). El politlogo debera haber diseado una prueba para la cul es suficientemente pequea cuando p1 excede a p2 en
una cantidad significativa. Por ejemplo, determine un tamao muestral
comn n para una prueba con = 0 05 y 0 20 cuando en realidad
p1 excede a p2 en 0 1. (Sugerencia: el valor mximo de p(1 p) es 0 25).
11. Una compaa de productos para el consumidor est desarrollando un
nuevo champ, y est interesada en la altura de la espuma (en mm). La
altura de la espuma tiene una distribucin normal, con una desviacin
estndar de 20 mm. La compaa desea probar H0 : = 175 mm contra
Ha : > 175mm, utilizando los resultados obtenidos con 10 muestras.
a. Encuentre la probabilidad del error tipo I si la regin crtica es
RR = {x > 185}.
FaCyT-Matemticas

283

Cap 5. Prueba de hiptesis sobre los parmetros


b. Cul es la probabilidad del error tipo II si la verdadera altura
promedio de la espuma es 195 mm?
c. Supngase que la media muestral es x = 190 mm. a que conclusin puede llegarse?
d. Suponga ahora que el tamao de la muestra aumenta a n = 16.
Dnde debe colocarse la frontera de la regin crtica si se desea
que la probabilidad del error tipo I siga siendo la misma que cuando el tamao de la muestra era n = 10?
e. Con n = 16 y la regin crtica determinada en el inciso d., encuentre la probabilidad del error tipo II si el valor verdadero de la
altura promedio de la espuma es 190 mm.
f. Compare el valor obtenido en el inciso e. con el calculado en el
inciso b. A qu conclusin puede llegar?

12. Se estudia el rendimiento de un proceso qumico. De la experiencia previa con este proceso, se sabe que la desviacin estndar del rendimiento
es 3. En los cincos das anteriores de operacin de la planta, se han observado los siguientes rendimientos: 91 6 %, 88 75 %, 90 8 %, 89 95 % y
91 3 %. Utilice = 0 05.
a. Existe evidencia de que el rendimiento no es del 90 %?
b. Cul es el valor p de esta prueba?
c. Qu tamao de muestra se requiere para detectar un rendimiento
promedio verdadero de 85 % con una probabilidad de 0 95?
c. Cul es la probabilidad del error tipo II si el rendimiento promedio verdadero es 92 %?
13. Una muestra aleatoria de 37 estudiantes de segundo grado que practicaban deporte obtuvieron calificaciones de habilidad manual con una
media de 32 19 y una desviacin estndar de 4 34. Una muestra independiente de 37 estudiantes del mismo grado que no los practicaban
tuv calificaciones de destreza manual con media de 31 68 y una desviacin estndar de 4 56.
a. Aplique una prueba para ver si existe suficiente evidencia que indique que los estudiantes de segundo grado que practican deportes
tienen una calificacin ms alta en destreza manual. Use = 0 05.
Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

284

b. Para la regin de rechazo empleada en el inciso a., calcule cuando


1 2 = 3.
c. Encuentre los tamaos muestrales que dan como resultado =
0 05 y = 0 05 cuando 1 2 = 3. (Suponga muestras de igual
tamao para cada grupo).
14. Una mquina expendedora de gaseosas fue diseada para descargar en
promedio 7 onzas de lquido por taza. En una prueba de la mquina,
diez tazas de lquido se sacaron de la mquina y se midieron. La media
y la desviacin estndar de las diez mediciones fueron 7 1 onzas y 0 12
onzas, respectivamente. Estos datos presentan suficiente evidencia para indicar que la descarga media difiere de 7 onzas?
a. Qu se puede decir acerca del nivel de significancia alcanzado
para esta prueba?
b. Cul es la decisin adecuada si = 0 10.
15. Suponga que se prueba H0 : 1 = 2 contra Ha : 1 6= 2 y se planea
utilizar muestras de las dos poblaciones del mismo tamao. Se supone
que embas poblaciones son normales con varianza iguales a 2 = 9. Si se
utiliza = 0 05 y si la verdadera media 1 es 1 = 2 + , qu tamao
de la muestra debe utilizarse para que la potencia de esta prueba sea
al menos 0 90?
16. Existen dos tipos de metales A y B apropiados para su uso por un
fabricante de piezas de fundicin. La tensin de ruptura de ese metal
es un parmetro importante. Se han tomado dos muestras aleatorias
de 11 metales de los dos tipos de metales, y se han realizado ensayos
a corte, la media de la muestra A fue de 50000 lb de presin, la media
de la muestra B fue de 45000 lb de presin, sus desviaciones fueron de
500 lb y 475 lb, respectivamente. La compaia no adoptar el metal A
a menos que la tensin de ruptura de ste exceda a la del metal B al
menos por 4500 lb de presin. Con base a la informacin contenida en la
muestra, la compaia deber utilizar el metal A? Utilice = 0 02 para
llegar a una decisin, asuma igualdad de desviaciones poblacionales.
17. Un diseador de productos est interesado en reducir el tiempo de
secado de una pintura tapaporos. Se prueban dos frmulas de pintura;
la frmula 1 tiene el contenido qumico estndar, y la frmula 2 tiene
FaCyT-Matemticas

285

Cap 5. Prueba de hiptesis sobre los parmetros


un nuevo ingrediente secante que debe reducir el tiempo de secado. De
la experiencia se sabe que la desviacin estndar del tiempo de secado
es ocho minutos, y esta variabilidad inherente no debe verse afectada
por la adicin del nuevo ingrediente. Se pintan diez especmenes con la
frmula 1, y otros diez con la frmula 2. Los dos tiempos promedio de
secado muestrales son x1 = 121 min y x2 = 112 min, respectivamente.
a. A qu conclusiones puede llegar el diseador del producto sobre
la eficacia del nuevo ingrediente, utilizando = 0 05?
b. Supngase que la verdadera diferencia en los tiempos de secado es
1 2 = 3 min. Qu tamao de la muestra debe utilizarse para
que la probailidad de que la pruebe detecte este valor sea de 0 10
. (Suponga que el tamao de las muestras son iguales).

18. Sea X1 , X2 , . . . , X20 una muestra aleatoria de tamao n = 20 de una


distribucin normal con media desconocida y varianza 2 = 5 conocida. Se desea probar H0 : = 7 contra Ha : > 7.
a. Encuentre la prueba uniformemente ms potente con nivel de significancia 0 05.
b. Para la prueba del inciso a., encuentre la potencia en cada uno de
los siguientes valores alternativos para : a = 7 5, 8 0, 8 5, 9 0.
c. Trace una grfica de la funcin potencia.
d. Cul es el mnimo tamao muestral para que una prueba de nivel
= 0 05 tenga potencia de al menos 0 80 cuando = 8?
19. Suponga que X1 , X2 , . . . , Xn constituyen una muestra aleatoria de una
distribucin normal con media conocida y varianza 2 desconocida.
Encuentre la prueba de nivel ms potente de H0 : 2 = 02 contra
Ha : 2 = 12 , donde 12 > 02 . Muestre que esta prueba es equivalente
a una prueba 2 . La prueba es uniformemente ms potente para Ha :
2 > 02 ?
20. Suponga que se tiene una muestra aleatoria de cuatro observaciones de
la funcin de densidad
(
 2
 x
1
x
exp
, x > 0
3
2
f (x; ) =
0,
en cualquier otro caso
Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

286

a. Encuentre la regin de rechazo para la prueba ms potente de


H0 : = 0 contra Ha : = a , suponiendo que a > 0 . (Sugerencia: haga uso de la distribucin 2 ).
b. La prueba dad en el inciso a. es uniformemente ms potente para
la alternativa > 0 ?
21. Suponga que X es una muestra aleatoria de tamao 1 desde una poblacin con funcin de densidad
(
x1 , 0 x 1
f (x; ) =
0,
en cualquier otro caso
donde > 0
a. Trace la funcin de potencia de la prueba con regin de rechazo:
X > 0 5.
b. Con base en la sola observacin de X, encuentre una prueba uniformemente ms potente de tamao para probar H0 : = 1 contra
Ha : > 1.
22. Sea X1 , X2 , . . . , Xn una muestra aleatoria de la funcin de densidad de
probabilidad dada por
( 
 m
1
mxm1 exp x , x > 0

f (x; ) =
0,
en cualquier otro caso
con m denotando una constante conocida.
a. Encuentre la prueba uniformemente ms potente para probar H0 : =
0 contra Ha : > 0 .
b. Si la prueba del inciso a. ha de tener 0 = 100, = 0 05, = 0 05
cuando a = 400, encuentre el tamao muestral apropiado y la
regin crtica.
23. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin que tiene
una distribucin de Poisson con media .
a. Encuentre la forma de la regin de rechazo para una prueba ms
potente de H0 : = 0 contra Ha : = a , donde a > 0 .
FaCyT-Matemticas

287

Cap 5. Prueba de hiptesis sobre los parmetros


b. Recuerde que

n
P

Xi tiene una idstribucin de Poisson con media

i=1

n. Indique el modo en que esta informacin se puede utilizar para


determinar constantes asociadas con la regin de rechazo obtenida
en el inciso a.
c. La prueba obtenida en el inciso a. es uniformemente ms potente
para probar H0 : = 0 contra Ha : > 0 ? Por qu?
d. Encuentre la forma de la regin de rechazo para una prueba ms
potente de H0 : = 0 contra Ha : = a , donde a < 0 .
24. suponga que X1 , X2 , . . . , Xn denota una muestra aleatoria de una poblacin que tiene una distribucin exponencial con media .
a. Encuentre la prueba uniformemente ms potente para probar H0 : =
0 contra Ha : = a , donde a < 0 .
b. La prueba obtenida en el inciso a. es uniformemente ms potente
para probar H0 : = 0 contra Ha : < 0 ?
25. Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con distribucin de bernoulli y parmetro p. Esto es:
p(xi ; p) = pxi (1 p)1xi ,

xi = 0, 1.

a. Defina la regin de rechazo para la prueba ms potente de H0 : p =


p0 contra Ha : p = pa , donde p0 < pa .
n
P
b. Recuerde que
Xi tiene una distribucin binomial con parmei=1

tros n y p. Indique el modo de determinar los valores de cualesquiera constantes contenidas en la regin de rechazo obtenidas en
el inciso a.

Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

288

FaCyT-Matemticas

Tablas estadsticas

TABLA 1: Valores de la distribucin acumulativa normal estndar.


TABLA 2: Valores de cuantiles de la distribucin acumulativa chicuadrada.
TABLA 3: Valores de cuantiles de la distribucin acumulativa t de
Student.
TABLA 4: Valores de cuantiles de la distribucin acumulativa F de
Fisher.

289

Sec 5.12. Ejercicios propuestos

290

Tabla 1: Valores de la distribucin acumulativa normal estndar


z

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

-3.5
-3.4
-3.3
-3.2
-3.1
-3.0
-2.9
-2.8
-2.7
-2.6
-2.5
-2.4
-2.3
-2.2
-2.1
-2.0
-1.9
-1.8
-1.7
-1.6
-1.5
-1.4
-1.3
-1.2
-1.1
-1.0
-0.9
-0.8
-0.7
-0.6
-0.5
-0.4
-0.3
-0.2
-0.1
-0.0

0.0002
0.0003
0.0005
0.0007
0.0010
0.0013
0.0019
0.0026
0.0035
0.0047
0.0062
0.0082
0.0107
0.0139
0.0179
0.0228
0.0287
0.0359
0.0446
0.0548
0.0668
0.0808
0.0968
0.1151
0.1357
0.1587
0.1841
0.2119
0.2420
0.2743
0.3085
0.3446
0.3821
0.4207
0.4602
0.5000

0.0002
0.0003
0.0005
0.0007
0.0009
0.0013
0.0018
0.0025
0.0034
0.0045
0.0060
0.0080
0.0104
0.0136
0.0174
0.0222
0.0281
0.0351
0.0436
0.0537
0.0655
0.0793
0.0951
0.1131
0.1335
0.1562
0.1814
0.2090
0.2389
0.2709
0.3050
0.3409
0.3783
0.4168
0.4562
0.4960

0.0002
0.0003
0.0005
0.0006
0.0009
0.0013
0.0018
0.0024
0.0033
0.0044
0.0059
0.0078
0.0102
0.0132
0.0170
0.0217
0.0274
0.0344
0.0427
0.0526
0.0643
0.0778
0.0934
0.1112
0.1314
0.1539
0.1788
0.2061
0.2358
0.2676
0.3015
0.3372
0.3745
0.4129
0.4522
0.4920

0.0002
0.0003
0.0004
0.0006
0.0009
0.0012
0.0017
0.0023
0.0032
0.0043
0.0057
0.0075
0.0099
0.0129
0.0166
0.0212
0.0268
0.0336
0.0418
0.0516
0.0630
0.0764
0.0918
0.1093
0.1292
0.1515
0.1762
0.2033
0.2327
0.2643
0.2981
0.3336
0.3707
0.4090
0.4483
0.4880

0.0002
0.0003
0.0004
0.0006
0.0008
0.0012
0.0016
0.0023
0.0031
0.0041
0.0055
0.0073
0.0096
0.0125
0.0162
0.0207
0.0262
0.0329
0.0409
0.0505
0.0618
0.0749
0.0901
0.1075
0.1271
0.1492
0.1736
0.2005
0.2297
0.2611
0.2946
0.3300
0.3669
0.4052
0.4443
0.4840

0.0002
0.0003
0.0004
0.0006
0.0008
0.0011
0.0016
0.0022
0.0030
0.0040
0.0054
0.0071
0.0094
0.0122
0.0158
0.0202
0.0256
0.0322
0.0401
0.0495
0.0606
0.0735
0.0885
0.1056
0.1251
0.1469
0.1711
0.1977
0.2266
0.2578
0.2912
0.3264
0.3632
0.4013
0.4404
0.4801

0.0002
0.0003
0.0004
0.0006
0.0008
0.0011
0.0015
0.0021
0.0029
0.0039
0.0052
0.0069
0.0091
0.0119
0.0154
0.0197
0.0250
0.0314
0.0392
0.0485
0.0594
0.0721
0.0869
0.1038
0.1230
0.1446
0.1685
0.1949
0.2236
0.2546
0.2877
0.3228
0.3594
0.3974
0.4364
0.4761

0.0002
0.0003
0.0004
0.0005
0.0008
0.0011
0.0015
0.0021
0.0028
0.0038
0.0051
0.0068
0.0089
0.0116
0.0150
0.0192
0.0244
0.0307
0.0384
0.0475
0.0582
0.0708
0.0853
0.1020
0.1210
0.1423
0.1660
0.1922
0.2206
0.2514
0.2843
0.3192
0.3557
0.3936
0.4325
0.4721

0.0002
0.0003
0.0004
0.0005
0.0007
0.0010
0.0014
0.0020
0.0027
0.0037
0.0049
0.0066
0.0087
0.0113
0.0146
0.0188
0.0239
0.0301
0.0375
0.0465
0.0571
0.0694
0.0838
0.1003
0.1190
0.1401
0.1635
0.1894
0.2177
0.2483
0.2810
0.3156
0.3520
0.3897
0.4286
0.4681

0.0002
0.0002
0.0003
0.0005
0.0007
0.0010
0.0014
0.0019
0.0026
0.0036
0.0048
0.0064
0.0084
0.0110
0.0143
0.0183
0.0233
0.0294
0.0367
0.0455
0.0559
0.0681
0.0823
0.0985
0.1170
0.1379
0.1611
0.1867
0.2148
0.2451
0.2776
0.3121
0.3483
0.3859
0.4247
0.4641

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

291

Tabla 1: Valores de la distribucin acumulativa normal estndar


z

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5

0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
0.9998

0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.9998

0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
0.9998

0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.9997
0.9998

0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7703
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.9997
0.9998

0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998

0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998

0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.9998

0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.9998

0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998

Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

292

Tabla 2: Valores de cuantiles de la distribucin acumulativa chicuadrada

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100

0 005
0.00
0.01
0.07
0.21
0.41
0.67
0.99
1.34
1.73
2.15
2.60
3.06
3.56
4.07
4.59
5.14
5.69
6.25
6.82
7.42
8.02
8.62
9.25
9.87
10.50
11.13
11.79
12.44
13.09
13.77
17.16
20.67
24.28
27.96
35.50
43.25
51.14
59.17
67.30

0 010
0.00
0.02
0.11
0.30
0.55
0.87
1.24
1.64
2.09
2.55
3.05
3.57
4.10
4.65
5.23
5.81
6.40
7.00
7.63
8.25
8.89
9.53
10.19
10.85
11.51
12.19
12.87
13.55
14.24
14.94
18.49
22.14
25.88
29.68
37.46
45.42
53.52
61.74
70.05

0 025
0.00
0.05
0.22
0.48
0.83
1.24
1.69
2.18
2.70
3.24
3.81
4.40
5.01
5.62
6.26
6.90
7.56
8.23
8.90
9.59
10.28
10.98
11.69
12.40
13.11
13.84
14.57
15.30
16.04
16.78
20.56
24.42
28.36
32.35
40.47
48.75
57.15
65.64
74.22

0 050
0.00
0.10
0.35
0.71
1.15
1.63
2.17
2.73
3.32
3.94
4.57
5.22
5.89
6.57
7.26
7.96
8.67
9.39
10.11
10.85
11.59
12.34
13.09
13.84
14.61
15.38
16.15
16.92
17.70
18.49
22.46
26.51
30.61
34.76
43.19
51.74
60.39
69.13
77.93

0 100
0.02
0.21
0.58
1.06
1.61
2.20
2.83
3.49
4.17
4.86
5.58
6.30
7.04
7.79
8.55
9.31
10.08
10.86
11.65
12.44
13.24
14.04
14.85
15.66
16.47
17.29
18.11
18.94
19.77
20.60
24.79
29.06
33.36
37.69
46.46
55.33
64.28
73.29
82.36

0 900
2.71
4.60
6.25
7.78
9.24
10.65
12.02
13.36
14.69
15.99
17.28
18.55
19.81
21.07
22.31
23.55
24.77
25.99
27.21
28.42
29.62
30.82
32.01
33.20
34.38
35.57
36.74
37.92
39.09
40.26
46.06
51.80
57.50
63.16
74.39
85.52
96.57
107.56
118.49

0 950
3.84
5.99
7.82
9.49
11.07
12.60
14.07
15.51
16.93
18.31
19.68
21.03
22.37
23.69
25.00
26.30
27.59
28.88
30.15
31.42
32.68
33.93
35.18
36.42
37.66
38.89
40.12
41.34
42.56
43.78
49.81
55.75
61.65
67.50
79.08
90.53
101.88
113.14
124.34

0 975
5.02
7.38
9.36
11.15
12.84
14.46
16.02
17.55
19.03
20.50
21.93
23.35
24.75
26.13
27.50
28.86
30.20
31.54
32.87
34.18
35.49
36.79
38.09
39.38
40.66
41.94
43.21
44.47
45.74
46.99
53.22
59.34
65.41
71.42
83.30
95.03
106.63
118.14
129.56

0 990
6.64
9.22
11.32
13.28
15.09
16.81
18.47
20.08
21.65
23.19
24.75
26.25
27.72
29.17
30.61
32.03
33.43
34.83
36.22
37.59
38.96
40.31
41.66
43.00
44.34
45.66
46.99
48.30
49.61
50.91
57.36
63.71
69.98
76.17
88.40
100.44
112.34
124.13
135.82

0 995
7.90
0.59
12.82
14.82
16.76
18.55
20.27
21.94
23.56
25.15
26.71
28.25
29.88
31.38
32.86
34.32
35.77
37.21
38.63
40.05
41.45
42.84
44.23
45.60
46.97
48.33
49.69
51.04
52.38
53.71
60.31
66.80
73.20
79.52
91.98
104.24
116.35
128.32
140.19

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

293

Tabla 3: Valores de cuantiles de la distribucin acumulativa t de


Student

t0 001

t0 005

t0 010

t0 025

t0 050

t0 100

t0 200

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100

-318.309
-22.327
-10.215
-7.173
-5.893
-5.208
-4.785
-4.501
-4.297
-4.144
-4.025
-3.930
-3.852
-3.787
-3.733
-3.686
-3.646
-3.610
-3.579
-3.552
-3.527
-3.505
-3.485
-3.467
-3.450
-3.435
-3.421
-3.408
-3.396
-3.385
-3.340
-3.307
-3.281
-3.261
-3.232
-3.211
-3.195
-3.183
-3.174

-63.657
-9.925
-5.841
-4.604
-4.032
-3.707
-3.499
-3.355
-3.250
-3.169
-3.106
-3.055
-3.012
-2.977
-2.947
-2.921
-2.898
-2.878
-2.861
-2.845
-2.831
-2.819
-2.807
-2.797
-2.787
-2.779
-2.771
-2.763
-2.756
-2.750
-2.724
-2.704
-2.690
-2.678
-2.660
-2.648
-2.639
-2.632
-2.626

-31.821
-6.965
-4.541
-3.747
-3.365
-3.143
-2.998
-2.896
-2.821
-2.764
-2.718
-2.681
-2.650
-2.624
-2.602
-2.583
-2.567
-2.552
-2.539
-2.528
-2.518
-2.508
-2.500
-2.492
-2.485
-2.479
-2.473
-2.467
-2.462
-2.457
-2.438
-2.423
-2.412
-2.403
-2.390
-2.381
-2.374
-2.369
-2.364

-12.706
-4.303
-3.182
-2.571
-2.571
-2.447
-2.365
-2.306
-2.262
-2.228
-2.201
-2.179
-2.160
-2.145
-2.131
-2.120
-2.110
-2.101
-2.093
-2.086
-2.080
-2.074
-2.069
-2.064
-2.060
-2.056
-2.052
-2.048
-2.045
-2.042
-2.030
-2.021
-2.014
-2.009
-2.000
-1.994
-1.990
-1.987
-1.984

-6.314
-2.920
-2.353
-2.015
-2.015
-1.943
-1.895
-1.860
-1.833
-1.812
-1.796
-1.782
-1.771
-1.761
-1.753
-1.746
-1.740
-1.734
-1.729
-1.725
-1.721
-1.717
-1.714
-1.711
-1.708
-1.706
-1.703
-1.701
-1.699
-1.697
-1.690
-1.684
-1.679
-1.676
-1.671
-1.667
-1.664
-1.662
-1.660

-3.078
-1.886
-1.638
-1.476
-1.476
-1.440
-1.415
-1.397
-1.383
-1.372
-1.363
-1.356
-1.350
-1.345
-1.341
-1.337
-1.333
-1.330
-1.328
-1.325
-1.323
-1.321
-1.319
-1.318
-1.316
-1.315
-1.314
-1.313
-1.311
-1.310
-1.306
-1.303
-1.301
-1.299
-1.296
-1.294
-1.292
-1.291
-1.290

-1.376
-1.061
-0.978
-0.920
-0.920
-0.906
-0.896
-0.889
-0.883
-0.879
-0.876
-0.873
-0.870
-0.868
-0.866
-0.865
-0.863
-0.862
-0.861
-0.860
-0.859
-0.858
-0.858
-0.857
-0.856
-0.856
-0.855
-0.855
-0.854
-0.854
-0.852
-0.851
-0.850
-0.849
-0.848
-0.847
-0.846
-0.846
-0.845

Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

294

Tabla 3: Valores de cuantiles de la distribucin acumulativa t de


Student

t0 800

t0 900

t0 950

t0 975

t0 990

t0 995

t0 999

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100

1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.852
0.851
0.850
0.849
0.848
0.847
0.846
0.846
0.845

3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.306
1.303
1.301
1.299
1.296
1.294
1.292
1.291
1.290

6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.690
1.684
1.679
1.676
1.671
1.667
1.664
1.662
1.660

12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.030
2.021
2.014
2.009
2.000
1.994
1.990
1.987
1.984

31.820
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.267
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.438
2.423
2.412
2.403
2.390
2.381
2.374
2.368
2.364

63.656
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.724
2.704
2.690
2.678
2.660
2.648
2.639
2.632
2.626

318.294
22.327
10.214
7.173
5.893
5.208
4.785
4.501
4.297
4.144
4.025
3.930
3.852
3.787
3.733
3.686
3.646
3.610
3.579
3.552
3.527
3.505
3.485
3.467
3.450
3.435
3.421
3.408
3.396
2.285
3.340
3.307
3.281
3.261
3.232
3.211
3.195
3.183
3.174

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

295

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 90
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

1 grados de libertad del numerador


2 grados de libertad del numerador

10

11

12

13

39.86
8.526
5.538
4.545
4.060
3.776
3.589
3.458
3.360
3.285
3.225
3.177
3.136
3.102
3.073
3.048
3.026
3.007
2.990
2.975
2.961
2.949
2.937
2.927
2.918
2.909
2.901
2.894
2.887
2.881
2.835
2.809
2.791
2.779
2.769
2.762
2.756
2.731

49.50
9.000
5.462
4.325
3.780
3.463
3.257
3.113
3.006
2.924
2.860
2.807
2.763
2.726
2.695
2.668
2.645
2.624
2.606
2.589
2.575
2.561
2.549
2.538
2.528
2.519
2.511
2.503
2.495
2.489
2.440
2.412
2.393
2.380
2.370
2.363
2.356
2.329

53.59
9.162
5.391
4.191
3.619
3.289
3.074
2.924
2.813
2.728
2.660
2.606
2.560
2.522
2.490
2.462
2.437
2.416
2.397
2.380
2.365
2.351
2.339
2.327
2.317
2.307
2.299
2.291
2.283
2.276
2.226
2.197
2.177
2.164
2.154
2.146
2.139
2.111

55.83
9.243
5.343
4.107
3.520
3.181
2.961
2.806
2.693
2.605
2.536
2.480
2.434
2.395
2.361
2.333
2.308
2.286
2.266
2.249
2.233
2.219
2.207
2.195
2.184
2.174
2.165
2.157
2.149
2.142
2.091
2.061
2.041
2.027
2.016
2.008
2.002
1.973

57.24
9.293
5.309
4.051
3.453
3.108
2.883
2.726
2.611
2.522
2.451
2.394
2.347
2.307
2.273
2.244
2.218
2.196
2.176
2.158
2.142
2.128
2.115
2.103
2.092
2.082
2.073
2.064
2.057
2.049
1.997
1.966
1.946
1.931
1.921
1.912
1.906
1.876

58.20
9.326
5.285
4.010
3.405
3.055
2.827
2.668
2.551
2.461
2.389
2.331
2.283
2.243
2.208
2.178
2.152
2.130
2.109
2.091
2.075
2.060
2.047
2.035
2.024
2.014
2.005
1.996
1.988
1.980
1.927
1.895
1.875
1.860
1.849
1.841
1.834
1.804

58.91
9.349
5.266
3.979
3.368
3.014
2.785
2.624
2.505
2.414
2.342
2.283
2.234
2.193
2.158
2.128
2.102
2.079
2.058
2.040
2.023
2.008
1.995
1.983
1.971
1.961
1.952
1.943
1.935
1.927
1.873
1.840
1.819
1.804
1.793
1.785
1.778
1.747

59.44
9.367
5.252
3.955
3.339
2.983
2.752
2.589
2.469
2.377
2.304
2.245
2.195
2.154
2.119
2.088
2.061
2.038
2.017
1.999
1.982
1.967
1.953
1.941
1.929
1.919
1.909
1.900
1.892
1.884
1.829
1.796
1.775
1.760
1.748
1.739
1.732
1.701

59.86
9.381
5.240
3.936
3.316
2.958
2.725
2.561
2.440
2.347
2.274
2.214
2.164
2.122
2.086
2.055
2.028
2.005
1.984
1.965
1.948
1.933
1.919
1.906
1.895
1.884
1.874
1.865
1.857
1.849
1.793
1.760
1.738
1.723
1.711
1.702
1.695
1.663

60.19
9.392
5.230
3.920
3.297
2.937
2.703
2.538
2.416
2.323
2.248
2.188
2.138
2.095
2.059
2.028
2.001
1.977
1.956
1.937
1.920
1.904
1.890
1.877
1.866
1.855
1.845
1.836
1.827
1.819
1.763
1.729
1.707
1.691
1.680
1.670
1.663
1.631

60.47
9.401
5.222
3.907
3.282
2.920
2.684
2.519
2.396
2.302
2.227
2.166
2.116
2.073
2.037
2.005
1.978
1.954
1.932
1.913
1.896
1.880
1.866
1.853
1.841
1.830
1.820
1.811
1.802
1.794
1.737
1.703
1.680
1.665
1.653
1.643
1.636
1.603

60.71
9.408
5.216
3.896
3.268
2.905
2.668
2.502
2.379
2.284
2.209
2.147
2.097
2.054
2.017
1.985
1.958
1.933
1.912
1.892
1.875
1.859
1.845
1.832
1.820
1.809
1.799
1.790
1.781
1.773
1.715
1.680
1.657
1.641
1.629
1.620
1.612
1.579

60.90
9.415
5.210
3.886
3.257
2.892
2.654
2.488
2.364
2.269
2.193
2.131
2.080
2.037
2.000
1.968
1.940
1.916
1.894
1.875
1.857
1.841
1.827
1.814
1.802
1.790
1.780
1.771
1.762
1.754
1.695
1.660
1.637
1.621
1.609
1.599
1.592
1.558

Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

296

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 90
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

1 grados de libertad del numerador


2 grados de libertad del numerador

14

15

16

17

18

19

20

21

22

23

24

25

26

61.07
9.420
5.205
3.878
3.247
2.881
2.643
2.475
2.351
2.255
2.179
2.117
2.066
2.022
1.985
1.953
1.925
1.900
1.878
1.859
1.841
1.825
1.811
1.797
1.785
1.774
1.764
1.754
1.745
1.737
1.678
1.643
1.619
1.603
1.590
1.581
1.573
1.539

61.22
9.425
5.200
3.870
3.238
2.871
2.632
2.464
2.340
2.244
2.167
2.105
2.053
2.010
1.972
1.940
1.912
1.887
1.865
1.845
1.827
1.811
1.796
1.783
1.771
1.760
1.749
1.740
1.731
1.722
1.662
1.627
1.603
1.587
1.574
1.564
1.557
1.522

61.35
9.429
5.196
3.864
3.230
2.863
2.623
2.454
2.330
2.233
2.156
2.094
2.042
1.998
1.961
1.928
1.900
1.875
1.852
1.833
1.815
1.798
1.784
1.770
1.758
1.747
1.736
1.726
1.717
1.709
1.649
1.613
1.589
1.572
1.559
1.550
1.542
1.507

61.46
9.433
5.193
3.858
3.223
2.855
2.615
2.446
2.320
2.224
2.147
2.084
2.032
1.988
1.950
1.917
1.889
1.864
1.841
1.821
1.803
1.787
1.772
1.759
1.746
1.735
1.724
1.715
1.705
1.697
1.636
1.600
1.576
1.559
1.546
1.536
1.528
1.493

61.56
9.436
5.190
3.853
3.217
2.848
2.607
2.438
2.312
2.215
2.138
2.075
2.023
1.978
1.941
1.908
1.879
1.854
1.831
1.811
1.793
1.777
1.762
1.748
1.736
1.724
1.714
1.704
1.695
1.686
1.625
1.588
1.564
1.547
1.534
1.524
1.516
1.480

61.65
9.439
5.187
3.848
3.212
2.842
2.601
2.431
2.305
2.208
2.130
2.067
2.014
1.970
1.932
1.899
1.870
1.845
1.822
1.802
1.784
1.768
1.753
1.739
1.726
1.715
1.704
1.694
1.685
1.676
1.615
1.578
1.553
1.536
1.523
1.513
1.505
1.468

61.74
9.441
5.184
3.844
3.207
2.836
2.595
2.425
2.298
2.201
2.123
2.060
2.007
1.962
1.924
1.891
1.862
1.837
1.814
1.794
1.776
1.759
1.744
1.730
1.718
1.706
1.695
1.685
1.676
1.667
1.605
1.568
1.543
1.526
1.513
1.503
1.494
1.458

61.81
9.444
5.182
3.841
3.202
2.831
2.589
2.419
2.292
2.194
2.117
2.053
2.000
1.955
1.917
1.884
1.855
1.829
1.807
1.786
1.768
1.751
1.736
1.722
1.710
1.698
1.687
1.677
1.668
1.659
1.596
1.559
1.534
1.517
1.503
1.493
1.485
1.448

61.88
9.446
5.180
3.837
3.198
2.827
2.584
2.414
2.287
2.189
2.111
2.047
1.994
1.949
1.911
1.877
1.848
1.823
1.800
1.779
1.761
1.744
1.729
1.715
1.702
1.690
1.680
1.669
1.660
1.651
1.588
1.551
1.526
1.508
1.495
1.484
1.476
1.438

61.94
9.448
5.178
3.834
3.194
2.822
2.580
2.409
2.282
2.183
2.105
2.041
1.988
1.943
1.905
1.871
1.842
1.816
1.793
1.773
1.754
1.737
1.722
1.708
1.695
1.683
1.673
1.662
1.653
1.644
1.581
1.543
1.518
1.500
1.487
1.476
1.468
1.430

62.00
9.450
5.176
3.831
3.191
2.818
2.575
2.404
2.277
2.178
2.100
2.036
1.983
1.938
1.899
1.866
1.836
1.810
1.787
1.767
1.748
1.731
1.716
1.702
1.689
1.677
1.666
1.656
1.647
1.638
1.574
1.536
1.511
1.493
1.479
1.468
1.460
1.422

62.05
9.451
5.175
3.828
3.187
2.815
2.571
2.400
2.272
2.174
2.095
2.031
1.978
1.933
1.894
1.860
1.831
1.805
1.782
1.761
1.742
1.726
1.710
1.696
1.683
1.671
1.660
1.650
1.640
1.632
1.568
1.529
1.504
1.486
1.472
1.461
1.453
1.414

62.10
9.453
5.173
3.826
3.184
2.811
2.568
2.396
2.268
2.170
2.091
2.027
1.973
1.928
1.889
1.855
1.826
1.800
1.777
1.756
1.737
1.720
1.705
1.691
1.678
1.666
1.655
1.644
1.635
1.626
1.562
1.523
1.498
1.479
1.465
1.455
1.446
1.407

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

297

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 90
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

1 grados de libertad del numerador


2 grados de libertad del numerador

27

28

29

30

40

50

60

70

80

90

100

200

62.14
9.454
5.172
3.823
3.181
2.808
2.564
2.392
2.265
2.166
2.087
2.022
1.969
1.923
1.885
1.851
1.821
1.795
1.772
1.751
1.732
1.715
1.700
1.686
1.672
1.660
1.649
1.639
1.630
1.621
1.556
1.517
1.492
1.473
1.459
1.448
1.440
1.400

62.18
9.456
5.170
3.821
3.179
2.805
2.561
2.389
2.261
2.162
2.083
2.019
1.965
1.919
1.880
1.847
1.817
1.791
1.767
1.746
1.728
1.711
1.695
1.681
1.668
1.656
1.645
1.634
1.625
1.616
1.551
1.512
1.486
1.467
1.453
1.442
1.434
1.394

62.22
9.457
5.169
3.819
3.176
2.803
2.558
2.386
2.258
2.159
2.080
2.015
1.961
1.916
1.876
1.843
1.813
1.787
1.763
1.742
1.723
1.706
1.691
1.676
1.663
1.651
1.640
1.630
1.620
1.611
1.546
1.507
1.481
1.462
1.448
1.437
1.428
1.388

62.26
9.458
5.168
3.817
3.174
2.800
2.555
2.383
2.255
2.155
2.076
2.011
1.958
1.912
1.873
1.839
1.809
1.783
1.759
1.738
1.719
1.702
1.686
1.672
1.659
1.647
1.636
1.625
1.616
1.606
1.541
1.502
1.476
1.457
1.443
1.432
1.423
1.383

62.52
9.466
5.160
3.804
3.157
2.781
2.535
2.361
2.232
2.132
2.052
1.986
1.931
1.885
1.845
1.811
1.781
1.754
1.730
1.708
1.689
1.671
1.655
1.641
1.627
1.615
1.603
1.592
1.583
1.573
1.506
1.465
1.437
1.418
1.403
1.391
1.382
1.339

62.68
9.471
5.155
3.795
3.147
2.770
2.523
2.348
2.218
2.117
2.036
1.970
1.915
1.869
1.828
1.793
1.763
1.736
1.711
1.690
1.670
1.652
1.636
1.621
1.607
1.594
1.583
1.572
1.562
1.552
1.483
1.441
1.413
1.392
1.377
1.365
1.355
1.310

62.79
9.475
5.151
3.790
3.140
2.762
2.514
2.339
2.208
2.107
2.026
1.960
1.904
1.857
1.817
1.782
1.751
1.723
1.699
1.677
1.657
1.639
1.622
1.607
1.593
1.581
1.569
1.558
1.547
1.538
1.467
1.424
1.395
1.374
1.358
1.346
1.336
1.289

62.87
9.477
5.149
3.786
3.135
2.756
2.508
2.333
2.202
2.100
2.019
1.952
1.896
1.849
1.808
1.773
1.742
1.714
1.690
1.667
1.647
1.629
1.613
1.597
1.583
1.570
1.558
1.547
1.537
1.527
1.455
1.412
1.382
1.361
1.344
1.332
1.321
1.273

62.92
9.479
5.147
3.782
3.132
2.752
2.504
2.328
2.196
2.095
2.013
1.946
1.890
1.843
1.802
1.766
1.735
1.707
1.683
1.660
1.640
1.622
1.605
1.590
1.576
1.562
1.550
1.539
1.529
1.519
1.447
1.402
1.372
1.350
1.334
1.321
1.310
1.261

62.97
9.480
5.145
3.780
3.129
2.749
2.500
2.324
2.192
2.090
2.009
1.942
1.886
1.838
1.797
1.761
1.730
1.702
1.677
1.655
1.634
1.616
1.599
1.584
1.569
1.556
1.544
1.533
1.522
1.512
1.439
1.395
1.364
1.342
1.325
1.312
1.301
1.250

63.00
9.481
5.144
3.778
3.126
2.746
2.497
2.321
2.189
2.087
2.005
1.938
1.882
1.834
1.793
1.757
1.726
1.698
1.673
1.650
1.630
1.611
1.594
1.579
1.565
1.551
1.539
1.528
1.517
1.507
1.434
1.388
1.358
1.335
1.318
1.304
1.293
1.242

63.16
9.486
5.139
3.769
3.116
2.734
2.484
2.307
2.174
2.071
1.989
1.921
1.864
1.816
1.774
1.738
1.706
1.678
1.652
1.629
1.608
1.590
1.572
1.556
1.542
1.528
1.515
1.504
1.493
1.482
1.406
1.359
1.326
1.302
1.284
1.269
1.257
1.199

Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

298

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 95
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

1 grados de libertad del numerador


2 grados de libertad del numerador

10

11

12

13

161.4
18.51
10.128
7.709
6.608
5.987
5.591
5.318
5.117
4.965
4.844
4.747
4.667
4.600
4.543
4.494
4.451
4.414
4.381
4.351
4.325
4.301
4.279
4.260
4.242
4.225
4.210
4.196
4.183
4.171
4.085
4.034
4.001
3.978
3.960
3.947
3.936
3.888

199.5
19.00
9.552
6.944
5.786
5.143
4.737
4.459
4.256
4.103
3.982
3.885
3.806
3.739
3.682
3.634
3.592
3.555
3.522
3.493
3.467
3.443
3.422
3.403
3.385
3.369
3.354
3.340
3.328
3.316
3.232
3.183
3.150
3.128
3.111
3.098
3.087
3.041

215.7
19.16
9.277
6.591
5.409
4.757
4.347
4.066
3.863
3.708
3.587
3.490
3.411
3.344
3.287
3.239
3.197
3.160
3.127
3.098
3.072
3.049
3.028
3.009
2.991
2.975
2.960
2.947
2.934
2.922
2.839
2.790
2.758
2.736
2.719
2.706
2.696
2.650

224.6
19.24
9.117
6.388
5.192
4.534
4.120
3.838
3.633
3.478
3.357
3.259
3.179
3.112
3.056
3.007
2.965
2.928
2.895
2.866
2.840
2.817
2.796
2.776
2.759
2.743
2.728
2.714
2.701
2.690
2.606
2.557
2.525
2.503
2.486
2.473
2.463
2.417

230.2
19.29
9.013
6.256
5.050
4.387
3.972
3.688
3.482
3.326
3.204
3.106
3.025
2.958
2.901
2.852
2.810
2.773
2.740
2.711
2.685
2.661
2.640
2.621
2.603
2.587
2.572
2.558
2.545
2.534
2.449
2.400
2.368
2.346
2.329
2.316
2.305
2.259

234.0
19.32
8.941
6.163
4.950
4.284
3.866
3.581
3.374
3.217
3.095
2.996
2.915
2.848
2.790
2.741
2.699
2.661
2.628
2.599
2.573
2.549
2.528
2.508
2.490
2.474
2.459
2.445
2.432
2.421
2.336
2.286
2.254
2.231
2.214
2.201
2.191
2.144

236.8
19.35
8.887
6.094
4.876
4.207
3.787
3.500
3.293
3.135
3.012
2.913
2.832
2.764
2.707
2.657
2.614
2.577
2.544
2.514
2.488
2.464
2.442
2.423
2.405
2.388
2.373
2.359
2.346
2.334
2.249
2.199
2.167
2.143
2.126
2.113
2.103
2.056

238.9
19.37
8.845
6.041
4.818
4.147
3.726
3.438
3.230
3.072
2.948
2.849
2.767
2.699
2.641
2.591
2.548
2.510
2.477
2.447
2.420
2.397
2.375
2.355
2.337
2.321
2.305
2.291
2.278
2.266
2.180
2.130
2.097
2.074
2.056
2.043
2.032
1.985

240.5
19.38
8.812
5.999
4.772
4.099
3.677
3.388
3.179
3.020
2.896
2.796
2.714
2.646
2.588
2.538
2.494
2.456
2.423
2.393
2.366
2.342
2.320
2.300
2.282
2.265
2.250
2.236
2.223
2.211
2.124
2.073
2.040
2.017
1.999
1.986
1.975
1.927

241.9
19.39
8.785
5.964
4.735
4.060
3.637
3.347
3.137
2.978
2.854
2.753
2.671
2.602
2.544
2.494
2.450
2.412
2.378
2.348
2.321
2.297
2.275
2.255
2.236
2.220
2.204
2.190
2.177
2.165
2.077
2.026
1.993
1.969
1.951
1.938
1.927
1.878

243.0
19.40
8.763
5.936
4.704
4.027
3.603
3.313
3.102
2.943
2.818
2.717
2.635
2.565
2.507
2.456
2.413
2.374
2.340
2.310
2.283
2.259
2.236
2.216
2.198
2.181
2.166
2.151
2.138
2.126
2.038
1.986
1.952
1.928
1.910
1.897
1.886
1.837

243.9
19.41
8.745
5.912
4.678
4.000
3.575
3.284
3.073
2.913
2.788
2.687
2.604
2.534
2.475
2.425
2.381
2.342
2.308
2.278
2.250
2.226
2.204
2.183
2.165
2.148
2.132
2.118
2.104
2.092
2.003
1.952
1.917
1.893
1.875
1.861
1.850
1.801

244.7
19.41
8.729
5.891
4.655
3.976
3.550
3.259
3.048
2.887
2.761
2.660
2.577
2.507
2.448
2.397
2.353
2.314
2.280
2.250
2.222
2.198
2.175
2.155
2.136
2.119
2.103
2.089
2.075
2.063
1.974
1.921
1.887
1.863
1.845
1.830
1.819
1.769

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

299

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 95
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

1 grados de libertad del numerador


2 grados de libertad del numerador

14

15

16

17

18

19

20

21

22

23

24

25

26

245.4
19.42
8.715
5.873
4.636
3.956
3.529
3.237
3.025
2.865
2.739
2.637
2.554
2.484
2.424
2.373
2.329
2.290
2.256
2.225
2.197
2.173
2.150
2.130
2.111
2.094
2.078
2.064
2.050
2.037
1.948
1.895
1.860
1.836
1.817
1.803
1.792
1.742

245.9
19.43
8.703
5.858
4.619
3.938
3.511
3.218
3.006
2.845
2.719
2.617
2.533
2.463
2.403
2.352
2.308
2.269
2.234
2.203
2.176
2.151
2.128
2.108
2.089
2.072
2.056
2.041
2.027
2.015
1.924
1.871
1.836
1.812
1.793
1.779
1.768
1.717

246.5
19.43
8.692
5.844
4.604
3.922
3.494
3.202
2.989
2.828
2.701
2.599
2.515
2.445
2.385
2.333
2.289
2.250
2.215
2.184
2.156
2.131
2.109
2.088
2.069
2.052
2.036
2.021
2.007
1.995
1.904
1.850
1.815
1.790
1.772
1.757
1.746
1.694

246.9
19.44
8.683
5.832
4.590
3.908
3.480
3.187
2.974
2.812
2.685
2.583
2.499
2.428
2.368
2.317
2.272
2.233
2.198
2.167
2.139
2.114
2.091
2.070
2.051
2.034
2.018
2.003
1.989
1.976
1.885
1.831
1.796
1.771
1.752
1.737
1.726
1.674

247.3
19.44
8.675
5.821
4.579
3.896
3.467
3.173
2.960
2.798
2.671
2.568
2.484
2.413
2.353
2.302
2.257
2.217
2.182
2.151
2.123
2.098
2.075
2.054
2.035
2.018
2.002
1.987
1.973
1.960
1.868
1.814
1.778
1.753
1.734
1.720
1.708
1.656

247.7
19.44
8.667
5.811
4.568
3.884
3.455
3.161
2.948
2.785
2.658
2.555
2.471
2.400
2.340
2.288
2.243
2.203
2.168
2.137
2.109
2.084
2.061
2.040
2.021
2.003
1.987
1.972
1.958
1.945
1.853
1.798
1.763
1.737
1.718
1.703
1.691
1.639

248.0
19.45
8.660
5.803
4.558
3.874
3.445
3.150
2.936
2.774
2.646
2.544
2.459
2.388
2.328
2.276
2.230
2.191
2.155
2.124
2.096
2.071
2.048
2.027
2.007
1.990
1.974
1.959
1.945
1.932
1.839
1.784
1.748
1.722
1.703
1.688
1.676
1.623

248.3
19.45
8.654
5.795
4.549
3.865
3.435
3.140
2.926
2.764
2.636
2.533
2.448
2.377
2.316
2.264
2.219
2.179
2.144
2.112
2.084
2.059
2.036
2.015
1.995
1.978
1.961
1.946
1.932
1.919
1.826
1.771
1.735
1.709
1.689
1.675
1.663
1.609

248.6
19.45
8.648
5.787
4.541
3.856
3.426
3.131
2.917
2.754
2.626
2.523
2.438
2.367
2.306
2.254
2.208
2.168
2.133
2.102
2.073
2.048
2.025
2.003
1.984
1.966
1.950
1.935
1.921
1.908
1.814
1.759
1.722
1.696
1.677
1.662
1.650
1.596

248.8
19.45
8.643
5.781
4.534
3.849
3.418
3.123
2.908
2.745
2.617
2.514
2.429
2.357
2.297
2.244
2.199
2.159
2.123
2.092
2.063
2.038
2.014
1.993
1.974
1.956
1.940
1.924
1.910
1.897
1.803
1.748
1.711
1.685
1.665
1.650
1.638
1.583

249.1
19.45
8.638
5.774
4.527
3.841
3.410
3.115
2.900
2.737
2.609
2.505
2.420
2.349
2.288
2.235
2.190
2.150
2.114
2.082
2.054
2.028
2.005
1.984
1.964
1.946
1.930
1.915
1.901
1.887
1.793
1.737
1.700
1.674
1.654
1.639
1.627
1.572

249.3
19.46
8.634
5.769
4.521
3.835
3.404
3.108
2.893
2.730
2.601
2.498
2.412
2.341
2.280
2.227
2.181
2.141
2.106
2.074
2.045
2.020
1.996
1.975
1.955
1.938
1.921
1.906
1.891
1.878
1.783
1.727
1.690
1.664
1.644
1.629
1.616
1.561

249.5
19.46
8.630
5.763
4.515
3.829
3.397
3.102
2.886
2.723
2.594
2.491
2.405
2.333
2.272
2.220
2.174
2.134
2.098
2.066
2.037
2.012
1.988
1.967
1.947
1.929
1.913
1.897
1.883
1.870
1.775
1.718
1.681
1.654
1.634
1.619
1.607
1.551

Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

300

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 95
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

1 grados de libertad del numerador


2 grados de libertad del numerador

27

28

29

30

40

50

60

70

80

90

100

200

249.6
19.46
8.626
5.759
4.510
3.823
3.391
3.095
2.880
2.716
2.588
2.484
2.398
2.326
2.265
2.212
2.167
2.126
2.090
2.059
2.030
2.004
1.981
1.959
1.939
1.921
1.905
1.889
1.875
1.862
1.766
1.710
1.672
1.646
1.626
1.610
1.598
1.542

249.8
19.46
8.623
5.754
4.505
3.818
3.386
3.090
2.874
2.710
2.582
2.478
2.392
2.320
2.259
2.206
2.160
2.119
2.084
2.052
2.023
1.997
1.973
1.952
1.932
1.914
1.898
1.882
1.868
1.854
1.759
1.702
1.664
1.637
1.617
1.601
1.589
1.533

249.9
19.46
8.620
5.750
4.500
3.813
3.381
3.084
2.869
2.705
2.576
2.472
2.386
2.314
2.253
2.200
2.154
2.113
2.077
2.045
2.016
1.990
1.967
1.945
1.926
1.907
1.891
1.875
1.861
1.847
1.751
1.694
1.656
1.629
1.609
1.593
1.581
1.524

250.1
19.46
8.617
5.746
4.496
3.808
3.376
3.079
2.864
2.700
2.570
2.466
2.380
2.308
2.247
2.194
2.148
2.107
2.071
2.039
2.010
1.984
1.961
1.939
1.919
1.901
1.884
1.869
1.854
1.841
1.744
1.687
1.649
1.622
1.602
1.586
1.573
1.516

251.1
19.47
8.594
5.717
4.464
3.774
3.340
3.043
2.826
2.661
2.531
2.426
2.339
2.266
2.204
2.151
2.104
2.063
2.026
1.994
1.965
1.938
1.914
1.892
1.872
1.853
1.836
1.820
1.806
1.792
1.693
1.634
1.594
1.566
1.545
1.528
1.515
1.455

251.8
19.48
8.581
5.699
4.444
3.754
3.319
3.020
2.803
2.637
2.507
2.401
2.314
2.241
2.178
2.124
2.077
2.035
1.999
1.966
1.936
1.909
1.885
1.863
1.842
1.823
1.806
1.790
1.775
1.761
1.660
1.599
1.559
1.530
1.508
1.491
1.477
1.415

252.2
19.48
8.572
5.688
4.431
3.740
3.304
3.005
2.787
2.621
2.490
2.384
2.297
2.223
2.160
2.106
2.058
2.017
1.980
1.946
1.916
1.889
1.865
1.842
1.822
1.803
1.785
1.769
1.754
1.740
1.637
1.576
1.534
1.505
1.482
1.465
1.450
1.386

252.5
19.48
8.566
5.679
4.422
3.730
3.294
2.994
2.776
2.609
2.478
2.372
2.284
2.210
2.147
2.093
2.045
2.003
1.966
1.932
1.902
1.875
1.850
1.828
1.807
1.788
1.770
1.754
1.738
1.724
1.621
1.558
1.516
1.486
1.463
1.445
1.430
1.364

252.7
19.48
8.561
5.673
4.415
3.722
3.286
2.986
2.768
2.601
2.469
2.363
2.275
2.201
2.137
2.083
2.035
1.993
1.955
1.922
1.891
1.864
1.839
1.816
1.796
1.776
1.758
1.742
1.726
1.712
1.608
1.544
1.502
1.471
1.448
1.429
1.415
1.346

252.9
19.49
8.557
5.668
4.409
3.716
3.280
2.980
2.761
2.594
2.462
2.356
2.267
2.193
2.130
2.075
2.027
1.985
1.947
1.913
1.883
1.856
1.830
1.808
1.787
1.767
1.749
1.733
1.717
1.703
1.597
1.534
1.491
1.459
1.436
1.417
1.402
1.332

253.0
19.49
8.554
5.664
4.405
3.712
3.275
2.975
2.756
2.588
2.457
2.350
2.261
2.187
2.123
2.068
2.020
1.978
1.940
1.907
1.876
1.849
1.823
1.800
1.779
1.760
1.742
1.725
1.710
1.695
1.589
1.525
1.481
1.450
1.426
1.407
1.392
1.321

253.7
19.49
8.540
5.646
4.385
3.690
3.252
2.951
2.731
2.563
2.431
2.323
2.234
2.159
2.095
2.039
1.991
1.948
1.910
1.875
1.845
1.817
1.791
1.768
1.746
1.726
1.708
1.691
1.675
1.660
1.551
1.484
1.438
1.404
1.379
1.358
1.342
1.263

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

301

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 975
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

1 grados de libertad del numerador


2 grados de libertad del numerador

10

11

12

13

647.8
38.51
17.44
12.218
10.007
8.813
8.073
7.571
7.209
6.937
6.724
6.554
6.414
6.298
6.200
6.115
6.042
5.978
5.922
5.871
5.827
5.786
5.750
5.717
5.686
5.659
5.633
5.610
5.588
5.568
5.424
5.340
5.286
5.247
5.218
5.196
5.179
5.100

799.5
39.00
16.044
10.649
8.434
7.260
6.542
6.059
5.715
5.456
5.256
5.096
4.965
4.857
4.765
4.687
4.619
4.560
4.508
4.461
4.420
4.383
4.349
4.319
4.291
4.265
4.242
4.221
4.201
4.182
4.051
3.975
3.925
3.890
3.864
3.844
3.828
3.758

864.2
39.17
15.44
9.979
7.764
6.599
5.890
5.416
5.078
4.826
4.630
4.474
4.347
4.242
4.153
4.077
4.011
3.954
3.903
3.859
3.819
3.783
3.750
3.721
3.694
3.670
3.647
3.626
3.607
3.589
3.463
3.390
3.343
3.309
3.284
3.265
3.250
3.182

899.6
39.25
15.10
9.604
7.388
6.227
5.523
5.053
4.718
4.468
4.275
4.121
3.996
3.892
3.804
3.729
3.665
3.608
3.559
3.515
3.475
3.440
3.408
3.379
3.353
3.329
3.307
3.286
3.267
3.250
3.126
3.054
3.008
2.975
2.950
2.932
2.917
2.850

921.8
39.30
14.89
9.364
7.146
5.988
5.285
4.817
4.484
4.236
4.044
3.891
3.767
3.663
3.576
3.502
3.438
3.382
3.333
3.289
3.250
3.215
3.183
3.155
3.129
3.105
3.083
3.063
3.044
3.026
2.904
2.833
2.786
2.754
2.730
2.711
2.696
2.630

937.1
39.33
14.74
9.197
6.978
5.820
5.119
4.652
4.320
4.072
3.881
3.728
3.604
3.501
3.415
3.341
3.277
3.221
3.172
3.128
3.090
3.055
3.023
2.995
2.969
2.945
2.923
2.903
2.884
2.867
2.744
2.674
2.627
2.595
2.571
2.552
2.537
2.472

948.2
39.36
14.62
9.074
6.853
5.695
4.995
4.529
4.197
3.950
3.759
3.607
3.483
3.380
3.293
3.219
3.156
3.100
3.051
3.007
2.969
2.934
2.902
2.874
2.848
2.824
2.802
2.782
2.763
2.746
2.624
2.553
2.507
2.474
2.450
2.432
2.417
2.351

956.6
39.37
14.54
8.980
6.757
5.600
4.899
4.433
4.102
3.855
3.664
3.512
3.388
3.285
3.199
3.125
3.061
3.005
2.956
2.913
2.874
2.839
2.808
2.779
2.753
2.729
2.707
2.687
2.669
2.651
2.529
2.458
2.412
2.379
2.355
2.336
2.321
2.256

963.3
39.39
14.47
8.905
6.681
5.523
4.823
4.357
4.026
3.779
3.588
3.436
3.312
3.209
3.123
3.049
2.985
2.929
2.880
2.837
2.798
2.763
2.731
2.703
2.677
2.653
2.631
2.611
2.592
2.575
2.452
2.381
2.334
2.302
2.277
2.259
2.244
2.178

968.6
39.40
14.42
8.844
6.619
5.461
4.761
4.295
3.964
3.717
3.526
3.374
3.250
3.147
3.060
2.986
2.922
2.866
2.817
2.774
2.735
2.700
2.668
2.640
2.613
2.590
2.568
2.547
2.529
2.511
2.388
2.317
2.270
2.237
2.213
2.194
2.179
2.113

973.0
39.41
14.37
8.794
6.568
5.410
4.709
4.243
3.912
3.665
3.474
3.321
3.197
3.095
3.008
2.934
2.870
2.814
2.765
2.721
2.682
2.647
2.615
2.586
2.560
2.536
2.514
2.494
2.475
2.458
2.334
2.263
2.216
2.183
2.158
2.140
2.124
2.058

976.7
39.42
14.34
8.751
6.525
5.366
4.666
4.200
3.868
3.621
3.430
3.277
3.153
3.050
2.963
2.889
2.825
2.769
2.720
2.676
2.637
2.602
2.570
2.541
2.515
2.491
2.469
2.448
2.430
2.412
2.288
2.216
2.169
2.136
2.111
2.092
2.077
2.010

979.8
39.42
14.31
8.715
6.488
5.329
4.628
4.162
3.831
3.583
3.392
3.239
3.115
3.012
2.925
2.851
2.786
2.730
2.681
2.637
2.598
2.563
2.531
2.502
2.476
2.452
2.429
2.409
2.390
2.372
2.248
2.176
2.129
2.095
2.071
2.051
2.036
1.969

Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

302

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 975
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

1 grados de libertad del numerador


2 grados de libertad del numerador

14

15

16

17

18

19

20

21

22

23

24

25

26

982.5
39.43
14.28
8.684
6.456
5.297
4.596
4.130
3.798
3.550
3.359
3.206
3.082
2.979
2.891
2.817
2.753
2.696
2.647
2.603
2.564
2.528
2.497
2.468
2.441
2.417
2.395
2.374
2.355
2.338
2.213
2.140
2.093
2.059
2.035
2.015
2.000
1.932

984.9
39.43
14.25
8.657
6.428
5.269
4.568
4.101
3.769
3.522
3.330
3.177
3.053
2.949
2.862
2.788
2.723
2.667
2.617
2.573
2.534
2.498
2.466
2.437
2.411
2.387
2.364
2.344
2.325
2.307
2.182
2.109
2.061
2.028
2.003
1.983
1.968
1.900

986.9
39.44
14.23
8.633
6.403
5.244
4.543
4.076
3.744
3.496
3.304
3.152
3.027
2.923
2.836
2.761
2.697
2.640
2.591
2.547
2.507
2.472
2.440
2.411
2.384
2.360
2.337
2.317
2.298
2.280
2.154
2.081
2.033
1.999
1.974
1.955
1.939
1.870

988.7
39.44
14.21
8.611
6.381
5.222
4.521
4.054
3.722
3.474
3.282
3.129
3.004
2.900
2.813
2.738
2.673
2.617
2.567
2.523
2.483
2.448
2.416
2.386
2.360
2.335
2.313
2.292
2.273
2.255
2.129
2.056
2.008
1.974
1.948
1.929
1.913
1.844

990.3
39.44
14.20
8.592
6.362
5.202
4.501
4.034
3.701
3.453
3.261
3.108
2.983
2.879
2.792
2.717
2.652
2.596
2.546
2.501
2.462
2.426
2.394
2.365
2.338
2.314
2.291
2.270
2.251
2.233
2.107
2.033
1.985
1.950
1.925
1.905
1.890
1.820

991.8
39.45
14.18
8.575
6.344
5.184
4.483
4.016
3.683
3.435
3.243
3.090
2.965
2.861
2.773
2.698
2.633
2.576
2.526
2.482
2.442
2.407
2.374
2.345
2.318
2.294
2.271
2.251
2.231
2.213
2.086
2.012
1.964
1.929
1.904
1.884
1.868
1.798

993.1
39.45
14.17
8.560
6.329
5.168
4.467
3.999
3.667
3.419
3.226
3.073
2.948
2.844
2.756
2.681
2.616
2.559
2.509
2.464
2.425
2.389
2.357
2.327
2.300
2.276
2.253
2.232
2.213
2.195
2.068
1.993
1.944
1.910
1.884
1.864
1.849
1.778

994.3
39.45
14.16
8.546
6.314
5.154
4.452
3.985
3.652
3.403
3.211
3.057
2.932
2.828
2.740
2.665
2.600
2.543
2.493
2.448
2.409
2.373
2.340
2.311
2.284
2.259
2.237
2.216
2.196
2.178
2.051
1.976
1.927
1.892
1.866
1.846
1.830
1.759

995.4
39.45
14.14
8.533
6.301
5.141
4.439
3.971
3.638
3.390
3.197
3.043
2.918
2.814
2.726
2.651
2.585
2.529
2.478
2.434
2.394
2.358
2.325
2.296
2.269
2.244
2.222
2.201
2.181
2.163
2.035
1.960
1.911
1.876
1.850
1.830
1.814
1.742

996.3
39.46
14.13
8.522
6.289
5.128
4.426
3.959
3.626
3.377
3.184
3.031
2.905
2.801
2.713
2.637
2.572
2.515
2.465
2.420
2.380
2.344
2.312
2.282
2.255
2.230
2.208
2.187
2.167
2.149
2.020
1.945
1.896
1.861
1.835
1.814
1.798
1.726

997.3
39.46
14.12
8.511
6.278
5.117
4.415
3.947
3.614
3.365
3.173
3.019
2.893
2.789
2.701
2.625
2.560
2.503
2.452
2.408
2.368
2.332
2.299
2.269
2.242
2.217
2.195
2.174
2.154
2.136
2.007
1.931
1.882
1.847
1.820
1.800
1.784
1.712

998.1
39.46
14.12
8.501
6.268
5.107
4.405
3.937
3.604
3.355
3.162
3.008
2.882
2.778
2.689
2.614
2.548
2.491
2.441
2.396
2.356
2.320
2.287
2.257
2.230
2.205
2.183
2.161
2.142
2.124
1.994
1.919
1.869
1.833
1.807
1.787
1.770
1.698

998.8
39.46
14.11
8.492
6.258
5.097
4.395
3.927
3.594
3.345
3.152
2.998
2.872
2.767
2.679
2.603
2.538
2.481
2.430
2.385
2.345
2.309
2.276
2.246
2.219
2.194
2.171
2.150
2.131
2.112
1.983
1.907
1.857
1.821
1.795
1.774
1.758
1.685

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

303

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 975
1 = P (F f1,1 ,2 )
1
2

27

28

29

30

1 grados de libertad del numerador


2 grados de libertad del numerador
40

50

60

70

80

90

100

200

999.6

39.461 39.462 39.463 39.465 39.473 39.478 39.481 39.484 39.486 39.487 39.488 39.493

1000.2 1000.8 1001.4 1005.6 1008.1 1009.8 1011.0 1011.9 1012.6 1013.2 1015.7

14.100 14.093 14.086 14.081 14.036 14.010 13.992 13.979 13.970 13.962 13.956 13.929

8.483

8.475

8.468

8.461

8.411

8.381

8.360

8.346

8.335

8.326

8.319

6.250

6.242

6.234

6.227

6.175

6.144

6.123

6.107

6.096

6.087

6.080

6.048

5.088

5.080

5.072

5.065

5.012

4.980

4.959

4.943

4.932

4.923

4.915

4.882

4.386

4.378

4.370

4.362

4.309

4.276

4.254

4.239

4.227

4.218

4.210

4.176

3.918

3.909

3.901

3.894

3.840

3.807

3.784

3.768

3.756

3.747

3.739

3.705

8.288

3.584

3.576

3.568

3.560

3.505

3.472

3.449

3.433

3.421

3.411

3.403

3.368

10

3.335

3.327

3.319

3.311

3.255

3.221

3.198

3.182

3.169

3.160

3.152

3.116

11

3.142

3.133

3.125

3.118

3.061

3.027

3.004

2.987

2.974

2.964

2.956

2.920

12

2.988

2.979

2.971

2.963

2.906

2.871

2.848

2.831

2.818

2.808

2.800

2.763

13

2.862

2.853

2.845

2.837

2.780

2.744

2.720

2.703

2.690

2.680

2.671

2.634

14

2.758

2.749

2.740

2.732

2.674

2.638

2.614

2.597

2.583

2.573

2.565

2.526

15

2.669

2.660

2.652

2.644

2.585

2.549

2.524

2.506

2.493

2.482

2.474

2.435

16

2.594

2.584

2.576

2.568

2.509

2.472

2.447

2.429

2.415

2.405

2.396

2.357

17

2.528

2.519

2.510

2.502

2.442

2.405

2.380

2.362

2.348

2.337

2.329

2.289

18

2.471

2.461

2.453

2.445

2.384

2.347

2.321

2.303

2.289

2.278

2.269

2.229

19

2.420

2.411

2.402

2.394

2.333

2.295

2.270

2.251

2.237

2.226

2.217

2.176

20

2.375

2.366

2.357

2.349

2.287

2.249

2.223

2.205

2.190

2.179

2.170

2.128

21

2.335

2.325

2.317

2.308

2.246

2.208

2.182

2.163

2.148

2.137

2.128

2.086

22

2.299

2.289

2.280

2.272

2.210

2.171

2.145

2.125

2.111

2.099

2.090

2.047

23

2.266

2.256

2.247

2.239

2.176

2.137

2.111

2.091

2.077

2.065

2.056

2.013

24

2.236

2.226

2.217

2.209

2.146

2.107

2.080

2.060

2.045

2.034

2.024

1.981

25

2.209

2.199

2.190

2.182

2.118

2.079

2.052

2.032

2.017

2.005

1.996

1.952

26

2.184

2.174

2.165

2.157

2.093

2.053

2.026

2.006

1.991

1.979

1.969

1.925

27

2.161

2.151

2.142

2.133

2.069

2.029

2.002

1.982

1.966

1.954

1.945

1.900

28

2.140

2.130

2.121

2.112

2.048

2.007

1.980

1.959

1.944

1.932

1.922

1.877

29

2.120

2.110

2.101

2.092

2.028

1.987

1.959

1.939

1.923

1.911

1.901

1.855

30

2.102

2.092

2.083

2.074

2.009

1.968

1.940

1.920

1.904

1.892

1.882

1.835

40

1.972

1.962

1.952

1.943

1.875

1.832

1.803

1.781

1.764

1.751

1.741

1.691

50

1.895

1.885

1.875

1.866

1.796

1.752

1.721

1.698

1.681

1.667

1.656

1.603

60

1.845

1.835

1.825

1.815

1.744

1.699

1.667

1.643

1.625

1.611

1.599

1.543

70

1.810

1.799

1.789

1.779

1.707

1.660

1.628

1.604

1.585

1.570

1.558

1.500

80

1.783

1.772

1.762

1.752

1.679

1.632

1.599

1.574

1.555

1.540

1.527

1.467

90

1.763

1.752

1.741

1.731

1.657

1.610

1.576

1.551

1.531

1.516

1.503

1.441

100

1.746

1.735

1.725

1.715

1.640

1.592

1.558

1.532

1.512

1.496

1.483

1.420

200

1.673

1.661

1.650

1.640

1.562

1.511

1.474

1.447

1.425

1.407

1.393

1.320

Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

304

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 99
1 = P (F f1,1 ,2 )
1
2

1 grados de libertad del numerador


2 grados de libertad del numerador
5

10

11

12

13

4052.2 4999.3 5403.5 5624.3 5763.9 5858.9 5928.3 5980.9 6022.4 6055.9 6083.4 6106.7 6125.8

98.502 99.000 99.164 99.251 99.302 99.331 99.357 99.375 99.390 99.397 99.408 99.419 99.422

34.116 30.816 29.457 28.710 28.237 27.911 27.671 27.489 27.345 27.228 27.132 27.052 26.983

21.198 18.000 16.694 15.977 15.522 15.207 14.976 14.799 14.659 14.546 14.452 14.374 14.306

16.258 13.274 12.060 11.392 10.967 10.672 10.456 10.289 10.158 10.051 9.963

9.888

13.745 10.925 9.780

9.148

8.746

8.466

8.260

8.102

7.976

7.874

7.790

7.718

7.657

12.246 9.547

8.451

7.847

7.460

7.191

6.993

6.840

6.719

6.620

6.538

6.469

6.410
5.609

9.825

11.259 8.649

7.591

7.006

6.632

6.371

6.178

6.029

5.911

5.814

5.734

5.667

10.562 8.022

6.992

6.422

6.057

5.802

5.613

5.467

5.351

5.257

5.178

5.111

5.055

10

10.044 7.559

6.552

5.994

5.636

5.386

5.200

5.057

4.942

4.849

4.772

4.706

4.650

11

9.646

7.206

6.217

5.668

5.316

5.069

4.886

4.744

4.632

4.539

4.462

4.397

4.342

12

9.330

6.927

5.953

5.412

5.064

4.821

4.640

4.499

4.388

4.296

4.220

4.155

4.100

13

9.074

6.701

5.739

5.205

4.862

4.620

4.441

4.302

4.191

4.100

4.025

3.960

3.905

14

8.862

6.515

5.564

5.035

4.695

4.456

4.278

4.140

4.030

3.939

3.864

3.800

3.745

15

8.683

6.359

5.417

4.893

4.556

4.318

4.142

4.004

3.895

3.805

3.730

3.666

3.612

16

8.531

6.226

5.292

4.773

4.437

4.202

4.026

3.890

3.780

3.691

3.616

3.553

3.498

17

8.400

6.112

5.185

4.669

4.336

4.101

3.927

3.791

3.682

3.593

3.518

3.455

3.401

18

8.285

6.013

5.092

4.579

4.248

4.015

3.841

3.705

3.597

3.508

3.434

3.371

3.316

19

8.185

5.926

5.010

4.500

4.171

3.939

3.765

3.631

3.523

3.434

3.360

3.297

3.242

20

8.096

5.849

4.938

4.431

4.103

3.871

3.699

3.564

3.457

3.368

3.294

3.231

3.177

21

8.017

5.780

4.874

4.369

4.042

3.812

3.640

3.506

3.398

3.310

3.236

3.173

3.119

22

7.945

5.719

4.817

4.313

3.988

3.758

3.587

3.453

3.346

3.258

3.184

3.121

3.067

23

7.881

5.664

4.765

4.264

3.939

3.710

3.539

3.406

3.299

3.211

3.137

3.074

3.020

24

7.823

5.614

4.718

4.218

3.895

3.667

3.496

3.363

3.256

3.168

3.094

3.032

2.977

25

7.770

5.568

4.675

4.177

3.855

3.627

3.457

3.324

3.217

3.129

3.056

2.993

2.939

26

7.721

5.526

4.637

4.140

3.818

3.591

3.421

3.288

3.182

3.094

3.021

2.958

2.904

27

7.677

5.488

4.601

4.106

3.785

3.558

3.388

3.256

3.149

3.062

2.988

2.926

2.872

28

7.636

5.453

4.568

4.074

3.754

3.528

3.358

3.226

3.120

3.032

2.959

2.896

2.842

29

7.598

5.420

4.538

4.045

3.725

3.499

3.330

3.198

3.092

3.005

2.931

2.868

2.814

30

7.562

5.390

4.510

4.018

3.699

3.473

3.305

3.173

3.067

2.979

2.906

2.843

2.789

40

7.314

5.178

4.313

3.828

3.514

3.291

3.124

2.993

2.888

2.801

2.727

2.665

2.611

50

7.171

5.057

4.199

3.720

3.408

3.186

3.020

2.890

2.785

2.698

2.625

2.563

2.508

60

7.077

4.977

4.126

3.649

3.339

3.119

2.953

2.823

2.718

2.632

2.559

2.496

2.442

70

7.011

4.922

4.074

3.600

3.291

3.071

2.906

2.777

2.672

2.585

2.512

2.450

2.395

80

6.963

4.881

4.036

3.563

3.255

3.036

2.871

2.742

2.637

2.551

2.478

2.415

2.361

90

6.925

4.849

4.007

3.535

3.228

3.009

2.845

2.715

2.611

2.524

2.451

2.389

2.334

100

6.895

4.824

3.984

3.513

3.206

2.988

2.823

2.694

2.590

2.503

2.430

2.368

2.313

200

6.763

4.713

3.881

3.414

3.110

2.893

2.730

2.601

2.497

2.411

2.338

2.275

2.220

FaCyT-Matemticas

Cap 5. Prueba de hiptesis sobre los parmetros

305

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 99
1 = P (F f1,1 ,2 )
1
2

14

15

16

17

1 grados de libertad del numerador


2 grados de libertad del numerador
18

19

20

21

22

23

24

25

26

6143.0 6156.9 6170.0 6181.1 6191.4 6200.8 6208.7 6216.1 6223.1 6228.7 6234.3 6239.9 6244.5

99.426 99.433 99.437 99.441 99.444 99.448 99.448 99.451 99.455 99.455 99.455 99.459 99.462

26.924 26.872 26.826 26.786 26.751 26.719 26.690 26.664 26.639 26.617 26.597 26.579 26.562

14.249 14.198 14.154 14.114 14.079 14.048 14.019 13.994 13.970 13.949 13.929 13.911 13.894

9.770

9.722

9.680

9.643

9.609

9.580

9.553

9.528

9.506

9.485

9.466

9.449

7.605

7.559

7.519

7.483

7.451

7.422

7.396

7.372

7.351

7.331

7.313

7.296

7.281

6.359

6.314

6.275

6.240

6.209

6.181

6.155

6.132

6.111

6.092

6.074

6.058

6.043

9.433

5.559

5.515

5.477

5.442

5.412

5.384

5.359

5.336

5.316

5.297

5.279

5.263

5.248

5.005

4.962

4.924

4.890

4.860

4.833

4.808

4.786

4.765

4.746

4.729

4.713

4.698

10

4.601

4.558

4.520

4.487

4.457

4.430

4.405

4.383

4.363

4.344

4.327

4.311

4.296

11

4.293

4.251

4.213

4.180

4.150

4.123

4.099

4.077

4.057

4.038

4.021

4.005

3.990

12

4.052

4.010

3.972

3.939

3.910

3.883

3.858

3.836

3.816

3.798

3.780

3.765

3.750

13

3.857

3.815

3.778

3.745

3.716

3.689

3.665

3.643

3.622

3.604

3.587

3.571

3.556

14

3.698

3.656

3.619

3.586

3.556

3.529

3.505

3.483

3.463

3.444

3.427

3.412

3.397

15

3.564

3.522

3.485

3.452

3.423

3.396

3.372

3.350

3.330

3.311

3.294

3.278

3.264

16

3.451

3.409

3.372

3.339

3.310

3.283

3.259

3.237

3.216

3.198

3.181

3.165

3.150

17

3.353

3.312

3.275

3.242

3.212

3.186

3.162

3.139

3.119

3.101

3.083

3.068

3.053

18

3.269

3.227

3.190

3.158

3.128

3.101

3.077

3.055

3.035

3.016

2.999

2.983

2.968

19

3.195

3.153

3.116

3.084

3.054

3.027

3.003

2.981

2.961

2.942

2.925

2.909

2.894

20

3.130

3.088

3.051

3.018

2.989

2.962

2.938

2.916

2.895

2.877

2.859

2.843

2.829

21

3.072

3.030

2.993

2.960

2.931

2.904

2.880

2.857

2.837

2.818

2.801

2.785

2.770

22

3.019

2.978

2.941

2.908

2.879

2.852

2.827

2.805

2.785

2.766

2.749

2.733

2.718

23

2.973

2.931

2.894

2.861

2.832

2.805

2.780

2.758

2.738

2.719

2.702

2.686

2.671

24

2.930

2.889

2.852

2.819

2.789

2.762

2.738

2.716

2.695

2.676

2.659

2.643

2.628

25

2.892

2.850

2.813

2.780

2.751

2.724

2.699

2.677

2.657

2.638

2.620

2.604

2.589

26

2.857

2.815

2.778

2.745

2.715

2.688

2.664

2.642

2.621

2.602

2.585

2.569

2.554

27

2.824

2.783

2.746

2.713

2.683

2.656

2.632

2.609

2.589

2.570

2.552

2.536

2.521

28

2.795

2.753

2.716

2.683

2.653

2.626

2.602

2.579

2.559

2.540

2.522

2.506

2.491

29

2.767

2.726

2.689

2.656

2.626

2.599

2.574

2.552

2.531

2.512

2.495

2.478

2.463

30

2.742

2.700

2.663

2.630

2.600

2.573

2.549

2.526

2.506

2.487

2.469

2.453

2.437

40

2.563

2.522

2.484

2.451

2.421

2.394

2.369

2.346

2.325

2.306

2.288

2.271

2.256

50

2.461

2.419

2.382

2.348

2.318

2.290

2.265

2.242

2.221

2.202

2.183

2.167

2.151

60

2.394

2.352

2.315

2.281

2.251

2.223

2.198

2.175

2.153

2.134

2.115

2.098

2.083

70

2.348

2.306

2.268

2.234

2.204

2.176

2.150

2.127

2.106

2.086

2.067

2.050

2.034

80

2.313

2.271

2.233

2.199

2.169

2.141

2.115

2.092

2.070

2.050

2.032

2.015

1.999

90

2.286

2.244

2.206

2.172

2.142

2.114

2.088

2.065

2.043

2.023

2.004

1.987

1.971

100

2.265

2.223

2.185

2.151

2.120

2.092

2.067

2.043

2.021

2.001

1.983

1.965

1.949

200

2.172

2.129

2.091

2.057

2.026

1.997

1.971

1.947

1.925

1.905

1.886

1.868

1.851

Universidad de Carabobo

Sec 5.12. Ejercicios propuestos

306

Tabla 4: Valores de cuantiles de la distribucin acumulativa F de


Fisher
1 = 0 99
1 = P (F f1,1 ,2 )
1
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
200

1 grados de libertad del numerador


2 grados de libertad del numerador

27

28

29

30

40

50

60

70

80

90

100

200

6249.1
99.462
26.546
13.878
9.418
7.266
6.029
5.234
4.684
4.283
3.977
3.736
3.543
3.383
3.250
3.137
3.039
2.955
2.880
2.815
2.756
2.704
2.657
2.614
2.575
2.540
2.507
2.477
2.449
2.423
2.241
2.136
2.068
2.019
1.983
1.956
1.934
1.836

6252.9
99.462
26.531
13.864
9.404
7.253
6.016
5.221
4.672
4.270
3.964
3.724
3.530
3.371
3.237
3.124
3.026
2.942
2.868
2.802
2.743
2.691
2.644
2.601
2.562
2.526
2.494
2.464
2.436
2.410
2.228
2.123
2.054
2.005
1.969
1.942
1.919
1.821

6257.1
99.462
26.517
13.850
9.391
7.240
6.003
5.209
4.660
4.258
3.952
3.712
3.518
3.359
3.225
3.112
3.014
2.930
2.855
2.790
2.731
2.679
2.632
2.589
2.550
2.514
2.481
2.451
2.423
2.398
2.215
2.110
2.041
1.992
1.956
1.928
1.906
1.807

6260.4
99.466
26.504
13.838
9.379
7.229
5.992
5.198
4.649
4.247
3.941
3.701
3.507
3.348
3.214
3.101
3.003
2.919
2.844
2.778
2.720
2.667
2.620
2.577
2.538
2.503
2.470
2.440
2.412
2.386
2.203
2.098
2.028
1.980
1.944
1.916
1.893
1.794

6286.4
99.477
26.411
13.745
9.291
7.143
5.908
5.116
4.567
4.165
3.860
3.619
3.425
3.266
3.132
3.018
2.920
2.835
2.761
2.695
2.636
2.583
2.536
2.492
2.453
2.417
2.384
2.354
2.325
2.299
2.114
2.007
1.936
1.886
1.849
1.820
1.797
1.694

6302.3
99.477
26.354
13.690
9.238
7.091
5.858
5.065
4.517
4.115
3.810
3.569
3.375
3.215
3.081
2.967
2.869
2.784
2.709
2.643
2.584
2.531
2.483
2.440
2.400
2.364
2.330
2.300
2.271
2.245
2.058
1.949
1.877
1.826
1.788
1.759
1.735
1.629

6312.9
99.484
26.316
13.652
9.202
7.057
5.824
5.032
4.483
4.082
3.776
3.535
3.341
3.181
3.047
2.933
2.835
2.749
2.674
2.608
2.548
2.495
2.447
2.403
2.364
2.327
2.294
2.263
2.234
2.208
2.019
1.909
1.836
1.785
1.746
1.716
1.692
1.583

6320.9
99.484
26.289
13.626
9.176
7.032
5.799
5.007
4.459
4.058
3.752
3.511
3.317
3.157
3.022
2.908
2.810
2.724
2.649
2.582
2.523
2.469
2.421
2.377
2.337
2.301
2.267
2.236
2.207
2.181
1.991
1.880
1.806
1.754
1.714
1.684
1.659
1.548

6326.5
99.484
26.269
13.605
9.157
7.013
5.781
4.989
4.441
4.039
3.734
3.493
3.298
3.138
3.004
2.889
2.791
2.705
2.630
2.563
2.503
2.450
2.401
2.357
2.317
2.281
2.247
2.216
2.187
2.160
1.969
1.857
1.783
1.730
1.690
1.659
1.634
1.521

6330.7
99.488
26.253
13.590
9.142
6.998
5.766
4.975
4.426
4.025
3.719
3.478
3.284
3.124
2.989
2.875
2.776
2.690
2.614
2.548
2.488
2.434
2.386
2.342
2.302
2.265
2.231
2.200
2.171
2.144
1.952
1.839
1.764
1.711
1.671
1.639
1.614
1.499

6333.9
99.491
26.241
13.577
9.130
6.987
5.755
4.963
4.415
4.014
3.708
3.467
3.272
3.112
2.977
2.863
2.764
2.678
2.602
2.535
2.476
2.422
2.373
2.329
2.289
2.252
2.218
2.187
2.158
2.131
1.938
1.825
1.749
1.695
1.655
1.623
1.598
1.481

6349.8
99.491
26.183
13.520
9.075
6.934
5.702
4.911
4.363
3.962
3.656
3.414
3.219
3.059
2.923
2.808
2.709
2.623
2.547
2.479
2.419
2.365
2.316
2.271
2.230
2.193
2.159
2.127
2.097
2.070
1.874
1.757
1.678
1.622
1.579
1.546
1.518
1.391

FaCyT-Matemticas

You might also like