Professional Documents
Culture Documents
Un segundo mtodo que se utiliza para estimar un parmetro desconocido de una poblacin asociada a una
variable aleatoria Y -discreta o continua-, con distribucin conocida f(y; ), est basado en los llamados
Intervalos de Confianza (IdeC) . La construccin de dichos intervalos se sustenta en la siguiente propiedad.
Todo estimador del parmetro es una variable aleatoria, por lo cual debe tener asociada alguna
distribucin de probabilidad
Estas distribuciones de probabilidad que se obtienen de las muestras se llaman distribuciones muestrales. Las
distribuciones ms usualmente utilizadas son la Normal Estndar, la Chi-Cuadrado, la t de Student, y la F de
Fischer. En base a dichas distribuciones, podemos calcular probabilidades, y as entonces combinaremos las
probabilidades con las muestras aleatorias.
Ejemplo:
Sea: Y1, Y2, Y3,...,Yn una m.a. de tamao n de la distribucin N(, 2). Sabemos que el estimador mximo
verosmil de la media est dado por V . Este estimador tiene asociada una distribucin de
probabilidad ( , 2 / n) , y a partir de ello podemos hacer la siguiente afirmacin probabilstica:
P 2
2 0,9544
P 2 2 0,9544
n
n
Esta ltima expresin es interesante de analizar ya que ser esencial en el estudio de los IdeC. Ntese que el
argumento de la probabilidad determina el intervalo:
Y 2 , Y 2
n
n
Dado que el estimador es una variable aleatoria, entonces este intervalo resulta ser un Intervalo Aleatorio.
Por otra parte, como en la inferencia clsica se asume que la media es una constante, entonces la forma
correcta de interpretar dicha probabilidad es la siguiente:
contenga a
Y 2 , Y 2
n
n
es 95,44%
Pgina 1
Adems, considerando la interpretacin frecuentista de la probabilidad, podemos decir que cualquiera sea el
verdadero valor del parmetro , de cada 100 intervalos aleatorios generados equivalentes al anteriormente
mencionado, aproximadamente entre 95 y 96 de ellos deberan contener la media . Para entender de mejor
forma esta ltima interpretacin se puede utilizar la aplicacin adjunta hecha en Excel, en la cual se simul
250 muestras de tamao 36 de una distribucin N(, 2). Se puede dar los valores que se desee tanto a la
media como a la varianza de la distribucin normal, una vez generadas las 250 muestras se trata de contar
todos aquellos intervalos aleatorios que NO lograron cubrir a la media . A modo de ejemplo se hizo una
aplicacin a una distribucin N(12,9), obtenindose los resultados expuestos en el siguiente cuadro:
Intervalo
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
LI
11,1
11,2
10,0
11,1
11,8
12,2
11,3
10,9
11,0
11,1
10,8
11,5
10,9
12,0
10,3
11,4
11,2
10,6
11,5
11,2
11,5
10,8
11,3
11,3
11,5
LS
13,1
13,2
12,0
13,1
13,8
14,2
13,3
12,9
13,0
13,1
12,8
13,5
12,9
14,0
12,3
13,4
13,2
12,6
13,5
13,2
13,5
12,8
13,3
13,3
13,5
Contiene
NO
NO
Intervalo
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
LI
11,2
10,8
10,9
11,0
11,9
10,7
11,3
11,4
11,3
10,2
10,5
11,0
12,3
10,5
10,5
9,6
11,2
11,7
10,3
10,1
10,8
10,8
12,2
11,7
11,2
LS
13,2
12,8
12,9
13,0
13,9
12,7
13,3
13,4
13,3
12,2
12,5
13,0
14,3
12,5
12,5
11,6
13,2
13,7
12,3
12,1
12,8
12,8
14,2
13,7
13,2
Contiene
NO
NO
NO
Intervalo
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
LI
11,2
11,6
11,0
10,7
10,3
11,0
11,6
11,3
10,8
11,3
10,9
12,2
10,2
10,9
9,7
11,1
10,8
11,1
11,6
10,8
12,2
10,5
10,8
10,8
10,3
LS
13,2
13,6
13,0
12,7
12,3
13,0
13,6
13,3
12,8
13,3
12,9
14,2
12,2
12,9
11,7
13,1
12,8
13,1
13,6
12,8
14,2
12,5
12,8
12,8
12,3
Contiene
NO
NO
NO
Intervalo
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
LI
11,1
11,6
10,5
11,4
10,3
11,1
10,9
11,7
11,0
10,8
11,4
11,1
11,8
11,3
10,3
10,7
11,3
11,0
10,2
11,3
11,3
11,5
10,6
10,8
11,0
LS
13,1
13,6
12,5
13,4
12,3
13,1
12,9
13,7
13,0
12,8
13,4
13,1
13,8
13,3
12,3
12,7
13,3
13,0
12,2
13,3
13,3
13,5
12,6
12,8
13,0
Intervalo
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
LI
9,8
9,7
10,9
10,8
11,3
11,1
10,1
10,8
10,8
11,4
10,9
10,4
11,2
11,4
10,7
11,2
11,2
11,1
10,6
11,5
11,2
12,1
10,8
11,1
11,5
LS
11,8
11,7
12,9
12,8
13,3
13,1
12,1
12,8
12,8
13,4
12,9
12,4
13,2
13,4
12,7
13,2
13,2
13,1
12,6
13,5
13,2
14,1
12,8
13,1
13,5
Contiene
NO
NO
Contiene
NO
Intervalo
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
LI
11,4
11,3
11,1
10,9
11,1
10,5
11,3
10,9
11,5
11,1
11,3
11,1
12,0
10,7
10,4
11,3
10,8
10,6
11,0
10,4
10,7
10,6
11,3
10,7
11,2
LS
13,4
13,3
13,1
12,9
13,1
12,5
13,3
12,9
13,5
13,1
13,3
13,1
14,0
12,7
12,4
13,3
12,8
12,6
13,0
12,4
12,7
12,6
13,3
12,7
13,2
Contiene
NO
Intervalo
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
LI
10,7
11,5
11,0
10,1
10,2
10,8
11,5
11,3
11,4
11,0
10,7
11,2
10,2
11,1
11,4
11,7
10,1
11,1
12,3
10,6
10,6
11,3
11,7
10,3
10,9
LS
12,7
13,5
13,0
12,1
12,2
12,8
13,5
13,3
13,4
13,0
12,7
13,2
12,2
13,1
13,4
13,7
12,1
13,1
14,3
12,6
12,6
13,3
13,7
12,3
12,9
Contiene
NO
Intervalo
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
LI
10,7
10,3
10,8
11,3
11,3
11,0
10,1
11,0
10,0
10,6
11,1
11,8
11,3
10,1
11,2
10,4
10,5
11,6
10,7
10,7
11,0
11,4
11,0
10,6
10,9
LS
12,7
12,3
12,8
13,3
13,3
13,0
12,1
13,0
12,0
12,6
13,1
13,8
13,3
12,1
13,2
12,4
12,5
13,6
12,7
12,7
13,0
13,4
13,0
12,6
12,9
Contiene
Intervalo
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
LI
10,9
10,9
11,0
12,1
11,4
10,5
11,5
10,7
10,2
11,3
10,8
11,4
11,6
10,1
11,3
11,3
11,0
11,2
11,6
10,5
10,3
11,4
11,7
11,1
10,6
LS
12,9
12,9
13,0
14,1
13,4
12,5
13,5
12,7
12,2
13,3
12,8
13,4
13,6
12,1
13,3
13,3
13,0
13,2
13,6
12,5
12,3
13,4
13,7
13,1
12,6
Contiene
NO
Intervalo
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
LI
11,1
11,1
11,1
11,3
11,0
11,1
10,9
11,2
10,7
10,8
10,4
11,1
11,0
10,8
11,0
11,2
11,3
11,1
11,1
12,1
10,8
10,6
11,2
11,4
11,0
LS
13,1
13,1
13,1
13,3
13,0
13,1
12,9
13,2
12,7
12,8
12,4
13,1
13,0
12,8
13,0
13,2
13,3
13,1
13,1
14,1
12,8
12,6
13,2
13,4
13,0
Contiene
NO
En este caso el nmero de intervalos que no contiene a la media result ser 15. Dicho valor debera estar
cerca de (1-0.9544)*250 = 11.4 11 intervalos. Ntese que cada uno de estos 250 intervalos es una
realizacin del intervalo aleatorio cuyos lmites son:
Lmite Inferior LI Y 2
3
Y 1
36
Lmite Superior LS Y 2
3
Y 1
36
Pgina 2
En la realidad se selecciona una sola muestra aleatoria de tamao n (en este caso, 36). Supongamos que la
muestra efectivamente seleccionada fue la nmero 10, en cuyo caso el promedio muestral fue 12,1. Luego, el
intervalo (11,1 ; 13,1) es una realizacin del intervalo aleatorio ( Y -1, Y +1). Desde el punto de vista
probabilstico en el sentido clsico, es CORRECTO decir que la probabilidad que el intervalo aleatorio
( Y - 1, Y + 1) contiene al parmetro con una probabilidad del 95,44%, o lo que resulta equivalente:
P( Y - 1 Y + 1) = 0,9544
Por otra parte es INCORRECTO afirmar que la media esta contenida en el intervalo (11,1 ; 13,1) con una
probabilidad del 95,44%, ya que en este caso, todo lo que se encuentra en el argumento de dicha probabilidad
es constante. Sin embargo la probabilidad del 95,44% del intervalo aleatorio induce una pseudo-probabilidad
llamada Probabilidad Fiducial, o, en su expresin ms comn, Confianza. As entonces, la siguiente
afirmacin es comnmente aceptada:
Con una confianza del 95,44% se puede afirmar que el intervalo ( 11,1 ; 13,1) contiene a la media
Definicin: Sea Y1, Y2 , Y3 , ... , Yn una m.a. de tamao n de la distribucin f(y; ). Se llama Intervalo de
Confianza (1 ) para el parmetro desconocido , a una realizacin de un Intervalo Aleatorio que con
probabilidad (1 ) contiene al parmetro .
Ejemplo:
Para el ejemplo anterior, el intervalo aleatorio ( Y - 1, Y + 1) contiene al parmetro con una probabilidad
del 95,44%, por lo tanto el intervalo (
parmetro , donde
Recuerde que, en general, cuando se denote la variable con letra mayscula, corresponder al estimador del
parmetro de estudio, y la minscula har referencia a la estimacin, es decir, a la realizacin del estimador en
la muestra.
Pgina 3
Observaciones:
Los niveles de confianza que usualmente se utilizan son: 90%; 95%; 98%, siendo el ms recurrido 95%.
Un Intervalo de Confianza se puede interpretar como una realizacin o estimacin del correspondiente
Intervalo Aleatorio, al igual que en estimacin puntual en que usualmente se confunde Estimador con
Estimacin, en este caso al Intervalo Aleatorio se le llama Intervalo de Confianza.
Los IdeC pueden ser bilaterales o unilaterales, para el caso que el parmetro representa la media de una
distribucin entonces el formato de los respectivos IdeC ser de la siguiente forma:
e, e
e,
, e
Usualmente para el caso bilateral se usa el caso simtrico, ya que as el intervalo de confianza para
tiene amplitud mnima.
Definicin: Sea: Y1, Y2, Y3, ... , Yn una m.a. de tamao n de la distribucin discreta o continua f(y ;). Sea
la funcin Q = q (Y1, Y2 , Y3 , ... , Yn; ), la cual depende simultneamente de la m.a. y del parmetro . Si la
distribucin de probabilidades de Q es independiente del parmetro , entonces Q es una Cantidad Pivotal o
Pivote.
Ahora enumeraremos algunos Pivotes tiles para el caso de una sola muestra en base a los cuales se obtendrn
los intervalos de confianza para los parmetros de los modelos ms usuales.
Pgina 4
1.
N(, 2/n). (Si n > 30 , por el TLC no se requiere que los Yi provengan de una normal)
2.
3.
Z i
2 (1) (El cuadrado de una N(0,1) es Chi-Cuadrado de parmetro 1)
4.
Y
Z i2 i
i 1
i n
Ntese que en una Chi-Cuadrado, se cumple que: E[(n)] = n y V[(n)] = 2n. Por lo tanto, por el TLC
se cumple que, para muestras grandes, (n) se aproxima a la N(n , 2n)
5.
W = n 1S 2
Ntese que la diferencia entre este caso y el anterior esta en que el parmetro media poblacional fue
reemplazado por su estimador, en tal caso la distribucin Chi-Cuadrado pierde un grado de libertad.
6.
La distribucin t de Student se construye de la siguiente forma: Sea Z una variable aleatoria con
distribucin normal estandarizada, e independientemente sea V una variable aleatoria con distribucin
Chi-Cuadrado de parmetro n. Entonces el siguiente cociente tiene distribucin Student de parmetro n.
Z
n
t (n) ; E (T ) 0 ; V (T )
; n2
n2
V /n
Aplicando a una m.a, se obtiene un Pivote para , asumiendo a 2 como desconocido, bajo muestra
pequea:
n
(n 1) S 2
2
Y
t (n 1)
s
n
(n 1)
Pgina 5
y z
1 / 2
yz
*
1 / 2
, con conocido.
/ n
Usando la simetra de la distribucin Normal podemos afirmar que: P (-Z1 /2 < Z < +Z1 /2) = 1
/2
z1
2
z1
2
z
1 2
z
1 2
/2
< + Z1 /2) = 1
/ n
PY z1 / 2 Y z1 / 2
n
n
= 1
yz
*
1 / 2
, yz
1 / 2
n
Pgina 6
Intervalo de Confianza para en una distribucin N(, 2), con Varianza desconocida
Sea Y1, Y2, Y3,...,Yn una m.a. de tamao n < 30 de la N(, 2). El Intervalo de Confianza (1 ) para es
s
s
y t1n1 / 2
, y t1n1 / 2
n
n
n 1
, con 2 desconocido.
S/ n
n 1
n 1
/2
/2
t1n1 / 2
t1n1 / 2
t1n1 / 2
Luego:
n 1
P (- t1 / 2
n 1
n 1
n 1
+ t1 / 2 ) = P( t1 / 2 S / n t1 / 2 S / n ) = 1 .
S/ n
y t
n 1
1 / 2
s / n , y t1n1 / 2 s / n
Pgina 7
y Z
1 / 2
s / n , y Z1 / 2 s / n
En este particular caso, basados en el Teorema del Lmite Central, esta ltima frmula no necesita la
normalidad de la poblacin. De acuerdo al Teorema del Lmite Central para el caso de muestras grandes la
condicin de normalidad de la distribucin poblacional no es necesaria, por lo tanto podemos obtener IdeC
para la media en el caso de muestras grandes de otros modelos usuales no necesariamente normales, tales
como los de la siguiente tabla
(1 )
P ( )
exp( )
IdeC ( )
p(1 p)
p(1 p) p z1 *
, p z1
2
2
n
y
y z *
Y
, y z1
1
2
2
n
Y2
, y z1
y z1 *
2
2
n
p(1 p)
n
y
Nota
Una expresin alternativa que se tiene cuando se construyen los intervalos de confianza y que podemos
destacar en este caso particular de muestras grandes es la siguiente:
(|
Pgina 8
Intervalo de Confianza para en una distribucin N(, 2), con media desconocida
Sea Y1,Y2,Y3,...,Yn una m.a. de tamao n de la N(, 2) Entonces un IdeC (1) para 2, con desconocido
es:
( n 1) s
( n 1) s
( n 1 ), 1
( n 1 ),
(n 1)
2
( n 1), / 2
es el percentil /2 de la distribucin n
/2
/2
1
Luego:
P(
<(
2
( n 1 ),
n 1)S 2 < 2
( n 1 ), 1
) = P ( n 1) S 2
2
2
( n 1 ), 1
( n 1) S 2 = 1
2
( n 1 ),
( n 1) s
( n 1) s
( n 1 ), 1
( n 1 ),
Pgina 9
Todas las frmulas ya obtenidas se han hecho para el caso bilateral, sin embargo ellas son fcilmente
extrapolables para los casos unilaterales. Consideremos, por ejemplo, el intervalo bilateral simtrico para la
media , asumiendo varianza desconocida y muestra pequea, esto es.
s
s
y t1n1 / 2
, y t1n1 / 2
n
n
En este caso el factor de holgura de la estimacin, llamado precisin o error de estimacin es:
s
e.e t n 1
1 / 2 n
As entonces el intervalo se puede expresar como:
y e.e y e.e
s
A 2 e.e 2t n 1
1 / 2 n
*
Tanto la Amplitud como el error de estimacin son directamente proporcionales a la confianza utilizada como
a la desviacin estndar de los datos e inversamente proporcional al tamao de la muestra
Si deseamos obtener los intervalos unilaterales el e.e. debe ser modificado de la siguiente forma:
s
e.e t n 1
1 n
Con lo cual los intervalos unilaterales son:
Unilateral
Superior y t n 1
1
s
*
; Unilateral
Inferior
y tn 1
1
s
*
Una regla mnemotcnica til para obtener un IdeC unilateral a partir del bilateral es: Para obtener el intervalo
unilateral superior, elimine la cota inferior y en la cota superior considere el subndice 1 en lugar de 1/2.
Para obtener el intervalo unilateral inferior, elimine la cota superior y en la cota inferior considere el
subndice 1 en lugar de 1/2
Pgina 10
Si revisamos los intervalos aleatorios precedentes, que utilizamos para construir los correspondiente IdeC
para la media nos daremos cuenta que la mayora de ellos tienen el siguiente formato
1 / 2
V z
1 / 2
Slo difiere el caso de muestra pequea y varianza desconocida, donde el percentil se debe buscar en la tabla
de Student y no en la Normal Estndar. Esta ltima frmula genrica es til para no tener que recordar cada
una de las frmulas usuales. Ntese que en la expresin del error de estimacin se debe multiplicar el
percentil por el error estndar del estimador de , esto es:
e.e. = Z1-/2
V ( ) .
En las aplicaciones siguientes utilizaremos algunas propiedades que son interesantes de aclarar previamente,
dado que ellas se usan recurrentemente. En primer lugar, se obtendr la forma para obtener IdeC para
funciones del parmetro y en segundo lugar IdeC para muestras grandes en base a las propiedades asintticas
de los EMV.
LI
LS.
g() g(LS)
g(LS) g() g(LI)
g(LI)
As por ejemplo si usted est interesado en obtener un IdeC para la desviacin estndar , entonces
previamente obtiene un IdeC para la varianza 2 y luego extrae raz cuadrada a ambos extremos del intervalo
para obtener el intervalo pedido
Intervalo de Confianza, caso muestras grandes, en base a las propiedades asintticas de los EMV
En este caso debemos recordar que si MV es el EMV del parmetro , entonces la distribucin de dicho
estimador para el caso de muestras grandes ser asintticamente Normal:
N , CCR()
a
g ( )
Pgina 11
Ejemplo
Sea Y1, Y2 , Y3 , ... , Yn una m.a. de Y ~ Poisson{}. Se necesita construir un IdeC (1 ) para el parmetro
, utilizando la distribucin asinttica de
Sabemos que
V ( )
CCR( )
a
a
1
MV N , N ,
4n
n
es:
z1 / 2
z
y 1 / 2
2 n
2 n
z
z
y 1 / 2 y 1 / 2
2 n
2 n
x 1e
X G ( , ) f X ( x)
, x>0;
( )
La distribucin Exponencial de parmetro es un caso particular de la distribucin Gama con parmetros
= 1 y = 1/.
Y exp fY ( y) ey , y > 0
Pgina 12
El EMV del parmetro es MV 1 / , es consistente, y su varianza alcanza la CCR, 2/n, con distribucin
asinttica Normal:
N , 2 / n
La suma de n variables aleatorias independientes isodistribuidas exp{} sigue una distribucin Gama, donde
el parmetro = n, y = 1/
i n
Y G (n, )
i 1
g
P
Y
( n ,1 / n )
.
1
Y
( n ,1 / n )
g( n ,1 / n )
2
g1(n,1 / n )
2
En este caso ms que un IdeC para el parmetro nos puede interesar un IdeC para la media de dicha
distribucin, esto es = 1/. Notemos que esta es una funcin montona decreciente de , por lo tanto el IdeC
(1 ) bilateral para la media es:
y
g
( n ,1 / n )
1
y
g
( n ,1 / n )
MV
N ( , ) , luego
Y
n
a
Y
Z
N ( 0,1)
podemos: P z Y
z1 1
1 2
n
EAS201a Inferencia Estadstica
Segundo Semestre 2014
1
1
1
P
z1
z1
2
2
Y (1
)
Y (1
)
n
n
Pgina 13
y ( 1
1
z1
y ( 1
y ( 1
1
z1
z1
z1
) y ( 1
Y
1
Y N ( ,
a
luego
es un pivote para
Por lo tanto
N (0,1)
,
1 1
Y a N ( , ) .
n
1
Y
z 1
P z1
1 2
1
2
z1
z1
1
1
2
2
P (1
) (1
) 1 .
Y
n
n
Y
z
z
1
1
(1
) (1
)
y
n
y
n
1
y
z
y
z
Pgina 14
1.
El gerente de crditos y cobranza de una empresa comercial, debe precisar sus polticas de crdito.
Suponga que el gerente desea estimar la proporcin de cuentas consideradas incobrables en la empresa,
para ello desea usar un IdeC Bilateral del 95%, con una precisin de 0,05.
a) Cuntas cuentas deben formar la muestra para cumplir con los objetivos planteados por el gerente?
Si
0,05 z
p(1 p)
n
0 , 975
p es la proporcin muestral
n = 1,96
p(1 p)
0,05
n = 1.536,64 p(1-p)
El tamao muestral depende de p a travs de la funcin: f(p) = p(1-p). sta corresponde a la varianza
estimada del modelo Bernoulli. Una solucin conocida como el caso de varianza mxima consiste en
buscar aquel valor de p que maximiza dicha funcin, como esta grfica corresponde a una parbola
invertida que se anula para p = 0 y para p = 1, entonces el mximo se produce para p = 0,5 y corresponde
a 0,25.
As entonces el mximo valor de n esta dado por n = 1.536,64 * 0,25 = 384 cuentas
b) Si se toma una muestra con el nmero de cuentas establecidas en el punto anterior y se determina que el
10% de ellas son incobrables Qu Intervalo del 95% de Confianza resulta de ello?
El I. de C. Para
0,1 1,96
0,1* 0,9
0,1* 0,9
0,1 1,96
384
384
p(1 p)
, p z1
2
n
p(1 p)
0,07 0,13
Pgina 15
c)
Compare y comente el IdeC Propuesto por el gerente con el realmente obtenido en el punto anterior.
El intervalo propuesto exige una precisin del 5%, sin embargo el obtenido supera dicho valor llegando a
ser del 3%, dado que el tamao muestral es el de varianza mxima y asume que la proporcin estar en
alrededor del 50%, pero en realidad en ste caso es del 10%.
d) Qu pasa con el tamao de la muestra si el gerente afirma lo siguiente? La proporcin real de
incobrables no puede superar el 15%, ya que ello implicara que la compaa estara al borde de la
quiebra, y tal hecho dista mucho de nuestra realidad financiera
A diferencia del caso anterior en que la varianza es mxima para una proporcin del 50% en ste caso el
mximo se produce en p = 15% , por lo tanto el tamao muestral es igual a:
, con p = 0,15
1,96
n
p(1 p)
0,05
2
n = 196
n = 1.536,64 * 0,15(1-0,15)
En general la frmula para determinar el tamao de muestra n en un muestreo para proporciones, dada una
error de estimacin (e.e.) y un nivel de confianza () est definido por:
2
z
n
p(1 p)
e.e.
1 / 2
Para distintas confianzas y precisiones, caso de varianza mxima y tamao poblacin infinita tenemos:
CONFIANZA
90%
95%
98%
n0
n0
n0
0,01
6.765
0,01
9.604
0,01
13.572
0,02
1.691
0,02
2.401
0,02
3.393
0,03
752
0,03
1.067
0,03
1.508
0,04
423
0,04
600
0,04
848
0,05
271
0,05
384
0,05
543
0,10
68
0,10
96
0,10
136
La frmula precedente asume que la poblacin es infinita, vale decir, cuando las sucesivas realizaciones
no afectan la probabilidad puntual del acontecimiento en estudio. Cuando esto no ocurre, es decir si la
poblacin es de tamao finito (variando la probabilidad de ocurrencia con cada elemento de la muestra
Pgina 16
que es retirado), el tamao de muestra n0 debe ser corregido por el llamado factor de correccin para
poblacin finita (f.c.p.f.), esto es,
n
n 1
1
N
0
2.
confianza
d
n0
0,95
0,1
96
0,95
0,05
384
0,95
0,01
9.604
0,9
0,1
68
0,9
0,05
271
0,9
0,01
6.765
N
5.000.000
1.000.000
500.000
200.000
100.000
50.000
25.000
12.500
7.500
5.000
4.000
3.000
2.500
1.000
500
200
100
96
96
96
96
96
96
96
95
95
94
94
93
93
88
81
65
49
384
384
384
383
383
381
378
373
365
357
351
341
333
278
217
132
80
9.586
9.513
9.423
9.164
8.763
8.057
6.939
5.431
4.212
3.288
2.824
2.286
1.984
906
475
196
99
68
68
68
68
68
68
67
67
67
67
67
66
66
63
60
51
41
271
271
270
270
270
269
268
265
261
257
254
248
244
213
176
115
73
6.756
6.720
6.675
6.544
6.336
5.959
5.324
4.390
3.557
2.875
2.514
2.079
1.826
871
466
194
99
Una empresa cervecera sabe que las cantidades de cerveza que contienen sus latas sigue una distribucin
Normal con desviacin estndar 0.05 litros.
(a) Se extrae una muestra de 16 latas. Si un IdeC para la media de la poblacin es (0,4755 ; 0,5245). Con
qu nivel de confianza se construy dicho intervalo?
Este es un intervalo bilateral para la media con varianza conocida, por lo tanto la amplitud est dada por
A2 z
*
(b) Si se quiere un intervalo de 98% de confianza, que tenga una amplitud de 0,02 litros a cada lado de la
media. De qu tamao debe ser la muestra?
e.e. z
0 , 99
0,01
0,05
n 137
0,01
0 , 99
Pgina 17
3.
Un analista de crditos tiene una intencin de aprobar en promedio ms de 100 crditos semanales.
En las ltimas 20 semanas, la aprobacin promedio fue de 101,9 crditos, con una desviacin estndar de
4,5 crditos. Asumiendo normalidad.
a.
Construya un IdeC apropiado que le permita averiguar si con un 95% de confianza el analista cumpli
o no con su intencin.
b.
Puede Usted hacer la misma afirmacin que en la respuesta anterior con un 99% de confianza?
c.
Para qu niveles de confianza el analista S cumple con su intencin y para qu niveles NO cumple?
a.- Se trata de obtener un IdeC del 95% Unilateral Inferior para la media , caso varianza desconocida,
muestra pequea , esto es:
y tn 1
1
101,9 1,7291
4,5
100,16
20
Como la cota inferior del intervalo unilateral supera los 100 crditos, se asume con una confianza del
95% que el analista SI cumple con su esperanza
b.- Se trata de obtener un IdeC del 99% Unilateral Inferior para la media , caso varianza desconocida,
muestra pequea , esto es,
y tn 1
1
s
*
101,9 2,8609
4,5
99,34
20
Como la cota Inferior del intervalo unilateral no supera los 100 crditos, se asume con una confianza del
99% que el analista NO cumple con su esperanza
c.- Se pide determinar el nivel de confianza (1 ) de tal modo que
y t n 1
1
s
*
100
20
t 19 101,9 100
1,89
4,5
1
1 96,3%
Este ltimo valor se obtuvo directamente de la planilla Excel. Entonces para niveles de confianza
inferiores al 96,3% el analista SI cumple con su esperanza y para niveles superiores NO cumple su
esperanza, podramos decir tambin que el nivel de confianza exacto del 96,3% es de INDIFERENCIA.
Nota: La funcin de Excel que se utiliz en este caso, corresponde al percentil de la distribucin T, esto es,
Pgina 18
4.
El detergente en polvo es comercializado en cajas que tienen un peso rotulado que se debe respetar.
Con el objeto de estimar el peso medio de las cajas, se realiza el siguiente proceso.
De la produccin total, se extraen dos muestras aleatorias independientes, pesndose el contenido de
detergente, obtenindose los siguientes resultados :
Muestra
Tamao
Promedio
Varianza
N1
10
152
N2
15
150
Como ambas muestras son de la misma distribucin, considere una sola muestra de tamao 25 para
Obtener un Intervalo de Confianza bilateral del 95% para . Asuma normalidad.
Construiremos los estadgrafos asumiendo que es una sola muestra de tamao 25, para ello tenemos que
i 25
10 152 15 150
y
150,8
25
*
s
2
y 25 y
i 1
24
para que esta expresin quede correctamente determinada es necesario encontrar la sumatoria de las 25
observaciones al cuadrado, lo cual haremos de la siguiente forma:
i 10
y 9 4 10 152 231.076 ;
i 1
i 25
y 14 2 15 150 568.604
i 11
de donde:
s
2
as el IdeC para
568.604 25 150,8
3,667
24
2
150,8 t 24
0,975
3,667
*
150,8 t 24
0,975
25
3,667
*
25
150,01 151,59
Pgina 19
5.
Una embotelladora de bebidas gaseosas, sabe que la cantidad real de bebida contenida en cada botella
rotulada con un valor nominal de 250 cc, vara de botella en botella. El contenido medio de llenado es
importante, sin embargo la variacin del contenido tambin es de vital importancia para la compaa, ya
que una alta variabilidad significar que algunas botellas contendrn poca bebida o contrariamente
mucha, siendo ambos extremos malos para la compaa. Para analizar este tema, el departamento de
control de calidad escogi 40 botellas, obtenindose los siguientes resultados.
a.
249,73
247,73
250,63
246,08
240,45
255,83
247,04
253,36
257,38
233,77
251,92
249,60
254,99
250,30
245,08
251,62
254,95
242,75
250,29
251,37
241,10
250,59
251,91
254,92
254,00
246,84
243,17
237,38
256,95
252,28
253,92
251,29
249,09
247,30
241,08
251,73
249,08
250,42
237,36
249,10
Asumiendo normalidad. Obtenga un IdeC del 95% para la verdadera varianza de llenado.
El IdeC bilateral ( 1- ) para 2 esta dado por :
( n 1) s
b.
2
( n 1 ), 1
( n 1) s
39 34,6
*
58,120
2
( n 1 ),
23,654
En el departamento de control de calidad sospechan que produccin no esta alcanzando a cumplir con el
valor nominal. Para qu niveles de confianza ellos S tienen razn?
Se trata de un IdeC unilateral inferior para , con varianza desconocida y muestra grande, esto es,
yz
1
yz
1
s
*
250
Para comprobar la afirmacin precedente considere 2 niveles de confianza distintos, uno inferior al 90%
y otro superior, as por ejemplo, si usted toma una confianza del 85% el IdeC resulta ser 249,78, en
tal caso la cota superior es menor a 250, por lo tanto a este nivel de confianza el departamento de control
de calidad SI tiene razn en afirmar que el contenido medio de las botellas NO esta alcanzando el valor
nominal, si usted considera el 95% de confianza se obtiene el intervalo 250,32 como dicho valor
supera a 250, entonces es posible que la media alcance dicho valor, por lo tanto con una confianza del
95% no es concluyente la afirmacin del departamento de control de calidad.
Pgina 20
6.
Una oficina comercial atiende clientes de tal modo que los tiempos de atencin por cliente pueden ser
considerados como variables aleatorias con distribucin exponencial de parmetro . Se tom una
muestra aleatoria de 40 clientes, encontrndose que el tiempo promedio fue de 8,2 min. Construya un
IdeC del 95 % para el tiempo medio de atencin, utilice los tres mtodos antes expuestos.
y
g
( n ,1 / n )
1
y
g
( n ,1 / n )
8,2
8,2
g
g
( 35 , 1 / 40 )
( 35 , 1 / 40 )
0 , 975
0 , 025
8,2
8,2
1,3329
0,7144
Por lo tanto de acuerdo a este mtodo un IdeC bilateral del 95% es: 6,15 11,48
z
z
y 1
y 1
n
n
1 / 2
1 / 2
1,96
1,96
8,21
8,21
40
40
Por lo tanto de acuerdo a este mtodo un IdeC bilateral del 95% es: 5,66 10,74
z1
2
y
z1
8,2
8,2
1,96
1,96
1
1
40
40
Por lo tanto de acuerdo a este mtodo un IdeC bilateral del 95% es: 6,26 11,88.Las dos ltimas
soluciones se basan en caso muestras grandes, por lo tanto utilizan como aproximacin la distribucin
normal, sin embargo, el primer caso no utiliza aproximaciones siendo por lo tanto una mejor solucin
como intervalo para la media .
Pgina 21
7.
El nmero de goles marcados Y por el equipo de ftbol de la Universidad Catlica (UC) contra la
Universidad de Chile (UCH) en cada uno de los 118 partidos jugados entre 1939 y 1993 siguen una
distribucin Poisson de parmetro . La tabla siguiente muestra los resultados obtenidos.
N de goles
0
1
2
3
4
5
6
a)
N de partidos
37
36
21
19
3
2
0
y
, y z1
2
n
y
.
n
1,33
1,33
,1,33 1,96 *
118
118
b) Determine un IdeC bilateral al 95% para la probabilidad que la UC le marque al menos 1 gol a la UCH.
P(Y 1) = 1 P(Y = 0) = 1 - e
donde g() = 1 - e
es: 1 - e
c)
1,12
1- e
es una funcin montona creciente. Luego, el IdeC Bilateral del 95% para g()
1- e
1, 54
P(Y 1) 0,685 1 - e
inferior dado, y se desea encontrar con qu confianza fue obtenido. Luego, la ecuacin a resolver es:
y z1
y
1,1552
n
z1
1, 331,1552
1, 647
1, 33
118
Por lo tanto, con una confianza del 95% se puede afirmar que P(Y 1) 0,685
Pgina 22
Los siguientes ejemplos se referirn a algunos casos especiales de construccin de pivotes, distintos a los ya
ejemplificados anteriormente
8.
La media muestral es un buen estimador puntual de la media poblacional , sin embargo tambin
puede ser usada para predecir un valor futuro de Y independientemente seleccionado desde la misma
poblacin.
Sea Y1, Y2, Y3, ... , Yn una m.a. de una distribucin N(, 2), donde la media muestral de estas primeras
n observaciones es y la varianza es S2. Encontrar un IdeC (1 ) bilateral simtrico para una nueva
observacin
Y Yn 1
n 1
N (0,1)
Y Yn 1
n 1
S
n
t (n 1)
y t n 1
s
1 / 2
*
n 1
n 1
y
y t n 1
s
n 1
1 / 2
n
n
*
Pgina 23
9.
Sea Y1, Y2, Y3, ... , Yn una m.a. de una distribucin N(, 2). Se dispone de dos estadsticos
independientes T1 y T2 los cuales poseen las siguientes propiedades
V = T1 N(0,1), e independientemente
W= (2(n-1) T2) (2n-2)
T1
2 (n 1)T2 2
T1
t (2(n 1)
2(n 1) T2
2(n 1)
As entonces se puede establecer que:
P t12(n / 12)
T1 2( n1)
1 / 2 1
2(n 1) T2
t12(n / 12)
2(n 1)t 2
t12(n/ 12)
t1
2(n 1)t 2
t1
10. Sea Y1, Y2, Y3, ....,Yn una muestra aleatoria de tamao grande de una distribucin Poisson de parmetro
, si se desea obtener un intervalo de confianza bilateral del 95% para el parmetro , veremos que
podemos encontrar diversas soluciones, de acuerdo al pivote que utilicemos.
Estandarizando tenemos:
a
1
Y N ,
4n
Y a
N 0,1 .
1
2 n
1,96
2 n
2
1,96
2 n
1,96
1,96
Y
Pgina 24
Sabemos que: Y N ,
Z
n
N 0,1
a
n
Como la dispersin es funcin de , podemos estimarla, resguardando la normalidad ya que la
muestra es de tamao grande, entonces
Y a
N 0,1
Y
n
Y
Y
Y 1,96
n
n
Y
Y
2
1,96 0,95
P 1,96
1,96 0,95 P
P Y
3,8416
2
3,8416 0,95 P 2 2Y
Y 0 0,95
n
n
Para determinar los valores de , en que la parbola es menor o igual a 0, debemos resolver la
ecuacin de 2 grado:
2 2Y
3,8416
2
Y 0
n
3,8416
3,8416
2
2Y
2Y
4Y
n
n
1,9208
3,8416Y 3,6598
2
n
n
n2
EAS201a Inferencia Estadstica
Segundo Semestre 2014
Pgina 25
1,9208
3,8416Y 3,6598
1,9208
3,8416Y 3,6598
2
n
n
n
n
n
n2
en: Y
1,9208
3,6598
y
son despreciables, entonces el IdeC se transforma
n
n2
3,8416Y
3,8416Y
, el cual es equivalente al obtenido en la segunda solucin
Y
n
n
Como ejemplo tomemos una muestra de tamao 500 de una distribucin Poisson, con promedio = 99,2
96
82
96
90
97
95 114 108
89
87
83 110
82 100 107
104
88
92
96 104
95
97 121
96 101
97
84
97
83
99 100 103
96
81
93 106
94
92 112 107
97
96
94 105
88
96
85
98 101 106
93
95 110
91
90
93
92
96
98 104 107
72
87
97
93 106
97
97 103
91
106 105
89
97
95
95
91
97
92
85
98
92 113
90
95 108
97 103
105
90
94
90
83
96
93 107
87 102
85
92
99 104
93
93
96 110
93
82 100
92
88
96 104
86 112 120
91
96 116
96
96 100
81
91
97 109
96 124
90 107
95 101
92 119 102
99 130
102 101
99 100
95 109
84
84 107 105
94 107
95 102
92
94 103
97
88
97 115
93 106
93
96 133
97
87
94 102
94
95
95 116 109
89
93
89
98
93
92
85
96 104
89
97
95 113
89
97 115
100
99
89 111
86
99
96
95
94 105 102
111 117
124
107
88 109
98 107
115 101
94 105
96
78
87 104
97
96
93
96
98
86 101
90
98 106
86 101
91 113 110
76
97
98
96 113
92 109 106
95
86 107 116
93 104 103
86
96
86
92 113
96 118
94 104
102 107
97
90 107 104
91
92
96
98 100
96
99 106 111
86
86
98
99 100
98
85
92 103 103
94 100 101
99
83
99 104 114
95 107 101
87
93
83
99
88
98
92
94 101
95
91
98
97
98
87 111
95 105
89 105 100
93 115
93
92
92 100
97 131
91 101
98
92
97 109 106
97 112 105
96 133
89
99 108 109
99
78
94 112 108
93 100
95
94
93 105
96
87 107 110
94
98
85
88
86
81 100 104
98
89
93 106
86 104
90
88
111 126
92
75
98 110
85 103 114
98
89
92
97 101 106
91 111
90 111
99
93 102 118
90 102 110
93
84 107
98 112
77 107 109
90 113 100
96 105
94
79 113
98
95
99 116
89 106
90
Entonces los intervalos obtenidos para cada una de las tres soluciones es.
Primera Solucin: ( 98,3289 ; 100,0749 )
Segunda Solucin: ( 98,3270 ; 100,0730 )
Tercera Solucin : ( 98,3308 ; 100,0769 )
EAS201a Inferencia Estadstica
Segundo Semestre 2014
Pgina 26
1.
Un instituto de opinin pblica desea obtener una muestra de votantes suficientemente grande de tal
modo que con probabilidad 0,01 la proporcin muestral obtenida a favor de un cierto candidato resulte
inferior al 50% sabiendo que la verdadera proporcin es del 52%. Determine el tamao de muestra.
2.
El contenido de nicotina en una marca de cigarrillos es Normal con desviacin estndar 1 miligramo. Se
quiere estimar el contenido promedio.
Cul es el error estndar de la media muestral si n =10 y si n = 20?
Cul es el error de estimacin de la media con una confianza del 95%?
De qu tamao debe ser la muestra si se quiere que el e.e. no supere a 0.5 miligramos?.
3.
Una empresa cervecera sabe que las cantidades de cerveza que contienen sus latas sigue una distribucin
Normal con desviacin estndar 0.03 litros.
a.
Se extrae una muestra de 25 latas. Si un intervalo de confianza para la media de la poblacin es (0.28,
0.38). Cul es el nivel de confianza?
b.
Si se quiere un intervalo de 99% de confianza, que tenga una amplitud mxima de 0.03 litros a cada lado
de la media. De qu tamao debe ser la muestra?
4.
El contenido efectivo de 15 paquetes de caramelos en gramos es 123, 131, 109, 108, 121, 120, 119, 131,
127, 119, 115, 118, 123, 121, 117.
a.
b.
c.
Cmo vara la amplitud del intervalo de confianza cuando (i) aumenta la confianza a 0.99, (ii) aumenta
la varianza de la muestra al doble, (iii) aumenta el tamao de la muestra al doble?
5.
Sea Y1, Y2, Y3,..., Yn una muestra aleatoria de una distribucin Normal. Si n es grande, se demuestra
que la distribucin de la mediana se puede aproximar por la distribucin normal, esto es,
Me N , 2 2 / n
A partir de esta relacin construya un intervalo de confianza (1 ) bilateral para asuma 2 conocido.
Compare el intervalo de confianza con el obtenido a partir de la media.
Y1
6.
Sea
a.
b.
parmetro .
Pgina 27
7.
b.
c.
Considerando un IdeC unilateral superior para , como [0; 30%], encuentre el nivel de confianza.
d.
Suponiendo que la estimacin del porcentaje es la misma anterior. Cul es el tamao de muestra que se
necesita para obtener un IdeC del 90% con un error de muestreo (e.e.) de 1%?
8.
La casa matriz de Teleflores est en Caracas y tiene una red muy grande de floristas (cerca de 500 locales
a travs de varios pases del mundo) la venta es un 30% va Internet y 70% va Telfono. Internet es slo
uno de los mecanismos de venta, ya que est limitado por el uso de las computadoras. Para negocios de
gran volumen, el telfono permite llegar a un mercado mayor, ya que an un alto % de los clientes
potenciales, o no tiene acceso a Internet, o no acostumbra a comprar por este medio. El resultado de
Teleflores muestra que una combinacin de ambas vas es la clave, pues si slo se tuviera el servicio por
Internet se perderan muchas ventas, es mejor seguir considerando el antiguo mtodo del telfono
gratuito.
Un ndice de la calidad de ste servicio telefnico es el tiempo de espera, esto es, el tiempo que transcurre
desde que el telfono suena por primera vez hasta que el agente de ventas telefnico contesta. El estndar
de Teleflores es que el tiempo medio de espera no debiera ser mayor de 30 segundos .
La cadena tiene inspectores secretos que viajan a travs del mundo verificando distintos aspectos del
servicio, entre otros indicadores al llegar a un pas lo primero que controlan es el tiempo de espera, para
ello realizan llamadas telefnicas aleatorias a la lnea gratuita 800 de los distintos locales de ese pas,
registrando los tiempos de espera. En una visita de rutina efectuada a Brasil, los tiempos en segundos
fueron: 5, 10, 10, 10, 11, 12, 13, 13, 14, 14, 14, 15, 15, 16, 17, 17, 18, 18, 19, 19, 25, 25, 26, 27, 30, 30,
33, 34, 35, 38, 39, 40, 40, 50, 50, 51, 51, 55, 58, 59, 65, 83.
En base a la informacin de la muestra obtenga algunas antecedentes estadsticos y en base a ellos realice
algn informe a la gerencia de Teleflores. Particularmente:
a.
Obtenga un Intervalo de Confianza del 95% para la desviacin estndar del tiempo de espera.
b.
c.
Obtenga un IdeC unilateral con del 95% para la el tiempo medio de espera.
d.
Al observar el IdeC anterior y los antecedentes del pre-informe realice un informe final
e.
Pgina 28
9.
Un nuevo tipo de tubos elctricos tiene una duracin la cual se puede considerar como una variable
aleatoria continua Y con funcin densidad de probabilidad de la forma:
f y
; y>0
En el envase de cada tubo se lee el siguiente rtulo: Duracin media 2.000 hrs. Se probaron 32 tubos
obtenindose una duracin promedio de 1.950 hrs.
a.
b.
Obtenga E ( ) ; V ( ) ; C.C.R.( ).
c.
10. La variabilidad en la obtencin de las caractersticas de un producto es fuente de mala calidad. Por ello
muchas veces interesa asegurar que la varianza no supere determinado valor. Sea Y1, Y2, Y3,..., Yn una
m.a. de tamao n de la distribucin N(, 2).
a.
b.
Si el intervalo anterior se considera con una confianza del 95% Cul debe ser el mnimo tamao de
muestra para que la Amplitud Esperada del intervalo obtenido no supere al triple de la varianza 2?
Nota: En este caso el intervalo unilateral superior asume que la cota inferior es cero, esto es, (0 , LS).
11. El departamento de inventarios de una empresa seleccion al azar, de una bodega de productos
terminados, una muestra de 50 cajas, cada una de las cuales contiene 3 artculos, encontrndose los
siguientes resultados
# Artculos fallados
# de Cajas
37
10
n 1
s
n
, y t1n1 / 2
s
, tiene Amplitud Mnima.
n
Pgina 29
13. Una m.a. Y1, Y2, Y3,..., Yn de tamao 50 de la distribucin exponencial de parmetro , entreg un
promedio de 558.
a.
b.
c.
14. Supngase que ocurren 175 caras y 225 sellos al lanzar 400 veces una moneda. Para averiguar si la
moneda est bien balanceada, determine un IdeC del 99% para la probabilidad de cara.
15. Sea Y1, Y2, Y3,..., Yn una m.a. de tamao n de la distribucin Bernoulli de parmetro . A travs de las
propiedades asintticas de los estimadores de mxima verosimilitud (es decir, pensando en que se cuente
con una muestra grande), obtenga un IdeC (1 ) bilateral para la varianza poblacional.
16. Una compaa que vende seguros para automviles desea encontrar el valor medio de las solicitudes de
reparacin de las carroceras de los autos asegurados. De qu tamao se debe seleccionar la muestra, si
se desea un IdeC bilateral del 95% de confianza con una Amplitud no mayor a US$50?
n 1
Sin embargo, bajo el caso de varianza desconocida, para encontrar n se debera resolver: n t1 / 2 s , en
e.e.
cuya circunstancia tenemos dos problemas: hay que estimar a travs de S, y tampoco se puede entrar a la tabla
t dado que no se conoce n. Para evitar dichos inconvenientes, en primer lugar se consideran restricciones
distintas tales como:
El tamao de muestra se asume lo suficientemente grande de tal modo que la distribucin t se aproxime
por z.
Aplique al ejemplo que e.e. debe ser 0,5 veces s y caso muestra grande.
Pgina 30