Professional Documents
Culture Documents
ESTADSTICA II
AUTOR: Rogelio Alvarado Martinez
NDICE
NDICE
Introduccin
Acceso rpido
4. Distribucin
muestral
de
X
cuando
se
desconoce
la
distribucin
de
la
poblacin
GENERALIDADES DESARROLLO
7. Distribucin
muestral
para
la
diferencia
entre
dos
medidas
muestrales
X1-X2
GLOSARIO REFERENCIAS
Ejemplo 1
Consideremos
una
poblacin
conformada
por
4
personas
(N=4).
La
variable
de
inters
es
el
gasto
mensual
en
transporte
(en
miles
de
pesos).
Los
datos
de
la
poblacin
son:
{78,
67,
83,
56}
y
vamos
a
responder
a
cada
literal
teniendo
en
cuenta
la
notacin
utilizada.
a. Calcular
la
media
y
la
desviacin
estndar
de
la
poblacin
78 + 67 + 83 + 56 284 c. Dichas
muestras
son
de
tipo
aleatorio
simple
para
poblacin
finita
o
infinita?
&' = = = 71
=
,
4 4
(
Y
la
desviacin
estndar
es
Como
cada
una
de
estas
muestras
tiene
la
misma
probabilidad
de
ser
elegida,
entonces
la
probabilidad
de
escoger
una
muestra
estara
dada
por:
(X ).
=
N
b. De
la
poblacin
vamos
a
seleccionar
todas
las
muestras
posibles
de
tamao
n
=2
sin
orden
y
sin
repeticin.
Cuntas
muestras
de
dos
elementos
de
la
poblacin
pueden
formarse?
Y,
por
ende,
estamos
en
presencia
de
muestreo
aleatorio
simple
para
poblacin
finita.
Como
hay
4
elementos
en
la
poblacin
y
queremos
formar
grupos
de
dos
sin
importar
su
orden
Como
X
es
una
variable
aleatoria,
vamos
a
calcular
la
media
en
cada
muestra,
entonces
X 1 :
el
tenernos
que
calcular
una
combinacin:
promedio
de
la
primera
muestra,
X 2 :
el
promedio
de
la
segunda
muestra,
etc.
Veamos:
4 4!
= =6
2 2!(4 2)!
78 + 67 78 + 83 78 + 56
X1 = = 72.5 X2 = = 80.5 X3 = = 67
2 2 2
Es
decir,
que
podemos
formar
6
grupos
de
dos
elementos
cada
uno.
Observmoslos
67 + 83 67 + 56 83 + 56
X4 = = 75 X5 = = 61.5 X6 = = 69.5
2 2 2
X 1 : (78, 67) X 2 : (78,83) X 3 : (78,56)
X 4 : (67,83) X 5 : (67,56) X 6 : (83,56)
1 1 1 1 1 1
E ( X ) = X1 + X 2 + X 3 + X 4 + X 5 + X 6
6 6 6 6 6 6
(10,4163). 4 2
X + X 2 + X 3 + X 4 + X 5 + X 6 72.5 + 80.5 + 67 + 75 + 61.5 + 69.5 426 .9 =
= 1 = = = 71 2 41
6 6 6
.9 = 36,1664
9 = 6,013
Ntese
que
el
promedio
de
las
medias
muestrales
es
igual
a
la
media
poblacional,
entonces
podemos
decir
que
X
es
una
buena
estimacin
de
.
Podemos
decir
entonces,
que
si
se
seleccionan
todas
las
muestras
posibles
de
tamao
n
de
una
poblacin
dada
entonces
se
tiene:
=
Calculamos
ahora
la
desviacin
estndar
de
para
las
seis
muestras
posibles:
y
(72.5 71) 2 + (80.5 71) 2 + (67 71) 2 + (75 71) 2 + (61.5 71) 2 + (69.5 71) 2
X =
=
6
6.013
Otra manera de presentar el teorema es la siguiente: b. Cul es la probabilidad de que la media muestral sea superior a 280 puntos.
LP DQ
5 =
IR
S
a. La
varianza
muestral
es
( X )2 ,
luego
el
error
tpico
de
la
media
muestral
es.
Para
la
cual
JUVF U
es
la
suma
de
dichas
variables
aleatorias
y
P
es
el
promedio
de
las
mismas,
se
distribuye
normal
estndar
cuando
n
tiende
a
aumentar
L =
Con
lo
anterior,
estamos
preparados
para
estudiar
las
distribuciones
muestrales
y
las
20
L = =5
caractersticas
de
los
estimadores
puntuales
ms
usados
en
la
inferencia
estadstica.
A
16
continuacin,
se
expondrn
las
variables
aleatorias
(con
sus
distribuciones
de
probabilidad)
que
ms
se
utilizan
para
estimar
los
parmetros
poblacionales
media,
varianza
y
proporcin
y
hacer
b. Con
base
al
enunciado
debemos
calcular
P ( X > 280)
y
esto
lo
logramos
estandarizando
la
inferencias
de
los
mismos.
variable
aleatoria
X .
3. Distribucin
muestral
de
en
una
poblacin
normal
X 280 280 280 300 20
P > = P Z > = P Z > = P Z > = P ( Z > 4 )
Si
X
es
la
media
de
una
muestra
aleatoria
de
tamao
n
sacada
de
una
poblacin
distribuida
5 5
X X X
I
normalmente
con
media
y
desviacin
5 = ;
y
por
lo
tanto
la
estandarizacin
L
es:
J
Veamos
la
representacin
grfica
de
la
probabilidad
solicitada:
5 =
5
=$16500
=$1500
n
=
25
LD
X F[\]^DF][^^
P
(>15760)
=
P >
I/ J F[^^/ .[
Cabe
resaltar
que
como
la
normal
estndar
es
una
distribucin
para
la
cual
los
valores
de
la
probabilidad
de
una
cantidad
negativa
son
igual
al
valor
de
la
probabilidad
de
la
cantidad,
pero
positiva,
es
decir,
4. Distribucin
muestral
de
cuando
se
desconoce
la
distribucin
de
la
poblacin
Cuando
la
muestra
no
proviene
de
una
distribucin
normal,
el
tamao
de
la
muestra
desempea
un
papel
muy
importante.
Cuando
n
es
pequea,
la
forma
de
la
distribucin
depende
P( Z > 4) = 1 P( Z < 4) 1 0.9999 = 0.0001
principalmente
de
la
forma
de
la
poblacin.
Sin
embargo,
cuando
n
crece,
uno
de
los
teoremas
ms
importantes
de
la
inferencia
estadstica
establece
que
la
forma
de
la
distribucin
muestral
se
aproxima
a
una
distribucin
normal,
independientemente
de
la
distribucin
que
tenga
la
Con
lo
cual
decimos
que
la
probabilidad
de
que
la
media
muestral
sea
superior
a
280
en
una
poblacin
de
origen.
(Teorema
del
lmite
central).
muestra
de
tamao
16
es
casi
nula.
En
otras
palabras,
no
es
muy
probable
que
en
una
muestra
de
16
calificaciones
la
media
muestral
sea
mayor
a
280
puntos.
La
diferencia
entre
este
enunciado
y
el
anterior
est
en
que
no
se
requiere
que
la
poblacin
de
origen
tenga
distribucin
normal
cuando
n
es
grande
(n
se
considera
grande
si
es
mayor
o
igual
que
30).
Ejemplo 3
Ejemplo 4
En
cierta
ciudad
los
gastos
semanales
en
transporte
para
los
habitantes,
estn
distribuidos
normalmente
con
media
de
$16500
y
una
desviacin
estndar
de
$1500.
Cul
es
la
probabilidad
de
que
una
muestra
de
25
personas,
tengan
un
gasto
promedio
semanal
superior
a
$15750.
La
duracin
de
cierta
marca
de
bombillas
tiene
una
media
de
900
horas
y
la
desviacin
estndar
de
70
horas.
Si
se
selecciona
una
muestra
de
36
bombillas,
determine
la
probabilidad
de
que
dure
entre
870
y
925
horas.
=900 = 70 n = 36
c\^Dd^^ LD
X d.[Dd^^
P
(870
925)
=
P ef i ef
gh j gh
=
/
Figura
2.
Tabla
t
Studente
Conocida
como
la
distribucin
t
Student
o
simplemente
con
el
nombre
de
la
distribucin
t.
Esto
quiere
decir,
que
para
hacer
inferencias
sobre
medias
poblacionales
cuando
no
se
conoce
la
Fuente: Elaboracin propia
varianza
de
la
poblacin,
se
utiliza
la
distribucin
t
en
lugar
de
la
distribucin
normal.
La
distribucin
t,
de
la
misma
manera
que
la
distribucin
normal
estandarizada,
tiene
forma
de
campana
y
tiene
media
igual
a
0,
alrededor
de
la
cual
es
simtrica.
La
varianza
de
la
distribucin
La
columna
de
la
izquierda
de
la
tabla
contiene
diversos
valores
de
(n
1)
grados
de
libertad.
Cada
t,
en
cambio,
es
mayor
que
1,
es
por
esto
que
la
distribucin
es
ms
aguda
en
el
centro
y
ms
alta
encabezamiento
en
las
columnas
indica
la
proporcin
del
rea
superior
bajo
la
curva
de
la
en
las
colas,
como
lo
muestra
la
siguiente
figura.
distribucin
t.
Si
estamos
interesados,
por
ejemplo,
en
la
distribucin
t
para
10
grados
de
libertad,
para
un
rea
superior
de
0,05
el
valor
es
t
=
1,8125.
El
rea
total
bajo
la
distribucin
t
es
igual
a
1
y
esta
distribucin
se
encuentra
tabulada
para
cada
valor
(n-1)
o
grados
de
libertad
denominados
gl.
Sea
A
el
nmero
total
de
elementos
que
presentan
cierta
caracterstica
en
una
poblacin,
entonces
la
proporcin
de
aquellos
que
cumplen
y
no
cumplen
con
dicha
caracterstica
est
dada
A NA Ejemplo 5
por
la
expresin
P =
y
1 P =
respectivamente.
N N
Se
sabe
que
el
60%
de
los
adultos
de
una
zona
del
pas
compran
determinado
producto.
Se
obtiene
Obsrvese
que
cada
observacin
de
este
experimento
es
de
tipo
Bernoulli
xito
(cumple
con
la
una
muestra
de
150
adultos
de
esta
rea.
Cul
es
la
probabilidad
de
que
la
proporcin
muestral
caracterstica)
y
fracaso
(no
cumple
con
la
caracterstica)
y
como
se
repite
cierto
nmero
de
veces
est
entre
el
50%
y
el
70%?
se
convierte
en
una
Binomial
para
la
cual
el
valor
esperado
de
la
variable
aleatoria
proporcin
de
individuos
con
la
caracterstica
es
P
y
la
varianza
es
P (1 P ) .
Si
el
tamao
de
muestra
es
grande
u = = 0,6 v
=
(^,])(^,w)
= 0,04
F[^
por
el
teorema
del
lmite
central,
esta
binomial
puede
aproximarse
a
una
normal
con
media
P
y
varianza
P (1 P ) .
Recordemos
que
como
P
es
aproximadamente
normal,
se
requiere
estandarizar
la
variable
aleatoria
para
poder
utilizar
las
tablas
de
probabilidades.
^,[^D^,] vDt ^,\D^,]
P(0,5
<
P
<
0,7)
=
< < = 2,5 < v
< 2,5
^,^w Iz ^,^w
Si P es la variable aleatoria proporcin de individuos de una poblacin que presentan
determinada caracterstica, entonces la proporcin muestral se distribuye de la = 0,9938 0,0062 = 0,9876
siguiente manera:
(1 )
~ o, q r
t(FDt)
proporcin
poblacional
y
s J
es
el
e rror
estndar
de
la
proporcin.
Para
tamao
de
muestra
pequeo,
es
decir,
que
cumpla
que
np < 5
o
n(1 p ) < 5
se
tiene
que
la
N n P(1 P)
varianza
y
desviacin
estndar
estn
definidas
de
la
siguiente
manera
Var ( P) =
y
N 1 n
Muchas
veces
el
inters
se
centra
en
dos
poblaciones
de
las
cuales
vamos
a
ver
si
las
medias
La
produccin
diaria
de
una
primera
fbrica
de
envases
de
plstico
tiene
una
distribucin
normal
poblacionales
no
son
iguales
o
podemos
estar
interesados
en
la
magnitud
de
cualquier
diferencia
con
una
media
de
50
unidades
y
una
desviacin
estndar
de
8
unidades.
La
produccin
de
una
que
se
pueda
presentar,
por
ejemplo,
se
podra
estar
interesado
en
conocer
si
dos
lneas
de
segunda
fbrica
est
distribuida
normalmente
con
una
media
de
40
unidades
y
una
desviacin
produccin
sacan
en
promedio
el
mismo
nmero
de
unidades
o
si
son
diferentes
dos
mtodos
de
estndar
de
12.
Para
comparar
el
rendimiento
en
el
trabajo
en
dos
fbricas
de
envases
plsticos,
entrenamiento
utilizados
en
el
personal
de
produccin.
se
saca
de
la
primera
fbrica
una
muestra
aleatoria
de
100
obreros
y
de
la
segunda
una
muestra
de
400.
Encontrar
la
probabilidad
de
que
los
obreros
de
la
primera
fbrica
produzcan
8
unidades
Como
una
generalizacin
de
la
distribucin
muestral
para
la
media
se
puede
decir
lo
siguiente:
ms
que
los
de
la
segunda.
1.
La
diferencia
muestral
para
la
diferencia
entre
dos
medias
muestrales
a
partir
de
muestras
independientes
de
tamao
n1
y
n2,
extradas
de
dos
poblaciones
distribuidas
normalmente,
estar
distribuida
normalmente
y
tendr
una
media
igual
a
(1
-
2)
y
una
varianza
igual
a:
Solucin:
I|H IH
( +
H )
Primera fbrica n1 = 100 = 50 =
J| JH
2.
Si
n1
y
n2
son
grandes,
la
distribucin
muestral
de
la
diferencia
entre
las
dos
medias
muestrales
Segunda fbrica n2 = 400
. = 40 =
ser
aproximadamente
normal
sin
tener
en
cuenta
la
forma
funcional
de
las
poblaciones
originales.
F. ..
+
P
[Z
>
-2]
=
1
P
[Z
-2]
=
1
0,0228
=
0,9772
F
.
CENSO:
Es
una
tcnica
para
obtener
los
datos
por
medio
de
la
cual
se
cuentan
todos
los
elementos
que
conforman
la
poblacin
y
se
registran
sus
caractersticas.
Figura
4.
Represantacin
grafica
ejemplo
7
Fuente: Elaboracin propia
La
probabilidad
de
que
el
rendimiento
medio
para
10
autos
de
la
marca
A
sea
mayor
que
el
de
9
autos
de
la
marca
B
es
de
0,0351
FREUND
John
E.,
M.
I.
(2000).
Estadstica
Matemtica
con
aplicaciones
(6
ed.).
Prentice
Hall.
Paul, N. (1988). Estadstica para los Negocios y la Economa (4 ed.). Prentice Hall.
LISTA DE FIGURAS
LISTA DE TABLAS