You are on page 1of 34

INFERENCIA

ESTADSTICA
Mg. Blanca Luz Laines Lozano
ESTIMACIN DE PARMETROS
Estimacin Puntual
Estimacin por intervalos
PRUEBA DE HIPTESIS
Prueba de hiptesis sobre los
parmetros poblacionales y sobre
las distribuciones poblacionales.
Parmetro
Es una medida de resumen que representa a
la poblacin y cuyo valor numrico se
calcula en base al estudio de toda la
poblacin, y como esto en general no es
factible por el tiempo que requiere y por el
costo que implica, entonces estos valores
son desconocidos y por lo tanto deben de ser
ESTIMADOS.
Estadgrafo
Es una medida de resumen que representa
los datos de una muestra aleatoria de
tamao n tomados de una determinada
poblacin.
Al estadgrafo tambin se le denomina
ESTIMADOR, y se define como una funcin
de los valores de una muestra aleatoria
X
1
, X
2
,,X
n
.
Estimacin Puntual
Si utilizamos el valor de un estadgrafo para calcular
un parmetro de una poblacin, este valor es una
estimacin puntual del parmetro. Estas
estimaciones reciben el nombre de estimacin
puntual porque son nmeros nicos, o puntos
situados en el eje real.
El estadgrafo cuyo valor se utiliza para la estimacin
puntual del parmetro se llama Estimador, y el
valor de este estimador ser el valor estimado
del parmetro.
X
Estima puntualmente a
S Estima puntualmente a o
Estima puntualmente a p p

Teorema Central del Lmite


Sean X
1
, X
2
,,X
n
, n variables aleatorias
independientes, cada una con cierta distribucin ,
de media
i
y varianza o
i
2
, i=1,2,n, si se define
la
v.a. Y de la siguiente manera:
Y=X
1
+X
2
++X
n
,


entonces si n>30, la v.a. Y tendr una
distribucin Normal con los siguientes
parmetros:

= =
= =
n
i
i Y
n
i
i Y
1
2 2
1
o o
Distribuciones Muestrales
Definicin:
Se denomina distribucin muestral a la
distribucin de probabilidades del estadgrafo
(o estimador) calculada a partir de todas las
posibles muestras de tamao n elegidas de
la poblacin en estudio.
Estas distribuciones se conciben en forma
terica puesto que por lo general es muy
difcil extraer todas las muestras de tamao n
de una poblacin.
Distribucin de la Media Muestral ( )
Si se toma una m.a. De tamao n de un
poblacin con media y varianza o
2
,
entonces por el Teorema del Lmite Central
tenemos que:



para n grande (n>30)
x
|
|
.
|

\
|
~
n
N x
2
,
o

Es decir:




Por lo tanto tendremos que:
n
x V
x E
x
x
2
2
) (
) (
o
o

= =
= =
n
x
Z
o

=
Si la poblacin es finita de Tamao N, entonces
debemos usar un factor de correccin, y la
distribucin de la media ser:



por lo tanto:
|
|
.
|

\
|

~
1
,
2
n
n N
n
N x
o

=
N
n N
n
x
Z
o

Un dado
Dos dados
Tres dados
Distribucin de puntaje promedio de un
experimento de lanzamiento de dos dados
Un artculo publicado en el Journal of Heat
Transfer describe un nuevo mtodo para
medir la conductividad trmica del hierro
Armco. Al utilizar una temperatura de 100F y
una potencia d entrada de 550 W, se
obtienen las 10 mediciones siguientes de
conductividad trmica (en Btu/hr-ft-F):
41.60; 41.48; 42.34; 41.95; 41.86;
42.18; 41.72; 42.26; 41.81; 42.04.
Una estimacin puntual de la conductividad trmica
promedio a 100F y 550 W es la media muestral

Btu/hr-ft-F

El error estndar de la media muestral es

Y dado que o es desconocido, puede reemplazarse por
la desviacin estndar muestral s=0.284 para obtener
el errror estndar estimado de como

924 . 41 = x
n
x
o
o =
X
0898 . 0
10
284 . 0

= = =
n
s
X
o
Ntese que el error estndar es alrededor de 0.2%
de la media muestral, lo que implica que se ha
obtenido una estimacin puntual relativamente
precisa de la conductividad trmica
Distribucin de la media muestral para
muestras pequeas :

Si se toma una m.a. de tamao n (n<30) de una
poblacin con distribucin normal de media y
varianza o
2
desconocida, entonces tendremos que:





Donde t
(n-1)
es una distribucin t de Student con
(n-1) grados de libertad.

) 1 (
=

n
t
n
s
x
Distribucin de la Varianza
Muestral (S
2
)
Si de una poblacin con distribucin normal
de media y varianza o
2
se extrae una
muestra aleatoria de tamao n, entonces la
distribucin de la varianza muestral ser:
2
) 1 (
2
2
) 1 (

n
S n
_
o
Distribucin de la Proporcin
Muestral ( )
Suponga una poblacin con distribucin de
Bernoulli con parmetro p, si de esta
poblacin se toma una muestra aleatoria de
tamao n, entonces la distribucin muestral
de ser: p

Z
n
p p
p p
=

) 1 (

INTERVALOS DE
CONFIANZA
Intervalos de Confianza
Un mtodo de estimacin de Parmetros que
se utiliza con frecuencia es la estimacin
mediante Intervalos de Confianza y cuya
ventaja sobre la estimacin puntual es que
en este caso es posible determinar el error
de estimacin as como el nivel de confianza
con el que se dan los resultados.
Definicin:
Un intervalos de confianza es un
rango de valores que se construye a
partir de datos muestrales de modo
que el parmetro, que se pretende
estimar, est contenido dentro de
dicho rango con una probabilidad
especificada. A la probabilidad
especificada se le conoce como Nivel
de Confianza y se le denota por
Es decir, dado un Parmetro de inters (que puede
ser la media , la Proporcin P, la varianza o
2
, etc)
basndonos en la informacin de una muestra
aleatoria y un nivel de confianza pre establecido ,
podremos decir que el parmetro est contenido en
el intervalo:
(L
i
, L
s
)
L
i
: Lmite inferior del intervalo
L
s
: Lmite superior del intervalo
Las frmulas para estimar estos lmites varan
dependiendo del Parmetro que deseamos estimar


Intervalo de Confianza para la
Media Poblacional ()
Supongamos que se toma una m.a. de
tamao n, de una poblacin con distribucin
normal con varianza o
2
conocida, entonces el
intervalo de confianza para la media es:



z
o
: Indice correspondiente el nivel de confianza fijado

n
z x IC
o
o
= ) (
Considrense los datos de conductividad
trmica para el hierro Armco. Encontrar un
intervalo de confianza del 95% para
conductividad trmica promedio de este
material, y que se sabe que la desviacin
estndar de la conductividad trmica a 100F
y 550 W es o= 0.30 Btu/hr-ft-F si se supone
que la conductividad trmica est distribuida
de manera normal (o que se satisfacen las
condiciones del teorema del lmite central)
Este intervalo se construye a partir de la
distribucin muestral de la media:


El error de estimacin, denotado por E, est
dado por

La longitud del intervalo de confianza ser


n
x
Z
/ o

=
n
z E
o
0
=
E
n
z L 2 2
0
= =
o
Cuando se conoce el tamao de la poblacin
N, entonces tendremos el intervalos de
confianza para la media en una poblacin
finita:



z
o
: Indice correspondiente el nivel de confianza fijado

A la expresin se le denomina factor de

correccin por poblacin finita

1
) (

=
N
n N
n
z x IC
o
o

1
. .

=
N
n N
c f
Intervalo de Confianza para la Media
Poblacional (), si varianza o
2
desconocida
Si de una poblacin con distribucin normal se toma
una m.a. de tamao n y la varianza o
2
desconocida,
entonces el intervalo de confianza para la media
ser:



t
o
: Indice correspondiente el nivel de confianza fijado,
donde t
0
tiene una distribucin t
(n-1)


n
s
t x IC
o
= ) (
Intervalo de Confianza para la
Proporcin Poblacional (P)
Supongamos que se toma una m.a. de
tamao n, (n>30) de una poblacin con
distribucin de Bernoulli con probabilidad P,
entonces el intervalo de confianza para la
Proporcin es:



z
o
: Indice correspondiente el nivel de confianza fijado

n
p p
z p P IC
o
)

1 (

) (

=
Intervalos de confianza para comparar
dos poblaciones
Cuando se desea comparar dos poblaciones, con
respecto a alguna caracterstica en particular,
podemos utilizar los intervalos de confianza.
En este caso tendremos:
Intervalos de confianza para la diferencia de
medias
Intervalos de confianza para la diferencia de
proporciones
Intervalos de confianza para el cociente de
varianzas
Intervalo de Confianza para la
diferencia de medias (
1
-
2
)
Supongamos que tenemos dos poblaciones
independientes, cada una con distribucin
normal con medias
i
y varianzas o
i
2
, de cada
poblacin se toma una m.a. de tamaos n
1
y
n
2
respectivamente, entonces el intervalo de
confianza para la diferencia de las medias de
estas dos poblaciones depender de la
informacin con la que se cuenta, y se
presentan los siguientes casos:


Caso 1:
Las varianzas son conocidas,
entonces:




z
0
: es el ndice correspondiente al nivel de
confianza, que se calcula en la distribucin normal
2
2
2
1
o o y
2
2
2
1
2
1
0 2 1 2 1
) ( ) (
n n
z x x IC
o o
+ =
Caso 2:
Las varianzas son desconocidas,
pero iguales , entonces:




t
0
: es el ndice correspondiente al nivel de confianza,
que se calcula en la distribucin t de Student con
n
1
+n
2
-2 grados de libertad
2
2
2
1
o o y
|
|
.
|

\
|
+
+
+
=
2 1 2 1
2
2 2
2
1 1
0 2 1 2 1
1 1
2
) 1 ( ) 1 (
) ( ) (
n n n n
S n S n
t x x IC
Caso 3:
Las varianzas son desconocidas,
pero diferentes , entonces:




t
0
: es el ndice correspondiente al nivel de confianza,
que se calcula en la distribucin t de Student con g
grados de libertad
2
2
2
1
o o y
2
2
2
1
2
1
0 2 1 2 1
) ( ) (
n
S
n
S
t x x IC + =
Interpretacin:

i) Si el valor 0 est a la izquierda del
intervalo, entonces:
1
>
2

ii) Si el valor 0 est a la derecha del
intervalo, entonces:
1
<
2

iii) Si el valor 0 est contenido en el
intervalo, entonces:
1
=
2