You are on page 1of 71

ESTADSTICA INFERENCIAL

Inferencia Estadstica
La

Inferencia Estadstica es diferente de


otras inferencias porque adems de
realizar la generalizacin a la poblacin, se
provee de una medida de la bondad de
dicha inferencia.
Hay dos maneras de realizar Inferencia
Estadstica:
Estimacin
Prueba

de Hiptesis

Inferencia Estadstica
Estimacin:
Respondemos

a la pregunta Cul es el valor


del parmetro poblacional desconocido?

Prueba

de Hiptesis:

Respondemos

a la pregunta Es el
parmetro poblacional igual a cierto valor
especfico?
Conocemos un valor para el parmetro
poblacional y queremos ver si es consistente
con la evidencia muestral.

ESTIMACIN

Estimador
Un

estimador es una funcin que se


calcula a partir de la muestra.
Un estimador es una variable aleatoria
en s mismo y por lo tanto sigue una
distribucin de probabilidad (muestral)
terica.
Con base en dicha distribucin de
probabilidad se puede calcular la
bondad de nuestra estimacin.

Estimacin puntual vs. intervalo


La

estimacin puntual de un parmetro


desconocido consiste en el clculo de
un nico valor numrico que sea una
buena aproximacin de la realidad. Un
estimador puntual por s solo es
inadecuado.
Se trata de buscar un intervalo de
valores entre los que posiblemente se
encuentre la cantidad que se estima:
una estimacin por intervalo.

Nivel de Confianza
La

cantidad (1-) es el nivel de


confianza del intervalo
Mide la probabilidad de que el
parmetro poblacional est contenido en
el intervalo que se usa para estimarlo.
El nivel de confianza se interpreta como
la probabilidad de haber acertado en la
estimacin del parmetro poblacional.

Nivel de Confianza y de Significancia

/2

/2

LI

LS

Nivel de Significancia
El

complemento del nivel de confianza


se llama nivel de significancia ().
Es la probabilidad contenida fuera del
intervalo de confianza (/2 en cada
cola).
Se interpreta como la probabilidad de no
acertar en la estimacin.

Distribucin muestral de X
Teorema del Lmite Central:
La poblacin sigue una distribucin
Normal: X~(,)
Se calculan las medias aritmticas ( X) de
diferentes muestras aleatorias de
tamao n
Las medias muestrales mostrarn un
comportamiento aproximadamente
Normal: X ~(, /n).

Distribucin muestral de X
Esta

aproximacin ser mas precisa


conforme el tamao de la muestra (n) se
incremente.
Si la poblacin no sigue una distribucin
Normal, este teorema tambin se
cumple cuando el tamao de la muestra
es suficientemente grande (n30).
(Ver pgina 275, grfica 8.2)

Estimacin de Intervalo de

Sabemos que para cualquier variable


X que se distribuye Normal(,), su
valor estndar es:X -
Z

Entonces, como X sigue una


distribucin Normal(,/n ), su valor
estndar es:
X -
Z

Estimacin de Intervalo de

Para estimar el valor de la media


poblacional () solo despejamos dicho
valor:

X Z

Este es el intervalo de (1-)% de


confianza (bilateral), en donde /2 es
la probabilidad acumulada en cada una
de las colas de la distribucin Normal.

Estimacin de Intervalo de
En caso de no conocer la varianza
poblacional (), se puede tomar como
valor estimado la varianza muestral
(S), ya que el tamao de la muestra
es grande (n30).
El valor de Z 2 se busca en Excel con
la funcin DISTR.NORM.ESTAND.INV
(NORMSINV) dando como
probabilidad acumulada /2

Estimacin de Intervalo de
La

bondad de esta estimacin est en el


nivel de confianza (1-)
Por ejemplo, si la estimacin de
intervalo tiene nivel de confianza de (1) = 0.95, implica que en el 95% de los
muestreos repetidos el verdadero
parmetro estar contenido en el
intervalo calculado (a largo plazo).

Estimacin de Intervalo de
Conclusin

1: el nivel de confianza (1-)


guarda una relacin directa con la cota
sobre el error de estimacin (la amplitud
del intervalo).
Conclusin 2: la dispersin de los datos
de la muestra (S) guarda una relacin
directa con la cota sobre el error de
estimacin (la amplitud del intervalo).

Estimacin de Intervalo de
Conclusin

3: el tamao de la muestra
(n) guarda una relacin inversa con la
cota sobre el error de estimacin (la
amplitud del intervalo).
De estos tres componentes de la cota
sobre el error de estimacin, solo
podemos modificar el nivel de confianza
y en el tamao de la muestra.

Estimacin Puntual de

En la estimacin puntual:

En donde la cota sobre el Error de


Estimacin es:


X - Z2

Tamao de muestra

Primero se establece:
El

nivel de confianza (1-) requerido para la


estimacin
La cota sobre el error mxima permitida en
la estimacin:

E Z2

Despejando de aqu n:

Z 2

ESTIMACIN DE LA
MEDIA POBLACIONAL ()
(Muestras chicas)

Distribucin muestral de X
En

una muestra de n<30 (proveniente


de una poblacin Normal) no se cumple
el Teorema del Lmite Central.
El grfico de frecuencias relativas para
las medias muestrales X ser
aproximadamente una distribucin t de
Student con media y desviacin
estndar S/n.

Distribucin t de Student
Es

simtrica, alrededor de cero (como la


Normal Estndar)
Es ms chaparra (platocrtica) que la
Normal, lo que resulta en colas ms pesadas.
Su curtosis cambia con el tamao de la
muestra. Cuando el tamao de la muestra
tiende a infinito, la t tiende a la distribucin
Normal.
Tiene un parmetro de grados de libertad.
Para cada valor de los grados de libertad
corresponde una distribucin t diferente.

Distribucin t de Student

Estimacin de Intervalo de

Como ahora X sigue una distribucin


t de Student, su valor estndar es:
t

X -
S
n

Estimacin de Intervalo de

Para estimar el valor de la media


poblacional () solo despejamos dicho
valor:
S

X t

,n

Este es el intervalo de (1-)% de


confianza (bilateral), en donde /2 es la
probabilidad acumulada en cada una de
las colas de la distribucin t de Student.

Estimacin de Intervalo de

El valor de t 2 , n 1 se busca en Excel


con la funcin DISTR.T.INV (TINV)
dando como:
probabilidad

acumulada en ambas colas

=
grados de libertad = n-1

Estimacin Puntual de

En la estimacin puntual:

En donde la cota sobre el Error de


Estimacin es:

X - t 2,n 1

S
n

Esta cota NO puede usarse para


calcular el valor del tamao de muestra

ESTIMACIN DE LA
PROPORCIN POBLACIONAL (p)

Distribucin muestral de p
La

proporcin muestral tiene una


distribucin Binomial.
En una muestra suficientemente
grande, en donde np5, esta
distribucin Binomial se puede
aproximar con una distribucin Normal:

pq
~ N(p, n ).

Estimacin de Intervalo de p

Sabemos que para cualquier variable


X que se distribuye Normal(,), su
valor estndar es:X -
Z

Entonces, como p sigue una


distribucin Normal(, pq ), su valor
n
p -p
estndar es:
Z

p q

Estimacin de Intervalo de p

Para estimar el valor de la proporcin


poblacional (p) solo despejamos dicho
valor:
p q

p Z

Este es el intervalo de (1-)% de


confianza (bilateral), en donde /2 es
la probabilidad acumulada en cada una
de las colas de la distribucin Normal.

Estimacin Puntual
En

la estimacin puntual:

p p
El

error de estimacin es:

p - p Z 2

p q
n

Tamao de muestra

Primero se establece:
El

nivel de confianza (1-) requerido para la


estimacin
La cota sobre el error mxima permitida en
la estimacin:

E Z2

p q
n

Despejando de aqu n:

p q Z 2 2
n
E2

ESTIMACIN DE LA
VARIANZA POBLACIONAL ()

Distribucin muestral de S
La

varianza muestral (S) no sigue una


distribucin de probabilidad especfica,
sin embargo la transformacin:

n 1 S

sigue una distribucin Ji Cuadrada

Distribucin Ji-Cuadrada
Admite

solo valores positivos


Tiene sesgo positivo
Su forma cambia al aumentar el tamao
de la muestra.
Tiene un parmetro de grados de
libertad. Para cada valor de grados de
libertad corresponde una distribucin JiCuadrada diferente.

Distribucin Ji-Cuadrada

Estimacin de Intervalo
2

Los valores de se buscan con la funcin:


PRUEBA.CHI.INV
(CHIINV en ingls)
dando para el extremo derecho:
probabilidad acumulada = /2
grados de libertad = n-1
Y para el extremo izquierdo:
probabilidad acumulada = 1-/2
grados de libertad = n-1

Estimacin de Intervalo
En

la funcin, despejo porque es lo que


deseo estimar:

Como

n 1 S

n 1 S

la distribucin Ji-Cuadrada es sesgada,


buscamos cada uno de los dos valores que
delimitan (1-)% de probabilidad central.

Estimacin de Intervalo
Sustituyendo

los valores de Ji-Cuadrada en la


funcin obtengo el intervalo de (1-)% de
confianza para la varianza poblacional:

n 1 S 2 n 1 S 2

,
2 ,n 1 12 ,n 1
2
2

El

intervalo para la desviacin estndar () se


obtiene al calcular la raz cuadrada de cada
extremo del intervalo.

FORMULARIO
DE ESTIMACIN

FORMULARIO ESTIMACIN

PRUEBAS DE HIPTESIS

Prueba de Hiptesis
Tenemos

informacin previa sobre el


parmetro poblacional que estamos
estimando.
Necesitamos comprobar si el parmetro
poblacional sigue siendo igual a ese
valor anterior, dada la evidencia
muestral (valor estimado).

Prueba de Hiptesis
Trata

de responder a la pregunta: es el
parmetro poblacional igual a cierto
valor especfico?
Se compone de cinco partes:
Hiptesis

Nula
Hiptesis Alternativa
Regin de Rechazo
Estadstica de Prueba
Conclusin

PRUEBA DE HIPTESIS DE LA
MEDIA POBLACIONAL ()
(Muestras grandes)

Prueba de Hiptesis
Tenemos

informacin previa sobre el


parmetro poblacional que estamos
estimando.
Queremos comprobar si el parmetro
poblacional es estadsticamente similar
al valor muestral que arroja la evidencia
(valor estimado).

Prueba de Hiptesis
Se

compone de cinco partes:

Hiptesis

Nula
Hiptesis Alternativa
Regin de Rechazo
Estadstica de Prueba
Conclusin

1. Hiptesis Nula (H0):


Afirma

el valor conocido del parmetro:

H0 : 0
0

es el valor conocido del parmetro


poblacional.

2. Hiptesis Alternativa (Ha):

i.
ii.
iii.

Generalmente contradice lo que afirma la


Hiptesis Nula.
Es la hiptesis que propone el investigador a
la luz de la evidencia muestral.
Puede seleccionarse alguna de las
siguientes tres formas:
cuando X > 0 (unilateral).
Ha : 0

Ha : 0
Ha : 0

cuando X < 0 (unilateral).


en cualquier caso (bilateral).

3. Regin de Rechazo:
Es una zona en la distribucin de
probabilidad del estimador muestral
(Normal Estndar, t de Student o JiCuadrada).
Se ubica en concordancia con la
hiptesis alternativa seleccionada:

i.
ii.
iii.

Cola derecha
Cola izquierda
Ambas colas

3. Regin de Rechazo (i)


en una distribucin Normal

1-

3. Regin de Rechazo (ii)


en una distribucin Normal

1-

3. Regin de Rechazo (iii)


en una distribucin Normal

1-
/2

/2

3. Regin de Rechazo:
Tiene

contenida una probabilidad


acumulada igual al nivel de significancia
() deseado para realizar la Prueba de
Hiptesis.
La regin de rechazo representa los
valores del estimador que consideramos
estn demasiado lejos del valor
especfico (0) y que nos hacen pensar
que la hiptesis nula no es verdadera.

3. Regin de Rechazo:
La

regin de rechazo est delimitada por


el valor terico correspondiente a la
distribucin de probabilidad del
estimador.
Este valor terico su busca en Excel
con la funcin:
DISTR.NORM.ESTAND.INV
DISTR.T.INV

(TINV)
PRUEBA.CHI.INV (CHIINV)

(NORMSINV)

3. Regin de Rechazo:

El valor Z terico:
DISTR.NORM.ESTAND.INV
(NORMSINV)
con probabilidad de:

i.

Cola derecha: 1-
Cola izquierda:
Ambas colas: /2

ii.
iii.

3. Regin de Rechazo:

El valor t terico:
DISTR.T.INV
(TINV)
con grados de libertad n-1 y
probabilidad de:

i.

Cola derecha: 2
Cola izquierda: 2
Ambas colas:

ii.
iii.

3. Regin de Rechazo:

El valor 2 terico:
PRUEBA.CHI.INV
(CHIINV)
con grados de libertad n-1 y
probabilidad de:

i.

Cola derecha:
Cola izquierda: 1-
Ambas colas: se buscan dos valores con /2
para el extremo derecho y 1- /2 para el
extremo izquierdo respectivamente.

ii.
iii.

4. Estadstica de Prueba:

Se utiliza un estadstico (frmula)


calculado a partir del estimador
(informacin muestral) para tomar
una decisin sobre la probabilidad de
que la Hiptesis Nula sea verdadera.

4. Estadstica de Prueba:
Por ejemplo: en una prueba para la
media, se estandariza el valor de X
para ubicarlo en relacin con la regin
de rechazo:
Esta es la Z o la t calculada:

X -

X -
S
n

5. Conclusin
Si

el valor de la estadstica de prueba


(calculada) cae dentro de la regin de
rechazo delimitada por el valor terico,
se rechaza la hiptesis nula (H0).

Esto

significa que lo ms probable es


que la hiptesis alternativa sea cierta.

5. Conclusin
Si

el valor de la estadstica de prueba


(calculada) cae fuera de la regin de
rechazo delimitada por el valor terico,
NO se rechaza la hiptesis nula (H0).

Esto

significa que lo ms probable es


que la hiptesis nula sea cierta.

Tipos de Error
Para

fijar la regin de rechazo, es


necesario hablar de los dos tipos de
errores que se pueden cometer.
Dependiendo de la veracidad de la
hiptesis nula, y del resultado de la
prueba de hiptesis podemos decir que
hay cuatro resultados posibles en una
prueba de hiptesis:

Tipos de Error
Hiptesis
Resultado de Nula
la Prueba:
Verdadera
Rechazo
la ERROR TIPO I
Hiptesis
Nula
Acepto
la
Hiptesis
Nula

CORRECTO

Hiptesis Nula
Falsa
CORRECTO

ERROR TIPO II

Tipos de Error
P(cometer

error I) =
P(cometer error II) =
Estas probabilidades estn
inversamente relacionadas, por lo que
se suele fijar el valor de alfa lo
suficientemente pequeo para que beta
no se considere grande.

PRUEBAS DE HIPTESIS

PRUEBA DE NORMALIDAD
JARQUE - BERA

PRUEBA JARQUE-BERA
Prueba

la normalidad de los datos


contenidos en la muestra.
Recordemos que una distribucin
Normal tiene:
Coeficiente

momento de Sesgo = 0
Coeficiente momento de Curtosis = 3

PRUEBA JARQUE-BERA
La

prueba de hiptesis tiene:

H0:

Las observaciones siguen una


distribucin Normal.
Ha: La distribucin no es Normal
Regin

de Rechazo: ,2 (2 grados de lib)

Estadstica

de Prueba:

a2 a 3 2

JB n 3 4
6

24

PRUEBA JARQUE-BERA
En

donde:

a3

es el resultado del coeficiente de


asimetra de Excel.
(a4 -3) es el resultado de la curtosis de
Excel
Esta

es una prueba asinttica, por lo


que tiene mejores resultados a mayor
tamao de muestra.

You might also like