You are on page 1of 49

Principios de

Inferencia estadstica o
Estadstica inferencial
Verdad absoluta
Vamos a jugar a adivinarle la
verdad a Dios
Estadsticas

x s p
Informacin de
la muestra
Caractersticas de
la poblacin
Parmetros

o t
Inferencia
(Fundamentos
probabilsticos)
Muestra
Poblacin
6
Procedimientos
de inferencia
Estimacin: aproxima el
valor de un parmetro a
partir de informacin
muestral
Pruebas (Juzgamiento) de
hiptesis: validacin de un
supuesto acerca del valor de un
parmetro, a partir de
informacin muestral
Estimador (Mtodo o funcin)
Estimacin (valor o valores calculados con UNA muestra
en particular)
Formas de hacer estimacin:
Estimacin puntual o de punto (un valor especfico
que aproxima al parmetro)
Estimacin por intervalo o intervalo de confianza (un
conjunto de valores presentados en forma de intervalo
que pueden contener al parmetro; a este evento se le
asocia un valor de probabilidad)
Terminologa en estimacin
Ser un estimador
adecuado no significa ...
Concepto de
estimacin de
parmetros
... significa manejo de
la incertidumbre y de
la imprecisin.
Para una proporcin (porcentaje):
=


Siendo X el nmero de xitos
TEOREMA CENTRAL DEL LMITE
La media muestral de una muestra aleatoria
de tamao n obtenida de una poblacin con
distribucin de probailidad f
X
(x), media y
desviacin estndar o finitas, entonces:
|
|
.
|

\
|


n
N X
n
2
,
o

Caso particular: Aproximacin Binomial-Normal.


Sea X una v. a. binomial con media np y desviacin
estndar




La distribucin de la variable aleatoria tiende a la normal
estndar en tanto n.
( ) p np = 1 o
( ) p np
np X
Z

=
1
Ejemplo
Se lanza una moneda 500 veces. Hallar la probabilidad de que
el nmero de caras no difiera de 250: a) en ms de 10 y b) en
ms de 30.
Como n es grande, la variable aleatoria nmero de caras se
puede aproximar a una normal con media np=5000.5=250 y
desviacin estndar

a)
( ) ( ) 1803 . 11 5 . 0 1 5 . 0 500 p 1 np = = = o
( ) 6528 . 0
1803 . 11
250 5 . 260
1803 . 11
250 X
1803 . 11
250 5 . 239
P 260 X 240 P =
|
.
|

\
|

= s s
b)
( ) 9936 . 0
1803 . 11
250 5 . 280
1803 . 11
250 X
1803 . 11
250 5 . 219
P 280 X 220 P =
|
.
|

\
|

= s s
1. Insesgamiento (el estimador tiende a tomar el valor del
parmetro; es muy probable que una estimacin sea cercana
al parmetro)
Sesgo es la diferencia entre el valor del parmetro y el valor
esperado del estimador.
Propiedades de los estimadores
2. Eficiencia (la varianza del estimador es muy pequea; la
concentracin del estimador alrededor de su media es muy
alta)
Si un estimador es insesgado y eficiente es muy probable
que una estimacin sea muy cercana al parmetro.
3. Consistencia (el estimador se aproxima al parmetro cuando
el tamao de muestra aumenta; no se desva de su objetivo)

4. Suficiencia (los datos dados por la muestra, que se evalan
con el estimador, no requieren de informacin adicional para
aproximar el parmetro)
Estimacin por intervalo o
Intervalos de Confianza
Recta con valores
posibles para el
parmetro u
( )
Lm inferior del IC para u Lm superior del IC para u
Estimacin por intervalo o
Intervalos de Confianza
El centro del
intervalo de
confianza es el
estimador puntual.
0
50
100
150
200
250
300
350
400
450
500
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
muestra
media poblacional lm.sup. lm.inf media muestral
Concepto de Confianza
=
Concepto de
Confianza
Caso: IC para media con varianza
conocida
Usando TCL:
n
z X
muestreo de error X
o
o 2 / 1

( )
n
S
t X
muestreo de error X
n 2 / 1 ; 1 o

IC para media con varianza desconocida:


Error estndar
Error estndar
percentil
IC para otros parmetros de localizacin
Si se tiene la misma variable en dos grupos o en dos
poblaciones diferentes, interesa:
Diferencia de medias:

Diferencia de proporciones:
( ) muestreo de error Y X
( ) muestreo de error p p
2 1
( )
n
p p
z p
muestreo de error p

1
2 / 1 o
Proporcin o probab. de tener una caracterstica (t):
Concepto de juzgamiento o
prueba de hiptesis
Hiptesis estadstica: Es una conjetura o
afirmacin no demostrada a sobre el modelo
probabilstico de una o mas poblaciones. Las
mas comunes (pero no las nicas) estn
relacionadas con parmetros poblacionales
como medias, proporciones, varianzas,
coeficientes de correlacin, etc.
Sistema de hiptesis
Hiptesis nula H
o
Hiptesis sobre la cual se estructura
el proceso de juzgamiento. Elegida
como contraste a la hiptesis de
investigacin H1
Hiptesis Alternativa H
1
Hiptesis que generalmente recoge
las sospechas del investigador.

: H
: H
1
0
23 s
23 >
Estas creencias se plasman en algunos parmetro estadstico como
medias, proporciones, varianzas, etc.
> s = , ,
< > = , ,
Se cree que la edad promedio a
la cual se gradan los
estudiantes de la facultad es
superior a 23 aos
Hasta no tener evidencia de
esta creencia se supondr
lo contrario.
Quin es H
0 y
H
1
?
Problema: La moneda est construida de manera balanceada?

Solucin:

Traducir a lenguaje estadstico:

Establecer su opuesto:

Seleccionar la hiptesis alternativa como aquella que plasma las
creencias del investigador.

Moneda desbalanceada:

Seleccionar la hiptesis nula como el complemento lgico de la
hiptesis alternativa.

Moneda balanceada:




5 . 0 :
1
= t H
5 . 0 :
0
= t H
Tipos de hiptesis Alternativa.
La posicin de la regin de rechazo depende de la hiptesis alternativa
Unilateral
Bilateral
H
1
: <23
H
1
: >23
H
1
: 23
Identificacin de hiptesis
Problema: Una empresa que se dedica a elaborar
declaraciones de impuestos desea comparar la calidad
del trabajo que se realiza en dos de sus oficinas
regionales. Para ello toma muestras aleatorias de
declaraciones previamente elaboradas en cada oficina.
La empresa sospecha que la proporcin de declaraciones
que no poseen errores es mayor en la oficina 2 que en la
Oficina 1.
Cul sera el sistema de hiptesis adecuado para esta
situacin?
2 1
t t >
> s = , ,
> < = , ,

: H
: H
1
0
2 1
t t <
Problema: Se juzga a un individuo por la presunta comisin de
un delito
Riesgos al tomar decisiones
H
0
: Hiptesis nula
No culpable


H
1
: Hiptesis alternativa
Es culpable
Los datos pueden refutarla

Se acepta si las pruebas
no indican lo contrario

Rechazarla por error tiene
graves consecuencias

No debera ser aceptada sin
una gran evidencia a favor.

Rechazarla por error tiene
consecuencias consideradas
menos graves que la anterior



Tipos de error al tomar una decisin



Realidad
NO Culpable Culpable

NO Culpable



Culpable
V
e
r
e
d
i
c
t
o

OK
OK
Error
Tipo II
Error
tipo I
Cul error
es ms
grave?
Realidad
Decisin -
Accin
H
0
cierta

H
0
Falsa
No Rechazo
H
0
Correcto
El promedio de edad del
grupo es 23 aos y as se
decide.


Rechazo H
0

Acepto H
1

Correcto
El promedio de edad del
grupo es 23 aos y el
experimento lo confirma.
23 :
0
= H
25 :
1
= H
Probabilidad condicional:
Probabilidad condicional:
Asumiendo un sistema de hiptesis simples:
Error de tipo II: El promedio
de edad del grupo es 25
aos pero se decide que
tiene 23.
Error de tipo I: El
promedio de edad del
grupo es 23 aos pero
se decide que no.
Para un tamao muestral fijo, no se pueden reducir a la vez
ambos tipos de error.
se fija; para reducir |, hay que aumentar el tamao muestral.
o
|
= P(Rechazar H
0
| H
0
es cierta)=P(Cometer error tipo I)
Tambin llamado Nivel de significancia.
| = P(No Rechazar H
0
| H
0
es falsa)=P(Cometer error tipo II)

Valores comunes de utilizados
en la prctica:
0,01 (1%)
0,05 (5%)
0,1 (10%)

Test
Procedimiento, regla o norma que permite tomar
una decisin basndose en la evidencia muestral.
Entre los test ms utilizados estn:

Para una muestra:
Prueba t para una media
Prueba binomial para una
proporcin
Prueba de Mann-Whitney

Para ms de una muestra:
Prueba t para dos muestras
independientes
Prueba t para dos muestras
pareadas
Prueba Z para dos proporciones
Prueba F para un ANOVA
Prueba de Wilcoxon
Algunas de estas pruebas estn implementadas en EXCEL (No todas);
mientras que el paquete estadstico R contiene todas estas pruebas y
muchas otras ms.
Decisiones basadas en valores p
Un valor p (tambin llamado significancia observada) es el nivel
de significancia mas bajo para el cual los datos observados en
una muestra particular, indican el rechazo de H0.
Grandes valores p representan evidencia en contra de H1 y
conllevan a un rechazo de la misma.
Pequeos valores p representan evidencia a favor de H1 y
conllevan a una aceptacin de la misma.
Criterio de decisin basado en el valor p:

< se valida la hiptesis de investigacin
Si
se invalida la hiptesis de investigacin


Procedimiento general de prueba
Precisar el problema plasmado en el sistema de
hiptesis concerniente al objetivo que se persigue,
nivel de significacin y tipo de datos.

Determinar los supuestos asociados a los datos
(Normalidad, independencia, igualdad de
varianzas, etc.)

Determinar la regla de decisin: Nivel de
significancia.

Tomar una decisin estadstica y una decisin en
el contexto de los datos.
Observaciones
Las hiptesis no se plantean despus de observar los datos.

Rechazar una hiptesis nula consiste en observar si la
evaluacin de la informacin de la muestra es poco probable
asumiendo el cumplimiento de la hiptesis nula

Rechazar una hiptesis nula no prueba que sea falsa, se puede
cometer error de tipo I

No rechazar una hiptesis nula no prueba que sea cierta, se
puede cometer error de tipo II

Cualquiera sea la decisin debemos mostrar la probabilidad de
equivocarnos.



aos 8 , 24 = X
Creo que la edad
media es superior
23 aos...
Son
demasiados...
Gran
diferencia!

Rechazo la
hiptesis nula
Muestra
aleatoria
Contrastando una hiptesis
40 =
20 = X
Si supongo que H
0
es cierta...
... el resultado del experimento sera improbable.
Sin embargo ocurri.
qu hace un cientfico
cuando su teora no
coincide con sus
predicciones?

Rechazo que H
0

sea cierta.

40 =
38 = X
Si supongo que H
0
es cierta...
... el resultado del experimento es coherente.
No hay evidencia a favor de H
0

No se rechaza H
0

El contraste no es significativo
Si una teora hace
predicciones con xito,
queda probado que es
cierta?

Opciones de pruebas de hiptesis
en el software disponible
EXCEL, como opcin en el cuadro de dilogo de insertar funcin:
EXCEL, como opcin en el cuadro de dilogo de Anlisis de datos:
EXCEL: OPCION ANLISIS DE DATOS
Ms de dos muestras? ANOVA de un factor.
(Principios del diseo experimental)
Vlido cuando :
Todas las muestras provienen de una distribucin normal
Las varianzas de todas las poblaciones son iguales
Las medias de las poblaciones pueden ser iguales
Las muestras son independientes
Si el comportamiento es el de este grfico no es vlido
porque hay una varianza diferente a las varianzas de las
otras poblaciones
Prueba de igualdad de varianzas
en K muestras independientes:
Prueba ANAVA o ANOVA (anlisis de varianza); en este caso:

You might also like