You are on page 1of 30

Tema.

Introduccin al
muestreo

Principales conceptos.
Muestreo. Distribucin
muestral de un estadstico.
Principales distribuciones
muestrales.
POBLACION es la totalidad de observaciones
relacionadas con una situacin particular , puede
ser finita o infinita.


Un PARAMETRO es una caracterizacin
numrica de la distribucin de la poblacin de
manera que describe, parcial o completamente la
funcin de densidad de poblacin de la
caracterstica de inters.

Una MUESTRA es un subconjunto de la
poblacin. Debe ser representativa y aleatoria.

Una estadstica (un estadstico) es cualquier
funcin de las variables aleatorias que se
observaron en la muestra, de manera que esta
funcin no contiene cantidades desconocidas.
REVISION DE CONCEPTOS
Ejemplos de
PARAMETROS
N
X

N
1 i
i


N
X
N
X
N
i
i
N
i
i

1
2
1
2
2
) (
) (

Varianza
poblacional
Desviacin
Standard de la
poblacn
x
Media
poblacional
POBLACION tamaodela
cesos numerodesu
n
X
p
PROPORCION
Ejemplos de
ESTADISTICOS
n
X
X
n
1 i
i

1
) (
1
) (
1
2
1
2
2

n
X X
n
X X
S
n
i
i
n
i
i
S
Varianza
muestral
Desviacin
Standard
Media
muestra tamaodela
cesos numerodesu
n
X
p
s

PROPORCION MUESTRAL
Principales conceptos en inferencia estadstica

Idea bsica: Hacer inferencias sobre la poblacin a
partir de la muestra que hemos extrado de la misma.

Ello nos lleva a tratar (brevemente) el tema del
muestreo. Pensemos que la muestra habr de ser
representativa de la poblacin, para que podamos
efectuar inferencias que tengan sentido.


Muestreo
Definicin: Proceso que nos permite la extraccin de
una muestra a partir de una poblacin


Hay dos tipos bsicos de muestreo:
1. Muestreo probabilstico o aleatorio. En este tipo de muestreo, la
probabilidad de aparicin en una muestra de cualquier elemento
de la poblacin es conocida (o calculable). Es el nico
cientficamente vlido, y es sobre el que nos extenderemos
especialmente.
2. Muestreo no probabilstico o de juicio. Es aquel en el que la
seleccin de los elementos de la muestra no se hacen al azar.
Se basa en la experiencia con la poblacin
Fuentes de sesgo
Las poblaciones objetivo y de estudio pueden diferir en
cuanto a las variables que estudiamos.
El nivel econmico en la poblacin de estudio es mayor que en
la objetivo,...
Los individuos que se eligen en la calle pueden ser de mayor
edad (mayor frecuencia de jubilados p.ej.)
En este caso, diremos que las muestras que se elijan estarn sesgadas.
Al tipo de sesgo debido a diferencias sistemticas entre poblacin
objetivo y poblacin de estudio se denomina sesgo de seleccin.
Hay otras fuentes de error/sesgo
No respuesta a encuestas embarazosas
Consumo de drogas, violencia domstica, prcticas poco
ticas,
Mentir en las preguntas delicadas.

Para evitar este tipo de sesgo se utilizan la tcnica de
respuesta aleatorizada.
Muestreo probabilstico

Este muestreo garantiza que, a la larga, las muestras que se van
obteniendo de la poblacin sean representativas de la misma. Vamos a
ver varios tipos de muestreo probabilstico.

1. Muestreo aleatorio simple
2. Muestreo estratificado
3. Muestreo por conglomerados
4. Muestreo por etapas (o polietpico)
5. Muestreo sistemtico (?)
Muestreo probabilstico
1. Muestreo aleatorio simple

Es aquel en el que, a priori, todos los elementos de la muestra tienen la
misma probabilidad de aparicin.

Supongamos que tengamos una poblacin de 50.000 individuos, y que
tenemos un listado con sus nombres. Si queremos elegir 100 personas,
lo que necesitamos es que el ordenador elija al azar a 100 individuos de
esos 50.000.
Muestreo probabilstico
2. Muestreo estratificado

En el muestreo estratificado, los investigadores han de
dividir a los sujetos en diferentes subpoblaciones (o
estratos), en funcin de cierta caracterstica relevante, y
despus lo que hacen es un muestro aleatorio simple de
cada estrato.
Evidentemente, cada individuo debe pertenecer a un estrato
(y solo uno), y cada individuo del estrato habr de tener la
misma probabilidad de ser escogido como parte de la
muestra.
Ejemplo: Supongamos que, en Machala, 70% de los nios de
primaria van a escuela pblica y el 30% a privada. Si
queremos 1,000 nios, lo que haremos es dividir los
alumnos en 2 estratos (pblica y privada) y se eligen
aleatoriamente 700 nios de la pblica y aleatoriamente 300
de la privada.
Muestreo probabilstico
3. Muestreo por conglomerados

En el muestreo por conglomerados, en lugar de considerar
cada elemento de la poblacin, lo que consideramos son
conglomerados de elementos. El proceso es elegir
aleatoriamente uno o varios conglomerados y la muestra
estar formada por TODOS los elementos de los
conglomerados.

Ejemplos:
-En las encuestas durante las elecciones, los
conglomerados pueden ser las mesas electorales, y lo que
se hace es escoger algunas mesas al azar (y de ah se toman
todos los votos de las mesas seleccionadas).
-En otros ejemplos, los conglomerados pueden ser los
bloques de viviendas, los municipios, etc.
Muestreo probabilstico
4. Muestreo por etapas

En este caso se combina el muestreo aleatorio
simple con el muestreo por conglomerados:

Primero se realiza un muestreo por conglomerados (v.g., si
los conglomerados son colegios en Machala, se seleccionan
aleatoriamente varios de ellos).
Segundo, no se eligen todos los alumnos (como ocurrira en
un muestro por conglomerados), sino que se elige una
muestra aleatoria. (Dicha muestra puede ser obtenida por
muestreo aleatorio simple o puede ser estratificado.)
Es decir, hemos tenido 2 etapas de muestreo. Y claro est,
es posible tener ms de 2 etapas...
Muestreo probabilstico
5. Muestreo aleatorio sistemtico
Supongamos que tengamos una lista de N elementos
(e.g., estudiantes de secundaria) y queramos una
muestra de tamao n. En este caso, lo que se hace
es ordenarlos (v.g., en funcin de los apellidos) y
despus se elige aleatoriamente un elemento entre los
N/n=k primeros, y luego se elige de manera sistemtica
el que est k lugares despus del primer elemento, y
as sucesivamente.
Ejemplo: Tenemos 10000 estudiantes (en una lista) y
queremos obtener una muestra de 100 estudiantes.
Primero elegimos al azar un estudiante entre los
10000/100=100 primeros (supongamos que salga el
26), el segundo elemento ser el estudiante 100+26
(126), el siguiente ser el 226, luego el 326, etc.
Muestreo no probabilstico

1. Muestreo sin norma (o de conveniencia)
Se elige a una muestra por ser conveniente, fcil,
econmica. Pero no se hace en base a un criterio de
aleatoridad.
Ejemplo: las encuestas en los peridicos
electrnicos; el muestreo habitual en los trabajos en
psicologa.

2. Muestreo intencional
En este caso, si bien el muestreo no es
probabilstico, los investigadores procuran que se
garantice la representatividad de la muestra
Distribucin muestral de un estadstico

Supongamos que tenemos una variable aleatoria,
cuya distribucin es f(x)
Supongamos, por simplicidad, que obtenemos una
muestra aleatoria simple con tamao n
X
1
, X
2
, ... X
n

Entonces, un estadstico es cualquier funcin h
definida sobre X
1
, X
2
, ... X
n
y que no incluye parmetro
desconocido alguno:
Y=h(X
1
, X
2
, ... X
n
)
La distribucin de dicho estadstico Y la vamos a denominar g(y)
Distribucin muestral de un estadstico
Observad:
f(x) es la distribucin de la v.a. bajo estudio
g(y) es la distribucin del estadstico que tenemos

Es vital conocer la distribucin muestral del
estadstico de inters para poder efectuar
inferencias sobre el parmetro correspondiente.

Esto es, para efectuar inferencias sobre la media
poblacional , necesitamos conocer la distribucin
muestral de

X
Diseo de experimentos
Conducir experimentos que produzcan resultados
significativos en forma de conclusiones aprovechables,
es de suma importancia la forman en que se disean los
experimentos.
Objetivo.- Punto de inicio.
Lo que se medir.- Variable de respuesta
Qu tamao de muestra.- Mientras ms grande la muestra ms
costoso el experimento.
Conduccin del experimento.- Efectuar experimento bajo
condiciones controladas.
Anlisis de datos.- Sujetos a pruebas de hiptesis.
Distribucin muestral de la media

Veremos primero el caso de que la distribucin
subyacente sea normal, con media y varianza


La media de la distribucin muestral de medias es
La varianza de la distribucin muestral de medias es

2
/ n
2

La forma de la distribucin muestral de la media es normal.


Nota: La desviacin tpica de la distribucin muestral suele ser denominada:
error tpico de tal estadstico (v.g., error tpico de la media, etc.)
Distribucin muestral de la media. Ejemplo 1
N10
1
1
6
.
0
1
1
4
.
0
1
1
2
.
0
1
1
0
.
0
1
0
8
.
0
1
0
6
.
0
1
0
4
.
0
1
0
2
.
0
1
0
0
.
0
9
8
.
0
9
6
.
0
9
4
.
0
9
2
.
0
9
0
.
0
8
8
.
0
8
6
.
0
8
4
.
0
8
2
.
0
400
300
200
100
0
Desv. tp. = 4.75
Media = 99.9
N = 3600.00
Distribucin poblacional
subyacente (dist. Normal):
Media=100
(Varianza=225)
Desv.Tpica=15
Distribucin muestral de la
media:
Tamao muestral=10
Media=100
(Varianza=225/10=22.5)
Desv.tpica=
22.5 4.74
La lnea (en este y sucesivos ejemplos) es una curva
normal
En este y sucesivos grficos: Nmero de rplicas
Distribucin muestral de la media. Ejemplo 2
N20
1
1
4
.
0
1
1
2
.
0
1
1
0
.
0
1
0
8
.
0
1
0
6
.
0
1
0
4
.
0
1
0
2
.
0
1
0
0
.
0
9
8
.
0
9
6
.
0
9
4
.
0
9
2
.
0
9
0
.
0
8
8
.
0
500
400
300
200
100
0
Desv. tp. = 3.36
Media = 100.0
N = 3600.00
Distribucin poblacional
subyacente (dist. Normal):
Media=100
Desv.Tpica=15
Distribucin muestral de la
media:
Tamao muestral=20
Media=100
(Varianza=225/20=11.3)
Desv.tpica=3.35
Distribucin muestral de la media. Ejemplo 3
N50
1
0
9
.
2
5
1
0
7
.
2
5
1
0
5
.
2
5
1
0
3
.
2
5
1
0
1
.
2
5
9
9
.
2
5
9
7
.
2
5
9
5
.
2
5
9
3
.
2
5
700
600
500
400
300
200
100
0
Desv. tp. = 2.12
Media = 99.95
N = 3600.00
Distribucin poblacional
subyacente (dist. Normal):
Media=100
Desv.Tpica=15
Distribucin muestral de la
media:
Tamao muestral=50
Media=100
(Varianza=225/50=4.5)
Desv.tpica=2.12
Distribucin muestral de la media

Veremos ahora el caso de que la distribucin
subyacente sea arbitraria, si bien sabemos que la
media es y la varianza sea

La media de la distribucin muestral de medias es
La varianza de la distribucin muestral de medias es

2
/ n
2

La forma de la distribucin muestral de la media TAMBIN tiende a ser normal.


En concreto, la distribucin muestral se acercar ms y ms a la distribucin
normal (media y varianza
2
/n) a medida que se aumente el tamao de cada
muestra.
MUESTREO DE POBLACIONES
NORMALES
Propiedades de la
distribucin de
muestreo de la media
cuando la poblacin
est normalmente
distribuida
Propiedad Ilustrado
simblicamente
La distribucin de muestreo
tiene una media igual a la media
de la poblacin
La distribucin de muestreo
tiene una desviacin estndar
igual a la desviacin estndar
de la poblacin dividida entre la
raz cuadrada del tamao de la
muestra
Ejemplo
Una institucin bancaria calcula que las cuentas de ahorro
individuales estn normalmente distribuidas con una media de
$2,000 y una desviacin estndar de $600. Si el banco toma una
muestra aleatoria de 100 cuentas. cul es la probabilidad de que
la media de la muestra caiga entre $1,900 y $2,050?
Error
estndar de
la media
Media de muestra
Media de la
poblacin
MUESTREO DE POBLACIONES
NORMALES
$2,050 $1,900
rea entre la media y una z de 1,67 = 0,4525
rea entre la media y una z de 0,83
= 0,2967
rea total = 0,7492
Experiencia de
cinco propietarios
de motocicletas con
la duracin de sus
llantas
Propietario
Carlos Dbora Elizabeth Frank George
Total
Duracin
de las
llantas
(meses)
3 3 7 9 14 36 meses
MUESTREO DE POBLACIONES NO
NORMALES
Media = 36/5 = 7,2 meses
Clculo de la media de la
muestra de la duracin
de la llanta con n = 3
Muestras de tres Datos de muestras Media de la muestra
EFG 7+9+14 10
DFG 3+9+14 8 2/3
DEG 3+7+14 8
DEF 3+7+9 6 1/3
CFG 3+9+14 8 2/3
CEG 3+7+14 8
CEF 3+7+9 6 1/3
CDF 3+3+9 5
CDE 3+3+7 4 1/3
CDG 3+3+14 6 2/3
72 meses
MUESTREO DE POBLACIONES NO
NORMALES
0
0.5
1
1.5
2
2.5
3 7 9 14
Distribucin de poblacin N=5
0
0.5
1
1.5
2
2.5
10 8.66 8.33 8 6.66 6.33 5 4.33
Distribucin de la muestra de la media n = 10
Duracin de la llanta en meses
Duracin de la llanta en meses
TEOREMA DEL LMITE CENTRAL
1. La media de la distribucin de muestreo de la media
ser igual a la media de la poblacin, sin importar el
tamao de la muestra, incluso si la poblacin no es
normal.
2. Al incrementarse el tamao de la muestra, la
distribucin de la media se acercar a la normalidad,
sin importar la forma de la distribucin de la poblacin
Asegura que la distribucin de muestreo de la media se aproxima a la
normal al incrementarse el tamao de la muestra.
n = 30
TEOREMA DEL LMITE CENTRAL
$19,000 $19,750
n = 30
0,50 0,4798
EJERCICIO
Desviaciones estndar de la
media de una distribucin
normal de probabilidad
El teorema del Lmite Central es uno de los conceptos ms poderosos de la
estadstica. Lo que dice en realidad es que la distribucin de las medias
muestrales tiende a tener una distribucin normal. Esto se cumple sin
importar la forma de la distribucin de la poblacin en donde se tomaron las
muestras

You might also like