You are on page 1of 8

EL MUESTREO Y LA INFERENCIA ESTADSTICA

Ing. Luz Bulln Camarena

En muchos problemas de investigacin es imposible y/o innecesario obtener informacin


de toda la poblacin de inters. Es posible examinar una parte (representativa) de sta, a
la cual se denomina muestra, y luego hacer generalizaciones (inferencias) acera del todo
o poblacin
FIG 1. Relacin entre poblacin y muestra, muestreo e inferencia

Poblacin

Muestra
Muestreo

Inferencia

PROBABILIDADES

El comportamiento observado en la muestra es vlido en la poblacin, con una cierta


probabilidad de cometer un error al hacer tal afirmacin.
EJEMPLO 1. Suponga los datos correspondientes a la Presin Sangunea Sistlica de
2232 hombres adultos, peruanos que viven en el Per, con edades entre 49 y 94 aos.
Luego, la Poblacin es: todos los hombres adultos, peruanos que viven en el pas, cuyas
presiones sanguneas seran medidas bajo condiciones estndar. No sera posible medir
a todos. La Muestra es el conjunto de 2232 personas, elegido de la poblacin.
EJEMPLO 2. Se quiere evaluar el efecto de una nueva dieta especial para nios con
Phenylketonuria (PKU). Un efecto de esta condicin es que los nios no tratados sufren
de retardo mental. La dieta es usada con un conjunto de nios con PKU, sus QI fueron
medidos cuando ellos cumplieron 4 aos de edad. La Poblacin, en este caso, hipttica,
son todos los nios con PKU quienes potencialmente podran ser tratados con la nueva
dieta. La variable de inters es el QI correspondiente a cada nio. La muestra: es el
conjunto de nios que realmente fue tratado.

RAZONES PARA EL MUESTREO


1. Las poblaciones que se investigan pueden ser infinitas, en tales casos el muestreo es
el nico procedimiento posible. Adems, an en el caso de poblaciones finitas,

48

frecuentemente el muestreo es el nico procedimiento prctico. Esto es as porque


una poblacin finita puede constar de decenas de millares o an millones de
elementos. Si hubiera que realizarse un censo de estas poblaciones, los costos de
localizar, visitar y entrevistar, seran prohibitivos.
2. La medicin de una caracterstica en los elementos de la poblacin a veces requiere la
destruccin de estos elementos, luego, no quedaran elementos despus del estudio.
3. Para muchos tipos de datos la poblacin no es accesible. Luego, en la prctica
tenemos que tratar con cualquier parte de los datos que podamos obtener.
4. An cuando financiera, prctica y fsicamente es posible observar toda la poblacin, el
muestreo puede ser an el procedimiento ms eficiente. Los resultados obtenidos
por el estudio de una muestra pueden ser iguales o ms precisos que los hallados por
una enumeracin completa del conjunto.

"Es un gran progreso cientfico hacia un dominio intelectual del mundo que nos
rodea, generalizar lgica y precisamente acerca de miles de valores que no hemos
visto, sencillamente por la confianza proporcionada por, por ejemplo, cincuenta o
cien de estos valores"
Roy Jastram, en Elements of Statistical Inference
DEFINICIN DE TRMINOS
A partir del ejemplo siguiente:
EJEMPLO. Suponga que se tiene el inters de estudiar los factores de riesgo de
enfermedades cardiovasculares en personas mayores de 40 aos, residentes en la
provincia constitucional del Callao. Se desea evaluar el parmetro : proporcin en la
poblacin, de personas con antecedentes familiares de infarto del miocardio.
Identificamos los trminos comunes al muestreo:
1. Unidad de Anlisis
Una persona mayor de 40 aos, residente en la provincia constitucional del Callao.
2. Poblacin o universo
La poblacin est constituida por todas las personas mayores de 40 aos, residentes
en la provincia constitucional del Callao.
Para determinar el tamao de esta poblacin se puede recurrir a publicaciones del
Instituto de Estadstica e Informtica (INEI)
3. Marco de Muestreo (Marco de la poblacin muestreada)
El marco muestral puede estar constituido por la relacin de hogares de la provincia
constitucional del Callao con sus respectivas direcciones domiciliarias y nombre del
jefe del hogar.
4. Unidad de muestreo

49

La unidad de muestreo puede ser una unidad primaria: el hogar. Esta unidad est
constituida por unidades elementales, las personas.
5. Muestra
El estudio como la mayora de los que se llevan a cabo en la prctica tiene
presupuesto y tiempo limitados, luego a partir de una muestra de n hogares,
entrevistaremos slo a los individuos de estos hogares, que cumplan con la definicin
de la poblacin.
6. Probabilidad de seleccin
Conociendo el tamao de la poblacin N: nmero de hogares de la provincia
constitucional del Callao, se pueden utilizar mecanismos que nos garanticen que todos
los hogares tienen una misma probabilidad de ser elegidos para formar parte de la
muestra.
7. Error
En un censo:
En un muestreo:

Error total = Error no muestral + Error de muestreo


mayor
grande
no estimable
menor
pequeo
estimable

En el ejemplo:
El error no muestral puede presentarse al entrevistar, por comodidad, a un individuo,
no seleccionado, al visitar un hogar que no corresponde a la direccin seleccionada, al
tomar mal los datos por cansancio o negligencia del entrevistador.
El error de muestreo es la diferencia entre el parmetro : proporcin en la poblacin,
de personas con antecedentes familiares de infarto del miocardio y el valor de la
estadstica P = proporcin de personas, en la muestra con antecedentes familiares.
Simblicamente: | P |
8. Precisin frente a exactitud
Las funciones bsicas del muestreo son el control y el clculo de la precisin (que
ayudan a alcanzar exactitud) de los resultados de la muestra por leyes de probabilidad
matemtica.
9. Eficiencia de los diseos de muestreo
Un diseo muestral es eficiente si los resultados deseados son obtenidos al costo
ms bajo posible. Un diseo de muestreo se dice que es ms eficiente que otro si el
primero proporciona la misma precisin a costos ms bajos, o mayor precisin a los
mismos costos, u, obviamente, mayor precisin a costos ms bajos, que el segundo.

ETAPAS DE UNA ENCUESTA POR MUESTREO


Las encuestas varan considerablemente en su complejidad. Es muy fcil tomar una
muestra de 1000 fichas de un Programa de Vigilancia Nutricional, fichas arregladas y
numeradas en un archivo. Pero la situacin es otra si se desea tomar una muestra de los
residentes de una regin donde se usa un medio de transporte fluvial a travs de la selva,
donde no hay mapas y se habla varios dialectos diferentes

50

1. Definir los objetivos de la encuesta


2. Definir la poblacin bajo muestreo
3. Captacin de los datos
4. Seleccionar los mtodos de medicin
5. Eleccin del marco
6. Seleccin de la muestra
7. Realizar una encuesta piloto
8. Organizar el trabajo de campo
9. Resumir y analizar los datos
10. Proporcionar informacin para encuestas futuras
El muestreo requiere atencin en todas las fases de la actividad: un trabajo mediocre en
una de ellas puede invalidar toda la encuesta.

TIPOS DE MUESTREO
En la teora del muestreo es importante distinguir las muestras aleatorias o probabilsticas
de las muestras no probabilsticas.
Una muestra aleatoria:
Es escogida por el mtodo de probabilidades, segn el cual ni el investigador ni las
unidades de muestreo pueden decidir qu unidades sern incluidas en la muestra. La
eleccin se logra solamente por accin del azar.
Las probabilidades de eleccin son conocidas.
En una muestra por probabilidades, el error de muestreo puede medirse y controlarse
por la teora de probabilidades.
Los errores sistemticos de seleccin, falta de respuesta y estimacin son eliminados
o por lo menos contenidos dentro de lmites conocidos.
Una muestra no probabilstica:
La seleccin de un elemento de la poblacin para que forme parte de la muestra se
basa en consideraciones distintas a las probabilidades.
La probabilidad de que cada elemento individual pertenezca a la muestra es
desconocida.
La fidelidad de los resultados no puede ser objeto del anlisis de probabilidades.
No se puede estimar el error de muestreo.
ALGUNOS PROCEDIMIENTOS DE MUESTREO NO PROBABILSTICO
1. Muestreo por conveniencia
Como lo indica su nombre, los elementos son elegidos por conveniencia, debido
posiblemente a que stos se encuentran disponibles o a la facilidad de obtener la

51

informacin.
2. Muestreo por juicio
La muestra es tomada de acuerdo con el juicio personal. Los elementos que
intervienen en ella son resultados del juicio experto del investigador sobre su
"representatividad".
3. Muestreo por cuotas
Es un tipo especial de muestreo por conveniencia. En este caso el investigador da
pasos secuenciales fin de obtener una muestra similar a la poblacin cumpliendo en
cada uno, una cuota determinada de unidades.

DISEOS DE MUESTREO ALEATORIO


1.-MUESTREO ALEATORIO SIMPLE (IRRESTRICTO ALEATORIO)
El muestreo irrestricto aleatorio es el muestreo probabilstico por excelencia. Al
seleccionar una muestra de tamao n de una poblacin con N elementos, la muestra es
una Muestra Aleatoria Simple, si cualquiera de las afirmaciones siguientes es cierta:

Todas las n unidades de la muestra son escogidas independientemente unas de otras,


y todas las N unidades de la poblacin tienen la misma probabilidad de ser incluidas
en la muestra.

En cada eleccin, todas las dems unidades de la poblacin tienen la misma


probabilidad de ser extradas

Todas las muestras posibles de un tamao n tienen la misma probabilidad de ser la


muestra elegida.

SELECCIN DE UNA MUESTRA IRRESTRICTA ALEATORIA

El procedimiento para seleccionar una MAS consiste en asignar un nmero de serie a


cada elemento de la poblacin, escogiendo nmeros de serie al azar por medio de una
tabla de nmeros aleatorios y usando como muestra aquellos individuos de la poblacin
cuyos nmeros de serie son elegidos. En determinadas circunstancias puede usarse un
generador de nmeros aleatorios de algn programa para computadora
Una tabla de nmeros aleatorios (ver la Tabla 2) es un arreglo de nmeros, generado de
modo que la tabla contenga los diez dgitos {0, 1, ..., 9}, en proporciones
aproximadamente iguales, sin tendencias ni sesgos. Por lo tanto, si un dgito es
seleccionado de un punto aleatorio en la tabla, es igualmente probable que sea cualquiera
de los dgitos entre el 0 y el 9.
Seleccionar nmeros de la tabla es anlogo a extraer bolos numerados, perfectamente
mezclados, de una urna.

52

2.-MUESTREO ESTRATIFICADO
El muestreo estratificado aleatorio, es uno de los diseos aleatorios que usando la
informacin disponible sobre la poblacin disea una muestra ms eficiente que la
obtenida por el procedimiento simple al azar. El proceso de estratificacin requiere que la
poblacin sea dividida en grupos o clases llamados estratos, luego se toma una muestra
de cada estrato por mtodos simples al azar. La muestra resultante se llama muestra
estratificada.
La estratificacin es ms eficiente con poblaciones heterogneas o altamente asimtricas.
En estas situaciones podemos estratificar la poblacin de tal manera que: 1. dentro de
cada estrato haya la mayor uniformidad posible y 2. entre los distintos estratos las
diferencias sean lo ms grandes posibles. En consecuencia se puede obtener una
muestra con menor error de muestreo (o una muestra ms pequea con la misma
precisin) que con el muestreo simple al azar.
Antes de decidir sobre la estratificacin se debe poseer algn conocimiento de las
caractersticas de la poblacin. Tal conocimiento puede basarse en datos pasados,
observacin preliminar de estudios piloto, juicio experto o simplemente intuicin o buenas
conjeturas. El juicio subjetivo usado para dividir la poblacin en estratos no significa que
las muestras estratificadas no sean muestras por probabilidades. Empleando la eleccin
simple al azar en cada estrato se asegura cierta probabilidad de que cada unidad sea
extrada, y esta probabilidad es conocida aunque en algunos casos no son iguales.
Una muestra estratificada puede ser proporcional o desproporcionada. En un diseo de
muestreo estratificado proporcional, el nmero de unidades extradas de cada estrato es
proporcional al tamao de este. Por ejemplo si la poblacin es dividida en cuatro estratos,
siendo sus tamaos respectivos 10, 20, 30 y 40 por ciento de la poblacin, y ha de
extraerse una muestra de 500, la muestra proporcional deseada puede obtenerse de la
siguiente manera:

Del estrato uno


Del estrato dos
Del estrato tres
Del estrato cuatro
Tamao de toda la muestra

500 (0.10) = 50 unidades


500 (0.20) = 100 unidades
500 (0.30) = 150 unidades
500 (0.40) = 200 unidades
500 unidades

La estratificacin proporcional da una muestra que representa la poblacin con respecto a


la proporcin de cada estrato en la poblacin. Este procedimiento es satisfactorio si no
hay gran diferencia en dispersin de un estrato a otro, pero no es el ms eficiente cuando
las desviaciones estndar difieren sustancialmente en los distintos estratos, puesto que la
consideracin ms importante para el tamao de la muestra no es tamao sino la
variabilidad de la poblacin. Esto implica que para obtener eficiencia mxima en la
estratificacin, se debe asignar mayor representacin a un estrato con una gran
dispersin y menor representacin a uno con pequea variacin
Una muestra estratificada desproporcionada comprende los procedimientos de tomar un
nmero igual de unidades de cada estrato sin tener en cuenta su tamao, o de dar slo

53

una pequea representacin a uno ms estratos cuyos miembros son demasiado


costosos de investigar.
El trmino asignacin ptima surge para diseos estratificados que toman en
consideracin la variabilidad y el tamao de cada estrato para determinar su
representacin en la muestra. A veces la asignacin ptima tambin toma en cuenta
diferentes costos de investigacin de un estrato a otro.
Finalmente, la precisin de las estimaciones en el muestreo estratificado puede medirse si
la muestra es suficientemente grande.
3.- MUESTREO DE CONGLOMERADOS
El muestreo de conglomerados o muestreo agrupado es el procedimiento de dividir la
poblacin en grupos o conglomerados y extraer una muestra de ellos para representar la
poblacin. Cuando los grupos, que son unidades primarias, son extrados, podemos
incluir en la muestra todas las unidades elementales de los grupos escogidos o tomar una
muestra de unidades primarias ms pequeas o unidades elementales de los grupos
escogidos.
Cuando se han observado todas las unidades elementales de los grupos, se tiene lo que
se conoce como muestreo en una sola etapa. Cuando se extrae una muestra de unidades
elementales de los grupos escogidos, se tiene un tipo de diseo llamado muestreo en dos
etapas o submuestreo. En ambas etapas se coge una muestra simple al azar. Cuando el
muestreo agrupado supone ms de dos etapas para escoger la muestra final, se lama
muestreo en mltiples etapas.
Cuando los grupos -las unidades primarias- son regiones geogrficas el muestreo por
conglomerados se convierte en el muestreo por regiones, muy usado.
Los principios que dictan la eficiencia mxima en el muestreo agrupado o por
conglomerados son los opuestos a los usados en la estratificacin. En el muestreo por
conglomerados es eficiente tener: 1. diferencias entre las unidades elementales del
mismo grupo lo ms grandes posible, y 2. diferencias entre los grupos lo ms pequeas
posible.
En la prctica el muestreo por conglomerados muchas veces tiene mayor error estndar
que el muestreo estratificado para el mismo nmero de unidades elementales de la
muestra, pero esto no significa que no puede ser ms eficiente que otros modelos al azar.

4.-MUESTREO SISTEMTICO
Otro diseo al azar usado frecuentemente es el diseo de muestreo sistemtico, que
genera los que se conoce por muestras sistemticas al azar. Para obtener una muestra
sistemtica al azar se numera serialmente las unidades de muestreo de la poblacin de 1
a N y se determina primero lo que se conoce como intervalo de muestreo, k = N / n.
Luego, se escoge al azar un nmero del primer intervalo de muestreo. Si este nmero es,
por ejemplo a, con a k, entonces la muestra, de tamao n tendra como sus elementos
las unidades de muestreo cuyos nmeros de serie corresponden a:
a, a + k , a + 2k , a + 3k , . . . . y as sucesivamente
Se observa que una muestra sistemtica no es una muestra simple al azar porque las
unidades de muestreo escogidas no son independientes. Igualmente, con el muestreo

54

sistemtico posiblemente slo pueden ser escogidas k muestras de tamao n, mientras

N
- k muestras tiene una probabilidad cero de ser
n

que cada una de las restantes,


extrada.

El muestreo sistemtico es realmente muestreo por agrupacin en una sola etapa, en el


que slo un grupo es extrado de la poblacin. Cada elemento de la poblacin pertenece a
un grupo y solamente uno y no hay superposicin entre los grupos. El primer elemento
escogido (de arranque aleatorio) escoge realmente todo el grupo que conforma la
muestra, hay una sola seleccin al azar. Tericamente, no podra calcularse errores
estndar de ninguna clase, pues e requiere por lo menos dos selecciones al azar. En la
prctica, las muestras sistemticas son tratadas como si fueran muestras simples al azar
lo cual es un procedimiento injustificado.
Una solucin inmediata para resolver el problema de calcular validamente errores
estndar a partir de muestras sistemticas (si el muestreo simple al azar es imposible de
llevar a cabo) es usar el muestreo sistemtico repetido, es decir, tomar dos ms grupos
de la poblacin. El nmero total de unidades de la muestra no es necesario que aumente,
simplemente se vuelve a definir los grupos. En este caso los errores estndar pueden ser
calculados validamente.
El muestreo sistemtico tiene la gran ventaja de la sencillez en el diseo. Es fcil escoger
la k-sima unidad de una lista archivo. Sin embargo procedimientos de eleccin
ligeramente ms difciles tienen la gran ventaja de permitir mediciones vlidas de error en
el muestreo.
Este diseo resulta menos representativo que el muestreo simple al azar si se trabaja con
poblaciones que tienen periodicidades ocultas. En estos casos hay incremento del error
de muestreo, stos son graves y en una muestra sistemtica no podemos medirlo.
Todos estos procedimientos aleatorios tratados como diseos independientes, en la
prctica se combinan dos o ms en un slo diseo. Mecanismos de probabilidad siempre
estn presentes de manera que pueden aplicarse frmulas apropiadas para medir la
fidelidad de los resultados de la muestra.

55

You might also like