You are on page 1of 6

MÉTODOS DE RECOLECCIÓN DE DATOS 1. Sesgo de selección.

Este error ocurre cuando alguna parte de la población objetivo no


está en la población muestreada. Una muestra así obtenida no es representativa de la
También el método de recolección de datos es fundamental en la reducción de los errores población objetivo.
de 2. Sesgo de medición. El sesgo de medición ocurre cuando los datos observados difieren del
no muestreo. Destacamos como métodos más habituales: valor verdadero. La obtención de respuestas precisas en las encuestas es fundamental pero
A) Entrevista personal. esto a veces no se consigue por diversos motivos:
B) Entrevista por teléfono. - A veces, las personas no dicen la verdad.
C) Cuestionarios auto aplicados. - Las personas no siempre comprenden las preguntas.
D) Observación directa. - Un entrevistador puede leer mal las preguntas o anotar las respuestas de manera
equivocada.
DISEÑO DEL CUESTIONARIO - La formulación y el orden de las preguntas tiene un gran efecto sobre las respuestas
Uno de los objetivos en cualquier diseño de encuesta es minimizar los errores de no obtenidas.
muestreo que pueden ocurrir. Algunos consejos interesantes para la construcción del 3. No respuesta. La no respuesta de un individuo seleccionado para formar parte de la
cuestionario son los siguientes: muestra puede causar un sesgo en los datos muestrales similar al sesgo de selección.
- Decidir lo que se quiere descubrir. Puede ocurrir que las personas que respondan no representen a la población bajo estudio.
- Verificar las preguntas antes de realizar la encuesta. Los errores de no muestreo pueden controlarse con las siguientes acciones:
- Elaborar las preguntas de manera sencilla y clara. 1. Reentrevistas.
- Prestar atención al orden de las preguntas. 2. Recompensas e incentivos.
- Decida si desea utilizar preguntas abiertas o cerradas. 3. Entrevistadores adiestrados.
- Evitar preguntas que induzcan al entrevistado a decir lo que usted quiere escuchar. 4. Verificación de datos.
- Utilice preguntas de opción forzosa.
TAMAÑO DE LA MUESTRA
PLANIFICACIÓN DE LA ENCUESTA
Teniendo en cuenta todo lo anteriormente expuesto, los siguientes aspectos deben de El determinar el tamaño de una muestra representa una parte esencial del método
tenerse en cuenta en la planificación de una encuesta: científico para poder llevar a cabo una investigación. Al muestreo lo podemos definir como
1. Establecer objetivos.
el conjunto de observaciones necesarias para estudiar la distribución de determinadas
2. Población objetivo.
características en la totalidad de una población, a partir de la observación de una parte o
3. El marco.
4. Diseño del muestreo. subconjunto de una población, denominada muestra. El cálculo del tamaño de la muestra
5. Método de recolección de datos. es uno de los aspectos a concretar en las fases previas de la investigación comercial y
6. Instrumentos de recolección de datos. determina el grado de credibilidad que concederemos a los resultados obtenidos.
7. Selección y preparación de investigadores de campo.
8. Prueba piloto. Al definir el tamaño de la muestra, nosotros deberemos procurar que ésta información sea
9. Organización del trabajo de campo. representativa, válida y confiable y al mismo tiempo nos represente un mínimo costo. Por
10. Organización de la administración de datos. lo tanto, el tamaño de la muestra estará delimitado por los objetivos del estudio y las
11. Análisis de los datos.
características de la población, además de los recursos y el tiempo de que se dispone.

RAZONES PARA EL USO DEL MUESTREO El tamaño de la muestra de una muestra estadística es el número de observaciones que la
Evitar la destrucción de la población.
componen.
Rapidez.
Economía y precisión.
El tamaño de la muestra normalmente es representado por "n" y siempre es un número
ERRORES DE NO MUESTREO
Otro tipo de errores, más difícil de controlar, pueden ocurrir en la encuesta. Estos errores entero positivo. No se puede hablar de ningún tamaño exacto de la muestra, ya que puede
se llaman errores de no muestreo. En muchas encuestas, el error de muestreo cometido variar dependiendo de los diferentes marcos de investigación. Sin embargo, si todo lo
para esa encuesta puede ser despreciable en comparación con los errores que no son de demás es igual, una muestra de tamaño grande brinda mayor precisión en las estimaciones
muestreo. de las diversas propiedades de la población.
Los errores de no muestreo más comunes son:
¿CUÁL DEBE SER EL TAMAÑO DE LA MUESTRA? Existen muchos enfoques para determinar el tamaño de la muestra, incluyendo el uso de un
Determinar el tamaño de la muestra que se va a seleccionar es un paso importante en censo en el caso de poblaciones más pequeñas, el uso de tablas publicadas, imitar un
cualquier estudio de investigación. Por ejemplo, un investigador desea determinar la tamaño de muestra de estudios similares y aplicar fórmulas para calcular un tamaño de la
prevalencia de problemas oculares en niños en edad escolar y quiere realizar una encuesta. muestra.
La pregunta importante que debe ser contestada en todas las encuestas de muestra es:
"¿Cuántos participantes deben ser elegidos para una encuesta?" Sin embargo, la respuesta ESTIMACIÓN ESTADÍSTICA
no puede ser dada sin tener en cuenta los objetivos y circunstancias de las investigaciones.
La inferencia estadística es el proceso que consiste en utilizar los resultados de una muestra
La elección del tamaño de la muestra depende de consideraciones no estadísticas y para llegar a conclusiones acerca de las características de una población.
estadísticas. Las consideraciones no estadísticas pueden incluir la disponibilidad de los Existen dos tipos de estimaciones: estimaciones puntuales y estimaciones de intervalo.
recursos, la mano de obra, el presupuesto, la ética y el marco de muestreo. Las Una estimación puntual consiste en una sola estadística de muestra que se utiliza para
consideraciones estadísticas incluirán la precisión deseada de la estimación de la estimar el valor verdadero de un parámetro de población. Puesto que la estadística de
prueba varía de una muestra a otra necesitamos considerar este hecho con el fin de
prevalencia y la prevalencia esperada de los problemas oculares en niños en edad escolar.
proporcionar una estimación más significativa y característica de la población. Para lograr
esto, debemos desarrollar una estimación de intervalo de la media de población verdadera,
Para determinar el tamaño adecuado de las muestras es necesario seguir los tres criterios: tomando en consideración la distribución de muestreo de la media. El intervalo que
construimos tendrá una confianza o probabilidad específica de estimar correctamente el
1. NIVEL DE PRECISIÓN valor verdadero del parámetro de población.

El nivel de precisión, también llamado error de muestreo, es el rango en donde se estima ESTIMACIÓN DEL INTERVALO DE CONFIANZA DE LA MEDIA POBLACIONAL
que está el valor real de la población. Este rango se expresa en puntos porcentuales. Por lo Estimación de intervalo de confianza de la media (desvío de la población conocida):
tanto, si un investigador descubre que el 70% de los agricultores de la muestra han En la inferencia estadística debemos tomar los resultados de una sola muestra y llegar a
adoptado una tecnología recomendada con una tasa de precisión de 5%, el investigador conclusiones acerca de la población. En la práctica, la media de la población es la cantidad
puede concluir que entre el 65% y el 75% de los agricultores de la población han adoptado desconocida que se va a determinar. Para algunas muestras la estimación de intervalo de la
la nueva tecnología. media de la población será correcta y para otras no. Tenemos que recordar que para el
cálculo del intervalo trabajamos con una estimación de intervalo de confianza de 95, por
ejemplo, esto puede interpretarse como si se tomaran todas las muestras posibles del
2. NIVEL DE CONFIANZA
mismo tamaño, n, 95% de ellas incluirían la media de población verdadera en alguna parte
del intervalo alrededor de sus medias de muestra, y solamente 5% de ellas no estarían
El intervalo de confianza es la medida estadística del número de veces de cada 100 que se
incluidas. En general el nivel de confianza se simboliza como (1-α ) 100%, en donde α es la
espera que los resultados se encuentren dentro de un rango específico.
porción que se encuentra en los extremos de la distribución que está fuera del intervalo de
Por ejemplo, un intervalo de confianza de 90% significa que los resultados de una acción
confianza. Por consiguiente para obtener la estimación del intervalo tenemos:
probablemente cubrirán las expectativas el 90% de las veces.
La idea básica descripta en el Teorema del límite central es que cuando una población se
muestrea muchas veces, el valor promedio de un atributo obtenido es igual al valor real de
la población. En otras palabras, si un intervalo de confianza es del 95%, significa que 95 de
100 muestras tendrán el valor real de la población dentro del rango de precisión.
Z es el valor correspondiente a un área de (1-α )/2 desde el centro de una distribución
3. GRADO DE VARIABILIDAD
normal estandarizada. El valor Z elegido para construir tal intervalo de confianza se conoce
como el valor crítico.
Dependiendo de la población objetivo y los atributos a considerar, el grado Cualquier aumento en el nivel de confianza se logra ampliando simultáneamente el
de variabilidad varía considerablemente. Cuanto más heterogénea sea una población, intervalo de confianza obtenido (haciéndolo menos preciso y menos útil).
mayor deberá ser el tamaño de la muestra para obtener un nivel óptimo de precisión. Ten
en cuenta que una proporción de 55% indica un nivel más alto de variabilidad que un 10% o Estimación de intervalo de confianza de la media (desvío desconocido)
un 80%. Esto se debe a que 10% y 80% significa que una gran mayoría no posee o posee el Del mismo modo en que la media de la población se desconoce, es probable que la
atributo en cuestión. desviación estándar real de la población tampoco sea conocida. Por lo tanto, necesitamos
obtener una estimación de intervalo de confianza utilizando las estadísticas de muestra " Tamaño de muestra para la media:
X " y "S". Para ello, utilizamos la distribución t-student.

De este modo, el intervalo de confianza se establecerá a partir de la siguiente fórmula:


Estimado del intervalo de confianza de la porción

Por consiguiente para determinar el tamaño de la muestra, deben conocerse tres


factores:

1. El nivel de confianza deseado.


ESTIMACIÓN DEL INTERVALO DE CONFIANZA DE LA DIFERENCIA DE DOS MEDIAS 2. EL error de muestreo permitido.
POBLACIONALES 3. La desviación estándar.

Determinación del tamaño de muestra para una proporción:

( 1   2 )
2 2

( X - Y )  Z 1-  / 2
n n 1 2

Es el intervalo de confianza de 100(1-  ) % de la diferencia de medias para: Al determinar el tamaño de muestra para estimar una porción se deben definir tres
incógnitas:
1) Muestras grandes, varianzas conocidas y poblaciones normales o no.
2) Muestras grandes, varianzas conocidas y poblaciones normales o no 1. El nivel de confianza.
3) Muestras pequeñas, varianzas conocidas y poblaciones normales. 2. El error de muestreo permitido.
3. La porción verdadera de éxitos.

( X - Y )  t 1-  / 2 , n n 2
1 2 Estimación y determinación del tamaño de muestra para poblaciones finitas.
Estimación de la media
(n1  1) s1  (n2  1) s 2 1
2 2
1
(  )
n1  n2  2 n1 n2
Es el intervalo de confianza de 100(1-  ) % de la diferencia de medias para:
Estimación de la proporción
Muestras pequeñas, varianzas desconocidas y poblaciones normales

ESTIMACIÓN DEL INTERVALO DE CONFIANZA DE LA PROPORCIÓN POBLACIONAL

Podemos establecer la siguiente estimación de intervalo de confianza (1-α) para la


proporción de la población:
Determinación del tamaño de muestra
ESTIMACIÓN PUNTUAL. INTERVALOS DE CONFIANZA. CONTRASTES DE HIPÓTESIS. Riesgos en la toma de decisiones al utilizar la metodología de prueba de hipótesis.
Cuando estimamos el valor de un parámetro poblacional con el valor que ha presentado en Se pueden presentar dos tipos diferentes de errores:
una determinada muestra el estimador asociado, hacemos una estimación puntual.
Si dicha estimación puntual se acompaña de un margen de error (límite para el error de - Un error tipo I se presenta si la hipótesis nula es rechazada cuando de hecho es verdadera
estimación) y de una medida de la certidumbre que se tiene en tal estimación (nivel de y debía ser aceptada.
confianza), hablamos de intervalo de confianza. Por ejemplo, utilizando muestras grandes, - Un error tipo II se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y
el intervalo de confianza para la media poblacional m con un nivel de confianza del 95% debía ser rechazada.
En ocasiones se quiere contrastar con los valores observados en una muestra la posibilidad
de que el verdadero valor de un parámetro de la población sea un determinado valor, por
Nivel de Significación. La probabilidad de cometer un error tipo I denotada con la letra
ejemplo, se quiere contrastar la hipótesis nula 0 0 H :m = m con un nivel de significación del
griega alfa, se conoce como nivel de significación de la prueba estadística. Está bajo el
5%. Lo anterior equivale a comprobar si en cuyo caso se aceptaría la hipótesis nula,
control directo del individuo que lleva a cabo la prueba. Ya que se ha especificado el valor
rechazándose en caso contrario.
de alfa, se conoce el tamaño de la región de rechazo, puesto que alfa es la probabilidad de
un rechazo de la hipótesis nula.
PRUEBA DE HIPOTESIS

La prueba de hipótesis empieza con algo de teoría, afirmación o negación con respecto a un Coeficiente de confianza. EL complemento ( 1-  ) de la probabilidad de cometer un error
parámetro particular de una población. La hipótesis de que el parámetro de la población es de tipo I se conoce como coeficiente de confianza.
igual a la especificación de la compañía se conoce como hipótesis nula. Una hipótesis nula
es siempre una de status quo o de no diferencia. Se simboliza con el símbolo Ho. El coeficiente de confianza es la probabilidad de que la hipótesis nula no sea rechazada
Siempre que especificamos una hipótesis nula, también debemos especificar una hipótesis cuando de hecho es verdadera y debería ser aceptada.
alternativa, o una que debe ser verdadera si se encuentra que la hipótesis nula es falsa. La
hipótesis alternativa se simboliza H1. La hipótesis alternativa representa la conclusión a la Riesgo  . La probabilidad de cometer un error de tipo II se conoce como nivel de riesgo
que se llegaría si hubiera suficiente evidencia de la información de la muestra para decidir del consumidor.
que es improbable que la hipótesis nula sea verdadera, y por tanto rechazarla. El hecho de
no rechazar la hipótesis nula no es una prueba de que ésta sea verdadera. Nunca podemos
probar que tal hipótesis sea correcta porque estamos basando nuestra decisión únicamente Potencia de una prueba. El complemento (1-  ) de la probabilidad de cometer un error del
en la información de la muestra, no en la población entera. tipo II se conoce como potencia de una prueba estadística.

- La hipótesis nula se refiere siempre a un valor especificado del parámetro de población, La potencia de una prueba es la probabilidad de rechazar la hipótesis nula cuando de hecho
no a una estadística de muestra. esta es falsa y debería ser rechazada.
- El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con
respecto al valor especificado del parámetro. Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un
estudio, consiste en aumentar el tamaño de la muestra. Tamaños más grandes de muestra,
- El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con nos permitirán detectar diferencias incluso muy pequeñas entre las estadísticas de muestra
respecto al valor especificado del parámetro. y los parámetros de la población. Cuando se disminuye  ,  aumentará de modo que
una reducción en el riesgo de cometer un error de tipo I tendrá como resultado un
Regiones de rechazo y de no rechazo aumento en el riesgo de cometer un error tipo II. Prueba de hipótesis Z para la media
(desvío de la población conocido)
La distribución de muestreo de la estadística de prueba se divide en dos regiones, una
región de rechazo (conocida como región crítica) y una región de no rechazo. Si la El estadístico de prueba a utilizar es:
estadística de prueba cae dentro de la región de no rechazo, no se puede rechazar la
hipótesis nula.
La región de rechazo puede considerarse como el conjunto de valores de la estadística de
prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro
lado, estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El
valor crítico separa la región de no rechazo de la de rechazo.
La Potencia de una prueba β representa la probabilidad de que la hipótesis nula no sea
rechazada cuando de hecho es falsa y debería rechazársele. La potencia de prueba 1-β
representa la sensibilidad de la prueba estadística para detectar cambios que se presentan
al medir la probabilidad de rechazar la hipótesis nula cuando de hecho es falsa y debería ser
rechazada. La potencia de prueba estadística depende de qué tan diferente en realidad es
Una distribución chi-cuadrado es una distribución sesgada cuya forma depende
la media verdadera de la población del valor supuesto.
exclusivamente del número de grados de libertad. Conforma este aumenta, la distribución
se vuelve más simétrica.
Una prueba de un extremo es más poderosa que una de dos extremos, y se debería utilizar
siempre que sea adecuado especificar la dirección de la hipótesis alternativa.
PRUEBAS DE DOS MUESTRAS CON DATOS NUMÉRICOS
Prueba t de varianza conjunta para diferencias entre dos medias
Puesto que la probabilidad de cometer un error tipo I y la probabilidad de cometer un error
tipo II tienen una relación inversa y esta última es el complemento de la potencia de prueba
(1-β), entonces α y la potencia de la prueba varían en proporción directa. Un aumento en el
valor del nivel de significación escogido, tendría como resultado un aumento en la potencia
y una disminución en α tendría como resultado una disminución en la potencia.
Un aumento en el tamaño de la muestra escogida tendría como resultado un aumento en la
potencia de la prueba, una disminución en el tamaño de la muestra seleccionada tendría
como resultado una disminución en la potencia. Supongamos que consideramos dos poblaciones independientes, cada una con una media y
Todos los procedimientos paramétricos tienen tres características distintivas: Los una desviación estándar. La estadística de prueba utilizada para determinar la diferencia
procedimientos de prueba paramétricos pueden definirse como aquellos. entre las medias de las poblaciones está basada en la diferencia entre las medias de las
muestras (X1 – X2). Debido al teorema del límite central esta estadística seguirá la
1) que requieren que el nivel de medición obtenido con los datos recolectados esté en distribución normal. La estadística de prueba Z es:
forma de una escala de intervalo o de una escala de cociente.
2) implican la prueba de hipótesis de valores de parámetros especificados. En donde X es la media de la muestra correspondiente a cada una de las dos muestras, n es
3) y por último requieren un conjunto limitante de suposiciones. el tamaño de la muestra y por último tenemos la varianza de la muestra.

Los procedimientos no paramétricos pueden definirse como aquellos que no tienen que ver Si suponemos que las varianzas son iguales y que las muestras fueron tomadas de manera
con los parámetros de una población. aleatoria e independiente se puede utilizar una prueba t de varianza conjunta para
determinar si existe alguna diferencia significativa entre las medias de las poblaciones. Si
Prueba t de hipótesis para la media (δ2 desconocida) puede calcular la siguiente estadística de prueba t de varianza conjunta:

En ocasiones se desconoce la desviación estándar de la población. Sin embargo, se la puede


estimar con el cálculo de S, la desviación estándar de la muestra. Recordemos de muestreo
de la media seguirá una distribución t con n-1 grado de libertad.

PRUEBA DE HIPÓTESIS Χ2 PARA LA VARIANZA (O DESVIACIÓN ESTÁNDAR)


Al intentar llegar a conclusiones con respecto a la variabilidad de la población, primero Donde: La estadística de prueba t de varianza conjunta sigue una distribución t con n1+n2-
debemos determinar que estadística de prueba puede utilizarse para representar la 2 grados de libertad.
distribución de la variabilidad de los datos de la muestra. Si la variable se supone que está
distribuida normalmente, entonces la estadística de prueba para probar si la varianza de la Prueba de varianza separada para diferencias entre dos medias
población es igual o no a un valor especificado es:
Si suponemos que las varianzas no son iguales como en el caso anterior debemos
replantear el estadístico a utilizar.

Prueba de hipótesis con datos categóricos

La estadística de prueba t puede ser aproximada con la fórmula de v, mostrada Prueba Z de una muestra para la proporción. Para evaluar la magnitud de la diferencia
anteriormente. entre la proporción de la muestra y la porción de la población supuesta la estadística de
prueba está dada por la ecuación siguiente:
Prueba t para la diferencia de medias

Con el propósito de determinar cualquier diferencia que exista entre dos grupos
relacionados, deben obtenerse las diferencias en los valores individuales de cada grupo.
Cuando la desviación estándar de la población de la diferencia es conocida y el tamaño de
muestra es lo suficientemente grande. La estadística de prueba Z es:

La estadística de prueba Z está distribuida de manera aproximadamente normal.

Prueba Z para diferencias entre dos porciones (muestras independientes). Cuando se


evalúan diferencias entre dos porciones basándose en muestras independientes se puede
emplear una prueba Z. La estadística de prueba es:
Sin embargo, en la mayoría de los casos no conocemos la desviación estándar real de la
población. La única información que se puede obtener son las estadísticas sumarias como la
media y la desviación estándar de muestra. Si se supone que la muestra de resultados es
tomada de manera aleatoria e independiente se puede realizar una prueba t para
determinar si existe una diferencia media de población significativa. La estadística seguirá
una distribución t con n-1 grados de libertad.

Ho= µd = 0 donde µd= µ1-µ2 Se supone que las dos porciones de población son iguales.
H1= µd ≠ 0

Se puede calcular el siguiente estadístico de prueba: Ho= p1=p2


H1= p1 ≠ p2

You might also like