Professional Documents
Culture Documents
RAZONES PARA EL USO DEL MUESTREO El tamaño de la muestra de una muestra estadística es el número de observaciones que la
Evitar la destrucción de la población.
componen.
Rapidez.
Economía y precisión.
El tamaño de la muestra normalmente es representado por "n" y siempre es un número
ERRORES DE NO MUESTREO
Otro tipo de errores, más difícil de controlar, pueden ocurrir en la encuesta. Estos errores entero positivo. No se puede hablar de ningún tamaño exacto de la muestra, ya que puede
se llaman errores de no muestreo. En muchas encuestas, el error de muestreo cometido variar dependiendo de los diferentes marcos de investigación. Sin embargo, si todo lo
para esa encuesta puede ser despreciable en comparación con los errores que no son de demás es igual, una muestra de tamaño grande brinda mayor precisión en las estimaciones
muestreo. de las diversas propiedades de la población.
Los errores de no muestreo más comunes son:
¿CUÁL DEBE SER EL TAMAÑO DE LA MUESTRA? Existen muchos enfoques para determinar el tamaño de la muestra, incluyendo el uso de un
Determinar el tamaño de la muestra que se va a seleccionar es un paso importante en censo en el caso de poblaciones más pequeñas, el uso de tablas publicadas, imitar un
cualquier estudio de investigación. Por ejemplo, un investigador desea determinar la tamaño de muestra de estudios similares y aplicar fórmulas para calcular un tamaño de la
prevalencia de problemas oculares en niños en edad escolar y quiere realizar una encuesta. muestra.
La pregunta importante que debe ser contestada en todas las encuestas de muestra es:
"¿Cuántos participantes deben ser elegidos para una encuesta?" Sin embargo, la respuesta ESTIMACIÓN ESTADÍSTICA
no puede ser dada sin tener en cuenta los objetivos y circunstancias de las investigaciones.
La inferencia estadística es el proceso que consiste en utilizar los resultados de una muestra
La elección del tamaño de la muestra depende de consideraciones no estadísticas y para llegar a conclusiones acerca de las características de una población.
estadísticas. Las consideraciones no estadísticas pueden incluir la disponibilidad de los Existen dos tipos de estimaciones: estimaciones puntuales y estimaciones de intervalo.
recursos, la mano de obra, el presupuesto, la ética y el marco de muestreo. Las Una estimación puntual consiste en una sola estadística de muestra que se utiliza para
consideraciones estadísticas incluirán la precisión deseada de la estimación de la estimar el valor verdadero de un parámetro de población. Puesto que la estadística de
prueba varía de una muestra a otra necesitamos considerar este hecho con el fin de
prevalencia y la prevalencia esperada de los problemas oculares en niños en edad escolar.
proporcionar una estimación más significativa y característica de la población. Para lograr
esto, debemos desarrollar una estimación de intervalo de la media de población verdadera,
Para determinar el tamaño adecuado de las muestras es necesario seguir los tres criterios: tomando en consideración la distribución de muestreo de la media. El intervalo que
construimos tendrá una confianza o probabilidad específica de estimar correctamente el
1. NIVEL DE PRECISIÓN valor verdadero del parámetro de población.
El nivel de precisión, también llamado error de muestreo, es el rango en donde se estima ESTIMACIÓN DEL INTERVALO DE CONFIANZA DE LA MEDIA POBLACIONAL
que está el valor real de la población. Este rango se expresa en puntos porcentuales. Por lo Estimación de intervalo de confianza de la media (desvío de la población conocida):
tanto, si un investigador descubre que el 70% de los agricultores de la muestra han En la inferencia estadística debemos tomar los resultados de una sola muestra y llegar a
adoptado una tecnología recomendada con una tasa de precisión de 5%, el investigador conclusiones acerca de la población. En la práctica, la media de la población es la cantidad
puede concluir que entre el 65% y el 75% de los agricultores de la población han adoptado desconocida que se va a determinar. Para algunas muestras la estimación de intervalo de la
la nueva tecnología. media de la población será correcta y para otras no. Tenemos que recordar que para el
cálculo del intervalo trabajamos con una estimación de intervalo de confianza de 95, por
ejemplo, esto puede interpretarse como si se tomaran todas las muestras posibles del
2. NIVEL DE CONFIANZA
mismo tamaño, n, 95% de ellas incluirían la media de población verdadera en alguna parte
del intervalo alrededor de sus medias de muestra, y solamente 5% de ellas no estarían
El intervalo de confianza es la medida estadística del número de veces de cada 100 que se
incluidas. En general el nivel de confianza se simboliza como (1-α ) 100%, en donde α es la
espera que los resultados se encuentren dentro de un rango específico.
porción que se encuentra en los extremos de la distribución que está fuera del intervalo de
Por ejemplo, un intervalo de confianza de 90% significa que los resultados de una acción
confianza. Por consiguiente para obtener la estimación del intervalo tenemos:
probablemente cubrirán las expectativas el 90% de las veces.
La idea básica descripta en el Teorema del límite central es que cuando una población se
muestrea muchas veces, el valor promedio de un atributo obtenido es igual al valor real de
la población. En otras palabras, si un intervalo de confianza es del 95%, significa que 95 de
100 muestras tendrán el valor real de la población dentro del rango de precisión.
Z es el valor correspondiente a un área de (1-α )/2 desde el centro de una distribución
3. GRADO DE VARIABILIDAD
normal estandarizada. El valor Z elegido para construir tal intervalo de confianza se conoce
como el valor crítico.
Dependiendo de la población objetivo y los atributos a considerar, el grado Cualquier aumento en el nivel de confianza se logra ampliando simultáneamente el
de variabilidad varía considerablemente. Cuanto más heterogénea sea una población, intervalo de confianza obtenido (haciéndolo menos preciso y menos útil).
mayor deberá ser el tamaño de la muestra para obtener un nivel óptimo de precisión. Ten
en cuenta que una proporción de 55% indica un nivel más alto de variabilidad que un 10% o Estimación de intervalo de confianza de la media (desvío desconocido)
un 80%. Esto se debe a que 10% y 80% significa que una gran mayoría no posee o posee el Del mismo modo en que la media de la población se desconoce, es probable que la
atributo en cuestión. desviación estándar real de la población tampoco sea conocida. Por lo tanto, necesitamos
obtener una estimación de intervalo de confianza utilizando las estadísticas de muestra " Tamaño de muestra para la media:
X " y "S". Para ello, utilizamos la distribución t-student.
( 1 2 )
2 2
( X - Y ) Z 1- / 2
n n 1 2
Es el intervalo de confianza de 100(1- ) % de la diferencia de medias para: Al determinar el tamaño de muestra para estimar una porción se deben definir tres
incógnitas:
1) Muestras grandes, varianzas conocidas y poblaciones normales o no.
2) Muestras grandes, varianzas conocidas y poblaciones normales o no 1. El nivel de confianza.
3) Muestras pequeñas, varianzas conocidas y poblaciones normales. 2. El error de muestreo permitido.
3. La porción verdadera de éxitos.
( X - Y ) t 1- / 2 , n n 2
1 2 Estimación y determinación del tamaño de muestra para poblaciones finitas.
Estimación de la media
(n1 1) s1 (n2 1) s 2 1
2 2
1
( )
n1 n2 2 n1 n2
Es el intervalo de confianza de 100(1- ) % de la diferencia de medias para:
Estimación de la proporción
Muestras pequeñas, varianzas desconocidas y poblaciones normales
La prueba de hipótesis empieza con algo de teoría, afirmación o negación con respecto a un Coeficiente de confianza. EL complemento ( 1- ) de la probabilidad de cometer un error
parámetro particular de una población. La hipótesis de que el parámetro de la población es de tipo I se conoce como coeficiente de confianza.
igual a la especificación de la compañía se conoce como hipótesis nula. Una hipótesis nula
es siempre una de status quo o de no diferencia. Se simboliza con el símbolo Ho. El coeficiente de confianza es la probabilidad de que la hipótesis nula no sea rechazada
Siempre que especificamos una hipótesis nula, también debemos especificar una hipótesis cuando de hecho es verdadera y debería ser aceptada.
alternativa, o una que debe ser verdadera si se encuentra que la hipótesis nula es falsa. La
hipótesis alternativa se simboliza H1. La hipótesis alternativa representa la conclusión a la Riesgo . La probabilidad de cometer un error de tipo II se conoce como nivel de riesgo
que se llegaría si hubiera suficiente evidencia de la información de la muestra para decidir del consumidor.
que es improbable que la hipótesis nula sea verdadera, y por tanto rechazarla. El hecho de
no rechazar la hipótesis nula no es una prueba de que ésta sea verdadera. Nunca podemos
probar que tal hipótesis sea correcta porque estamos basando nuestra decisión únicamente Potencia de una prueba. El complemento (1- ) de la probabilidad de cometer un error del
en la información de la muestra, no en la población entera. tipo II se conoce como potencia de una prueba estadística.
- La hipótesis nula se refiere siempre a un valor especificado del parámetro de población, La potencia de una prueba es la probabilidad de rechazar la hipótesis nula cuando de hecho
no a una estadística de muestra. esta es falsa y debería ser rechazada.
- El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con
respecto al valor especificado del parámetro. Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un
estudio, consiste en aumentar el tamaño de la muestra. Tamaños más grandes de muestra,
- El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con nos permitirán detectar diferencias incluso muy pequeñas entre las estadísticas de muestra
respecto al valor especificado del parámetro. y los parámetros de la población. Cuando se disminuye , aumentará de modo que
una reducción en el riesgo de cometer un error de tipo I tendrá como resultado un
Regiones de rechazo y de no rechazo aumento en el riesgo de cometer un error tipo II. Prueba de hipótesis Z para la media
(desvío de la población conocido)
La distribución de muestreo de la estadística de prueba se divide en dos regiones, una
región de rechazo (conocida como región crítica) y una región de no rechazo. Si la El estadístico de prueba a utilizar es:
estadística de prueba cae dentro de la región de no rechazo, no se puede rechazar la
hipótesis nula.
La región de rechazo puede considerarse como el conjunto de valores de la estadística de
prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro
lado, estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El
valor crítico separa la región de no rechazo de la de rechazo.
La Potencia de una prueba β representa la probabilidad de que la hipótesis nula no sea
rechazada cuando de hecho es falsa y debería rechazársele. La potencia de prueba 1-β
representa la sensibilidad de la prueba estadística para detectar cambios que se presentan
al medir la probabilidad de rechazar la hipótesis nula cuando de hecho es falsa y debería ser
rechazada. La potencia de prueba estadística depende de qué tan diferente en realidad es
Una distribución chi-cuadrado es una distribución sesgada cuya forma depende
la media verdadera de la población del valor supuesto.
exclusivamente del número de grados de libertad. Conforma este aumenta, la distribución
se vuelve más simétrica.
Una prueba de un extremo es más poderosa que una de dos extremos, y se debería utilizar
siempre que sea adecuado especificar la dirección de la hipótesis alternativa.
PRUEBAS DE DOS MUESTRAS CON DATOS NUMÉRICOS
Prueba t de varianza conjunta para diferencias entre dos medias
Puesto que la probabilidad de cometer un error tipo I y la probabilidad de cometer un error
tipo II tienen una relación inversa y esta última es el complemento de la potencia de prueba
(1-β), entonces α y la potencia de la prueba varían en proporción directa. Un aumento en el
valor del nivel de significación escogido, tendría como resultado un aumento en la potencia
y una disminución en α tendría como resultado una disminución en la potencia.
Un aumento en el tamaño de la muestra escogida tendría como resultado un aumento en la
potencia de la prueba, una disminución en el tamaño de la muestra seleccionada tendría
como resultado una disminución en la potencia. Supongamos que consideramos dos poblaciones independientes, cada una con una media y
Todos los procedimientos paramétricos tienen tres características distintivas: Los una desviación estándar. La estadística de prueba utilizada para determinar la diferencia
procedimientos de prueba paramétricos pueden definirse como aquellos. entre las medias de las poblaciones está basada en la diferencia entre las medias de las
muestras (X1 – X2). Debido al teorema del límite central esta estadística seguirá la
1) que requieren que el nivel de medición obtenido con los datos recolectados esté en distribución normal. La estadística de prueba Z es:
forma de una escala de intervalo o de una escala de cociente.
2) implican la prueba de hipótesis de valores de parámetros especificados. En donde X es la media de la muestra correspondiente a cada una de las dos muestras, n es
3) y por último requieren un conjunto limitante de suposiciones. el tamaño de la muestra y por último tenemos la varianza de la muestra.
Los procedimientos no paramétricos pueden definirse como aquellos que no tienen que ver Si suponemos que las varianzas son iguales y que las muestras fueron tomadas de manera
con los parámetros de una población. aleatoria e independiente se puede utilizar una prueba t de varianza conjunta para
determinar si existe alguna diferencia significativa entre las medias de las poblaciones. Si
Prueba t de hipótesis para la media (δ2 desconocida) puede calcular la siguiente estadística de prueba t de varianza conjunta:
La estadística de prueba t puede ser aproximada con la fórmula de v, mostrada Prueba Z de una muestra para la proporción. Para evaluar la magnitud de la diferencia
anteriormente. entre la proporción de la muestra y la porción de la población supuesta la estadística de
prueba está dada por la ecuación siguiente:
Prueba t para la diferencia de medias
Con el propósito de determinar cualquier diferencia que exista entre dos grupos
relacionados, deben obtenerse las diferencias en los valores individuales de cada grupo.
Cuando la desviación estándar de la población de la diferencia es conocida y el tamaño de
muestra es lo suficientemente grande. La estadística de prueba Z es:
Ho= µd = 0 donde µd= µ1-µ2 Se supone que las dos porciones de población son iguales.
H1= µd ≠ 0