Professional Documents
Culture Documents
1.- Introduccin:
Para aplicar este diseo, se precisa que la poblacin est dividida en subpoblaciones, estratos, que no se solapen. Se selecciona una muestra probabilstica en cada estrato y se trabaja de manera independiente entre estratos. Razones de la popularidad de este mtodo: Permite realizar estimaciones de precisin expecifica en cada estrato; En un experimento, los aspectos prcticos relacionados con la respuesta, la medida o la informacin auxiliar pueden diferir considerablemente de una subpoblacin a otra. Existirn razones administrativas, divisin territorial, ... . Cuestiones tcnicas que plantea este muestreo: i) Construccin de Estratos: Los objetivos del estudio y los recursos disponibles contestarn las siguientes cuestiones Qu caractersticas utilizar para dividir la poblacin en estratos?; Cmo se identificarn los estratos?; Cuntos estratos debe haber?. En particular, los estratos deben estar constituidos por unidades lo ms homogeneas posibles; En el caso lmite de estricta homogeneidad bastara seleccionar una sola unidad en cada estrato ii) Eleccin de una muestra y mtodos de estimacin en cada estrato; El proceso de muestreo se realizar de manera independiente en cada estrato Ventajas de este diseo: i) Si las mediciones dentro de cada estrato son homognes, la estratificacin producir un lmite ms pequeo para el error de estimacin que el m.a. ii) Se puede reducir el costo por observacin al estratificar la poblacin en grupos convenientes. iii) Permite obtener estimaciones de parmetros poblacionales para subgrupos de la poblacin. Ejemplos: Ciudades i) El I.P.C. se obtiene a partir de encuestas a: Familias urbanas Empresas de bienes y sevicios
Bienes y servicios especficos ii) Una empresa de publicidad desea determinar cunto debe emplear en publicidad televisiva en un municipio, para lo que decide realizar una encuesta por muestreo para estimar el nmero medio de horas semanales que se ve la televisin en los hogares del municipio. ste comprende dos pueblos, A y B, y un rea rural. El pueblo A circunda una fbrica y los hogares son de trabajadores con nios en edad escolar. El B es un suburbio de una ciudad vecina con muchos jubilados y pocos nios. El A tiene 155 hogares, el B tiene 62 y el rea rural 93.
h1
kU
Nh N
h1kU h
L
h1
Nh N
h1
y U h W h y U h / W h
h1
3.- Estimadores.
-estimador:
h ; Puesto que la seleccin en los distintos estratos se realiza de manera
h1 L
Nota: Este mtodo teien gran aplicacin ya que no precisa que el diseo muestral sea el mismo en cada estrato,
ks h
yk nh
Nh ;
2 h ; 2 S h .
Var st Var st
L h1 h1 L
N2 h 1f h nh N2 h 1f h nh
ii) P st W h P h ;
h1
VarP st W 2 h VarP st W 2 h
h1 h1 L
1f h nh 1f h nh
N h P1P N h 1
; .
P h 1P h n h n h 1
Nh;
N2 h nh N2 h nh
Var st Var st
h1 h1 L
2 h;
2 S h
4.- Afijaciones:
La obtencin del tamao muestral n se realiza en base a las condiciones del experimento o a la fijacin de la precisin deseada. La afijacin trata de repartir el tamao muestral n entre los estratos. Factores generales a tener en cuenta: Tamao del estrato; Variabilidad entre estratos; Costo que tiene medir una observacin en cada estrato.
C h
h1
C C 0
C h W h
h1
y k y k
U Uh
N h h
h1
Observaciones: 1- Los valores de n h son proporcionales a los productos N h h y cuando h h n h nW h . Por esto se dice que es la afijacin de mnima varianza, si todos los estratos tienen la misma variabilidad respecto de la caracterstica en estudio.
2- Esta afijacin tiene el inconveniente de que precisa estimar mayor nmero de caractersticas poblacionales: h h1,...,L . 3- La utilidad de esta afijacin reside en los casos en los que hay gran diferencia en la variabilidad de la respuesta entre estratos ii) Consideracin de costes: Fijado C C 0 C h n h :
min
nh L Var C 0 C h n h C h1 CC 0
Wh h Ch h
h1
Si st n h
W
h h 1
Ch
No fijado C :
L min Var C 0 C h n h nh h1 W Si st n h h h Ch
C h n h Var V o
h1
Wh h Ch
; Vo B k
Ch
Si st n h h?.
W
h h 1 L
B2 K2
1 N
h 1
2 Wh h
h1
Nh X Uh
st : n
h 2 W wh h h1 B2 K2 2 Wh h N h h1 h 2 N wh h L 2 L 2
st : n
h1 B2 K2
2 h Nh h1
N h h
h1
P st : n
B2 K2 h1
W2 h wh l
Nh N h 1
P h 1P h
Nh N h 1
P h 1P h WNh
h1
Ejercicio: Una empresa de publicidad desea determinar cunto debe emplear en publicidad televisiva en un municipio, para lo que decide realizar una encuesta por muestreo para estimar el nmero medio de horas semanales que se ve la televisin en los hogares del municipio. ste comprende dos pueblos, A y B, y un rea rural. El pueblo A circunda una fbrica y los hogares son de trabajadores con nios en edad escolar. El B es un suburbio de una ciudad vecina con muchos jubilados y pocos nios. El A tiene 155 hogares, el B tiene 62 y el rea rural 93. Una encuesta previa sugiere que las varianzas de los estratos son 2 2 2 1 25, 2 225, 3 100. Estimar la media poblacional seleccionando el tamao de muestra en cada estrato para cometer un error de estimacin inferior a 2 horas con una confianza del 95% y unas fracciones de tamaos muestrales w i 1 ; i 1, 2, 3. 3 Si ademas se sabe que el coste por observacin en cada pueblo es de 9 euros y en el rea rural de 16 euros, encontrar los tamaos de muestra que permitan estimar a la empresa, con un coste mnimo, el tiempo medio que se ve la televisin.
h1
Wh2 h n
h1
W h y h y 2 n
Afijacin Proporcional
Var st
1f nN1
Nh y h y
h1
1 N
N
h1
Conclusiones: a) Si las medias de los estratos son iguales o casi iguales, puede ocurrir que el diseo estratificado con afijacin proporcional de resultados menos precisos que m.a.s. Qu pasa si y h y h?. b) La afijacin de mnima varianza siempre proporciona un estimador ms preciso que la afijacin proporcional; si h h, coinciden los errores de muestreo.
7.- Ejercicios.
7.1 El servicio cultural de la Junta de Castilla y Len desea conocer qu servicio prestan las bibliotecas existentes en la Comunidad y la utilizacin que de ellas hacen los ciudadanos. Por ello, de las N217 bibliotecas existentes (N 1 131 pblicas y N 2 86 privadas) se elige en cada estrato, cada semana y de forma aleatoria, a una de ellas y se anota el nmero de libros prestados en dicha semana. Se observa que al final del ao se prestaron un total de 11.360 libros en las 52 bibliotecas pblicas seleccionadas y 14.413 libros en las respectivas bibliotecas privadas. Las respectivas variabilidades muestrales fueron, en las bibliotecas 2 2 pblicas, s 1 1.415,2 y en las privadas s 2 12.978,5 a) Es el muestreo en cada estrato con o sin reposicin?. b) Determinar el nmero promedio estimado de libros que presta una biblioteca Castellano-Leonesa en una semana. Hallar un intervalo de confianza del 95%. ( ). c) La Junta desea tambin conocer cul es la proporcin de bibliotecas que prestan en promedio ms de 300 libros por semana. En las pblicas, slo 8 de las 52 bibliotecas prestaron en la semana observada ms de 300 libros, mientras que 29 bibliotecas privadas sobrepasaron esta cifra. Dar una estimacin del porcentaje de bibliotecas que en promedio prestan ms de 300 libros por semana y hallar la varianza estimada correspondiente. Solucin: a) El muestreo debe ser con reposicin. 2 11360 86 14413 217 241. 7; b) st W h y h 131 217 52 52 Var st
h1 h1 2 W2 h nh 2 S h 49. 12
P st W h P h
h1
131 8 217 52
86 24 217 52
0. 314;
Ph
1 P h
0. 0017.
Intervalo de confianza del 95% 0. 314 1. 96 0017 . 7.2 Una escuela desea estimar la calificacin promedio que puede ser obtenida en un examen de comprensin de lectura por estudiantes de 6 de E.G.B. Los alumnos de la escuela son agrupados en 3 estratos, los que aprenden rpido en el estrato I, los que aprenden lento en el estrato III y el resto en el estrato II. La escuela decide esta estratificacin porque de esta manera se reduce la variabilidad en las calificaciones del examen. El 6 curso de E.G.B. contiene 55 alumnos en el estrato I, 80 en el estrato II y 65 en el estrato III. El examen se aplica a la muestra de 50 alumnos utilizando afijacin proporcional, y se obtienen los siguientes resultados: Estrato I Estrato II Estrato III yi : 79.71 64.75 37.44
2 s 105.14 158.2 186.13 i : a) Estimar la calificacin promedio para este curso. b) Habra sido conveniente utilizar afijacin de mnima varianza?. c) Encontrar el tamao de muestra requerido para estimar la calificacin promedio, con un lmite de 3.92 puntos para el error de estimacin (con una confianza del 95%). Usar
asignacin proporcional. d) Repetir el apartado c) usando ahora la asignacin de mnima varianza. Comparar los resultados con los del apartado c). Solucin: n 1 13. 75 14 Ni Afijacin proporcional n i 50 N n 2 20 20 n 3 16. 25 16 a) Estimadores: st W h h ; Var st
h1 3 h1 3 3 W2 h 1f h nh 2 S h / Wh Nh N
Estimaciones: st W h y h 59. 98; Var st 2. 28; B 1. 96 2. 28 2. 96 Intervalo de confianza del 95% 59. 98 2. 96 b) Para resolver esta cuestin lo que se debera hacer es un contraste de homogeneidad de las varianzas entre estratos. Si no la respuesta se basa en la comparacin visual de 2 s i :105.14, 158.2, 186.13. h W h / h 1, 2, 3; c) Afijacin proporcional w h nnh N N
h 2 W wh h L 2 2 W h h L
h1
h1
h1
2 2 Wh h N h
B2 K2
h1
estimacin
h1
2 2 Wh h N h
32. 05 33
n 1 33 n 2 13 n 3 11
55 200
nh n
Nh h
w 1 0. 23
W2 h wh L 2 h 2
h1
w 2 0. 41 w 3 0. 36 31. 7 32
Nh h
L
2 Wh h N h h1
n 1 33 w 1 7 n 2 13 w 2 13 n 3 11 w 3 12 7.3 Una empresa de publicidad desea determinar cunto debe emplear en publicidad televisiva en un municipio, para lo que decide realizar una encuesta para estimar el nmero medio de horas semanales que se ve la televisin en los hogares del municipio. ste comprende dos pueblos, A y B, y un rea rural. El pueblo A circunda una fbrica y los hogares son de trabajadores con nios en edad escolar. El B es un suburbio de una ciudad vecina con muchos jubilados y pocos nios. El A tiene 155 hogares, B 62 y el rea rural 93. Una encuesta previa sugiere que las varianzas de los estratos son 2 2 2 1 25, 2 225, 3 100. Estimar la media poblacional seleccionando el tamao de muestra en cada estrato para cometer un error de estimacin inferior a 2 horas con una ; i 1, 2, 3. confianza del 95% y unas fracciones de tamaos muestrales w i 1 3
Solucin:
h 2 N wh h L 2
Frmula L 3; w i 1 3 N 3 93 n
general
h1 B2 K2
h1
;
2 h Nh
En
este
caso . N 2 62,
2 2 2 ; N 1 155, 1 25, 2 225, 3 100, i1,2,3 6991.275 56. 7, es decir n57n i n w i 19; i 1, 2, 3 123.225
8.- Programas.
Obtencin del tamao de muestra fijado un error de estimacin B y una confianza k:
Programa estranp.m: Permite obtener el tamao de muestra n fijado el error de estimacin, por ejemplo B 0. 05 y la confianza, por ejemplo k 1. 96. El diseo considerado es muestreo estratificado con L estratos y m.a.s. en cada estrato. Se supone que la afijacin es proporcional. El objetivo es estimar una proporcin poblacional P. function [n, nh]estranp(B,k,Ni) Lmax(size(Ni)) Ni2Ni-1 Ni3Ni./Ni2 Nsum(Ni) WiNi/N aux1Wi.*Ni3*0.25 n0.25*sum(aux1)/((B^2/k^2)0.25*(sum(aux1)/N)) nhn*Wi
errormusqrt(varmu) %Intervalo de confianza del 95% icmu[muest-1.96*errormu, muest1.96*errormu] %Solucion apartado c) %Numero de semanas que prestan mas de 300 libros [Bibliotecas Pblicas, Privadas] Ai[8 29] PiAi./ni %Estimacin de la proporcion Pestsum(Wi.*Pi) %Estimacion del error de muestreo sp2Pi.*(1-Pi) varpsum((Wi2.*sp2)./(ni-1)) errorpsqrt(varp) %Intervalo de confianza del 95% icp[Pest-1.96*errorp, Pest1.96*errorp]