Professional Documents
Culture Documents
CONTENIDO
Tema 1: Definición de probabilidad
Tema 2:
Tema 3:
Tema 4:
Ejemplos.
ξ2 : Lanzar un dado
2
Cada elemento del espacio muestral está asociado con al menos un resultado
posible del experimento aleatorio.
Los espacios muestrales discretos suelen construirse con la técnica del diagrama
del árbol.
Note aquí, que el espacio muestral tiene 6x6=36 elementos, es decir 36 pares
ordenados en los que el primer número representa el número de puntos del 1°
dado y el segundo número representa el número de puntos del 2° dado.
Ω = { 0, 1, 2, 3, …… }
3
4. Para el experimento de inspeccionar la calidad de un producto. Aquí el interés
será si el producto es bueno o malo.
4
A3 = La suma de puntos es menor que cinco: Notación por compresión
A3 = {(1,1), (1,2), (1,3), (2,1), (2,2), (3,1)} : Notación por extensión
A2 A1
A3
E1 = {X / 0 ≤ X < 37}
E2 = {X / 36 ≤ X ≤ 38}
E3 = {X / X > 38}
5
Ejemplo 3: Para el experimento de disparar a un blanco tres veces y si solo nos
interesa si el disparo da o no en el blanco, el espacio muestral será el siguiente:
M = { (0,0,0) }
6
uniones, intersecciones y complementos; de aquí la necesidad de estudiar las
operaciones que se pueden hacer con eventos.
A
A Ocurre el evento A
A’ No ocurre el evento A
7
a. A B = { 7 }
b. ( A'B) C = { 8 }
c. B'C = { 1, 2, 3, 4, 5 }
d. ( B'C ) D = {1, 5 }
e. A'C = {2, 4, 8 }
f. ( A'C ) D = ɸ
8
4.1.1. Probabilidad matemática o de Laplace: Esta probabilidad se basa
en un modelo razonable del sistema que se estudia mediante un
experimento aleatorio.
1
P(1) P(2) P(3) P(4) P(5) P(6)
6
9
N ( A) 2
P( A) 0.333
N ( ) 6
1
P(1,1) P(1,2) P(1,3) P(6,6)
36
N ( A) 6
P( A) 0.1666
N () 36
n( A)
P( A) Lim n k
n
10
Estado Civil N° de personas (ni) Proporción de personas (pi)
Divorciado 60 0.03
Viudo 60 0.03
5. Axiomas de probabilidad
Los axiomas de probabilidad son premisas que no requieren demostración; pero
que sobre las cuales se construye la teoría de probabilidades.
11
P( A1 A2 A3 . . . ) P( A1 ) P( A2 ) . . .
12
Esta regla podría ser extendida a la reunión de más de tres eventos usando el
mismo razonamiento.
Solución
Entonces tenemos:
P( A B) P( A) P( B) P( A B)
= 0.92
Solución
Sea:
13
Entonces tenemos:
P( A B) P( A) P( B) P( A B)
= 0.09
Solución
B = Tapar caries
C = Extraer un diente
Entonces tenemos:
Sabemos que:
P( A B C ) P( A) P( B) P(C ) P( A B) P( A C ) P( B C ) P( A B C )
= 0.44 + 0.24 + 0.21 - 0.08 - 0.11 - 0.07 + 0.03
= 0.66
7. Probabilidad condicional
Dados dos eventos A y B con P(B) > 0, la probabilidad condicional de A dado B,
expresada como P(A/B), representa la fracción de veces que ocurre A sabiendo
que ha ocurrido B. Su cálculo corresponde al cociente entre la probabilidad de
que ocurra A y B (ambos) y probabilidad de que ocurra B.
14
P( A B)
P( A / B)
P( B)
Esto significa que el suceso B ocurrirá una fracción P(B) veces y, asimismo A y B
(ambos) ocurrirá una fracción P( A B) de las veces. El cociente
P( A B) / P( B) indica la proporción de veces que cuando ocurre B, ocurre
también A. Esto es, Si ignoramos las veces en que B no ocurre, y consideramos
solo aquellas en que ocurre, el cociente P( A B) / P( B) corresponde a la
fracción de veces que A también sucederá. Esto es precisamente lo que significa
la probabilidad condicional de A dado B.
A B
A∩B
En efecto, es fácil probar que las dos expresiones que aparecen en la figura
anterior son equivalentes.
# ( A B)
P( A B) # ( ) # ( A B)
P( A / B) A
P( B) # ( B) # ( B)
# ( )
15
Naturalmente esta probabilidad es ½, lo que podemos establecer de manera más
formal establecer como
Pero consideremos que sabemos que en dos de las tres monedas ha salido cara.
¿Cuál es ahora la probabilidad de que la primera moneda sea cara?.
Más exactamente, hemos calculado una probabilidad condicional. Esto es, hemos
determinado que bajo la condición de que sabemos que dos de las tres monedas
han salido cara, la probabilidad condicionada de que la primera sea cara es 2/3,
lo que matemáticamente se expresa como:
16
Ejemplo 2: Considere que se dispone la siguiente información relacionada con el
comportamiento de un gran número de clientes:
B = El cliente que visita el establecimiento comercial compra algo (lo que estaba
buscando)
# ( A) 1200
P( A) 0.48
# () 2500
# ( B) 1600
P( B) 0.64
# () 2500
# ( A B) 1100
P( A B) 0.44
# () 2500
P( A B) 0.44
P( A / B) 0.6875
P( B) 0.64
# ( A B) 1100
P( A / B) 0.6875
# ( B) 1600
P( A B) P( A) P( B / A).
17
Esto nos permite calcular la probabilidad conjunta de A y B conociendo la
probabilidad de A y la probabilidad condicional de B dado A.
8. Regla de la multiplicación
i. Para dos eventos: Supongamos que A y B, son dos eventos cualquiera del
mismo espacio muestral Ω,
P( A B) P( A) P( B / A)
ii. Para varios eventos: Supongamos que A1, A2, …, Ak, son k eventos cualquiera
del mismo espacio muestral Ω,
Ejemplo 1:
Solución:
P(A1∩A2) = P(A1)P(A2/A1)
= (15/240).(14/239)
= 0.003661
18
Esto supone que estamos muestreando sin reemplazo; esto es la primera
persona seleccionada no se regresa a la población antes de que de seleccionar
la segunda persona.
Ejemplo 2:
a) Sin reemplazo;
b) Con reemplazo.
Solución:
4 3 1
. .
52 51 121
4 4 1
. .
52 52 169
Ejemplo3:
Solución:
5 4 3 1
P( A B C ) . .
20 19 18 114
9. Eventos independientes
19
Con símbolos, dos eventos A y B son independientes si, P( B / A) P( B) o en
forma equivalente P( A / B) P( A) , siempre que las probabilidades condicionales
existan, es decir que P( A) 0 y también P( B) 0 .
P( A B) P( A) P( B / A)
P( A).P( B)
Por lo que finalmente podemos decir que, dos eventos A y B son independientes
si y solo si:
P( A B) P( A).P( B)
Generalizando para k eventos, tenemos que los eventos A1, A2, …, Ak, son
independientes si y sólo si la probabilidad de la intersección de cualquiera 2, 3, …
, o k de estos eventos es igual al producto de sus probabilidades respectivas.
P( A B) P( A).P( B)
P( A C ) P( A).P(C )
P( B C ) P( B).P(C )
P( A B C ) P( A).P( B) P(C )
Finalmente los eventos A1, A2, …, Ak, son Conjuntamente Independientes si y sólo
si
P( A1 A2 A3 .... Ak ) P( A1 ) P( A2 ) P( A3 )...P( Ak )
20
Ejemplo
A
B
1/4 ¼
¼1/4
C
Solución:
1
P( A).P( B) P( A B)
4
1
P( A).P(C ) P( A C )
4
1
P( B).P(C ) P( B C )
4
Pero
1
P( A).P( B).P(C ) P( A B C )
8
A propósito del ejemplo anterior se le puede dar una interpretación “real” al
considerar un cuarto grande que tiene tres interruptores separados que controlan
las luces del techo. Estas luces estarán encendidas cuando los tres interruptores
estén “hacia arriba” y por tanto también cuando uno de los interruptores este “hacia
arriba” y los otros dos estén “hacia abajo”. Si A es el evento que el primer interruptor
este “hacia arriba”, B es el evento que el segundo interruptor este “hacia arriba” y C
es el evento de que el tercer interruptor este “hacia arriba”, el diagrama de Venn de
la figura anterior muestra un posible conjunto de probabilidades asociado con que
los interruptores estén “hacia arriba” o “hacia abajo” cuando las luces del techo
estén están prendidas.
21
Ejemplo:
Solución:
1 1 1 1
. .
2 2 2 8
Ejemplo:
Ω={1c,2c,3c,4c,5c,6c,1s,2s,3s,4s,5s,6s}.
P( B) P( B A) P( B A' )
22
ii. Para varios eventos: Supongamos que A1, A2, …, Ak, constituye una partición
n
del espacio muestral Ω, es decir que Ai Aj i j y A , i
i 1
k
P( B) P( A j ) P( B / A j )
j 1
Ejemplo 1:
Una clase está formada por un 60% de chicas y 40% de chicos. Supongamos que
el 30% de las chicas y el 20% de los chicos llevan el pelo largo. Si se escoge un
alumno de la clase al azar, ¿Cuál es la probabilidad de que el alumno
seleccionado lleve el pelo largo?
Nos interesa calcular P(B), que por el teorema ley de probabilidad total resulta:
23
Ejemplo 2 :
Solución:
P( B) P( A B) ( A'B)
P( A B) P( A'B)
P( A) P( B / A) P( A' ) P( B / A' )
Ejemplo 3:
Solución:
24
P( A1 ) 0.60, P( A2 ) 0.30, P( A3 ) 0.10, P( B | A1 ) 0.09, P( B | A2 ) 0.20 y
P( B | A3 ) 0.06 .
Así 12% de los automóviles rentadas entregados a esta empresa necesitaran una
afinación.
Sea A1 , A2 , .... , An una partición del espacio muestral Ω, es decir que
in1 Ai , además Ai A j , i j . Entonces si B es un evento
cualquiera con P( B) 0 , se verifica que:
P( Ai B)
P( Ai / B) i 1, 2, 3, .... , n
P( B)
o también:
P( Ai ) P( B / Ai )
P( Ai / B) k
P( A )P( B / A )
j 1
j j
Demostramos el cálculo:
P( A) P( A) P( A B) P( A B)
P( B / A) P( A | B)
P( B ) P( B) P( A) P( B)
25
para calcular probabilidades de la segunda etapa, y el Teorema de Bayes para
calcular probabilidades de la primera etapa habiendo ocurrido alguno de los
sucesos de la segunda etapa.
P( A1 ) P( B / A1 )
P( A1 / B) k 3
P( A )P( B / A )
j 1
j j
26
0.02 0.5
P( A1 / B) 0.40
0.02 0.5 0.02 0.25 0.04 0.25
27
Ejercicios 3:
2. Explique por qué hay un error en cada una de las siguientes declaraciones:
a) La probabilidad de que Jean apruebe el examen de la barra de abogados es
0.66 y la probabilidad de que no lo pase es ־0.34.
b) La probabilidad de que el equipo de casa gane un juego de futbol venidero
es 0.77, la probabilidad de que se empate el juego es 0.08 y la probabilidad
de que gane o empate el juego es 0.95.
c) Las probabilidades de que una secretaria cometa 0, 1, 2, 3, 4, 5 o más
errores al mecanografiar un informe son, respectivamente, 0.12, 0.25, 0.36,
0.14, 0.09 y 0.07.
d) Las probabilidades de que un banco reciba 0, 1, 2, 3 o más cheques malos
en un día dado son, respectivamente, 0.08, 0.21, 0.29 y 0.40.
Suponga que se sabe que el estudiante tiene una tarjeta de crédito bancaria,
¿Cuál es la probabilidad de que ella o él, tengan una tarjeta de crédito para
viaje y entretenimiento.?
28
Formación Egresados de la No Egresados de la
Universidad universidad
Experiencia
a) P(G T );
b) P(G T );
c) P(G T );
d) P(G T´).
7. Los registros médicos muestran que una entre diez personas en una cierta
ciudad tiene deficiencia tiroidea. Si se escogen aleatoriamente 12 personas en
esta ciudad y se les hace un análisis, ¿Cuál es la probabilidad de que al menos
una de ellas tenga una deficiencia tiroidea?
9. Una tienda departamental que factura a sus clientes una vez al mes ha
encontrado que si un cliente paga oportunamente en un mes, la probabilidad
es 0.90 de que él o ella pague también oportunamente el siguiente mes-, sin
embargo, si un cliente no paga oportunamente en un mes, la probabilidad de
que él o ella pague oportunamente el mes siguiente es solamente 0.40.
29
Profesor Saavedra, 25% con el profesor Hurtado y 35% con la profesora Oliva.
También se sabe que el 75% de los estudiantes del profesor Saavedra
aprueban la asignatura, 70% de los estudiantes del Profesor Hurtado aprueban
la asignatura y 80% de los estudiantes de la Profesora Oliva también aprueban
la asignatura. ¿Cuál es la probabilidad de que un estudiante de dicha
asignatura apruebe?
11. Por experiencia se sabe que en una cierta industria 60% de todos los litigios
entre los trabajadores y la administración son por salarios, 15% por las
condiciones de trabajo y 25% son sobre aspectos de prestaciones. También
45% de los litigios por salarios se resuelven sin huelgas, 70% de los litigios por
condiciones de trabajo se resuelven sin huelgas y 40% de los litigios acerca
de prestaciones se resuelven sin huelgas. ¿cuál es la probabilidad de que un
litigio entre trabajadores y la administración se resuelva sin una huelga?
12. En una cierta comunidad, 8% de todos los adultos mayores de 50 años tienen
diabetes. Si un servicio de salud en esta ciudad diagnostica correctamente a
95% de las personas con diabetes como enfermas de diabetes e
incorrectamente diagnostica a 2% de todas las personas sin diabetes como
enfermas de diabetes, encuentre la probabilidad de que
30
1. Variables Aleatorias.
a. Definición: Sea un experimento aleatorio y el espacio muestral asociado
con el experimento. Una función X que asigna a cada uno de los elementos
s , un número real X (s ) se llama Variable aleatoria.
Ejemplo. Sea el experimento aleatorio = Lanzar tres monedas legales sobre una
superficie regular, entonces el espacio muestral debe ser
ccc, ccs, csc,scc, css, scs, ssc, sss, considere también que la variable aleatoria X =
Número de caras al lanzar tres monedas legales sobre una superficie regular, entonces el
Rango o conjunto de valores que podría tomar esta variable será: RX 0,1,2,3
31
Por extensión:
Por Compresión:
3
𝑃(𝑥) = ( ) × (0.5)3 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑥 = {0, 1, 2, 3}
𝑥
b. Función de Probabilidades
Llamaremos a p(x) función de probabilidades o función de cuantía por tratarse de
una variable discreta, siempre que cumpla con las dos condiciones siguientes:
i) p( xi ) 0 , i 1,2,3,4,....
ii) p ( xi ) 1
# número de posibilidades 24 16
número de repeticiones
Donde:
4
El número de formas en que pueden aparecer x caras es ; por lo tanto:
x
32
4
p( x) 4
x
; x 0,1,2,3,4
2
4
p( x) 4 0
x
i)
2
4
x 1
4 4
ii)
x 0
p( x)
x 0 24
4
Por lo que concluimos que p( x) 4 es una función de cuantía.
x
2
Podemos calcular los valores de la función de cuantía para cada uno de los
valores de X:
4
4 4 4!
1 entonces p(0) 4 1 0.0625
0
Para x 0 :
x 0 0!4! 2 16
33
4
4 4 4!
4 entonces p(0) 4 4 0.25
1
Para x 1 :
x 1 1!3! 2 16
4
4 4 4!
6 entonces p(2) 4 6 0.375
2
Para x 2 :
2 2 2!2! 2 16
4
4 4 4!
4 entonces p(3) 4 4 0.25
3
Para x 3 :
x 3 3!1! 2 16
4
4 4 4!
1 entonces p(4) 4 1 0.0625
4
Para x 4 :
x 4 4!0! 2 16
Y al graficarlo tenemos:
34
Conviene resaltar que p(x) da las frecuencias relativas con que se presenta cada
uno de los valores de x . Así, si suponemos que las cuatro monedas se lanzan un
gran número de veces, debemos esperar que no aparezcan caras ( x 0 ) en 1 16
aproximadamente de las tiradas; esperamos que aparezca una cara ( x 1 ) en la
cuarta parte aproximadamente de las tiradas, y así sucesivamente. Decimos
aproximadamente porque ya estamos familiarizados con las fluctuaciones que
acompañan los sucesos aleatorios.
35
4
P( x 2) p(2) 4
2 6
0.375
2 16
4 4 4
p( x) p(0) p(1) p(2) 4 4 4
2
0 1 2 1 4 6 11
P( x 3) 0.6875
x 0 2 2 2 16 16 16 16
4 4 4
p( x) p(1) p(2) p(3) 4 4 4
3
1 2 3 4 6 4 14
P(1 x 3) 0.875
x 1 2 2 2 16 16 16 16
A x : x 0,1,2
B x : x 0,1,2,3
P( A B)
P( A / B)
P( B)
Ahora bien:
A B x : x 0,1,2
Luego
2
4
x
11
2
P( A B) p ( x) x 0
x 0 24 16
También
36
3
4
x
15
3
P( B) p( x) x 0
x 0 24 16
De donde:
11 / 16 11
P( A / B) P( x 3 / x 4)
15 / 16 15
El valor esperado de una variable aleatoria se define como un número real al cual
tienden los valores de la variable en el largo plazo; también se suele entender como
el centro de masa de su distribución de probabilidades y matemáticamente el valor
esperado se define como la suma de los productos de cada uno de los valores de
la variable por sus correspondientes probabilidades, así:
𝐸(𝑋) = 𝜇 = ∑𝑚
𝑖=1 𝑥𝑖 . 𝑝(𝑥𝑖 ),
𝑖=1
37
2. La distribución Binomial:
Sea un experimento aleatorio de Bernoulli, es decir que tiene las siguientes
características:
1 : Éxito (E)
xi
0 : Fracaso (F)
p si xi 1 para todo 0≤ p ≤ 1
P( xi )
q si xi 0 para todo q=1–p y p+q=1
38
X = Número de éxitos en las n-repeticiones del experimento de Bernoulli .
Esta variable así definida es discreta y se llama variable aleatoria Binomial, la cual
sigue la ley de probabilidades Binomial, caracterizada por:
La forma de la función de cuantía depende del valor de p. Así por ejemplo para una
Binomial con n=10 y tres valores de p=0.2, 0.5 y 0.8, tenemos que la función de
cuantía es
39
Ejemplo. Sea el experimento aleatorio = Lanzar una moneda legal tres veces sobre una
superficie regular, y deseamos estudiar la variable aleatoria X = Número de caras en dicho
experimento.
El experimento de Bernoulli básico es = Lanzar una moneda legal, en donde los posibles
resultados son Ω = {C , S}, donde C = cara y S = Sello. En este espacio muestral,
definimos la variable aleatoria de Bernoulli
1 : Cara (Éxito)
xi
0 : Sello (Fracaso)
Entonces la variable aleatoria X = Número de caras al lanzar tres monedas legales sobre una
superficie regular se puede expresar como:
40
3
X x1 x2 x3 xi donde, cada xi puede ser 0 ó 1, por lo que el rango de
i 1
x
41
Ha de pasar un auto por dicha ruta una vez al día en los próximos 7 días, y desea
predecir el número de los mismos en que el puente estará en la posición elevada,
cuando Ud. se acerque.
f. Determine el valor esperado y desviación estándar del número de días en que encuentra
el puente elevado.
SOLUCIÓN
E, F
7
ser ,
7
X x1 . . . x7 xi donde cada xi puede ser 0 ó 1, por lo que el
i 1
Esta variable seguirá una distribución Binomial B(7, 0.2), con función de cuantía:
x
42
7 7 7
b) P( X 7) p (7) 0.2 0.8 0.000013
7
7
7 7 3
c) P ( X 3) p (3) 0.2 0.8 0.114688
3
3
7 71
d) P( X 1) p (1) 0.2 0.8 0.367002
1
1
43
aleatoria X = Número de elementos en la muestra que poseen la cualidad específica en
estudio. Esta variable sigue una Distribución Binomial con parámetros n y p,
donde n es el tamaño de muestra y p es la probabilidad de obtener un elemento
que tenga la cualidad en estudio en cualquier extracción de los elementos de la
muestra, usando un muestreo con reemplazo (p = A/N).
Ejemplo 3: Un auditor de registros contables sabe por larga experiencia que el 10%
de los registros contables tendrán algún tipo de defecto que requerirá un ligero
reajuste. Suponga que el total de registros que el auditor debe examinar son N=
500, pero por diversas razones decide examinar una muestra de n = 20 registros
contables:
44
iii. Más de 2 requerirá arreglo?
iv. Elabore una gráfica de la función de cuantía.
SOLUCIÓN
Población N = 500
Muestra sin reemplazo n = 20
Fracción de muestreo f = n/N = 20/500 = 0.04 < 0.05
x
20
P( X 0) p(0) 0.1 .0.9 0.920 0.12157665
0 200
b) i.
0
iii.
P( X 3) 1 P( X 2) 1 0.67692681 0.32307317
P( X 3) 1 P( X 0) P( X 1) P( X 2)
P( X 3) 1 0.121576655 0.270170344 0.285179807
P( X 3) 1 0.676926805 0.323073195
45
46
3. Distribución Geométrica
a. Definición. Se denomina experimento geométrico a las repeticiones
independientes de un experimento de Bernoulli hasta obtener el primer éxito,
En cada ensayo de Bernoulli puede ocurrir un éxito (E) con probabilidad p o
un fracaso (F) con probabilidad q=1-p, siendo 0<p<1.
El espacio muestral del experimento geométrico es el conjunto:
Ω = { 𝐸, 𝐹𝐸, 𝐹𝐹𝐸, 𝐹𝐹𝐹𝐸, … , }
Se trata de un conjunto infinito numerable
1
∑∞ 𝑘 2 3
𝑘=0 𝑟 = 1 + 𝑟 + 𝑟 + 𝑟 + ⋯ = , 𝑆𝑖 |𝑟| < 1
1−𝑟
1 1
En efecto, ∑∞
𝑘=1 𝑞
𝑘−1
𝑝 = 𝑝(1 + 𝑞 + 𝑞 2 + 𝑞 3 + ⋯ . ) = 𝑝 (1−𝑞) = 𝑝 (𝑝) = 1
1
Valor esperado: 𝐸(𝑋) = 𝜇 = 𝑝
Prueba
1
Utilizando la identidad: ∑∞
𝑘=1 𝑘𝑞
𝑘−1
= (1−𝑞)2
se obtiene:
∞ ∞
1 1 1
𝐸(𝑋) = ∑ 𝑘𝑞 𝑘−1 𝑝 = 𝑝 ∑ 𝑘𝑞 𝑘−1 = 𝑝 2
=𝑝 2=
(1 − 𝑞) 𝑝 𝑝
𝑘=1 𝑘=1
47
𝑞
Varianza: 𝑉(𝑋) = 𝜎 2 = 𝑝2
Prueba
1+𝑞
Utilizando la identidad: ∑∞ 2 𝑘−1
𝑘=1 𝑘 𝑞 = (1−𝑞)3
, se tiene:
∞
2)
1+𝑞 2−𝑝
𝐸(𝑋 = 𝑝 ∑ 𝑘 2 𝑞 𝑘−1 = 𝑝 ( 3
)=
(1 − 𝑞) 𝑝2
𝑘=1
2 2−𝑝 1 𝑞
Luego: 𝑉𝑎𝑟(𝑋) = 𝐸(𝑋 2 ) − (𝐸(𝑋)) = 𝑝2
− 𝑝2 = 𝑝2
SOLUCIÓN
Sea X el número de llamadas hasta conseguir una venta. Sus posibles valores
son: 1, 2, 3, …, etc. El modelo de probabilidad de X es Geométrica de parámetro
p=0.02, esto es:
c. El evento “Sabiendo que ya hizo tres llamadas sin éxito y se quiere conocer
la probabilidad hacer más de cinco llamadas hasta que obtenga un éxito”,
entonces:
48
𝑃[𝑋 > 3 ∧ 𝑋 > 5] 𝑃(𝑋 > 5) 1 − 𝑃(𝑋 ≤ 5)
𝑃(𝑋 > 5⁄𝑋 > 3) = = =
𝑃[𝑋 > 3] 𝑃[𝑋 > 3] 1 − 𝑃(𝑋 ≤ 3)
1 − 0.09608 0.90392
= = = 0.9604
1 − 0.05881 0.94119
𝑃(𝑋 ≥ 6) 𝑝[𝑞 5 + 𝑞 6 + 𝑞 7 + 𝑞 8 + ⋯ ]
𝑃(𝑋 > 5⁄𝑋 > 3) = = =
𝑃(𝑋 ≥ 4) 𝑝[𝑞 3 + 𝑞 4 + 𝑞 5 + ⋯ ]
𝑞5 + 𝑞6 + 𝑞7 + 𝑞8 + ⋯ 𝑞 2 (𝑞3 + 𝑞 4 + 𝑞 5 + ⋯ . )
𝑃(𝑋 > 5⁄𝑋 > 3) = =
𝑞3 + 𝑞4 + 𝑞5 + ⋯ 𝑞3 + 𝑞4 + 𝑞5 + ⋯ .
= 𝑞 2 = 0.982 = 0.9604
4. La distribución Hipergeométrica:
Sea N una población finita formada por un número pequeño de individuos, objetos
o medidas, de los cuales una parte A de estos elementos tienen una cualidad que
estamos interesados en estudiar. Considere que de esta población se selecciona
una muestra aleatoria sin reemplazamiento tamaño n.
49
Variable aleatoria: X = Número de elementos en la muestra
nA
Valor Esperado: E( X )
N
N n nA A
Varianza: V (X ) 1
N 1 N N
SOLUCIÓN
50
N=9
A=6
n=3
X = Número de tabletas que contiene narcóticos
El rango de X será:
La distribución de X es:
RX: {0, 1, 2, 3}
X ~
6 3
x 3 x
P( X x ) p( x )
9
3
P(X ≥ 1) = 1 - P(X = 0)
6 9 6
0 3 0
P( X 1) 1 1 0.011905 0.988095
9
3
nA 3 6 18
E( X ) 2
N 9 9
9 3 3 6 6
DE X V X 1 0.5 0.7071
9 1 9 9
51
Ejemplo1.a. Repita el ejemplo anterior, pero esta suponga que el oficial de la
Aduana selecciona una muestra de cinco tabletas.
SOLUCIÓN
N = 9, A = 6, n=5 y X = Número de tabletas que contiene narcóticos
El rango de X será:
Máx {X} = Mín {n, A } = Mín {5, 6} = 5
Mín {X} = Máx { 0, (n-(N-A)) } = Máx { 0, (5-(9-6) } = Máx {0, 2 } = 2
La distribución de X es:
RX: {2, 3, 4, 5}
X ~
6 3
x 5 x
P( X x ) p( x )
9
5
6 9 6
2 5 2
P ( X 2) 0.11905
9
5
6 9 6
3 5 3
P( X 3) 0.47619
9
5
52
6 9 6
P( X 4) 0.35714
4 5 4
9
5
6 9 6
5 5 5
P( X 5) 0.04762
9
5
nA 5 6 30
E( X ) 3.3333
N 9 9
9 5 5 6 6
DE X V X 1 0.55556 0.74536
9 1 9 9
Ejemplo 2. Considere que una caja que contiene 15 artículos, 10 de los cuales son
aceptables. Se selecciona una muestra de 4.
SOLUCIÓN
53
N = 15, A = 10, n=4 X = Número de artículos aceptables en la muestra
La distribución de X es:
10 15 10
3 4 3
P( X 3) 0.4396
15
4
10 15 10
4 4 4
P( X 4) 0.1538
15
4
P(X ≥ 1) = 1- P(X = 0)
10 15 10
0 4 0
P( X 1) 1 P( X 0) 1 1 0.0037 0.9963
15
4
54
SOLUCIÓN
N = 15
A=6
n=5
X = Número de productos con fecha de vencimiento pasada.
La distribución de X es:
6 15 6 6 9
2 5 2 2 3
P( X 2) p(2) 0.41958
15 15
5 5
SOLUCIÓN
N = 15
A = 10
n=8
X = Número de productos con fecha de vencimiento pasada.
55
La Distribución de Probabilidades quedará del siguiente modo
Encontramos las probabilidades para cada uno de los valores de la variable, y lo graficamos
5. Distribución de Poisson:
Sea una variable aleatoria X = Número de ocurrencias por unidad de medición (minuto, hora,
centímetro, metro cuadrado, etc,) de la cual se conoce la tasa media de ocurrencias por unidad
denotada por λ, la cual se mantiene constante durante el período de estudio. Esta
variable sigue una distribución de Poisson, la cual debe su nombre a su creador, el
Matemático Francés Simenon Poisson (1781–1840). La distribución de Poisson tiene
como parámetro a la tasa media de ocurrencias λ, y mide la probabilidad de un evento
aleatorio sobre algún intervalo de tiempo o espacio.
56
La ocurrencia del evento en un intervalo es independiente de la ocurrencia de
otro intervalo cualquiera.
Dados estos supuestos, la distribución puede expresarse como:
Rango: Rx = {0, 1, 2, 3, 4, …. }
X ~
e x
Función de cuantía P( X x) p( x)
x!
X : Número de veces que ocurre el evento
: Número promedio de ocurrencias por unidad de tiempo o de espacio (o tasa
promedio de ocurrencias por unidad de tiempo o de espacio)
Varianza : V[x] = λ
57
La distribución de probabilidades Poisson a menudo proporciona un buen modelo
de la distribución de probabilidad para el número “X” de eventos poco comunes que
se presentan en el espacio, tiempo, volumen o cualquier otra dimensión, donde λ
es el valor promedio de “X”. Así tenemos que, esta distribución proporciona un
buen modelo de la distribución de probabilidad del número X de accidentes
automovilísticos, industriales u otra clase de accidentes que ocurren en cierta
unidad de tiempo. El número de llamadas telefónicas que atiende un conmutador
en un intervalo, el número de partículas radioactivas que se desintegran en cierto
período, el número de errores que una mecanógrafa comete en una cartilla, el
número de vehículos que doblan en un sentido específico en una bifurcación de la
vía rápida en un intervalo de 10 minutos, son otros ejemplos de variables aleatorias
con una distribución aproximada a la de Poisson.
SOLUCIÓN
Rango: Rx = {0, 1, 2, 3, 4, 5, 6, …. }
X ~
e1010 x
Función de cuantía P( X x) p( x)
x!
58
e10105
P( X 5) p(5) 0.0378
5!
Otros cálculos
5
e 10105
P( X 5) 0.067085
x 0 5!
P X 5 1 P( X 5) 1 0.067085 0.93915
59
P7 X 14 P( X 14) P X 6 0.91654 0.13014 0.78640
SOLUCIÓN
e2 23
P( X 3) p(3) 0.1804
3!
60
Rango: Rx = {0, 1, 2, 3, 4, 5, 6, …. }
X ~
e t (t ) x
Función de cuantía P( X x) p( x)
x!
Rango: Rx = {0, 1, 2, 3, 4, 5, 6, …. }
X ~
e23 (2 3) x e6 6 x
Función de cuantía P( X x) p( x)
x! x!
e 6 65
P( X 5) p(5) 0.16062
5!
a. Propiedades de la distribución de Poisson:
i. Si X es una variable con distribución de Poisson con parámetro λ y Y es otra
variable también con distribución de Poisson pero con parámetro µ, entonces
la suma de estas variables generan una nueva variable Z = X + Y con la misma
distribución de Poisson, pero con parámetro dado por (λ + µ).
61
b. Sea Z una variable aleatoria con distribución de probabilidades Poisson con
parámetro λ. Sea “p” una probabilidad de que la variable Z adquiera un atributo
particular y “(1-p)” es la probabilidad de que no lo adquiera, entonces se generan
dos variables X y Y con la misma distribución de Poisson cada una de ellas, pero
con parámetros (pλ) y (1-p)λ respectivamente.
Estas dos características son conocidas como la propiedad de reproducción de
la distribución de Poisson.
62
6. Aproximación de la distribución de Poisson a la Binomial:
Suponga que X es una variable aleatoria Binomial con parámetros n y p, es decir que
X Bn, p . Cuando n y p 0 tal que el producto np se mantiene
constante, el cual lo denotamos por , es decir que np ; entonces la distribución
Binomial Bn, p puede ser suficientemente bien aproximada por la distribución de
λ = 50*0.02= 1
X B(50, 0.02) P(λ=1)
0 0.364170 0.367879
1 0.371602 0.367879
2 0.185801 0.183940
3 0.060670 0.061313
4 0.014548 0.015328
5 0.002732 0.003066
6 0.000418 0.000511
7 0.000054 0.000073
8 0.000006 0.000009
9 0.000001 0.000001
10 0.000000 0.000000
λ = 200*0.03= 6
X B(200, 0.03) P(λ=6)
0 0.002261 0.002479
63
1 0.013987 0.014873
2 0.043043 0.044618
3 0.087860 0.089235
4 0.133828 0.133853
5 0.162250 0.160623
6 0.163086 0.160623
7 0.139788 0.137677
8 0.104301 0.103258
9 0.068817 0.068838
10 0.040652 0.041303
11 0.021716 0.022529
12 0.010578 0.011264
13 0.004731 0.005199
14 0.001955 0.002228
15 0.000750 0.000891
16 0.000268 0.000334
17 0.000090 0.000118
18 0.000028 0.000039
19 0.000008 0.000012
20 0.000002 0.000004
Por lo tanto es fácil deducir que para las condiciones especificadas anteriormente
de una distribución Binomial, podría utilizarse la Distribución de Poisson como una
distribución aproximada, con la cual se obtendrán probabilidades suficientemente
próximas a su valor verdadero Binomial.
64
unidades independientes para determinar su desempeño durante el tiempo de
garantía.
a) ¿Cuál es la probabilidad de que ninguna de las unidades fallen durante el
período de garantía?
b) Cuál es el número esperado de unidades que fallan durante el período de
garantía?
c) ¿Cuál es la probabilidad de que fallen más de dos unidades durante el período
de garantía?
SOLUCIÓN
e10 (10)0
a) P( X 0) 0.000045
0!
El valor de esta probabilidad con su distribución verdadera es
500
P( X 0) (0.02)0 (0.98)500 0.000041
0
La ventaja de usar la distribución aproximada es solamente por facilidad de
cómputo.
b) E X np 500 0.02 10
2
e10 (10) x
c) P( X 2) 1 P X 2 1
x 0 x!
P( X 2) 1 0.000045 0.000454 0.002270
P( X 2) 1 0.002769 0.997231
65
EJERCICIOS PROPUESTOS 4
1. Una caja contiene 8 focos de luz eléctrica, tres de los cuales son defectuosos. De la
caja se selecciona al azar un foco y se la prueba, repitiéndose la operación hasta que
aparezca un defectuoso. Sea X la variable aleatoria que se define como el número
de extracciones necesarias hasta que aparezca el primer foco defectuoso. Determine
la distribución de probabilidades de X, si las extracciones son sin reposición.
Respuesta a) Valores: 1, 2, 3, 4, 5, 6, Probab.: 21/56, 15/56, 10/56, 6/56, 3/56, 1/56
2. En una encuesta sobre corretaje reporta que el 30% de los inversionistas individuales
ha utilizado a un corredor de descuento; esto es, uno que no cobra las comisiones
completas. En una muestra seleccionada al azar de nueve inversionistas, ¿Cuál es
la probabilidad de que:
a. Exactamente dos de los individuos de la muestra hayan empleado a un corredor de
descuento?
b. Exactamente cuatro de ellos hayan utilizado a un corredor de este tipo?.
c. Entre tres y cinco individuos inclusive hayan utilizado a un corredor de este tipo?
d. Más de cinco individuos hayan utilizado un corredor de este tipo?
3. Un estudiante debe obtener por lo menos el 60% de respuestas correctas en un
examen con 18 preguntas diseñadas cada pregunta con dos alternativas de
verdadero o falso. Si el estudiante lanza una moneda para determinar la respuesta a
cada pregunta, ¿Cuál es la probabilidad de que el estudiante pase?
4. El 75% de la mercadería que recibe un comerciante del fabricante A es de calidad
excepcional, mientras que el 80% de la mercadería que recibe del fabricante B es de
calidad excepcional. El 60% de la mercadería lo recibe de A y el resto de B. Si
seleccionan 4 unidades de la mercadería, ¿Cuál es la probabilidad que se encuentren
2 unidades que sean de calidad excepcional?.
Rpta. p=0.77, X~B(4,p), P[X=2]=0.188
6. Una empresa de electrodomésticos ha creado una nueva lavadora que realiza una
serie de funciones que no hace ninguna otra. Se está planeando una demostración,
pero les preocupa algunos problemas iniciales de producción que han hecho que, en
un 3% de las nuevas lavadoras aparezcan determinados problemas. Entonces, Si se
seleccionan exactamente 40 lavadoras al azar ¿Qué probabilidad tendrían que por
lo menos 2 no funcionen bien?
7. En un proceso de producción, la probabilidad de que se produzca cada artículo que
cumpla con ciertas especificaciones es de 0.99. En determinado momento se plantea
el objetivo de producir 150 artículos que cumplan con las especificaciones; pero al
mismo tiempo se decide detener el proceso de producción, tan luego se produzca el
primer artículo que no cumpla con las especificaciones.
66
a. ¿Cuál es la probabilidad de lograr el objetivo
b. Si después de producir 100 artículos, aún no se detenido el proceso. ¿Cuál
sería la probabilidad de lograr el objetivo?
Rpta. X= # de artículos producidos hasta que ocurra el primer defectuoso, X~G(0.01), k =
1, 2, etc. a) P[X>150]=(0.99)150, b) P[X>150/X>100]=(0.99)50
67
7. Distribución Normal
1. Distribución normal o campana de Gauss-Laplace
2. FUNCIÓN DE DENSIDAD
x 2
1
f ( x) e 2 2
2
Donde:
68
1
2
P( 2 X 2 ) 0.9545
P( 3 X 3 ) 0.9973
69
3. FUNCIÓN DE DISTRIBUCIÓN
t 2
x 1
P( X x ) F ( x ) e 2 2
dt
2
1. F(x) es continua
2. F(x) es monótona no decreciente.
3. F(-∞) = 0 y F(+∞) = 1
4. TIPIFICACIÓN O ESTANDARIZACIÓN
decir N (0,1)
z2
1
f ( z) e 2
; z
2
70
y su función de distribución es
t2
1
t
F ( z ) P( Z z ) f ( z ) e 2
dt
2
71
1
Tiene un máximo en este eje e igual a: 0.399
2
Tiene dos puntos de inflexión en z =1 y z = -1
a. P(X<13.5)
b. P(X< 9.5)
c. P(10.5 < X < 14.5)
d. P(8 < X < 12)
e. P(6 < X < 14)
f. P(|X-µ| < 2)
g. P(|X-µ| < 4)
h. P(|X-µ| < 6)
DESARROLLO
X 13.5 10
a. P( X 13.5) P
2
PZ 1.75
= 0.959941
X 9.5 10
b. P( X 9.5) P
2
PZ 0.25 = 0.401294
Si no se tiene una tabla de la normal estándar para valores negativos de
Z, se puede resolver aprovechando la simetría de la distribución:
PZ 0.25
1 PZ 0.25
= 1 – 0.598706
= 0.401294
10.5 10 X 14.5 10
c. P(10.5 X 14.5) P
2 2
P0.25 Z 2.25
PZ 2.25 P(Z 0.25)
72
= 0.987776 - 0.598706
= 0.389069
8 10 X 12 10
d. P(8 X 12) P
2 2
P 1 Z 1
PZ 1 P(Z 1)
= 0.841345 - 0.158655
= 0.682689
6 10 X 14 10
e. P(6 X 14) P
2 2
P 2 Z 2
PZ 2 P(Z 2)
= 0.977250 - 0.022750
= 0.954500
X 2
f. P(| X | 2) P
2
P Z 1
X 4
g. P(| X | 4) P
2
P Z 2
X 6
P(| X | 6) P
h. 2
P Z 3
73
= 0.998650 - 0.001350 = 0.997300
𝑃(𝑍 < 𝑍𝛼 ) = 1 − 𝛼
Z∝⁄ = Valores de Z entre los cuales hay una probabilidad acumulada igual a (1−∝),
2
se obtiene, haciendo una lectura invessa de la tabla N(0,1)
Ejemplo
Confianza Unilateral Bilateral
1-α α 𝑍∝ ∝⁄ 𝑍∝⁄2
2
0.90 0.10 1.28 0.050 1.645
0.95 0.05 1.64 0.025 1.960
0.99 0.01 2.33 0.005 2.576
74
8. Aproximación de la Binomial por la Normal (Teorema de De Moivre) :
Demostró que bajo determinadas condiciones (para n grande y tanto p como q no
estén próximos a cero) la distribución Binomial B(n, p) se puede aproximar
mediante una distribución normal con media np y varianza npq.
Esto es:
𝑛𝑝 ≥ 5 𝑦 𝑛𝑞 ≥ 5
Hay que tener en cuenta que para realizar correctamente esta transformación de
una variable discreta (binomial) en una variable continua (normal) es necesario
hacer una corrección de continuidad agregando o restando 0.5 según convenga
para un evento específico, tal como se puede apreciar en los siguientes gráficos.
75
76
MANEJO DE TABLAS. CASOS MÁS FRECUENTES.
La distribución de la variable Z se encuentra tabulada
Luego: P(170 < x <230) = P(-1.50 < z < 1.50) = P(z < 1.5) – P(z < -1.5)
77
176
Ejemplo 2. El departamento de carnes en un supermercado prepara sus paquetes de
1 Kg. de carne molida, de manera que habrá variedad en los pesos, algunos con un
poco más y algunos con un poco menos de 1 Kg. Suponga que los pesos de estos
paquetes de 1 Kg. Tienen una distribución normal con una media de 1.00 Kg. y una
deviación estándar de 0.15 Kg.
a. ¿Qué proporción de paquetes pesará más de 1 Kg.?
b. ¿Qué proporción de paquetes pesará entre 0.95 y 1.05 Kg.?
c. ¿Cuál es la probabilidad de que un paquete de carne molida, seleccionado al
azar, pese menos de 0.8 Kg.?
SOLUCIÓN
𝑋~𝑁(1, 0.152 ), 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝜇 = 1 𝐾𝑔. 𝑦 𝜎 = 0.15 𝐾𝑔.
a) 𝑃(𝑋 > 1) = 1 − 𝑃(𝑋 ≤ 1) = 1 − 𝑃(𝑍 ≤ 0) = 1 − 0.5 = 0.5
1.05−1 0.95−1
b) 𝑃(0.95 ≤ 𝑋 ≤ 1.05) = 𝑃(𝑋 ≤ 1.05) − 𝑃(𝑋 ≤ 0.95) = 𝑃 (𝑍 ≤ ) − 𝑃 (𝑍 ≤ )
0.15 0.15
78
0.8−1
c) 𝑃(𝑋 < 0.8) = 𝑃 (𝑍 < 0.15
) = 𝑃(𝑍 < −1.333) = 0.09121
Ejemplo 3. Las estaturas de los humanos son una de las muchas variables aleatorias
modeladas mediante la distribución normal Suponga que las estaturas de los varones
tienen una media de 170 cm., y una desviación estándar de 8 cm.
a. Qué proporción de todos los varones serán más altos que 160 cm.
b. ¿Cuál es la probabilidad de que un varón seleccionado al azar tenga una estatura
entre 167.6 cm y 180.3 cm?
SOLUCIÓN
𝑋~𝑁(170, 82 ), 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝜇 = 170 𝑐𝑚. 𝑦 𝜎 = 8 𝑐𝑚.
160−170
a) 𝑃(𝑋 < 160) = 𝑃 (𝑍 < 8
) = 𝑃(𝑍 < −1.25) = 0.10565
SOLUCIÓN
2 ),
𝑋~𝑁(15.2, 2.4 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝜇 = 15.2 𝑚. 𝑦 𝜎 = 2.4 𝑚.
79
12.2−15.2
a) 𝑃(𝑋 < 12.2) = 𝑃 (𝑍 < 2.4
) = 𝑃(𝑍 < −1.25) = 0.10565
15.2 − 15.2
𝑃(𝑋 < 15.2) = 𝑃 (𝑍 < ) = 𝑃(𝑍 < 0) = 0.5
2.4
18.3−15.2
b) 𝑃(𝑋 < 18.3) = 𝑃 (𝑍 < 2.4
) = 𝑃(𝑍 < 1.292) = 0.90176
80
Ejercicios propuestos 5 (Distribución Normal)
3. El volumen que una máquina de llenado automático deposita en tasas de café tiene
una distribución normal con media 12.4 onzas de líquido y desviación estándar de
0.1 onzas de líquido.
a. ¿Cuál es la probabilidad de que el volumen depositado sea menor que 12 onzas
de líquido?
b. Si se desechan todas la tasas que tienen menos de 12.1 o más de 12.6 onzas
de líquido, ¿cuál es la proporción de latas desechadas?.
c. Calcule especificaciones que sean simétricas alrededor de la media, de modo
que se incluya al 99% de todas la tasas?
81
5. Los tiempos de vida de una unidad de cierta marca de teléfono móviles sigue una
distribución normal de media 1.500 horas y desviación de 200 horas. ¿Cuál debe
ser el tiempo de garantía de estos móviles si el fabricante desea que sólo se
presenten el 5% de las averías dentro de este tiempo?
Rpta. 1171
8. El valor medio del peso de determinada marca de cereal, el año pasado, fue 0.297
kg (10.5 oz), con una desviación estándar de 0.024 kg. Suponiendo que la
distribución es normal, determinar el porcentaje de los datos que cae abajo del límite
inferior de la especificación, de 0.274 kg. (Nota: Como la media y la desviación
estándar se determinaron en una cantidad grande de pruebas durante el año, se
considera que son estimaciones válidas de los valores poblacionales).
Rpta. 0.1689
10. Un fabricante de cereal instantáneo desea que 1.5% de su producto pese menos
que la especificación de 0.567 kg (1.25 lb). Si los datos tienen distribución normal,
y la desviación estándar de la llenadora de cereal es 0.018 kg, ¿qué peso medio se
requiere?
Rpta. 𝜇 = 0.606
11. Es común que las aerolíneas y hoteles concedan reservaciones en exceso para
reducir pérdidas por personas que no se presentan. Suponga que el registro de un
hotel muestran que, en promedio 10% de sus probables huéspedes no reclaman su
reservación. Si el hotel acepta 215 reservaciones y sólo hay 200 habitaciones en el
82
hotel, ¿Cuál es la probabilidad de que los huéspedes que llegan a reclamar su
reservación reciban la habitación?
Rpta. X~N° de clientes que ocupan su habitación reservada, X ~ B(215, 0.9), P(X=200)=0.03174
Utilizando la Distribución normal con µ=np=193.5 y σ2=npq=19.35, como una aproximación de
la Binomial, P(X=200) = 0.03052
13. Los puntajes de una prueba de aptitud académica están distribuidos normalmente
con una media de 60 y una desviación estándar de 10 puntos.
83
porcentaje de granos con impurezas por saco es una variable aleatoria cuyo modelo
de probabilidad es normal con media y desviación estándar respectivas de 6% y
2% para A, y de 8% y de 3% para B.
Rpta. a) P=0.4xP[Z>2]+0.6xP[Z>0.67]=0.4x0.0228+0.6x0.2514=0.15996 b)
0.4x0.0228/0.15996
84
MUESTREO
TERMINOLOGÍA TÉCNICA:
85
2.1.1.1.6. UNIDAD DE OBSERVACIÓN.-
Son los elementos de la población sobre los cuales se medirán las variables de
interés. Ésta es la unidad básica, a veces llamada elemento. En los estudios de
poblaciones humanas la unidad de observación son los individuos.
2.1.1.1.7. POBLACION.-
Es el conjunto de todas las unidades de análisis cuyas características se van a
estimar. Una población debe definirse en términos de su contenido, extensión y
tiempo
Una población en estudio debe estar definida sin ambigüedad, de manera que
no dé lugar a confusiones.
2.1.1.1.8. POBLACION OBJETIVO.-
La población objetivo está constituida por todos los elementos (unidades de
observación), sin límite a través del tiempo y del espacio, que constituyen el
objetivo final de la generalización o inferencia.
POBLACION MUESTRAL.-
La población muestral está constituida por una parte o un subconjunto de la
población objetivo. Está determinada y delimitada en el tiempo y en el espacio y de
cuyos elementos en la práctica se obtiene la muestra para realizar el estudio.
2.1.1.1.9. MUESTRA.-
Una muestra es un conjunto de unidades, una porción del total, que nos
representa la conducta del universo en su conjunto.
Una muestra, en un sentido amplio, no es más que eso, una parte del todo
que llamamos universo y que sirve para representarlo.
Sin embargo, no todas las muestras resultan útiles para llevar a cabo un
trabajo de investigación. Lo que se busca al emplear una muestra es que,
observando una porción relativamente reducida de unidades, se obtengan
conclusiones semejantes a las que lograríamos si estudiáramos el universo
total. Cuando una muestra cumple con esta condición, es decir, cuando nos
refleja en sus unidades lo que ocurre en el universo, la llamamos muestra
representativa. Por lo tanto, una muestra representativa contiene las
características relevantes de la población en las mismas proporciones en que
están incluidas en tal población. Sus conclusiones son susceptibles de ser
generalizadas al conjunto del universo, aunque para ello debamos añadir un
cierto margen de error en nuestras proyecciones.
Las muestras pueden ser clasificadas, en una primera división en
probabilísticas y no probabilísticas.
86
En las muestras probabilísticas, la característica fundamental es que todo
elemento del universo tiene una determinada probabilidad de integrar la
muestra, y esa probabilidad puede ser calculada matemáticamente con
precisión. En las muestras no probabilísticas ocurre lo contrario y el
investigador no tiene idea del error que puede estar introduciendo en sus
apreciaciones.
Ejemplo:
Podríamos querer estudiar a las personas, pero no tenemos una lista de todos
los individuos que pertenecen a la población objetivo. En vez de esto, la
vivienda sirven como las unidades de muestreo y las unidades de observación
son los individuos que viven en una vivienda.
87
Población Muestral: Todos los residentes del distrito de Chiclayo
Ejemplo: Si se desea estudiar factores que influyen, para drogarse, en los Jóvenes
de una determinada ciudad, no se podría tener información sobre cuántos son,
dónde viven, como se llaman, por lo que sería imposible extraer una muestra de estos
Jóvenes. El investigador tendría que tomar una muestra de casas para poder llegar
a los Jóvenes.
3. TIPOS DE MUESTREO
4. MUESTRAS NO ALEATORIAS
88
necesitamos estudiar directamente y, además, actuar sin los tediosos procesos de
selección aleatoria y verificación estadística.
Sin embargo, hay una desventaja: corremos un gran riesgo de obtener demasiado
sesgo en la muestra. No seremos capaces siquiera de advertir la presencia, y menos
aún la cantidad, de sesgo si hacemos personalmente la selección de la muestra. Y
la presencia de sesgo puede hacer imposible generalizar nuestros resultados.
Un modo de reducir el sesgo hasta cierto punto es dejar a otra persona o grupo la
selección de los elementos.
Una muestra de voluntarios suele ser una alternativa bastante sensata; no obstante,
el investigador debe considerar cuidadosamente los riesgos de sesgo. Hay dos
cuestiones que plantearse:
¿Es cierto que todos los miembros de la población bajo muestreo tenían las mismas
oportunidades de ser incluidos en la muestra? Por definición, los voluntarios difieren
de la media de la población en su mayor actividad. La cuestión crucial entonces es
¿difieren del resto de la población también en otros aspectos?.
89
mejor posición para dar información sobre ese tema; podríamos también pedirles
que nos indicasen personas que compartan sus puntos de vista y también otras que
sean de opinión opuesta. Entonces entrevistaremos a nuevos individuos y
continuaremos del mismo modo hasta que no obtengamos nuevos puntos de vista
de nuevos entrevistados. Este es un buen método por ejemplo para recoger los
distintos puntos de vista existentes en un grupo, pero su inconveniente es que no
obtenemos una idea exacta de la distribución de las opiniones.
Recordemos también que no tenemos que incluir elementos que no sean miembros
de la población en nuestra muestra.
Por ejemplo, podríamos decidirnos (de forma bastante sensata) por investigar
las preferencias de los clientes de electrodomésticos entrevistando a
vendedores. O podríamos estudiar las historias de vida de arrendatarios
mediante un cuestionario a administradores de casas o caseros. La idea es
factible, ya que esta gente habitualmente conoce mucho sobre el tema. Sin
embargo, los "especialistas" no pueden ser tomados como muestra de "no
especialistas". Son dos poblaciones diferentes. No debiéramos generalizar
los resultados de "especialistas" a ninguna otra población que no sea la de
"especialistas", cualquiera que sea el campo del que tratemos.
En los ejemplos de arriba, podríamos tal vez continuar transformando los resultados
a partir de los especialistas en hipótesis que más tarde verificaríamos con una
muestra apropiada de la población "real" o de no especialistas, que serían en los
ejemplos citados, respectivamente, los consumidores y los arrendatarios. En otras
palabras, podríamos usar la entrevista de los especialistas sólo como un estudio
preliminar.
Antes de decidir el tamaño de una muestra no aleatoria, tal vez debamos leer cómo
debe ser evaluada la representatividad de los resultados a partir de una muestra no
aleatoria. De otro modo podríamos sufrir una sorpresa bastante desagradable
90
cuando estemos intentando, demasiado tarde, definir la población en que nuestros
resultados puedan ser declarados válidos.
6. ERROR DE MUESTREO:
91
Para fijar el tamaño de la muestra adecuado a cada investigación, es preciso
primero determinar el porcentaje de error que estamos dispuestos a admitir.
Una vez hecho esto, deberán realizarse las operaciones estadísticas
correspondientes para poder calcular el tamaño de la muestra que nos permite
situarnos dentro del margen de error aceptado.
Simbólicamente: Error de estimación = / /
Una muestra aleatoria simple se extrae por selección aleatoria empleando los
números aleatorios, este proceso ofrece la oportunidad de que todos los elementos
que no han sido sacados previamente tengan igual probabilidad de pertenecer a la
muestra.
92
geográfica de los elementos muestrales no constituye un problema; así es
relativamente fácil y barato seleccionar las unidades muestrales. El inconveniente en
poblaciones grandes es conseguir una lista completa o exacta de la población (marco
muestral). Otro problema conexo es el costo de determinar el número de elementos
de la muestra y recabar información a partir de cada elemento (poblaciones
heterogéneas) Por ejemplo, la muestra puede contener elementos que se hallan muy
dispersos por lo tanto, para efectuar entrevistas personales se requieren fuertes
desembolsos por concepto de viaje.
Z 2 2
n 2
Z 2 2
d2 2
N
93
Donde:
n Tamaño de muestra
Probabilidad de
confianza (1 )
Probabilidad de
significancia: ( ) 𝑍∝
2 Z
2
94
Técnicas de estimación de la varianza 2
2
2° Posibilidad: Utilizar la varianza s de la misma población obtenida en un
estudio anterior resiente.
Máximo Mínimo
2
ˆ 2
6
95
̂ 0.24Máximo Mínimo
ˆ 2 s 2
96
10 de estos estudiantes que acudieron a su control médico en la Dirección de
Bienestar universitario, se estima una desviación estándar de 6.6 Kgr. Si
deseamos tener un máximo error de muestreo de 1.5 Kgr. y una confianza de
0.95.¿Cuál será el tamaño de muestra mínimo requerido?
Z 2 2
n 2
Z 2 2
d2 2
N
Población N = 400
Confianza (1-α) 0.95
Significancia (α) 0.05
(1-α/2) 0.975
Z 1.960
Error 1.500
DE(x) = σ = 6.6
Tamaño de muestra n = 63
1.96 2 6.6 2
n 63
1.96 6.6 2
1 .5
2
400
Ejemplo 2
SOLUCIÓN
97
Entonces el estimador de la desviación estándar será: 𝜎 = 0.24 (19 − 7) = 2.88
1
Y el estimador de la media será: 𝜇 = 7 + 3 (19 − 7) = 11
𝜎 2.88
El coeficiente de variación será 𝐶𝑉(𝑋) = 𝜇
= 11
= 0.26 = 26% < 33%
Como se quiere estimar la media poblacional 𝜇, con una precisión 𝑑 = 0.6 𝑝𝑢𝑛𝑡𝑜𝑠
y una confianza (1 − 𝛼) = 0.95 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑍𝛼⁄2 = 1.96 , la formula para el tamaño
de muestra será
𝑍𝛼2⁄2 × 𝜎 2
𝑛=
𝑍𝛼2⁄2 × 𝜎 2
𝑑2 +
𝑁
Reemplazando tenemos:
1.962 × 2.882
𝑛= = 79.7 ≈ 80 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠
1.962 × 2.882
0.62 + 800
Elementos de la muestra:
98
Z 2 pq
n 2
Z 2 pq
d2 2
N
Donde:
n Tamaño de muestra
Z Desvío Normal para una confianza (1 ) . (Sus valores se obtienen de la
2
99
p.q tiende a cero cuando p tiende a cero o a 1; en cambio toma su máximo valor
cuando p = 0.5.
Ejemplo 1
SOLUCIÓN
Ejemplo 2
100
Se desea determinar el tamaño de muestra para estimar la proporción de
mujeres P con infección vaginal entre las que acuden al servicio de Obstetricia
del Hospital Regional Docente Las Mercedes de Chiclayo:
Z 2 pq
n 2
Z 2 pq
d2 2
N
Entonces: q = 1 - p = 0.70
1° Caso: H o : o
101
H a : o
2
Z Z 2
n 2
2
Donde:
Probabilidad de error tipo I, o nivel de significancia de la prueba
Probabilidad de error tipo II
o
102
2° Caso: H o : o
H a : o ó H a : o
n
Z Z 2
2
2
Donde:
o
n
Z Z 2
2
2
Donde:
𝛼 = 𝛽 = 0.01
𝑍𝛼 = 𝑍𝛽 = 2.33
103
3° Caso: H o : 1 2
H a : 1 2
2
Z Z ( 2 2 )
n 2 1 2
2
Donde:
1 2
4° Caso: H o : 1 2
H a : 1 2 ó H a : 1 2
n
Z Z ( 12 22 )
2
2
Donde:
Probabilidad de error tipo I, o nivel de significancia de la prueba
Probabilidad de error tipo II
1 2
Ejemplo
Se desea calcular el tamaño de muestra para comparar la aptitud promedio de
dos poblaciones de estudiantes preuniversitarios mediante una prueba
unilateral en donde se sospecha que el rendimiento de la segunda población
es mayor que el de la primera, para lo cual se tomaron dos muestras aleatorias
previas de tamaños 20 y 25 respectivamente, encontrando las desviaciones
estándar respectivas de 8 y 7 puntos las cuales serán consideradas como
estimadores de las desviaciones estándar poblacionales. Se desea tener una
confianza y potencia para la prueba igual a 95%. Se supone que la diferencia
104
entre las medias poblacionales es de 6 puntos. Calcule el tamaño de muestra
para cada población.
SOLUCIÓN
n
Z Z ( 12 22 )
2
2
Donde:
𝜎12 = 𝑠12 = 82 = 64
𝜎22 = 𝑠22 = 72 = 49
𝛿 = |𝜇1 − 𝜇2 | = 6
1° Caso: H o : P Po
H a : P Po
2
Z Po Qo Z pq
n 2
2
Donde:
105
Probabilidad de error tipo II
p Po
Qo 1 Po
p proporción muestral
q 1 p
2° Caso: H o : P Po
H a : P Po ó H a : P Po
n
Z Po Qo Z pq
2
2
Donde:
Probabilidad de error tipo I, o nivel de significancia de la prueba
Probabilidad de error tipo II
p Po
Qo 1 Po
p proporción muestral
q 1 p
106
SOLUCIÓN
2
(𝑍𝛼 √𝑃𝑜 𝑄𝑜 + 𝑍𝛽 √𝑝𝑞)
𝐸𝑙 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑠𝑒𝑟á: 𝑛 =
𝛿2
2
(1.96√0.3 × 0.7 + 1.282√0.25 × 0.75)
𝑛= = 476
0.062
Respuesta: Se requiere seleccionar una muestra aleatoria de 476 cuentas por pagar.
3° Caso: H o : P1 P2
H a : P1 P2
2
Z p1 p2 q1 q2 / 2 Z p1q1 p2 q2
n 2
2
Donde:
Probabilidad de error tipo I, o nivel de significancia de la prueba
Probabilidad de error tipo II
P1 P2
4° Caso: H o : P1 P2
H a : P1 P2 ó H a : P1 P2
107
n
Z p1 p2 q1 q2 / 2 Z p1q1 p2 q2 2
2
Donde:
Probabilidad de error tipo I, o nivel de significancia de la prueba
Probabilidad de error tipo II
P1 P2
Ejemplo:
n
Z p1 p2 q1 q2 / 2 Z p1q1 p2 q2 2
2
n = tamaño de muestra para cada grupo
108
n
1.645 0.01 0.180.99 0.82 / 2 1.645 0.01 0.99 0.18 0.82
2
62
0.01 0.182
Ho : P1 P2
Ha : P1 P2
2
Z 2 pq Z p1q1 p2 q2
n 2
2
Donde:
Probabilidad de error tipo I, o nivel de significancia de la prueba
Probabilidad de error tipo II
p1 Casos
p2 Controles
p2 p2
p : Proporción mancomunada
2
q 1 p
P1 P2
Ejemplo: Se necesita calcular el tamaño de muestra para una investigación con
diseño de casos y controles, para probar una hipótesis de que la proporción de partos
exitosos con método de inducción es mayor a la proporción de partos exitosos
cuando no se usa este tratamiento. ´
109
Ho: P1=P2 contra
Ha: P1>P2
La fórmula que corresponde ser utilizada es:
n
Z 2 pq Z p1q1 p2 q2
2
p1 p2 2
𝑛 = Tamaño de muestra mínimo para cada grupo: Casos y controles
Z𝛼 = 1.645 : Desvío normal para una significancia del 0.05
Z𝛽 = 1.645 : Desvío normal para una significancia de 0.05
𝑝1 = 0.8 :Proporción de inducción exitosa del parto usando el tratamiento
(Caso)
𝑝2 = 0.6 :Proporción de partos exitosos sin usar tratamiento (control)
q1 = 1 − p1 = 1 − 0.8 = 0.2
q1 = 1 − p1 = 1 − 0.8 = 0.2
𝑝1 +𝑝2 0.8+0.6
𝑝= = = 0.7 y 𝑞 = 1 − 𝑝 = 1 − 0.7 = 0.3
2 2
2
(1.645 × √2 × 0.7 × 0.3 + 1.645 × √0.8 × 0.2 + 0.4 × 0.4)
𝑛= = 111
(0.8 − 0.6)2
Respuesta:
El tamaño de muestra será n1 = 111 casos y n2 = 111 controles
110
variabilidad en cada subpoblación no exceda el 33%, aun cuando la
población general dicha variabilidad sea mayor que el 33%.
111
Tamaño general de muestra para estimar la media poblacional con
asignación de Neyman en el MAE.
Este tipo de asignación toma en cuenta el tamaño y dispersión interna de
cada estrato
(∑ 𝑊ℎ 𝑆ℎ )2
𝑛=
∑ 𝑊ℎ 𝑆ℎ2
𝑉+ 𝑁
𝑊ℎ 𝑆ℎ
𝑛ℎ = ×𝑛
∑ 𝑊ℎ 𝑆ℎ
112
Confianza (1-α/2) = 0.95
Desvío Normal 𝑍𝛼⁄2 = 1.96
Precisión (3.5% de la media) d = 0.5
Media estratificada 𝑥̅𝑠𝑡 = ∑3ℎ=1 𝑊ℎ 𝑥̅ℎ = 14.255
Varianza deseada: V=(d/Z)2 = 0.06507944
Calculo del tamaño de muestra general para investigar competencias básicas
de comprensión lectora:
(∑ 𝑊ℎ 𝑆ℎ )2 (2.3786)2
𝑛= = = 73
∑ 𝑊ℎ 𝑆ℎ2 0.06507944 + 5.6697
𝑉+ 𝑁 450
𝑊1 𝑆1 0.7406
𝑛1 = ×𝑛= × 73 = 23
∑ 𝑊ℎ 𝑆ℎ 2.3786
𝑊2 𝑆2 0.7980
𝑛2 = ×𝑛= × 73 = 24
∑ 𝑊ℎ 𝑆ℎ 2.3786
𝑊3 𝑆3 0.8400
𝑛3 = ×𝑛= × 73 = 26
∑ 𝑊ℎ 𝑆ℎ 2.3786
Institución Educativa N° de
(Estrato h) Estudiantes Promedio en Desv. Estánd. Ponderación: muestra del
Nh Lenguaje Lenguaje Sh Wh Wh. Sh Wh.Sh^2 estrato: nh
Elvira García 148 14.20 2.25 0.329 0.7406 1.6675 23
Magdalena Sofía 152 13.82 2.36 0.338 0.7980 1.8854 24
San José 150 14.75 2.52 0.333 0.8400 2.1168 26
Total 450 1.000 2.3786 5.6697 73
(∑ 𝑊ℎ 𝑆ℎ )2 (2.9521)2
𝑛= = = 103
∑ 𝑊ℎ 𝑆ℎ2 0.06507944 + 8.7850
𝑉+ 450
𝑁
𝑊1 𝑆1 1.0591
𝑛1 = ×𝑛 = × 103 = 37
∑ 𝑊ℎ 𝑆ℎ 2.9521
113
𝑊2 𝑆2 0.8763
𝑛2 = ×𝑛 = × 103 = 31
∑ 𝑊ℎ 𝑆ℎ 2.9521
𝑊3 𝑆3 1.0167
𝑛3 = ×𝑛 = × 103 = 35
∑ 𝑊ℎ 𝑆ℎ 2.9521
Cuadro de cálculos del tamaño de muestra para investigar competencias básicas de Matemáticas
en tres instituciones Educativas de Chiclayo
Institución N° de Desv. Estánd.
Educativa Estudiantes Promedio en Matemáticas Ponderación: muestra del
(Estrato h) Nh Matemáticas Sh Wh Wh. Sh Wh.Sh^2 estrato: nh
Elvira García 148 13.94 3.22 0.329 1.0591 3.4107 37
Magdalena Sofía 152 14.11 2.59 0.338 0.8763 2.2734 31
San José 150 14.92 3.05 0.333 1.0167 3.1008333 35
Total 450 1.000 2.9521 8.7850 103
𝑛ℎ
Siendo 𝑓ℎ = = 𝐹𝑟𝑎𝑐𝑐𝑖ó𝑛 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑒𝑜
𝑁ℎ
114
Donde: 𝑍𝛼⁄2 = 𝐷𝑒𝑠𝑣𝑖𝑜 𝑁𝑜𝑟𝑚𝑎𝑙 𝑝𝑎𝑟𝑎 𝑢𝑛𝑎 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 (1 − 𝛼)
Ejemplo
Obtenga un intervalo de confianza de 0.95 para la media poblacional del
rendimiento académico en Lenguaje, a partir de una muestra obtenida
con un muestreo estratificado, cuyas medidas de resumen se muestran
en el siguiente cuadro.
N1=23 N1=23
N1=23
𝑥̅1 = 14.2 𝑥̅2 = 13.82 𝑥̅3 = 14.75
𝑠1 = 2.25 𝑠2 = 2.36
𝑠3 = 2.52
Solución
Desv.
N° de Promedio. Ponderación 𝑠ℎ2
Institución Estánd.
Estudiantes Lenguaje 𝑁ℎ 𝑥̅ℎ 𝑊ℎ 𝑊ℎ2 (1 − 𝑓ℎ )
Educativa Muestra Lenguaje 𝑊ℎ = 𝑛ℎ
𝑁ℎ 𝑥̅ℎ 𝑁
𝑛ℎ 𝑠ℎ
Elvira
148 14.200 2.25
García 23 0.3289 4.6702 0.02011
Magdalena
152 13.820 2.36
Sofía 24 0.3378 4.6681 0.02230
San José 150 26 14.750 2.52 0.3333 4.9167 0.02243
115
Suma 450 73 14.2550 0.06484
2
(∑ 𝑊ℎ √𝑝ℎ 𝑞ℎ )
𝑛=
∑ 𝑊ℎ 𝑝ℎ 𝑞ℎ
𝑉+
𝑁
Donde:
N = Tamaño general de la Población
n = Tamaño general de muestra
Wh = Nh/N = Ponderación del estrato h en la población
V = (d/𝑍𝛼⁄2 )2 = Varianza deseada al estimar la media poblacional
ph = Proporción estimada en el estrato h.
qh = 1-ph
𝑊ℎ √𝑝ℎ 𝑞ℎ
Tamaño de muestra en los estratos: 𝑛ℎ = ×𝑛
∑ 𝑤ℎ √𝑝ℎ 𝑞ℎ
116
Población: La población lo constituyen los 6120 estudiantes de la USAT
matriculados en el semestre académico 2011-I, clasificados según
carrera profesional.
Administración
Admi Administración Psicología
de empresas hotelera N18 = 301
N1 = 1141 N2 = 291
d = 0.05
(1-α)=0.95
n18 = 30
n1 = 69 n2 = 18
Tamaño general de
muestra pst = Estimado
estratificado de P
n = 413
El tamaño general de muestra:
(Wh ph qh ) 2
n ,
V Wh ph qh
N
Donde
2
d
V Varianza deseada del estimador de la proporción
z
117
Asumimos: Una confianza (1-α) de 0.95, para el cual, el desvío normal es
Z = 1.96
Una precisión (máximo error de muestreo tolerado) d 0.05
2
0.05
V 0.000651
1.96
(0.474033) 2
n 327
0.225107
0.000651
6120
Wh ph qh
nh n
W h ph qh
Cuadro N° 2 Cálculo del tamaño de muestra estratificado con asignación de Neyman para estudiantes
de la USAT matriculados en el semestre académico 2011-I.
Proporción de
Matriculados N estudiantes con
ESTRATO (h) Wh h calidad de qh 1 ph Wh ph qh Wh ph qh nh nh (corr )
(2011-I): Nh N sueño deficiente
Carrera profesional
ph
ADM. DE EMPRESAS 1131 0.1848 0.3 0.7 0.084686 0.038808 58 58
ADM. HOTELERA Y
DE SERVICIOS
289 0.0472 0.25 0.75 0.020438 0.00885 14 30
CONTABILIDAD 479 0.0783 0.3 0.7 0.035882 0.016443 25 30
118
ECONOMÍA 177 0.0289 0.3 0.7 0.013244 0.006069 9 30
EDUCACIÓN (inicial,
Prim. y Secundaria.) 254 0.0415 0.25 0.75 0.017970 0.00778125 12 30
COMUNICACIÓN 220 0.0359 0.4 0.6 0.017587 0.008616 12 30
DERECHO 703 0.1149 0.4 0.6 0.056289 0.027576 39 39
ARQUITECTURA 234 0.0382 0.4 0.6 0.018714 0.009168 13 30
ING. CIVIL Y AMB. 320 0.0523 0.4 0.6 0.025622 0.012552 18 30
ING. DE SIST. Y
COMP.
398 0.0650 0.6 0.4 0.031843 0.0156 22 30
ING. ENERGÉTICA 9 0.0015 0.4 0.6 0.000735 0.00036 1 9
ING. INDUSTRIAL 415 0.0678 0.6 0.4 0.033215 0.016272 23 30
ING. MECÁNICA
ELÉCTRICA
71 0.0116 0.6 0.4 0.005683 0.002784 4 30
ING. NAVAL 28 0.0046 0.4 0.6 0.002254 0.001104 2 28
ENFERMERÍA 589 0.0962 0.4 0.6 0.047128 0.023088 32 32
MEDICINA 296 0.0484 0.7 0.3 0.022180 0.010164 15 30
ODONTOLOGÍA 207 0.0338 0.6 0.4 0.016559 0.008112 11 30
PSICOLOGÍA 300 0.0490 0.4 0.6 0.024005 0.01176 17 30
TOTAL 6120 1.0000 0.474033 0.225107 327 556
Ejemplo
Obtenga un intervalo de confianza para la proporción poblacional de
estudiantes con calidad de sueño deficiente en los estudiantes de la Facultad
de Ciencias Empresariales
Estrato (h) 𝑁ℎ 𝑊ℎ 𝑝ℎ 𝑞ℎ 𝑝ℎ 𝑊ℎ 𝑝ℎ . 𝑞ℎ 𝑁ℎ − 𝑛ℎ 𝑛ℎ
𝑊ℎ2 ( )
𝑛ℎ 𝑁ℎ − 1
ADM. DE EMPR. 1131 0.5448 0.3 0.7 0.1634 0.001020 58
ADM. HOTELERA 289 0.1392 0.25 0.75 0.0348 0.000248 14
CONTABILIDAD 479 0.2307 0.3 0.7 0.0692 0.000425 25
ECONOMÍA 177 0.0853 0.3 0.7 0.0256 0.000162 9
119
Suma 2076 0.2930 0.001855
120
o Por ejemplo tenemos un censo actualizado de un sector de
salud que tiene 2 189 individuos distribuidos en 8 manzanas del
siguiente modo:
Manzana: 1 2 3 4 5 6 7 8
Tamaño : 114 222 525 308 205 191 414 210
Pasos:
1. Crear una lista de las UPE (conglomerados) y obtener los tamaños
acumulados Di = N1 + N2 + ... + Ni a lo largo de la misma:
Marco muestral de Unidad Primaria Elemental (UPE)
UPE i Tamaño Ni Tamaño acumulado Di
1 114 114
2 222 336
3 525 861
4 308 1169
5 205 1374
6 191 1565
7 414 1979
8 210 2189
121
3°. Seleccionar un número aleatorio R entre 1 e I. En nuestro caso de 1
en 547. Supongamos que al seleccionar un número aleatorio se
obtiene R = 369
Se calculan los números
Z1 =R, Z2 =R+I, Z3 = R+2I …. Zm = R+(m-1)I
Asociar cada uno de estos números con una UPE del modo siguiente:
se selecciona en cada caso la primera UPE cuyo tamaño acumulado
supere o iguale al número en cuestión.
De este modo, 369 identifica a la manzana 3 ( pues C3 = 861 es el
primer valor que supera 369); 916 identifica a la UPE número 4 por
ser 1 169 el primer acumulado que lo supera; 1 463 a la manzana 6
y 2 010 a la última.
122
Ejercicios 6 (Muestreo)
4 12 6 8 4 5 7 5 9 7 4 5 11 6 7 6 8 4 8 3
7 5 5 11 6 3 5 9 6 5 6 5 3 11 6 4 6 6 6 7
123
veces más bienes que los existentes en una casa en el estrato de renta baja, y
se espera que Sh sea proporcional a la raíz cuadrada de la media del estrato.
Existen 4 000 familias en el estrato de renta alta y 20 000 familias en el estrato
de renta baja. ¿Cómo distribuiría una muestra de 1000 familias entre los dos
estratos?
124
socioeconómicas de dicho pueblo joven realizado en el 2016, se sabe que la
proporción de hogares en los que se consumía leche fresca fue de 0.30 y que
en el lugar existen un total de 1189 familias residentes en viviendas agrupadas
en 37 manzanas. Si deseamos tener una precisión para la estimación de 0.05 y
una confianza de 0.95, Cuál será el tamaño de muestra para el propósito de
esta investigación? (considere para este cálculo usar un muestreo aleatorio
simple). Considerando una cantidad fija de 20 viviendas por manzana
seleccionada para un muestreo por conglomerados con probabilidades
proporcionales al tamaño, ¿Cuáles serán las manzana seleccionadas?.
125
características socioeconómicas, de dicho pueblo joven, hecha por un
grupo de Investigadores de la UNPRG en el 2016, se sabe que en el lugar
existen un total de 2987 familias residentes en viviendas agrupadas en
113 Manzanas. Estas manzanas fueron agrupadas en cinco zonas
residenciales o estratos, de las que se sabe además del número de
viviendas por estrato, se sabe también la proporción de familias que
consumen leche fresca. Tal como aparece en el siguiente cuadro.
126
Diseño de muestra para estimar la proporción de familias que
consumen Leche Fresca en el P.J. STM 2016
N° Viviendas
Zona N° por estrato Ponderación Proporción
(Estrato) h Mz. Nh Wh ph
1 20 410 0.137 0.25
2 37 994 0.333 0.3
3 16 354 0.119 0.35
4 20 714 0.239 0.25
5 20 515 0.172 0.36
Total 113 2987 1.000
127