You are on page 1of 10

Teoría de la Estimación Estadística

Razón para estimar


Los administradores utilizan las estimaciones porque se deben tomar decisiones racionales, sin
que tengan la información pertinente completa y con una gran incertidumbre acerca de lo que
pueda deparar el futuro, pero con la esperanza de que las estimaciones posean una semejanza
razonable con el resultado.
Estimador
Es la regla o procedimiento, expresado en general por medio de una fórmula, que se utiliza para
deducir la estimación.
Estimación
Es un valor específico observado de un estimador, por lo que asigna un valor numérico a un
parámetro de una población sobre la base de datos de muestra.
Características que debe tener un buen estimador
a) Debe ser insesgado: un estimador es insesgado, si en promedio, tiende a tomar valores que
están por encima del parámetro de la población con la misma frecuencia y la misma extensión,
con la que tiende a asumir valores por debajo del parámetro de población que se está estimando.
b) Debe ser eficiente: de varios estimadores insesgados, el más eficiente es el que tiene el error
estándar más pequeño.
c) Debe ser consistente: significa que a medida que aumenta el tamaño de la muestra, la
estimación se aproxima al valor del parámetro.
d) Debe ser suficiente: significa que ningún otro estimador puede suministrar más información
sobre el parámetro.
Tipos de estimación
a) Estimación puntual: consiste en un solo estadístico muestral que se usa para estimar el valor
verdadero de un parámetro de una población que es desconocido. Por ejemplo, la media
muestral 𝑥̅ es una estimador puntual de la media poblacional μ.
Cuando usamos una estimación puntual, sabemos que aunque usemos un método bueno de
estimación es prácticamente improbable que el valor de la estimación coincida con el verdadero
valor del parámetro, así que sería conveniente acompañar nuestra estimación con alguna medida
que nos permitiera expresar la cercanía del estimador al parámetro. Una solución a ello no los
brindan los estimadores por Intervalos de Confianza.
b) Estimación por intervalo: es la estimación de un parámetro de la población dado por dos
números entre los cuales se puede considerar que se encuentra el parámetro. Las
estimaciones de intervalo indican la precisión de una estimación y son, por lo tanto,
preferibles a las estimaciones puntuales.
Supongamos que, con la ayuda de la información muestral, podemos encontrar dos variables U y
V, con U menor que V, tales que: 𝑃(𝑈 < 𝜃 < 𝑉) = 1 − 𝛼, para todo 𝛼 ∈ (0,1)
 La fracción 1 − 𝛼 recibe el nombre de grado de confianza, 𝛼 se llama nivel de significancia
y el intervalo U hasta V es un estimador por intervalo de 𝜃 del (1 − 𝛼)100%
Grado de Confianza
Es la probabilidad asociada con una estimación de intervalo de un parámetro de población. Ésta
indica qué tan seguro se está de que la estimación de intervalo incluirá al parámetro de la
población. Los niveles de confianza que más se utilizan son 90%, 95% y 99%.
Intervalo de Confianza
Es el alcance, rango o recorrido de la estimación que se hace y que tiene designada una
probabilidad de que incluya el valor real del parámetro de la población que se está estimando.
Límites de Confianza
Son el límite inferior y superior de un intervalo de confianza. ( U y V)

Interpretación de los intervalos de confianza


Un intervalo de confianza se puede interpretar de dos maneras diferentes. Ejemplo: una directora
de tiendas cree que el gasto medio de sus clientes en el último año se encuentra en el intervalo de
35 a 38 dólares y concede una significación del 95% a ese intervalo.
 Interpretación 1: confía al 95% en que la media poblacional se encuentra entre 35 y 38
dólares. Nota: no significa que haya una probabilidad del 95% de que μ se encuentre entre
35 y 38 dólares. En sentido apriorístico (antes de formar el intervalo de confianza) hay una
probabilidad del 95% de construir un intervalo que comprenda a μ, pero una vez fijado el
intervalo, μ está o no está comprendido en él; es decir, el 95% de probabilidad se asigna a
nuestro grado de confianza de que μ se encuentra en el intervalo, no a la probabilidad de
que esté en él.
 Interpretación 2: si se construyen todos los intervalos de confianza posibles, el 95% de
ellos incluirá el parámetro desconocido.
Probabilidad de error (el valor α)
Es la proporción de intervalos que no contienen el valor desconocido del parámetro. Se calcula
utilizando el nivel de significancia: α = 1 – grado de Confianza.

 Intervalo de confianza para la media


- Caso I
 Población normal y varianza conocida.
 Población normal, varianza desconocida y 𝑛 ≥ 30
 Población desconocida (o no normal), varianza conocida o desconocida y 𝑛 ≥ 30
Entonces, el intervalo de confianza de (1 − 𝛼)100% para 𝜇 es
𝜎 𝜎
𝑥̅ − 𝑍𝛼⁄2 < 𝜇 < 𝑥̅ + 𝑍𝛼⁄2
√𝑛 √𝑛
𝑥̅ −𝜇
Siendo 𝑍𝛼⁄ el valor de 𝑍 =
2 𝜎 a la derecha del cual se tiene un área de 𝛼⁄2 en la
⁄ 𝑛

distribución normal.
Ejemplo: Si una muestra aleatoria de tamaño 𝑛 = 20 tomada de una población normal con la
varianza 𝜎 2 = 225 tiene la media 𝑥̅ = 64,3 construya un intervalo de confianza del 95% de la
media de la población 𝜇.
Se cumple la primera condición
𝑥̅ = 64.3
𝜎 2 = 225 → 𝜎 = √225 = 15
𝑛 = 20
1 − 𝛼 = 0.95 → 𝛼 = 0.05 → 𝛼⁄2 = 0.025

𝑝(𝑧 > 𝑘) = 0.025


𝑝(𝑧 < 𝑘) = 1 − 0.025
𝑝(𝑧 < 𝑘) = 0.975
𝑍𝛼⁄2 = 𝑘 = 1.96
15 15
64.3 − 1.96 < 𝜇 < 64.3 + 1.96
√20 √20
64.3 − 6.574 < 𝜇 < 64.3 + 6.574
57.725 < 𝜇 < 70.874
Respuesta: Con una confianza del 95% la media poblacional esta entre 57.725 y 70.874 unidades

- Caso II
 Población normal, varianza desconocida y 𝑛 < 30
Entonces, el intervalo de confianza de (1 − 𝛼)100% para 𝜇 es
𝜎 𝜎
𝑥̅ − 𝑡𝛼⁄2,𝑛−1 < 𝜇 < 𝑥̅ + 𝑡𝛼⁄2,𝑛−1
√𝑛 √𝑛
𝑥̅ −𝜇
Siendo 𝑡𝛼⁄ el valor de
2
𝑡= 𝑠 a la derecha del cual se tiene un área de 𝛼⁄2 en la
⁄ 𝑛

distribución t-student con n-1 grados de libertad.

Ejemplo. Un fabricante de pintura desea determinar el tiempo de secado en promedio de una


nueva pintura para interiores. Si en 12 arcas de prueba de igual tamaño él obtuvo un tiempo de
secado medio de 𝑥̅ = 66.3 minutos y una desviación estándar de 𝑠 = 8,4 minutos, suponga que la
distribución de los tiempos de secado es normal, construya un intervalo de confianza del 95% para
la media verdadera 𝜇.
Como la población es normal, varianza poblacional es desconocida y 𝑛 < 30
𝑥̅ = 66.3
𝑠 = 8.4
𝑛 = 12
1 − 𝛼 = 0.95 → 𝛼 = 0.05 → 𝛼 ⁄ 2 = 0.025
𝑝(𝑡𝑛−1 > 𝑘) = 0.025
𝑝(𝑡12−1 < 𝑘) = 1 − 0.025
𝑝(𝑡11 < 𝑘) = 0.975
𝑡𝛼⁄2,𝑣 = 𝑘 = 2.201
8.4 8.4
66.3 − 2.201 < 𝜇 < 66.3 + 2.201
√12 √12
66.3 − 5.337 < 𝜇 < 66.3 + 5.337
60.962 < 𝜇 < 71.637

Respuesta: Con una confianza del 95% el tiempo medio de secado de la nueva pintura esta entre
60.962 y 71.637 minutos

 Intervalo de confianza para la diferencia de medias


- Caso I: Varianzas conocidas

𝜎 21 𝜎2 2 𝜎 21 𝜎2 2
(𝑥̅1 − 𝑥̅2 ) − 𝑍𝛼⁄ √ + < 𝜇1 − 𝜇2 < (𝑥̅1 − 𝑥̅2 ) + 𝑍𝛼⁄2 √ +
2 𝑛1 𝑛2 𝑛1 𝑛2

Ejemplo: Construya un intervalo de confianza del 94% de la diferencia real entre las duraciones en
promedio de dos tipos de focos eléctricos, dado que una muestra tomada al azar de 40 focos de
un tipo duró en promedio 418 horas de uso continuo y 50 focos de otra clase duraron en
promedio 402 horas. Las desviaciones estándar de las poblaciones, según se sabe, son
𝜎1 = 26 𝑦 𝜎2 = 22.

- Caso II: Varianzas desconocidas pero iguales

𝑠𝑝 2 𝑠𝑝 2 𝑠 2 𝑝 𝑠𝑝 2
(𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼⁄ ,𝑣 √ + < 𝜇1 − 𝜇2 < (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼⁄2,𝑣 √ +
2 𝑛1 𝑛2 𝑛1 𝑛2

Donde
(𝑛1 −1)𝑠1 2 +(𝑛2 −1)𝑠2 2
𝑠𝑝 2 = , 𝜈 = 𝑛1 + 𝑛2 − 2
𝑛1 +𝑛2 −2

Ejemplo: Se ha realizado un estudio para comparar el contenido de nicotina de dos marcas de


cigarrillos. Diez cigarrillos de la marca A tuvieron un contenido de nicotina en promedio de 3.1
miligramos con una desviación de 0.5 miligramos, mientras que ocho cigarrillos de marca B
tuvieron un contenido de nicotina en promedio de 2.7 miligramos con una desviación estándar de
0.7 miligramo. Suponiendo que los dos conjuntos de datos son muestras tomadas al azar de
poblaciones normales con varianzas iguales, construya un intervalo de confianza del 95% de la
diferencia real en el contenido promedio de nicotina de las dos marcas de cigarrillos.
- Caso III: Varianzas desconocidas y diferentes

𝑠1 2 𝑠2 2 𝑠 21 𝑠2 2
(𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼⁄ ,𝑣 √ + < 𝜇1 − 𝜇2 < (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼⁄2,𝑣 √ +
2 𝑛1 𝑛2 𝑛1 𝑛2
2
𝑠1 2 𝑠2 2
( + )
𝑛1 𝑛2
𝑣= 2 2
𝑠1 2 𝑠2 2
( ) ( )
𝑛1 𝑛
+ 2
𝑛1 − 1 𝑛2 − 1
Ejemplo: En un proceso químico, dos catalizadores están siendo comparados por su efecto en el
resultado de la reacción del proceso. Se preparó una muestra de 12 lotes utilizando el catalizador
1 y una muestra de 10 lotes utilizando el catalizador 2. Los 12 lotes en los cuales se utilizó el
catalizador 1 dieron un rendimiento medio de 85 con una desviación estándar de 4, en tanto que
el rendimiento para la segunda muestra fue de 81 con una desviación estándar de 5. Obtenga un
intervalo de confianza de 90% para la diferencia entre las medias poblacionales, suponiendo que
éstas están distribuidas en forma aproximadamente normal, con varianzas distintas.

Ejercicios
1. Una empresa desea estimar las horas promedio de trabajo a la semana de las áreas de
finanzas y de recursos humanos, para lo cual toma 2 muestras independientes de 130
personas de cada uno de esos departamentos. Del área de finanzas se obtuvo que las
horas de trabajo promedio a la semana son 50 con una desviación estándar de 3 horas; en
el área de recursos humanos este promedio es de 60 horas con una desviación estándar
de 2 horas. Estime la diferencia entre las horas de trabajo de las 2 áreas con un nivel de
confianza de 95 por ciento.
2. Un banco desea estimar la diferencia entre el promedio del monto depositado en moneda
nacional entre los clientes de 2 sucursales, toma una muestra aleatoria de 27 clientes de la
sucursal A y otra muestra de igual tamaño de la sucursal B y encuentra que en la primera
sucursal se deposita en promedio $5 000 con una varianza de $600 y, en la sucursal B, $3
500 con una varianza de $700. Construya el intervalo de la diferencia real que existe entre
los depósitos de los clientes de las 2 sucursales con un nivel de confianza de 98 por ciento.
Suponga poblaciones normales con varianzas iguales.
3. Una dependencia del gobierno desea estimar la diferencia entre el nivel de vida de 12
zonas del país, obtiene una muestra aleatoria de 500 personas del sur del país con un
salario promedio de $3 000 con una varianza de $400 y otra muestra del mismo tamaño,
pero de la zona norte, con un salario promedio de $8 000 con una varianza de $700.
Construya el intervalo de la diferencia de los salarios promedio entre estas 2 zonas con un
nivel de confianza de 95 por ciento.
4. Una compañía especializada en encontrar estudiantes con cierto perfil de acuerdo con las
vacantes de las empresas con las que trabaja desea estimar la diferencia del promedio de
tiempo que permanecen en la empresa una vez contratados, entre los que recibieron
capacitación y aquellos que no; de acuerdo con los registros de seguimiento, obtiene una
muestra aleatoria de 85 estudiantes contratados capacitados y 85 no capacitados y
encuentra que, del primer grupo, el promedio de tiempo de permanencia en la empresa
es de 7.5 años con una desviación estándar de 1.3 y del grupo de los que no recibieron
capacitación el tiempo promedio es de 4 años con una desviación estándar de 0.8. Con un
nivel de confianza de 90%, encuentre la diferencia de promedios de tiempo de
permanencia en la empresa entre los estudiantes que recibieron capacitación y los que no.
5. En una muestra de 10 comprobantes de compra de un supermercado, la compra
promedio fue de $114, con una desviación estándar de $33; si las compras siguen una
distribución aproximadamente normal, haga una estimación de intervalo con un nivel de
confianza de 99% del promedio de compra del total de compras.
6. Se repartieron por correo cupones de descuento alrededor de la ciudad, en 27 tiendas en
promedio se hicieron válidos 32 cupones por día en cada una con una desviación estándar
de 12; si se supone que el cambio de los cupones sigue una distribución aproximadamente
normal, haga una estimación de intervalo con un nivel de confianza de 80% del número de
cupones que se hacen válidos en el total de tiendas.
7. Se realizó una encuesta a 25 personas a las que se les mostró un nuevo modelo de reloj y
se les preguntó cuál es el precio máximo que estarían dispuestas a pagar por él; en
promedio el precio aceptado fue de $527 con una desviación estándar de $67. Si las
respuestas siguen una distribución aproximadamente normal, haga una estimación por
intervalo con un nivel de confianza de 95% del precio máximo promedio que los posibles
clientes en general pagarían por el reloj.
8. Se preguntó a 15 estudiantes de segundo grado de secundaria el número de libros que
leyó en el último año, en promedio leyeron 5 libros con una desviación estándar de 1.5.
Haga una estimación de intervalo con los siguientes niveles de confianza para el promedio
de libros que leyeron todos los estudiantes de segundo grado de secundaria durante ese
último año:
a) 90%.
b) 98%.
9. Se tomó una muestra de 35 empleados de una empresa que, en promedio, tienen un
salario diario de $133, con una desviación estándar muestral de $6. Haga una estimación
de intervalo con nivel de confianza de 95% para el promedio de salario diario del total de
trabajadores de la empresa.
10. Una cadena de comida rápida registró el número de clientes que recibió durante un día en
una muestra aleatoria de 43 de los restaurantes que tiene en el país; se encontró que en
promedio se recibieron 107 clientes diarios con una desviación estándar de 23. Haga una
estimación de intervalo con nivel de confianza de 90% para el promedio de clientes que se
reciben en el total de restaurantes.
11. Se tomó una muestra aleatoria de 400 llantas producidas en una planta, y se encontró que
la vida útil promedio era de 43 000 kilómetros con una desviación estándar de 1 300. Haga
una estimación por intervalo para la vida útil promedio del total de llantas producidas con
niveles de confianza:
a) de 85%.
b) de 95%.
12. En 33 oficinas postales elegidas al azar se recibieron en promedio 1 357 cartas durante un
día específico, con una desviación estándar de 226. Haga una estimación de intervalo con
un nivel de confianza de 92% para el promedio de las cartas recibidas en ese mismo día en
todas las oficinas.
13. Durante el verano de 2000 fueron visitados 30 restaurantes de comida rápida entre los
que se encontraban Wendy’s, McDonald’s y Burger King (The Cincinnati Enquirer, 9 de
julio de 2000). Se registró el tiempo que transcurría entre que el cliente hiciera su pedido y
la recepción del mismo. Los tiempos en los 30 restaurantes visitados fueron los siguientes:

0.9 1.0 1.2 2.2 1.9 3.6 2.8 5.2 7.2 3.6
1.8 2.1 6.8 1.3 3.0 4.5 2.8 2.3 9.1 7.3
2.7 5.7 4.8 3.3 3.5 2.6 5.0 4.0 2.8 9.0

a. Dé una estimación puntual de la media poblacional.


𝜎
b. ¿Cuál es el margen de error con 95% de confianza? (𝑍𝛼⁄ )
2 √𝑛
c. ¿Cuál es la estimación por intervalo de confianza de 95% para la media poblacional?
14. En una muestra aleatoria simple de 50 artículos de una población en la que 𝜎 = 6 la media
muestral fue 32.
a. Proporcione un intervalo de confianza de 90% para la media poblacional.
b. Establezca un intervalo de confianza de 95% para la media poblacional.
c. Proporcione un intervalo de confianza de 99% para la media poblacional.
15. En una investigación sobre los negocios pequeños que tienen un sitio en la Web se
encontró que la cantidad promedio que se gasta en un sitio es $11 500 por año. Dada una
muestra de 60 negocios y una desviación estándar 𝜎 = $4000, ¿cuál es el margen de
error? Use 95% de confianza. ¿Qué recomendaría si el estudio requiere un margen de
error de $500?
16. Una fábrica lleva a cabo un análisis para definir a qué proveedor comprará su materia
prima durante los siguientes 2 años y por ello desea saber la diferencia del promedio de
tiempo de entrega de la mercancía una vez ordenada entre los 2 proveedores, para esto,
toma una muestra aleatoria de 20 ventas de cada proveedor y encuentra que, en el
primero, el tiempo de entrega promedio es de 14 días con una desviación estándar de 2.8,
y en cuanto al segundo proveedor, este tiempo en promedio es de 18 días con una
desviación estándar de 2.2. Estime con un nivel de confianza de 96% la diferencia del
promedio de tiempo de entrega de mercancías entre los 2 proveedores, si las poblaciones
de los tiempos se distribuye de forma normal y las varianzas poblacionales son iguales.
17. Una empresa de productos de belleza obtiene la mayor parte de sus utilidades por las
ventas en campo, el gerente de los vendedores en campo divide a sus empleados según la
zona en la que venden y desea estimar la diferencia del promedio de ventas diarias que
realiza cada vendedor entre las 2 zonas de mayores ventas, por lo que toma una muestra
aleatoria de 28 empleados de la zona A y encuentra que en promedio realizan 44 ventas
diarias con una desviación estándar de 3.7, y toma otra muestra aleatoria de 25
empleados correspondiente a la zona B y encuentra que el promedio de ventas fue de 56
diarias por persona con una desviación estándar de 4.2. Encuentre la diferencia del
promedio de ventas diarias por persona entre los empleados de las zonas A y B de dicha
empresa con un nivel de confianza de 96 por ciento. Suponga que las poblaciones se
distribuyen de forma normal y las varianzas son iguales.
18. Una productora de materiales para la construcción tiene 2 áreas de diseño muy
importantes y cada una de ellas maneja diferentes materiales, el gerente de diseño desea
saber la diferencia del promedio de presupuesto que gastan estas 2 áreas diariamente,
por lo que toma una muestra aleatoria de 20 días en cada una de las áreas y encuentra
que en la primera se gasta en promedio $1 750 diarios con una desviación estándar de
$350 y en la otra área el promedio era de $2 300 diarios con una desviación estándar de
$375. Con un nivel de confianza de 92%, estime la diferencia de promedio del dinero
utilizado diariamente entre las 2 áreas de diseño de esta empresa. Suponga población
normal y varianzas diferentes.
19. Una hipotecaria desea conocer la diferencia del promedio de deuda que tienen los clientes
de 2 diferentes zonas del país, para ello, toma una muestra aleatoria de la zona A de 25
personas y encuentra que en promedio la deuda asciende a $728 300 con una desviación
estándar de $27 850, y toma una muestra aleatoria de 29 para la zona B y encuentra que
la deuda promedio es de $597 450 con una desviación estándar de $37 500. Con un nivel
de confianza de 98%, estime la diferencia de promedio la deuda que tienen las personas
de las 2 zonas. Suponga población normal y varianzas diferentes
20. Una empresa de telefonía celular ofrece 2 tipos de paquetes a sus clientes: el básico y el
premier; la gerencia de atención al cliente desea conocer la diferencia del promedio de
quejas que se reciben semanalmente por parte de los usuarios de cada paquete, así que
toma una muestra aleatoria de 18 semanas para cada paquete, y encuentra que, en el
caso del paquete básico, se presentan 24 quejas con una desviación estándar de 3, y del
paquete premier se presentan 13 quejas con una desviación estándar de 2. Con un nivel
de confianza de 95%, estime la diferencia de promedio de quejas que se presentan para
cada uno de los paquetes que ofrece la empresa. Suponga poblaciones normales y
varianzas diferentes
21. Se extrae una muestra de n = 30 elementos de una población que se sabe que tiene un
gran número de elementos y cuyas media y desviación estándar son μ = 162 y σ = 20.
Encuentre la probabilidad de que la media de esa muestra:
1. Sea superior a 170.
2. Esté entre 152 y 172.
22. El promedio del peso neto de atún enlatado por una empacadora es de μ = 325 g, con una
desviación estándar σ = 20 g, si se extrae de la producción de la empacadora una muestra
aleatoria de 50 latas de atún, ¿cuál es la probabilidad de que su media:
1. sea inferior a 320 g?
2. esté entre 320 y 330 g?
23. Se tiene una población con N = 10 000, μ = 20 y σ = 2. Calcule la probabilidad de extraer de
esta población una muestra de n = 100 elementos que tenga una media:
a) Inferior a 19.5.
b) Superior a 20.1.
c) Entre 19.7 y 20.4.
24. Una tienda vende una marca de champú en sus 4 presentaciones, en la siguiente tabla se
registró el número de botellas vendidas de cada una a lo largo de la semana.
presentación Ventas
A 10
B 4
C 8
D 6

Encuentre:
a) La media de esta población.
b) La desviación estándar de esta población.
c) La distribución muestral de las medias para muestras de tamaño n = 2.
d) El valor esperado de la media.
f ) ¿Se cumple que: E(X ) = μ?
𝜎 𝑁−𝑛
g) 𝜎𝑥̅ = √ ?
√𝑛 𝑁−1
El tiempo promedio en que se cobra a un cliente en las cajas de un supermercado es de
5.2 minutos, con una desviación estándar de 3.2. Determine la probabilidad de que en una
muestra de 15 clientes el tiempo promedio para el cobro sea:
a) Entre 4 y 4.5 minutos.
b) Entre 5.5 y 6 minutos.
25. El peso promedio de las latas de atún es de 42 g con una desviación de 15. Determine la
probabilidad de que el peso promedio de una muestra de 22 latas sea:
a) Entre 38 y 44.
b) Menor de 40.
c) Mayor de 45.
26. De acuerdo con los registros históricos de un rastro, el peso promedio de las reses que
llegan al matadero es de 750 kg con desviación estándar de 150 kg. Determine la
probabilidad de que el peso promedio de una muestra de n = 10 de esas reses esté:
a) Por encima de 780 kg.
b) Por debajo de 735 kg.
c) Entre 740 y 760 kg.