You are on page 1of 19

UNIVERSIDAD DE EL SALVADOR EN LÍNEA

FACULTAD DE INGENIERÍA Y ARQUITECTURA


PROBABILIDAD Y ESTADÍSTICA
Página 1 de 19

PROBABILIDAD Y ESTADÍSTICA
UNIDAD IV: ESTIMACIÓN Y PRUEBA DE HIPÓTESIS
Temas
4.1 Estimación de Intervalos de Confianza para la media (con sigma
conocida).
4.2 Estimación de Intervalos de Confianza para la media (con sigma
desconocida).

OBJETIVO DE LA UNIDAD
Aplicar diferentes test estadísticos para validar diferentes tipos de hipótesis estadísticas.

INTRODUCCIÓN
El propósito de la estadística inferencial o inductiva es extraer, de los datos de una
muestra aleatoria obtenida de una población, conclusiones que se generalizan a toda la
población, y se evalúa el error de muestreo asociado con esa generalización. Este proceso
implica, haber resuelto dos problemas:

• ¿Qué método usar para la generalización?, Y


• ¿Cómo medir el error asociado a esa generalización o inferencia?

Si la muestra es seleccionada aleatoriamente, se tendrá un modelo probabilístico


para describir el proceso de muestreo, y será posible una medición válida del error
asociado a la inferencia; así diremos, que se tiene una inferencia estadística.

Dado que las muestras son aleatorias, su composición la determina el azar, y como los
errores de muestreo son también aleatorios (entendiendo por error de muestreo, a la diferencia
entre el valor estimado por medio de la muestra y el valor verdadero o valor del parámetro), se
tiene entonces una distribución probabilística, y será entonces posible aplicar la teoría de las
probabilidades para medir la confiabilidad de las inferencias.

En la inferencia estadística se distinguen dos tipos de dificultades: La primera, es en la que


interesa estimar parámetros para la población (o valores de las características o propiedades de
las distribuciones de probabilidades asociadas a las variables aleatorias bajo estudio) tales como
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 2 de 19

la media, la varianza, la proporción de elementos que tienen una cierta característica, etc., la que
puede ser una estimación puntual o una estimación por intervalos; y la segunda es la que
concierne a someter a prueba de hipótesis estadísticas que se tienen acerca de esos parámetros
de la población.

Los temas a desarrollar en esta sección son:

4.1. Estimación de intervalos de confianza para la media (con sigma conocida).


4.2. Estimación de intervalos de confianza para la media (con sigma desconocida).

4.1. ESTIMACIÓN DE INTERVALOS DE CONFIANZA PARA LA MEDIA (CON SIGMA


CONOCIDA)

VALORES DE LA POBLACIÓN Y ESTIMADORES

Las medidas que representan características o propiedades de una población se


denominan parámetros de la población, y como ejemplos pueden mencionarse:

µ = Media aritmética o promedio de la población.

𝜎 2 = Varianza de la población.

R = Recorrido de la población (Valor mayor – valor menor).

Me = Mediana de la población.

P = Proporción de los elementos de la población que tienen una cierta característica.

Un estimador es una función de los valores de la muestra utilizada para aproximar o


estimar el verdadero parámetro poblacional; por una estimación se entiende al valor numérico
obtenido de una muestra específica. Por ejemplo, µ, la media de una población, se podría estimar
por lo menos, por medio de:

o La media de la muestra, 𝑋̅.


o El promedio simple obtenido promediando el valor mayor y el valor menor en la
muestra.
o La mediana de la muestra.

Se acostumbra a seleccionar estimadores que reúnan la mayoría de las características de


un buen estimador, algunas de las cuales se comentan a continuación:

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 3 de 19

Insesgado: Se dice que un estimador es insesgado, si la media de la distribución del


estimador de todas las muestras posibles de un cierto tamaño resulta ser igual al valor del
parámetro.
Por ejemplo, la media muestral 𝑋̅, es un estimador insesgado de la media de la población
µ. Es decir, se cumple que: 𝐸[𝑋̅ ] = 𝜇.

Consistente: Un estimador es consistente, si al aumentar el tamaño de la muestra se logra


una seguridad casi absoluta que el valor estimado está muy cerca al valor de la población.

Por ejemplo, en el caso de 𝑋̅, a medida que aumenta el tamaño de la muestra, 𝑋̅ se acerca
cada vez más a µ, es decir, 𝑋̅ - µ tiende a cero al aumentar n.

Varianza Mínima: esta propiedad se refiere a seleccionar entre varios estimadores aquel
que varía menos de muestra a muestra, es decir, aquel que resulta ser más estable.

Por ejemplo, al considerar a la media y mediana como estimadores de µ, al aumentar el


tamaño de la muestra la media es más estable que la mediana.

LOS ESTIMADORES COMO VARIABLES ALEATORIAS

Debido a que los estimadores se aplican a una muestra, y se pueden seleccionar distintas
muestras del mismo tamaño de la misma población, y cada una de esas muestras produce una
estimación (que se espera que no sean todas iguales), entonces los valores del estimador varían
de muestra a muestra, es decir, el estimador es una variable aleatoria, y por lo tanto tiene
asociada una distribución de probabilidades, y esta a su vez, tiene una media aritmética, varianza,
etc. A esta distribución de probabilidad se le conoce como distribución muestral.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Suponga que de una población se seleccionan muestras de tamaño n y que para cada una
de ellas se calcula su media 𝑋̅, entonces surgen varias preguntas:

• ¿Cuál es la distribución de 𝑋̅?

• ¿Cuál es la media de la distribución de 𝑋̅? es decir: E( 𝑋̅ ) =?

• ¿Cuál es la varianza de la distribución de 𝑋̅? es decir: E [(𝑋̅−E (𝑋̅))2] =?

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 4 de 19

Para responder a estas preguntas, es necesario considerar si la población es finita o


infinita y si el muestreo al azar es con reemplazo o sin reemplazo.

Aunque el muestreo con reemplazo no presenta dificultades especiales, en la práctica se


utiliza, casi exclusivamente, el muestreo sin reemplazo.

Ejemplo 1. Considere una población formada por cinco empresas A, B, C, D, E de productos


alimenticios en una zona industrial con el número de ingenieros que se presenta en la siguiente
tabla 1:
Empresa Número de
Ingenieros
A 2
B 3
C 4
D 5
E 6
Tabla 1: Distribución de la población

Figura 1: Distribución de Ingenieros

¿Qué sucede si se toman muestras sin reemplazo de tamaño dos?

Solución
Se deduce que la media de la población es µ = 4 y la varianza de la población es σ2 = 2.
5
Se observa que se tienen ( )= 10 muestras sin reemplazo de tamaño 2 que se pueden
2
seleccionar de la población. Las 10 muestras, el número de ingenieros y la media de cada muestra
se presentan en la siguiente tabla:
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 5 de 19

Número de
Muestras Media
ingenieros
A, B 2, 3 5/2
A, C 2, 4 3
A, D 2, 5 7/2
A, E 2, 6 4
B, C 3, 4 7/2
B, D 3, 5 4
B, E 3, 6 9/2
C, D 4, 5 9/2
C, E 4, 6 5
D, E 5, 6 11/2
Tabla 2: Distribución de las muestras.

Luego los promedios varían entre 2.5 y 5.5 con la siguiente distribución de probabilidad:

𝑋̅ 2.5 3 3.5 4 4.5 5 5.5


p(𝑋̅) 1/10 1/10 2/10 2/10 2/10 1/10 1/10
Tabla 3: Distribución Muestral de la media (𝑋̅).

Figura 2: Distribución Muestral de la Media con n=2


7

𝜇𝑋̅ = ∑ 𝑋̅𝑖 𝑝(𝑋̅𝑖 ) = 4


𝑖=1

𝜎𝑋2̅ = E [(𝑋̅−E (𝑋̅))2]= 0.75

¿Qué sucede si se toman muestras de tamaño 3?

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 6 de 19

5
Se nota que se tienen ( )= 10 muestra sin reemplazo de tamaño 3 que se pueden
3
seleccionar de la población. Las 10 muestras, el número de ingenieros y la media de cada muestra
se presentan en la siguiente tabla:
Muestras Número de ingenieros Media

A, B, C 2, 3, 4 3
A, B, D 2, 3, 5 10/3
A, B, E 2, 3, 6 11/3
A, C, D 2, 4, 5 11/3
A, C, E 2, 4, 6 4
A, D, E 2, 5, 6 13/3
B, C, D 3, 4, 5 4
B, C, E 3, 4, 6 13/3
B, D, E 3, 5, 6 14/3
C, D, E 4, 5, 6 5
Tabla 4: Distribución de las muestras

Luego los promedios varían entre 3 y 5 con la siguiente distribución de probabilidad:

𝑋̅ 3 10/3 11/3 4 13/3 14/3 5


p(𝑋̅) 1/10 1/10 2/10 2/10 2/10 1/10 1/10
Tabla 5: Distribución Muestral de la media (𝑋̅)

Figura 3: Distribución de la media Muestral con n=3


7

𝜇𝑋̅ = ∑ 𝑋̅𝑖 𝑝(𝑋̅𝑖 ) = 4


𝑖=1

𝜎𝑋2̅ = E [(𝑋̅−E (𝑋̅))2]= 0.33

Del ejemplo anterior se pueden observar varios aspectos importantes:

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 7 de 19

• 𝑋̅ es una variable aleatoria.


• La media de la población global µ = 4 es igual a la esperanza matemática de la variable
aleatoria 𝜇𝑋̅ = 4 (esto no debe sorprender porque 𝑋̅ es un estimador insesgado de µ).
• La variable aleatoria 𝑋̅ tiene un comportamiento como una variable aleatoria normal
y entre mayor sea el tamaño de la muestra mayor es la concentración de los datos
alrededor de la media, pues la varianza se reduce.

Pero en general, ¿Cuál es el valor esperado (o esperanza matemática) y la varianza de la


distribución de 𝑋̅?

Teorema 1. Supóngase que se tiene una población de tamaño N y se toman muestras de


tamaño n, sin reposición, entonces:
𝐸[𝑋̅] = 𝜇𝑥̅ = 𝜇

𝑁−𝑛 𝜎2
𝜎𝑋2̅ = 𝑁−1 𝑛

Donde 𝜎 2 y µ, son la varianza y la media de la población total, respectivamente.


𝑁−𝑛
Observación: Al factor 𝑁−1 se denomina factor de corrección para poblaciones finitas.

Teorema 2. Supóngase que se tiene una población de tamaño N y se toman muestras de


tamaño n con reposición, o si la población es infinita, entonces

𝐸[𝑋̅] = 𝜇𝑥̅ = 𝜇
𝜎2
𝜎𝑋2̅ = 𝑛

Donde 𝜎 2 y µ, son la varianza y la media de la población total respectivamente

Teorema 3. Teorema del Límite Central

Sea X una variable aleatoria cualquiera, con media µ y desviación típica σ.

1. Sea cual sea la forma de la distribución de X, si se toman muestras aleatorias simples de X,


de tamaño n, es decir, n variables aleatorias independientes e idénticamente distribuidas con la
misma distribución arbitraria de X, entonces cuando n se hace cada vez más grande la
distribución de la media muestral 𝑋̅ se aproxima cada vez más a la normal
𝜎
𝑁(𝜇 , )
√𝑛

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 8 de 19

En particular, para n suficientemente grande (usaremos n > 30), tenemos


𝑎−𝜇 𝑎+𝜇
𝑝(𝑎 ≤ 𝑋̅ ≤ 𝑏) ≈ 𝑝( 𝜎 ≤ 𝑍 ≤ 𝜎 )
√𝑛 √𝑛
Siendo Z de tipo normal N (0,1).

2. Si además sabemos que la variable original X es de tipo normal N (µ, σ), entonces,
independientemente del tamaño n de la muestra, la media muestral también es normal, del
mismo tipo
𝜎
𝑋̅ ~ 𝑁(𝜇 , )
√𝑛
El resultado es tan importante, que vamos a repetirlo con otras palabras. En resumidas
cuentas:

• Para muestras suficientemente grandes, la distribución de las medias muestrales de


todas las variables, sin importar el tipo de distribución de probabilidades de las
variables individuales, se comporta como una variable normal.
• Pero, además, si hemos empezado con una variable normal, entonces el tamaño de
la muestra es irrelevante.
𝜎
La desviación estándar de 𝑋̅, es decir, se denomina, error estándar del promedio o
√𝑛
error muestral, y se indica con 𝜎𝑥̅ ; mide la variabilidad de 𝑋̅ de muestra a muestra, y por ello
puede emplearse para medir la confianza que corresponde a 𝑋̅ como estimador de µ. Es claro,
que cuanto mayor sea el error estándar, mayor es la probabilidad de que los valores de 𝑋̅ se
alejen de µ, y menor será la confianza que pueda tenerse en que el 𝑋̅ dado por una muestra
específica este cerca de µ.

Ahora, estamos listos para empezar a hacer Inferencia, que es el núcleo central de la
Estadística propiamente dicha. Vamos a utilizar las muestras para tratar de obtener información
sobre la población.

Límites de Confianza para µ

Para estimar µ puede considerarse simplemente 𝑋̅. Esta sería una estimación puntual del
parámetro µ.

Por ejemplo, si se quiere estimar las ventas semanales medias de una determinada marca
de leche, y se selecciona una muestra aleatoria de 50 semanas, luego se calcula la cantidad
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 9 de 19

promedio de litros vendidos en una semana, la cual sería una estimación de la media población
de ventas semanales. A veces, la estimación puntal es insuficiente si no se posee alguna medida
de la confianza que merece. Esta situación se resuelve utilizando la estimación por intervalos, es
decir, construyendo un intervalo de confianza, a partir de la estimación puntual, dentro de cuyos
límites se espera, con un determinado nivel de confianza, que esté contenido el verdadero valor
poblacional, lo cual puede funcionar a partir del Teorema del Límite Central, afirmando que, por
ejemplo:

Hay una probabilidad del 95% de que µ esté dentro del intervalo (a, b)

Como puede notarse:

• La estimación se refiere a un intervalo (a, b) de valores. No decimos cuál es el valor de


µ, sino que decimos algo sobre dónde está con cierto nivel de confianza. La
estimación, por tanto, siempre va a incorporar un cierto margen de error.
• La estimación se hace en términos de probabilidad. Tampoco estamos afirmando que
el valor de µ está, con absoluta seguridad, dentro del intervalo (a, b). Hay un margen
de incertidumbre, que se refleja en esa probabilidad del 95%.

Estas dos características, el margen de error y el margen de incertidumbre, acompañan


siempre a las estimaciones estadísticas. Desde el punto de vista del método científico,
representan un gran avance, puesto que hacen cuantificable, medible y fácil de comunicar, la
fiabilidad de nuestras afirmaciones.

La afirmación anterior la podemos denotarla en términos de probabilidad, así:

𝑃(𝑎 < 𝜇 < 𝑏) = 0.95

Un poco de terminología: El intervalo (a, b) será un intervalo de confianza para µ, y el


porcentaje del 95% es el nivel de confianza de ese intervalo.

¿Cómo se construyen estos intervalos?

Utilizando la distribución de probabilidad de la normal estándar tenemos que el 95% del


área central bajo la curva está entre -1.96 y +1.96; por lo tanto, en la distribución muestral de 𝑋̅,
el 95% de los valores se encuentran entre 𝜇 − 1.96𝜎𝑋̅ y 𝜇 + 1.96𝜎𝑋̅ . Es decir:

𝑃(𝜇 − 1.96𝜎𝑋̅ < 𝑋̅ < 𝜇 + 1.96𝜎𝑋̅ ) = 0.95

De la expresión anterior puede obtenerse una fórmula para el cálculo de un intervalo de


confianza del 95% para la media poblacional µ.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 10 de 19

Sustrayendo µ en los términos de la desigualdad:

𝑃(−1.96𝜎𝑋̅ < 𝑋̅ − 𝜇 < 1.96𝜎𝑋̅ ) = 0.95

Sustrayendo 𝑋̅:

𝑃(− 𝑋̅ − 1.96𝜎𝑋̅ < −𝜇 < −𝑋̅ + 1.96𝜎𝑋̅ ) = 0.95

Multiplicando por -1 la desigualdad:

𝑃( (𝑋̅ + 1.96𝜎𝑋̅ > 𝜇 > 𝑋̅ − 1.96𝜎𝑋̅ ) = 0.95

Ordenando la desigualdad:

𝑃( 𝑋̅ − 1.96𝜎𝑋̅ < 𝜇 < 𝑋̅ + 1.96𝜎𝑋̅ ) = 0.95

𝑃( 𝐿𝑖 < 𝜇 < 𝐿𝑠 ) = 0.95

Donde:

𝐿𝑖 = 𝑋̅ − 1.96𝜎𝑋̅

𝐿𝑠 = 𝑋̅ + 1.96𝜎𝑋̅

Los límites del intervalo anterior corresponden a un nivel de confianza de 95%. También
pueden obtenerse de forma similar intervalos para otros niveles de confianza como 90%, 99%,
etc., lo que debe tenerse en cuenta es, que se debe sustituir en la expresión el valor de la normal
estándar z=1.96, que corresponde a la probabilidad del área central del 95%, por el valor de z del
nivel de confianza deseado. Lo anterior permite generalizar la expresión para estimar los límites
de un intervalo de confianza:

Intervalo de confianza para la media µ. Población normal, con desviación típica


conocida.

Sea X una variable aleatoria normal, cuya desviación típica sigma, σ, se conoce. Si
consideramos muestras de tamaño n, entonces el intervalo de confianza al nivel nc = (1−α) para
la media µ es:
𝜎 𝜎
𝑋̅ − 𝑧∝ ≤ 𝜇 ≤ 𝑋̅ + 𝑧∝
2 √𝑛 2 √𝑛

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 11 de 19

Figura 4: Representación de los valores críticos en la normal estándar con nc=1-α

Donde α es el complemento del nivel de confianza nc.

El valor:
𝜎
𝑧∝
2 √𝑛
es la semiamplitud (o semianchura) del intervalo, y si lo dividimos por el valor crítico,
obtenemos el error estándar de la muestra:
𝜎
√𝑛
Ejemplo 2. Considere que la distribución de la variable aleatoria llenado de un envase con un
producto de café se comporta como una normal, se toma una muestra al azar de 25 envases
llenos, se obtuvo un promedio muestral de 48 onzas. Suponga que la varianza es 𝜎 2 = 4 y calcule
un intervalo de confianza del 90%.
𝜎 𝜎
Solución: 𝑋̅ − 𝑧∝ ≤ 𝜇 ≤ 𝑋̅ + 𝑧∝
2 √𝑛 2 √𝑛
Utilizando el software RStudio, la información disponible y siguiendo las instrucciones se
obtiene el intervalo de confianza que se busca.
#Información disponible
Xbar=48
Sigma= 2
n=25
nc= 0.90
alpha = 1 - nc
# Calculamos el valor critico:
(z_alpha2 = qnorm (1 - alpha / 2))

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 12 de 19

## [1] 1.644854

#y la semianchura del intervalo


(semianchura=z_alpha2 * Sigma / sqrt(n))

## [1] 0.6579415

# El intervalo de confianza (a, b) para mu es este:

(intervalo = Xbar + c (-1, 1) * semianchura)

## [1] 47.342 48.658

Interpretación Probabilística de intervalo de Confianza


Cuando decimos que, a partir de una muestra de tamaño n, hemos construido un
intervalo para la media con un nivel de confianza del 95%, lo que estamos diciendo es una
afirmación probabilística sobre el procedimiento que hemos utilizado, referida al conjunto
formado por todas las muestras de tamaño n. Es decir, que, de cada 100 muestras elegidas al
azar, es de esperar que 95 de ellas, cuando se usa este procedimiento, darán como resultado un
intervalo que contiene a la media de la población.
En la Figura 5, se ha realizado esto: hemos elegido 100 muestras al azar de una misma
población normal (con µ = 0, σ = 1), y hemos construido los 100 intervalos de confianza
correspondientes. El segmento horizontal central indica la posición de la media real µ de la
población. Y cada uno de los segmentos verticales representa un intervalo de confianza,
construido para una de esas muestras. Como puede verse, la inmensa mayoría de los segmentos
verticales cortan al segmento horizontal central. Es decir, la mayoría de los intervalos de
confianza que hemos construido contienen a la media.
Figura 5:
Interpretación Probabilística de los Intervalos de
Confianza
1

0.5

0
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
97

-0.5

-1

L C R

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 13 de 19

Pero hay algunos pocos casos en los que no es así, como el señalado en el gráfico (muestra
38). Y no es porque esos intervalos estén mal construidos. Para construirlos se ha usado
exactamente el mismo procedimiento que con cualquiera de los otros intervalos correctos. El
problema no está en el procedimiento, sino en la muestra. Como hemos discutido al hablar de la
distribución muestral, un porcentaje (habitualmente pequeño) de muestras de tamaño n se
pueden considerar muestras malas, en el sentido de poco representativas de la población. Si al
elegir una muestra al azar nos ha tocado en suerte una de esas muestras malas, por más que
apliquemos cuidadosamente el procedimiento que hemos descrito, es posible que terminemos
con un intervalo de confianza que no contenga a la media de la población.

Cálculo del tamaño necesario de la muestra para alcanzar una precisión dada

Es de hacer notar la importancia del tamaño de la muestra en las investigaciones


estadísticas. Se ha señalado, que el tamaño de la muestra está determinado por factores como:
variabilidad de la población, precisión deseada en las estimaciones, recursos disponibles para el
estudio., etc. Considerando el problema para el caso de muestreo aleatorio simple. En el que se
desea estimar el ingreso promedio mensual de remesas recibidas por familia en una gran ciudad.
Por estudios previos, se estima que σ = 200 dólares.
¿De qué tamaño debe ser la muestra para obtener una probabilidad de 95% de que la
discrepancia entre 𝑋̅ y µ (error de estimación) no será mayor de 20 dólares?
Este problema se puede plantear mediante simbología probabilística en la siguiente
forma:
𝑝[|𝑋̅ − 𝜇| ≤ 20] = 0.95
Aplicando la propiedad de la desigualdad:
𝑝[−20 ≤ 𝑋̅ − 𝜇 ≤ 20]=0.95
𝜎
Aplicando el Teorema del Límite Central y estandarizando al dividir la desigualdad por
√𝑛
para lograr una variable con distribución normal estándar:

−20 𝑋̅ − 𝜇 20
𝑝[ ≤ ≤ ] = 0.95
200 200 200
√𝑛 √𝑛 √𝑛

−20 20
𝑝[
≤𝑧 ≤ ] = 0.95
200 200
√𝑛 √𝑛
Por la normal estándar se sabe que:
𝑝[−1.96 ≤ 𝑧 ≤ 1.96] = 0.95
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 14 de 19

De las dos últimas expresiones, se deduce que debe cumplirse la relación:


20
= 1.96
200
√𝑛
Despejando √𝑛, y elevando al cuadrado se tiene:
200 2
𝑛 = (1.96 ∗ )
20
𝑛 = (1.96 ∗ 10)2
n = 384.16
n = 385
El resultado indica que debe tomarse una muestra de 385 familias.
Analizando los componentes de cálculo para n puede establecerse una expresión general
para el tamaño de muestra, cuando se utiliza muestreo simple al azar. Así:
𝑧𝑐 ∗ 𝜎 2
𝑛=[ ]
𝑑
Donde:
𝜎: desviación estándar de la población
d= 𝑋̅ − 𝜇 : discrepancia permisible o error máximo de estimación permisible
𝑧𝑐 : valor de z crítico, normal estándar, para un nivel de confianza de (1- α/2) %.

La expresión anterior para n puede utilizarse para resolver otro tipo de problemas,
despejando la variable de interés.

Ejemplo 3. Para el mismo caso del ingreso promedio mensual de remesas recibidas por
familia, suponga ahora que se quiere tener un nivel de confianza de 90% de que la diferencia
𝑋̅ − 𝜇 no será mayor de 20 dólares.
Solución:
𝛼
En este caso, σ = 200 d = 20 1-α= 0.90 = 0.05
2
α = 0.10 𝑧0.95 = 1.645
1.645 ∗ 200 2
𝑛=( ) = (16.45)2 ≈ 271
20

La muestra debe ser de 271 familias. El valor obtenido es menor que el anterior, ya que
se redujo el nivel de confianza de 95% a 90%.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 15 de 19

Ejemplo 4. Para el mismo caso del ingreso promedio mensual de remesas recibidas por familia,
suponga que se toma una muestra de 400 familias. ¿Cuál es la probabilidad de que el error de
estimación sea de 30 dólares o menos?
Solución
𝑧𝑐 ∗𝜎 2
Como sabemos 𝑛 = [ ] . Despejando zc, se tiene:
𝑑
√𝑛 √𝑛
= (𝑋̅ − 𝜇 ) ∗
𝑧𝑐 = 𝑑 ∗
𝜎 𝜎
Sustituyendo los valores conocidos:
√400
𝑧𝑐 = 30 ∗
=3
200
Luego, el nivel de confianza es el área de la normal estándar comprendida entre -3 y 3:
𝑛𝑐 = 𝑝(−3 ≤ 𝑧 ≤ 3) = 1 − 2 ∗ 𝑝(𝑧 ≤ −3)
Instrucciones de R para calcular la probabilidad de interés.

(alpha2=pnorm(-3, mean = 0, sd = 1, lower.tail = T, log.p = FALSE))


[1] 0.001349898

(nc=1-2*alpha2)
[1] 0.9973002

4.1.1. SECCIÓN DE EJERCICIOS.


1. La distribución del número de huevos puestos por una cierta especie de gallina durante
su período de reproducción tiene una media de 35 huevos con una desviación estándar
de 18.2. Supongamos que un grupo de investigadores toma muestras aleatorias de 45
gallinas de esta especie, cuenta el número de huevos puestos durante su período de
reproducción y registra la media de la muestra. Repiten esto 1,000 veces, y construyen
una distribución de medias de muestra.
(a) ¿Cómo se llama esta distribución?
(b) ¿Esperaría que la forma de esta distribución fuera simétrica, sesgada a la derecha o
izquierda? Explica tu razonamiento.
(c) Calcule la variabilidad de esta distribución y establezca el término apropiado usado
para referirse a este valor.
(d) Suponga que el presupuesto de los investigadores se reduce y solo pueden recolectar
muestras aleatorias de 10 gallinas. Se registra la media de muestra del número de huevos,
y lo repiten 1,000 veces, y construyen una nueva distribución de medias de muestra.
¿Cómo se comparará la variabilidad de esta nueva distribución con la variabilidad de la
distribución original?

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 16 de 19

2. Supongamos que los tiempos promedio de entrega de pizza se distribuyen normalmente


con una media poblacional desconocida y una desviación estándar de la población de seis
minutos. Se toma una muestra aleatoria de 28 restaurantes de entrega de pizzas y tiene
una media muestral de tiempo de entrega de 36 minutos. Encuentre una estimación del
intervalo de confianza del 90% para la media poblacional del tiempo de entrega.
3. Una muestra aleatoria de 50 individuos de una población normal, con varianza conocida,
e igual a 16, presenta una media muestral de 320. Calcular un intervalo de confianza al
99% para la media de la población.
4. En población cuya distribución se desconoce se obtiene una muestra (m.a.s.) de 2000
valores de la que resulta una media de 225 y una desviación típica de 10. Suponiendo que
la varianza muestral coincide con la poblacional, estimar un intervalo para la media de la
población con un nivel de confianza del 95%.
5. En la región costera de un país hay 350 escuelas públicas. Se desea estimar el número de
pupitres por reemplazar por su mal estado, se decide hacer un estudio directo en una
muestra de escuelas. Por una investigación realizada varios años antes, se estima que σ =
55. ¿Qué tamaño de muestra sugeriría utilizar, sabiendo que interesa un margen de error
de 10 pupitres y un 90% de estimación?
6. Una población de fuentes de energía para una computadora personal tiene un voltaje de
salida que se distribuye normalmente con media 5.00 V y desviación estándar 0.1 V. Se
selecciona una muestra de 8 fuentes de energía35. Especifique la distribución muestral
de 𝑋̅ .
7. Un científico interesado en vigilar contaminantes químicos en alimentos y, por lo tanto,
la acumulación de contaminantes en la dieta humana, seleccionó una muestra aleatoria
de n = 50 adultos hombres. Se encontró que el promedio de ingesta diaria de productos
lácteos fue de 𝑋̅ = 756 gramos por día, con una desviación estándar de 𝑠 = 35 gramos
por día. Use esta información muestral para construir un intervalo de confianza de 95%
para la ingesta diaria media de productos lácteos para hombres e interprete el resultado.
8. Una empresa ha comprado 25 resistores al vendedor, de una población que se supone se
distribuyen normalmente con media 100 Ω y desviación estándar 1.5 Ω . ¿Cuál es el error
estándar de 𝑋̅ ?
9. Quinientos cojinetes de bolas tienen un peso medio de 5.02 onzas y una desviación típica
de 0.30 onzas. Hallar la probabilidad de que una muestra al azar de 100 cojinetes elegidos
entre este grupo tenga un peso total:
(a) comprendido entre 496 y 500 onzas
(b) de más de 510 onzas.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 17 de 19

10. Una casa encuestadora en 2017 formuló la pregunta: "Después de un día de trabajo
promedio, ¿cuántas horas tiene para relajarse o realizar actividades que le gustan?" A una
muestra aleatoria de 1,155 personas. Un intervalo de confianza del 95% para la media del
número de horas dedicadas a relajarse o realizar actividades que disfrutan fue (1.38,
1.92).
(a) Interprete este intervalo en el contexto de los datos.
(b) Supongamos que otro grupo de investigadores informó un intervalo de confianza con
un margen mayor de error basado en tamaño de muestra igual de 1,155. ¿Cómo se
comparará su nivel de confianza con el nivel de confianza del intervalo indicado
anteriormente?
(c) Suponga que este año se lleva a cabo una nueva encuesta con la misma pregunta,
y esta vez el tamaño de la muestra es de 2.500. Asumiendo que las características de
la población, con respecto a la cantidad de tiempo que las personas pasan relajándose
después del trabajo, no han cambiado mucho en un año. ¿Cómo se comparará el
margen de error del intervalo de confianza del 95% basado en los datos de la nueva
encuesta con el margen de error del intervalo indicado anteriormente?
11. Supongamos que los puntajes de una de las pruebas en Probabilidad y Estadística se
distribuyen normalmente con una media de población desconocida y una desviación
estándar poblacional de tres puntos. Se selecciona una muestra aleatoria de 36 puntajes
y se obtiene una media muestral (puntaje promedio de la muestra) de 68. Encuentre un
intervalo de confianza del 90% para la media real (población) de los puntajes de los
exámenes de Probabilidad y Estadística, e interprételo.

ENLACES SUGERIDOS

http://www.randomservices.org/random/apps/SpecialSimulation.html

https://www.uv.es/ceaces/

https://www.bioestadistica.uma.es/analisis/teoremacentral/

http://www.stats.gla.ac.uk/steps/glossary/confidence_intervals.html

http://www.randomservices.org/random/

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 18 de 19

REFERENCIAS BIBLIOGRÁFICAS

1. Canavos, G., (1998), Probabilidad y estadística: Aplicaciones y métodos, Mexico, D.F.,


McGraw-Hill/Interamericana de Mexico S.A. de C.V.
2. Diez, D., Barr C., Rundel, M., (2015). Advanced High School Statistics (1a. ed.), Retomado
de: https://www.openintro.org/download.php?file=ahss1&referrer=/stat/textbook.php
3. Gómez, M., (2016). Elementos de Estadística Descriptiva (5a.ed.), San José, Costa Rica,
Editorial Universidad Estatal a Distancia.
4. Illowsky, B., Dean, S., (2017). Introductory Statistics, Houston, Texas, U.S.A. OpenStax,
Rice University, Retomado de: https://d3bxy9euw4e147.cloudfront.net/oscms-
prodcms/media/documents/Statistics-OP.pdf
5. Mendenhall, W., Beaver, R., Beaver, B., (2010). Introducción a la Probabilidad y Estadística
(13ª ed.) Mexico, D.F., Cengage Learning Editores S.A de C.V.
6. San Segundo, F., Marvá, M., (2016). PostData 1.0 Una Introducióna los conceptos de la
Estadística, pensado para principiantes, Retomado de: http://www.postdata-
statistics.com/IntroEstadistica/Curso/000-CursoEstadistica-color.pdf
7. Yakir, B., (2011). Introduction to Statistical Thinking (With R, Without Calculus), Retomado
de: http://pluto.huji.ac.il/~msby/StatThink/IntroStat.pdf

GLOSARIO

Una muestra aleatoria es una secuencia de variables aleatorias independientes, distribuidas de


forma idéntica (IID).

Estadístico: es una función computable definida en el espacio muestral S.

Media muestral: es simplemente el promedio aritmético de los valores de muestra.

Margen de error: es una estadística que expresa la cantidad de error de muestreo aleatorio en
los resultados de una encuesta.

Estimador: es una función que asigna el espacio de muestra a un conjunto de estimaciones de


muestra.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 19 de 19

Estimación puntual: es el proceso de estimación de un parámetro a partir de una distribución de


probabilidad, basada en datos observados de la distribución.

Intervalo de confianza: es un rango estimado de valores que probablemente incluya un


parámetro de población desconocido, y el rango estimado se calcula a partir de un conjunto dado
de datos en la muestra.

Los límites de confianza: son los límites / valores inferior y superior de un intervalo de confianza,
es decir, los valores que definen el rango de un intervalo de confianza.

Intervalo de confianza para una media: especifica un rango de valores dentro del cual puede
estar el parámetro de población desconocida, en este caso la media.

El nivel de confianza: es el valor de probabilidad asociado con un intervalo de confianza.

Intervalo de confianza para una media: especifica un rango de valores dentro del cual puede estar
el parámetro de población desconocida, en este caso la media.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.

You might also like