Professional Documents
Culture Documents
PROBABILIDAD Y ESTADÍSTICA
UNIDAD IV: ESTIMACIÓN Y PRUEBA DE HIPÓTESIS
Temas
4.1 Estimación de Intervalos de Confianza para la media (con sigma
conocida).
4.2 Estimación de Intervalos de Confianza para la media (con sigma
desconocida).
OBJETIVO DE LA UNIDAD
Aplicar diferentes test estadísticos para validar diferentes tipos de hipótesis estadísticas.
INTRODUCCIÓN
El propósito de la estadística inferencial o inductiva es extraer, de los datos de una
muestra aleatoria obtenida de una población, conclusiones que se generalizan a toda la
población, y se evalúa el error de muestreo asociado con esa generalización. Este proceso
implica, haber resuelto dos problemas:
Dado que las muestras son aleatorias, su composición la determina el azar, y como los
errores de muestreo son también aleatorios (entendiendo por error de muestreo, a la diferencia
entre el valor estimado por medio de la muestra y el valor verdadero o valor del parámetro), se
tiene entonces una distribución probabilística, y será entonces posible aplicar la teoría de las
probabilidades para medir la confiabilidad de las inferencias.
la media, la varianza, la proporción de elementos que tienen una cierta característica, etc., la que
puede ser una estimación puntual o una estimación por intervalos; y la segunda es la que
concierne a someter a prueba de hipótesis estadísticas que se tienen acerca de esos parámetros
de la población.
𝜎 2 = Varianza de la población.
Me = Mediana de la población.
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 3 de 19
Por ejemplo, en el caso de 𝑋̅, a medida que aumenta el tamaño de la muestra, 𝑋̅ se acerca
cada vez más a µ, es decir, 𝑋̅ - µ tiende a cero al aumentar n.
Varianza Mínima: esta propiedad se refiere a seleccionar entre varios estimadores aquel
que varía menos de muestra a muestra, es decir, aquel que resulta ser más estable.
Debido a que los estimadores se aplican a una muestra, y se pueden seleccionar distintas
muestras del mismo tamaño de la misma población, y cada una de esas muestras produce una
estimación (que se espera que no sean todas iguales), entonces los valores del estimador varían
de muestra a muestra, es decir, el estimador es una variable aleatoria, y por lo tanto tiene
asociada una distribución de probabilidades, y esta a su vez, tiene una media aritmética, varianza,
etc. A esta distribución de probabilidad se le conoce como distribución muestral.
Suponga que de una población se seleccionan muestras de tamaño n y que para cada una
de ellas se calcula su media 𝑋̅, entonces surgen varias preguntas:
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 4 de 19
Solución
Se deduce que la media de la población es µ = 4 y la varianza de la población es σ2 = 2.
5
Se observa que se tienen ( )= 10 muestras sin reemplazo de tamaño 2 que se pueden
2
seleccionar de la población. Las 10 muestras, el número de ingenieros y la media de cada muestra
se presentan en la siguiente tabla:
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 5 de 19
Número de
Muestras Media
ingenieros
A, B 2, 3 5/2
A, C 2, 4 3
A, D 2, 5 7/2
A, E 2, 6 4
B, C 3, 4 7/2
B, D 3, 5 4
B, E 3, 6 9/2
C, D 4, 5 9/2
C, E 4, 6 5
D, E 5, 6 11/2
Tabla 2: Distribución de las muestras.
Luego los promedios varían entre 2.5 y 5.5 con la siguiente distribución de probabilidad:
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 6 de 19
5
Se nota que se tienen ( )= 10 muestra sin reemplazo de tamaño 3 que se pueden
3
seleccionar de la población. Las 10 muestras, el número de ingenieros y la media de cada muestra
se presentan en la siguiente tabla:
Muestras Número de ingenieros Media
A, B, C 2, 3, 4 3
A, B, D 2, 3, 5 10/3
A, B, E 2, 3, 6 11/3
A, C, D 2, 4, 5 11/3
A, C, E 2, 4, 6 4
A, D, E 2, 5, 6 13/3
B, C, D 3, 4, 5 4
B, C, E 3, 4, 6 13/3
B, D, E 3, 5, 6 14/3
C, D, E 4, 5, 6 5
Tabla 4: Distribución de las muestras
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 7 de 19
𝑁−𝑛 𝜎2
𝜎𝑋2̅ = 𝑁−1 𝑛
𝐸[𝑋̅] = 𝜇𝑥̅ = 𝜇
𝜎2
𝜎𝑋2̅ = 𝑛
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 8 de 19
2. Si además sabemos que la variable original X es de tipo normal N (µ, σ), entonces,
independientemente del tamaño n de la muestra, la media muestral también es normal, del
mismo tipo
𝜎
𝑋̅ ~ 𝑁(𝜇 , )
√𝑛
El resultado es tan importante, que vamos a repetirlo con otras palabras. En resumidas
cuentas:
Ahora, estamos listos para empezar a hacer Inferencia, que es el núcleo central de la
Estadística propiamente dicha. Vamos a utilizar las muestras para tratar de obtener información
sobre la población.
Para estimar µ puede considerarse simplemente 𝑋̅. Esta sería una estimación puntual del
parámetro µ.
Por ejemplo, si se quiere estimar las ventas semanales medias de una determinada marca
de leche, y se selecciona una muestra aleatoria de 50 semanas, luego se calcula la cantidad
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 9 de 19
promedio de litros vendidos en una semana, la cual sería una estimación de la media población
de ventas semanales. A veces, la estimación puntal es insuficiente si no se posee alguna medida
de la confianza que merece. Esta situación se resuelve utilizando la estimación por intervalos, es
decir, construyendo un intervalo de confianza, a partir de la estimación puntual, dentro de cuyos
límites se espera, con un determinado nivel de confianza, que esté contenido el verdadero valor
poblacional, lo cual puede funcionar a partir del Teorema del Límite Central, afirmando que, por
ejemplo:
Hay una probabilidad del 95% de que µ esté dentro del intervalo (a, b)
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 10 de 19
Sustrayendo 𝑋̅:
Ordenando la desigualdad:
Donde:
𝐿𝑖 = 𝑋̅ − 1.96𝜎𝑋̅
𝐿𝑠 = 𝑋̅ + 1.96𝜎𝑋̅
Los límites del intervalo anterior corresponden a un nivel de confianza de 95%. También
pueden obtenerse de forma similar intervalos para otros niveles de confianza como 90%, 99%,
etc., lo que debe tenerse en cuenta es, que se debe sustituir en la expresión el valor de la normal
estándar z=1.96, que corresponde a la probabilidad del área central del 95%, por el valor de z del
nivel de confianza deseado. Lo anterior permite generalizar la expresión para estimar los límites
de un intervalo de confianza:
Sea X una variable aleatoria normal, cuya desviación típica sigma, σ, se conoce. Si
consideramos muestras de tamaño n, entonces el intervalo de confianza al nivel nc = (1−α) para
la media µ es:
𝜎 𝜎
𝑋̅ − 𝑧∝ ≤ 𝜇 ≤ 𝑋̅ + 𝑧∝
2 √𝑛 2 √𝑛
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 11 de 19
El valor:
𝜎
𝑧∝
2 √𝑛
es la semiamplitud (o semianchura) del intervalo, y si lo dividimos por el valor crítico,
obtenemos el error estándar de la muestra:
𝜎
√𝑛
Ejemplo 2. Considere que la distribución de la variable aleatoria llenado de un envase con un
producto de café se comporta como una normal, se toma una muestra al azar de 25 envases
llenos, se obtuvo un promedio muestral de 48 onzas. Suponga que la varianza es 𝜎 2 = 4 y calcule
un intervalo de confianza del 90%.
𝜎 𝜎
Solución: 𝑋̅ − 𝑧∝ ≤ 𝜇 ≤ 𝑋̅ + 𝑧∝
2 √𝑛 2 √𝑛
Utilizando el software RStudio, la información disponible y siguiendo las instrucciones se
obtiene el intervalo de confianza que se busca.
#Información disponible
Xbar=48
Sigma= 2
n=25
nc= 0.90
alpha = 1 - nc
# Calculamos el valor critico:
(z_alpha2 = qnorm (1 - alpha / 2))
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 12 de 19
## [1] 1.644854
## [1] 0.6579415
0.5
0
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
97
-0.5
-1
L C R
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 13 de 19
Pero hay algunos pocos casos en los que no es así, como el señalado en el gráfico (muestra
38). Y no es porque esos intervalos estén mal construidos. Para construirlos se ha usado
exactamente el mismo procedimiento que con cualquiera de los otros intervalos correctos. El
problema no está en el procedimiento, sino en la muestra. Como hemos discutido al hablar de la
distribución muestral, un porcentaje (habitualmente pequeño) de muestras de tamaño n se
pueden considerar muestras malas, en el sentido de poco representativas de la población. Si al
elegir una muestra al azar nos ha tocado en suerte una de esas muestras malas, por más que
apliquemos cuidadosamente el procedimiento que hemos descrito, es posible que terminemos
con un intervalo de confianza que no contenga a la media de la población.
Cálculo del tamaño necesario de la muestra para alcanzar una precisión dada
−20 𝑋̅ − 𝜇 20
𝑝[ ≤ ≤ ] = 0.95
200 200 200
√𝑛 √𝑛 √𝑛
−20 20
𝑝[
≤𝑧 ≤ ] = 0.95
200 200
√𝑛 √𝑛
Por la normal estándar se sabe que:
𝑝[−1.96 ≤ 𝑧 ≤ 1.96] = 0.95
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 14 de 19
La expresión anterior para n puede utilizarse para resolver otro tipo de problemas,
despejando la variable de interés.
Ejemplo 3. Para el mismo caso del ingreso promedio mensual de remesas recibidas por
familia, suponga ahora que se quiere tener un nivel de confianza de 90% de que la diferencia
𝑋̅ − 𝜇 no será mayor de 20 dólares.
Solución:
𝛼
En este caso, σ = 200 d = 20 1-α= 0.90 = 0.05
2
α = 0.10 𝑧0.95 = 1.645
1.645 ∗ 200 2
𝑛=( ) = (16.45)2 ≈ 271
20
La muestra debe ser de 271 familias. El valor obtenido es menor que el anterior, ya que
se redujo el nivel de confianza de 95% a 90%.
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 15 de 19
Ejemplo 4. Para el mismo caso del ingreso promedio mensual de remesas recibidas por familia,
suponga que se toma una muestra de 400 familias. ¿Cuál es la probabilidad de que el error de
estimación sea de 30 dólares o menos?
Solución
𝑧𝑐 ∗𝜎 2
Como sabemos 𝑛 = [ ] . Despejando zc, se tiene:
𝑑
√𝑛 √𝑛
= (𝑋̅ − 𝜇 ) ∗
𝑧𝑐 = 𝑑 ∗
𝜎 𝜎
Sustituyendo los valores conocidos:
√400
𝑧𝑐 = 30 ∗
=3
200
Luego, el nivel de confianza es el área de la normal estándar comprendida entre -3 y 3:
𝑛𝑐 = 𝑝(−3 ≤ 𝑧 ≤ 3) = 1 − 2 ∗ 𝑝(𝑧 ≤ −3)
Instrucciones de R para calcular la probabilidad de interés.
(nc=1-2*alpha2)
[1] 0.9973002
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 16 de 19
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 17 de 19
10. Una casa encuestadora en 2017 formuló la pregunta: "Después de un día de trabajo
promedio, ¿cuántas horas tiene para relajarse o realizar actividades que le gustan?" A una
muestra aleatoria de 1,155 personas. Un intervalo de confianza del 95% para la media del
número de horas dedicadas a relajarse o realizar actividades que disfrutan fue (1.38,
1.92).
(a) Interprete este intervalo en el contexto de los datos.
(b) Supongamos que otro grupo de investigadores informó un intervalo de confianza con
un margen mayor de error basado en tamaño de muestra igual de 1,155. ¿Cómo se
comparará su nivel de confianza con el nivel de confianza del intervalo indicado
anteriormente?
(c) Suponga que este año se lleva a cabo una nueva encuesta con la misma pregunta,
y esta vez el tamaño de la muestra es de 2.500. Asumiendo que las características de
la población, con respecto a la cantidad de tiempo que las personas pasan relajándose
después del trabajo, no han cambiado mucho en un año. ¿Cómo se comparará el
margen de error del intervalo de confianza del 95% basado en los datos de la nueva
encuesta con el margen de error del intervalo indicado anteriormente?
11. Supongamos que los puntajes de una de las pruebas en Probabilidad y Estadística se
distribuyen normalmente con una media de población desconocida y una desviación
estándar poblacional de tres puntos. Se selecciona una muestra aleatoria de 36 puntajes
y se obtiene una media muestral (puntaje promedio de la muestra) de 68. Encuentre un
intervalo de confianza del 90% para la media real (población) de los puntajes de los
exámenes de Probabilidad y Estadística, e interprételo.
ENLACES SUGERIDOS
http://www.randomservices.org/random/apps/SpecialSimulation.html
https://www.uv.es/ceaces/
https://www.bioestadistica.uma.es/analisis/teoremacentral/
http://www.stats.gla.ac.uk/steps/glossary/confidence_intervals.html
http://www.randomservices.org/random/
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 18 de 19
REFERENCIAS BIBLIOGRÁFICAS
GLOSARIO
Margen de error: es una estadística que expresa la cantidad de error de muestreo aleatorio en
los resultados de una encuesta.
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 19 de 19
Los límites de confianza: son los límites / valores inferior y superior de un intervalo de confianza,
es decir, los valores que definen el rango de un intervalo de confianza.
Intervalo de confianza para una media: especifica un rango de valores dentro del cual puede
estar el parámetro de población desconocida, en este caso la media.
Intervalo de confianza para una media: especifica un rango de valores dentro del cual puede estar
el parámetro de población desconocida, en este caso la media.
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en línea en la
Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del mismo es
responsabilidad del estudiante.