You are on page 1of 37

Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -

ESTADISTICA
El principal propsito de esta gua es orientar a los estudiantes que cursan sus estudios en el
sistema mixto, que se caracteriza, entre otras cosas, porque ellos son los principales
responsables de su propio aprendizaje.
Como es este sistema cada alumno debe estudiar por su cuenta, en los tiempos y lugares que
ms le convengan, se vuelve necesaria una gua que le ayude a lograr los objetivos de
aprendizaje y que le facilite el acceso a los materiales didcticos (libros, publicaciones,
audiovisuales, etctera) que requiere. Por estas razones, se han estructurado estas guas
bsicamente en cuatro grandes partes:
1. Informacin general de la asignatura
2. Panorama de la asignatura
3. Desarrollo de cada una de las unidades
4. Bibliografa
A su vez, estas cuatro partes contienen las siguientes secciones:
1. La informacin general de la asignatura que incluye: portada, caractersticas oficiales de
la materia, ndice de contenido de la gua y los nombres de las personas que han
participado en la elaboracin del material.
2. El panorama de la asignatura contiene el objetivo general del curso, el temario oficial
(que incluye solamente el ttulo de cada unidad), el temario detallado de todas las
unidades y el esbozo de la materia, en el cual se presenta un panorama general del
contenido de la asignatura, incluyendo sus elementos ms importantes.
3. Por su parte, el desarrollo de cada unidad que est estructurado en los siguientes
apartados:
Objetivo particular de la unidad
Temario detallado de la unidad que es, simplemente, la parte del temario
detallado global que corresponde a cada unidad
Presentacin de la unidad. Contenido de la unidad, dividido por sesiones.
Bibliografa especifica sugerida. Contiene indicaciones precisas de dnde
encontrar el material que se requiere estudiar para abarcar el contenido de la
unidad. En esta bibliografa especfica se detalla en qu secciones, captulos y/o
pginas del libro o libros sugeridos se encuentra el material a revisar.
Actividades complementarias de aprendizaje. Esta seccin contiene tambin
sugerencias sobre otras actividades, aparte del estudio del material bsico o de
la realizacin de las prcticas o ejercicios fundamentales, que se pueden llevar a
cabo para reforzar los conocimientos y/o habilidades adquiridas e incluye, como
ejercicio inicial, la elaboracin de un mapa conceptual, que es un resumen
grfico de los contenidos de la unidad y que tiene como objetivo principal ayudar
a reflexionar, comprender, relacionar y asimilar los principales conceptos de la
- 1
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
unidad. En un apndice del final de la gua se exponen diversas ideas sobre
cmo elaborar estos mapas conceptuales.
Cuestionario de autoevaluacin. Estos cuestionarios son un conjunto de
preguntas sobre los contenidos esenciales que conforman cada unidad y que
pretenden permitir que el estudiante, mediante sus respuestas, se d cuenta del
grado de dominio logrado en el estudio y, con ello, de la medida en que alcanz
los objetivos. En otras palabras, este cuestionario le debe permitir al alumno
decidir si ya aprendi lo suficiente como para estar en posibilidades de presentar
el examen correspondiente para acreditar la unidad. Al final de la gua se
incluyen las respuestas de estos cuestionarios de autoevaluacin.
Finalmente la ltima divisin gruesa de la gua contiene las bibliografas bsica y
complementaria que estn contempladas en el temario oficial, as como tambin
una bibliografa adicional que no est en el temario oficial pero que ha sido
sugerida por algn profesor.
Esperamos que esta gua cumpla con su cometido y, en todo caso, deseamos invitar a los
lectores, tanto profesores como alumnos, a que nos hagan llegar todo comentario o sugerencia
que permita mejorarla.
Caractersticas de la asignatura
ESTADISTICA
Licenciatura: Informtica Administrativa
Semestre: 3
rea: Administrativa
Requisitos: Ninguno
Objetivo general de la asignatura
El estudiante debe:
El estudiante obtendr los elementos necesarios para analizar aspectos estadsticos de los
sistemas que incluyen componentes aleatorios para la toma de decisiones.
Temario oficial (18 asesoras)
1- Distribuciones muestrales
2- Teora de la estimacin
3- Prueba de Hiptesis
4- Regresin y Correlacin Lineal
- 2
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
Temario detallado
1. Distribuciones muestrales
1.1. Introduccin.
1.2. Tipos de muestra (aleatorio simple, sistemtico, estratificado y conglomerado)
1.3. Distribucin muestral de medias
1.4. Teorema del lmite central.
1.5. Distribucin muestral de la media con varianza conocida
1.6. Distribucin muestral de la media con varianza desconocida
1.7. Distribucin muestral de la proporcin.
1.8. Distribucin muestral de la diferencia de medias.
1.9. .Distribucin muestral de la diferencia de proporciones.
2. Teora de la estimacin
2.1. Introduccin
2.2. Estimacin y propiedades de los estimadores.
2.3. Estimacin por intervalo.
2.4. Intervalo de confianza para la media con varianza conocida y desconocida.
2.5. Intervalo de confianza para una proporcin y diferencia de proporciones.
3. Prueba de Hiptesis
3.1. Conceptos de la teora de prueba de hiptesis.
3.2. Errores tipo I y II.
3.3. Prueba de hiptesis para una media con varianza conocida y desconocida.
3.4. Prueba de hiptesis para una proporcin y diferencia de proporciones.
3.5. Prueba de hiptesis para diferencia de medias con varianzas conocidas y
desconocidas.
3.6. Prueba de hiptesis para una varianza
3.7. Prueba de hiptesis para una razn de varianzas.
3.8. Prueba de bondad de ajuste.
4. Anlisis de Regresin Lineal
4.1. Anlisis de regresin lineal con una variable independiente.
4.2. Relaciones entre variables.
4.3. Modelos de regresin y sus usos.
4.4. Estimacin de la funcin de regresin.
4.4.1. Mtodo de mnimos cuadrados.
4.4.2. Estimadores de mnimos cuadrados.
4.4.3. Estimacin de la varianza de los errores.
4.5. 5.5 Inferencias en el anlisis de regresin.
4.5.1. Inferencias respecto a alfa y beta.
4.5.2. Intervalos de confianza para la funcin de regresin y valores observados.
4.6. 5.6 Medidas descriptivas de la asociacin entre (x) y (y) en el modelo de regresin.
- 3
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
1. Distribuciones muestrales
1.1. Introduccin.
1.2. Tipos de muestra (aleatorio simple, sistemtico, estratificado y conglomerado)
1.3. Distribucin muestral de medias
1.4. Teorema del lmite central.
1.5. Distribucin muestral de la media con varianza conocida
1.6. Distribucin muestral de la media con varianza desconocida
1.7. Distribucin muestral de la proporcin.
1.8. Distribucin muestral de la diferencia de medias.
1.9. .Distribucin muestral de la diferencia de proporciones.
Objetivos Particulares
Al trmino de la unidad, el alumno debe:
1. Conocer la importancia de las distribuciones de muestreo
2. Determinar el tamao de una muestra
3. Explicar el Teorema del Lmite Central
4. Calcular probabilidades en una distribucin muestral de la media y de la
diferencia de medias
5. Calcular probabilidades en una distribucin muestral de proporciones
SESION 1
1.1 Introduccin
Concepto de distribucin de muestra
La comprensin del concepto de la distribucin de muestreo es fundamental para el correcto
entendimiento de la inferencia estadstica. Una distribucin de la poblacin es la distribucin de
la totalidad de las medidas individuales de una poblacin, en tanto que una distribucin
muestral es la distribucin de los valores individuales incluidos en la muestra.
La distribucin de muestreo se refiere a la distribucin de los diferentes valores que una
estadstica muestral o estimador, podra adoptar en muchas muestras del mismo tamao. As,
aunque por lo general disponemos nicamente de una muestra aleatoria a subgrupo racional,
reconocemos que la estadstica muestral particular que determinamos, como la media o
mediana de la muestra, no es exactamente igual al respectivo parmetro de la poblacin. Mas
a un el valor de una estadstica muestral variar de una muestra a otra, a causa de la
variabilidad del muestreo aleatorio, o error de muestreo.
Las razones de la utilizacin del muestreo son:
o Estudiar toda la poblacin tomara mucho tiempo
o El costo de estudiar todos los elementos de la poblacin, a menudo es muy alto
- 4
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
o Casi siempre, los resultados de la muestra son adecuados
o La naturaleza destructiva de ciertas pruebas
o La imposibilidad fsica de revisar todos los elementos.
1.2 Tipos de muestra
Los tipos de muestreo que estudiaremos son:
- Muestreo Aleatorio Simple
- Muestreo Aleatorio Sistemtico
- Muestreo Aleatorio Estratificado
- Muestreo por Conglomerados
Muestreo Aleatorio Simple: Es el que ms se usa. Es una muestra seleccionada de modo que
cada elemento o persona en la poblacin tiene la misma oportunidad de resultar seleccionado.
Muestreo Aleatorio Sistemtico: Se selecciona un punto de inicio aleatorio y despus se elige
cada k miembro de la poblacin. Primero se calcula k, que es el resultado de dividir el tamao
de la poblacin entre el tamao de la muestra. Antes de utilizar este muestreo, debemos
observar con cuidado el orden fsico de la poblacin. Cuando el orden fsico se relaciona con la
caracterstica de la poblacin, entonces no se debe utilizar el muestreo aleatorio sistemtico.
Muestreo Aleatorio Estratificado: Cuando una poblacin se divide en subgrupos, llamados
estratos, y selecciona al zar un elemento en cada estrato
Muestreo por conglomerados: Se utiliza a fin de reducir el costo del muestreo de una poblacin
dispersa en una regin geogrfica extensa. En este muestreo una poblacin se divide en
grupos o conglomerados utilizando los lmites naturales geogrficos o de otros tipos. Luego,
los grupos se seleccionan al azar y se recopila una muestra al elegir en forma aleatoria
elementos en cada grupo.
1.3 Distribucin de muestreo de la media
Cuando en la inferencia estadstica acerca de una media poblacional se emplea la media de
una sola muestra es til conocer el valor esperado y la variabilidad por esperar de una muestra
a otra.
El siguiente ejemplo describe la construccin de una distribucin muestral de medias:
Tartus Industries cuenta con 7 empleados de produccin (se considera como la poblacin). En
la siguiente tabla se proporcionan los ingresos por hora de cada empleado).
a) Cul es la media de la poblacin?
b) Cul es la distribucin muestral de medias para muestras de tamao 2?
c) Cul es la media de la distribucin muestral de medias?
- 5
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
Empleado
Ingresos por hora
(Dlares)
Joe 7
Sam 7
Sue 8
Bob 8
Jan 7
Art 8
Ted 9
Respuesta:
a) La media de la poblacin: 71 . 7
7
9 8 7 8 7 7

+ + + + +

b) Distribucin muestral de medias: Para llegar a esta distribucin, todas las muestras posibles
de tamao 2 se seleccionaron sin reemplazos en la poblacin, y se calcularon sus medias. Hay
21 muestras posibles que se obtuvieron mediante la frmula de combinatoria:
21
7
2
C C
n
k
, donde n es el nmero de elementos de la poblacin y k es el tamao de
la muestra.
En la siguiente tabla se ilustran las 21 medias de muestras de todas las muestras posibles de
tamao 2 que se pueden extraer de la poblacin. Estas 21 muestras se utilizan para construir
una distribucin de probabilidad que es la distribucin muestral de medias:
Muestr
a
Empleado
s
Ganancias
por hora
Media
Muestr
a
Empleado
s
Ganancias
por hora
Media
1 Joe, Sam 7,7 7.00 12 Sue, Bob 8,8 8.00
2 Joe, Sue 7,8 7.50 13 Sue, Jan 8,7 7.50
3 Joe, Bob 7,8 7.50 14 Sue, Art 8,8 8.00
4 Joe, Jan 7,7 7.00 15 Sue, Ted 8,9 8.50
5 Joe, Art 7,8 7.50 16 Bob, Jan 8,7 7.50
6 Joe, Ted 7,9 8.00 17 Bob, Art 8,8 8.00
7 Sam, Sue 7,8 7.50 18 Jan, Art 8,9 8.50
8 Sam, Bob 7,8 7.50 19 Jan, Art 7,8 7.50
9 Sam, Jan 7,7 7.00 20 Jan, Ted 7,9 8.00
10 Sam, Art 7,8 7.50 21 Art, Ted 8,9 8.50
11 Sam, Ted 7,9 8.00
Distribucin muestral de medias para n=2
Media de la
muestra
Nmero de
medias
Probabilidad
7,00 3 0.1429
7,50 9 0.4285
8,00 6 0.2857
8,50 3 0.1429
21 1.0000
- 6
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
d) La media de la distribucin muestral de medias se obtiene al sumar las diversas medias
de la muestra y dividiendo la suma entre el nmero de muestras:
71 . 7
21
50 . 8 ... 50 . 7 00 . 7

+ + +

La distribucin de muestreo de la media se describe determinando la media de dicha


distribucin, la cual es el valor esperado E(X) la desviacin estndar de la distribucin de las
medias mustrales, designada como
x

. Dado que esta desviacin estndar es indicativa de


la exactitud de la estadstica muestral como estimador de una media poblacional,
x

suele
recibir el nombre de error estndar de la media. Cuando los parmetros de la poblacin o
proceso son conocidos, el valor esperado y error estndar de la distribucin de muestreo de la
media son:
) (x E
n
x


Otro Ejemplo: Supongamos que la media de una poblacin muy grande es =50.0 y que la
desviacin estndar es
x
=12.0. Determinamos la distribucin de muestreo de las medias
mustrales para un tamao de muestra n=36, en trminos del valor esperado y el error
estndar de la distribucin, de la siguiente manera:
0 . 50 ) ( x E 0 . 2
36
0 . 12

n
x

Cuando el muestreo se basa en una poblacin finita de tamao limitado, se dispone de un


factor de correccin por finitud para la correcta determinacin del error estndar. El efecto de
este factor de correccin es siempre es reducir el valor que de otra forma se calculara. La
correccin es insignificante y puede omitirse cuando n<0.05N; esto es, cuando el tamao de la
muestra es inferior al 5% del tamao de la poblacin. La frmula del error estndar de la media
con el factor de correccin por finitud incluido es:

1

N
n N
n
x

El factor de correccin en la formula anterior es el factor bajo la raz cuadrada que se ha


aadido a la formula bsica del error estndar de la media. Este medio factor de correccin
puede aadirse a todas las formulas de error estndar para la media.
Si la desviacin estndar de la poblacin o proceso es desconocida, el error estndar de la
media puede estimarse usando la desviacin estndar de la muestra como estimador de la
desviacin de la poblacin. Para diferenciar este error estndar estimado del preciso basado
en una conocida, se le designa con el smbolo ), la frmula del error estndar
estimado de la media es:

n
s
s
x

Ejemplo: un auditor toma una muestra aleatoria de tamao n=16 de un conjunto de N=16 de
un conjunto de N= 1500 cuentas se desconoce. Sin embargo, la desviacin estndar de la
- 7
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
muestra es s=$57.00. Determinar el valor del error estndar de la distribucin de muestreo de
la media de la siguiente manera:

25 . 14
16
57

n
s
s
x

1.4 TEOREMA DEL LMITE CENTRAL
Este Teorema, tiene amplia aplicacin a la distribucin muestral de medias. Nos permite
utilizar la distribucin normal de probabilidad a fin de crear intervalos de confianza para la
media de la poblacin y efectuar pruebas de hiptesis.
El Teorema del Lmite Central establece, que para muestras aleatorias grandes, la forma de la
distribucin muestral de medias se aproxima a una distribucin de probabilidad normal. Esta
aproximacin es ms precisa para muestras grandes que para muestras pequeas. Podemos
razonar acerca de la distribucin muestral de medias sin ninguna informacin acerca de la
forma de la distribucin de la poblacin de la que se toma la muestra. O sea, el teorema es
verdadero para todas las distribuciones.
El enunciado del teorema dice as:
Si todas las muestras de un tamao en particular se seleccionan de cualquier poblacin,
la distribucin muestral de medias se aproxima a una distribucin normal. Esta
aproximacin mejora con muestras ms grandes.


Actividades complementarias de aprendizaje
1. Exponga un ejemplo aplicado a cada mtodo de muestreo.
2. Investigue qu es un error de muestreo
Cuestionario de autoevaluacin
1. Enumere los motivos para realizar un muestreo de poblacin
2. Una poblacin est formada por los cuatro valores siguientes: 12, 12. 14 y 16
a. Enumere todas las muestras de tamao 2 y calcule la media de cada muestra
b. Calcule la media de la distribucin muestral de medias y la media de la
poblacin. Compare los dos valores
c. Qu importancia tiene el teorema Central del Lmite?
- 8
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
3. A cada empleado nuevo se le da un nmero de identificacin. Los archivos de
personal se ordenan en secuencia empezando por el empleado nmero 0001.
Para tomar una muestra de los empleados, se seleccion primero el nmero
0453, etc, se convirtieron en miembros de la muestra. A este tipo de muestreo se
le llama:
a) Muestreo Aleatorio simple
b) Muestreo aleatorio estratificado
c) Muestres estratificado
d) Muestro por conglomerados

- 9
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
SESION 2
1.5Distribucin muestral de la media con varianza conocida
Si la distribucin de muestreo de la media tiene una distribucin normal, ya sea porque la
poblacin tiene distribucin normal o por la aplicacin del teorema central del lmite, podemos
determinar probabilidades en relacin con los posibles valores de la media muestral, dado que
conocemos la media y desviacin estndar de la poblacin. El proceso es anlogo a la
determinacin de probabilidades para observaciones individuales mediante el uso de la
distribucin normal. El valor asignado a la media muestral el que se convierte en un valor de
z a fin de emplear la tabla de probabilidades normales.
En esta frmula de conversin se hace uso del error estndar de la media, cuando se conoce
la desviacin estndar poblacional, porque ste es la desviacin estndar de la variable . As,
la formula de conversin es:
x
x
Z

Donde:
n
x



x

es el error estndar de la media


Ejemplo: un auditor toma una muestra aleatoria de tamao n=36 de una poblacin de 1000
cuentas por cobrar. El valor medio de las cuentas por cobrar para la poblacin es =$260.00,
con la desviacin estndar de la poblacin =$45,00.
Cul es la probabilidad de que la media muestral sea inferior a $250.00?
Aparece la curva de probabilidad. La distribucin de muestreo es descrita por la media y el
error estndar:
00 . 260 ) ( x E
50 . 7
36
45

n
x

- 10
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
33 . 1
5 . 7
260 250

x
x
Z

Por lo tanto:
0918 . 0 ) 33 . 1 ( ) 250 ( z P x P
Ejemplo: en referencia al ejemplo anterior Cul es la probabilidad de que la media muestral
se encuentre a no ms de $15.00 de la media de la poblacin?
9544 . 0 ) 00 . 2 00 . 2 ( ) 275 245 ( + z P x P
1.6Distribucin muestral de la media con varianza desconocida
Hay ocasiones en que deseamos hacer inferencias acerca de la poblacin, pero no sabemos
mucho acerca de esta. En este caso resulta til el teorema del lmite central. Sabemos que
para cualquier forma de distribucin de la poblacin, si seleccionamos una muestra lo
suficientemente grande, la distribucin de muestreo de la media de la muestra seguir una
distribucin normal. La teora estadstica ha sealado que las muestras de por lo menos 30
elementos no son lo suficientemente grandes como para permitirnos suponer que la
distribucin de muestreo sigue la distribucin normal. A menudo no conocemos el valor de la
desviacin estndar poblacional. De nuevo, como la muestra es de por lo menos 30,
calculamos la desviacin estndar de la poblacin, con la desviacin estndar de la muestra.
Por lo que utilizamos la frmula siguiente:

x
s
x
Z

Donde,
n
s
s
x

x
s
es el error estndar de la media
Actividades complementarias de aprendizaje
1. Seale las dos condiciones fundamentales para que la distribucin de muestreo
siga la distribucin de probabilidad normal
Cuestionario de autoevaluacin
1. Una gran poblacin de saldos de cuentas tiene distribucin normal, el saldo
medio es de 4150.00 con desviacin estndar de %35.00. Cul es la
probabilidad de que la media de muestra aleatoria de tamao 40 tenga un saldo
que exceda de $160.00?
2. Se sabe que el valor en dlares de los montos de ventas de un producto de
consumo especfico durante el ltimo ao tienen una distribucin normal con
media de $3400 por establecimiento de ventas al detalle, con una desviacin
estndar muestral de $200. Si el producto es manejado por un gran nmero de
establecimientos Cul es la probabilidad de que la media muestral de una
muestra de tamao 35 sea:
a. Mayor a $ 3 500?
b. Entre $3 500 y $3 450
- 11
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
SESION 3
Distribucin muestral de proporciones
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporcin de artculos defectuosos o la proporcin de alumnos
reprobados en la muestra. La distribucin muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin
muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el
estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters y
"n" el tamao de la muestra) en lugar del estadstico media.
Una poblacin binomial est estrechamente relacionada con la distribucin muestral de
proporciones; una poblacin binomial es una coleccin de xitos y fracasos, mientras que una
distribucin muestral de proporciones contiene las posibilidades o proporciones de todos los
nmeros posibles de xitos en un experimento binomial, y como consecuencia de esta
relacin, las afirmaciones probabilsticas referentes a la proporcin muestral pueden evaluarse
usando la aproximacin normal a la binomial, siempre que np 5 y
n(1-p) 5. Cualquier evento se puede convertir en una proporcin si se divide el nmero
obtenido entre el nmero de intentos.
La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de
proporciones est basada en la aproximacin de la distribucin normal a la binomial. Esta
frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en la
muestra.

n
Pq
P p
z

A esta frmula se le puede agregar el factor de correccin de


1

N
n N
si se cumple con las
condiciones necesarias
Generacin de la Distribucin Muestral de Proporciones
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos defectuosos. Se van
a seleccionar 5 artculos al azar de ese lote sin reemplazo. Genere la distribucin muestral de
proporciones para el nmero de piezas defectuosas.
Como se puede observar en este ejercicio la Proporcin de artculos defectuosos de esta
poblacin es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote estn
defectuosas.
El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12 elementos es
12
C
5
=792, las cuales se pueden desglosar de la siguiente manera:
- 12
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
Artculos
Buenos
Artculos
Malos
Proporcin
de artculos
defectuoso
Nmero de
maneras en las
que se puede
obtener la
muestra
1 4 4/5=0.8
8
C
1
*
4
C
4
=8
2 3 3/5=0.6
8
C
2
*
4
C
3
=112
3 2 2/5=0.4
8
C
3
*
4
C
2
=336
4 1 1/5=0.2
8
C
4
*
4
C
1
=280
5 0 0/5=0 8C5*4C0=56
Total 792
Para calcular la media de la distribucin muestral de proporciones se tendra que hacer la
sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla entre el nmero
total de muestras. Esto es:
333 . 0
3
1
792
) 56 . 0 * 0 ( ... ) 112 * 6 (. ) 8 * 08 (.

+ + +

Como podemos observar la media de la distribucin muestral de proporciones es igual a la


Proporcin de la poblacin.
P
p

Tambin se puede calcular la desviacin estndar de la distribucin muestral de proporciones:
1681 . 0
792
)
3
1
0 ( ... )
3
1
6 . 0 ( )
3
1
8 . 0 (
2 2 2

+ + +

La varianza de la distribucin binomial es npq


2
, por lo que la varianza de la distribucin
muestral de proporciones es:
n
pq
p

2
. Si se sustituyen los valores en esta frmula tenemos
que:
45
2
5
)
3
2
)(
3
1
(
2

n
pq
p

y la desviacin sera
2108 . 0
p

Este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de correccin para
una poblacin finita y un muestreo sin reemplazo:
- 13
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
( )( )
1681 . 0
1 12
5 12
5
3
2
3
1
1
2

N
n N
n
pq
p

Un ejemplo: Un medicamento para malestar estomacal tiene la advertencia de que algunos


usuarios pueden presentar una reaccin adversa a l, ms an, se piensa que alrededor del
3% de los usuarios tienen tal reaccin. Si una muestra aleatoria de 150 personas con malestar
estomacal usa el medicamento, encuentre la probabilidad de que la proporcin de la muestra
de los usuarios que realmente presentan una reaccin adversa, exceda el 4%.
Datos:
n=150 personas
P=0.03
p= 0.04
P(p>0.04) = ?
96 . 0
150
) 97 . 0 )( 03 . 0 (
03 . 0 0433 . 0

n
Pq
P p
z
Existe una probabilidad del 17% de que al tomar una muestra de 150 personas se tenga una
proporcin mayor de 0.04 presentando una reaccin adversa
Actividades complementarias de aprendizaje
1. Realice un resumen del tema
2. Cundo usamos el factor de correccin?
Cuestionario de autoevaluacin
1. Se sabe que la verdadera proporcin de los componentes defectuosos fabricados
por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de
tamao 60 tenga:
a. Menos del 3% de los componentes defectuosos.
b. Ms del 1% pero menos del 5% de partes defectuosas.
- 14
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
SESION 4
1.8 Distribucin muestral de la diferencia de media
A continuacin presentaremos a dos poblaciones que son distintas, la primera con tiene una
media de
1
, con una desviacin estndar
1
, y la segunda con media

2
y desviacin
estndar
2
. Se toma una muestra aleatoria de tamao n
1
de la primera poblacin y una
muestra independiente aleatoria de tamao n
2
de la segunda poblacin; se calcula la media
muestral para cada muestra y la diferencia entre dichas medias. La coleccin de todas esas
diferencias se llama distribucin muestral de las diferencias entre medias
2 1 x x
.
Se sabe que la distribucin es aproximadamente normal para tamaos de muestras mayores o
iguales a 30, par ambas muestras. Si las poblaciones son normales, entonces la distribucin
muestral de medias es normal sin importar los tamaos de las muestras.
La frmula que se utilizar para el clculo de probabilidad de las diferencias de medias
muestrales:
2 1
) ( ) (
2 1
2 1
x x
x x
z


Donde,
2
2
2
1
2
1
2 1
n n
x x

+


Ejemplo:
Los productores de computadoras personales compran determinados componentes a dos
compaas. Los componentes de la compaa A tienen una vida media de 7.2 aos con una
desviacin estndar de 0.8 aos, mientras que los de la B tienen una vida media de 6.7 aos
con una desviacin estndar de 0.7. Determine la probabilidad de que una muestra aleatoria
de 34 componentes de la compaa A tenga una vida promedio de al menos un ao ms que
la de una muestra aleatoria de 40 componentes de la compaa B.
Datos:
aos
A
2 . 7
aos
B
7 . 6
aos
A
8 . 0
aos
B
7 . 0
34
A
n
40
B
n
( ) [ ] ? 1 B A x x P
- 15
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
84 . 2
1762 . 0
5 . 0 1 ) ( ) (

B A x x
B A
B A x x
z


Actividades complementarias de aprendizaje
1. Realice un resumen del tema
Cuestionario de autoevaluacin
1. Se sabe que la verdadera proporcin de los componentes defectuosos fabricados por una
firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamao 60
2-. Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrndose una desviacin
estndar de 1.23km/L para la primera gasolina y una desviacin estndar de 1.37km/L para la
segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos.
Promedio de rendimiento de la gasolina uno sea de 5km/l y para la gasolina dos sea de 5.3 km
por litro
a. Cul es la probabilidad de que la primera gasolina de un rendimiento promedio mayor
de 0.45km/L que la segunda gasolina?
b. Cul es la probabilidad de que la diferencia en rendimientos promedio se encuentre
entre 0.65 y 0.83km/L a favor de la gasolina 1?.
- 16
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
SESION 5
Distribucin muestral de la diferencia de proporciones.
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse
utilizando proporciones o porcentajes. A continuacin se citan algunos ejemplos:
Educacin.- Es mayor la proporcin de los estudiantes que aprueban matemticas que
las de los que aprueban ingls?
Medicina.- Es menor el porcentaje de los usuarios del medicamento A que presentan
una reaccin adversa que el de los usuarios del frmaco B que tambin presentan una
reaccin de ese tipo?
Administracin.- Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales.
Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos que genera
la mquina A a los que genera la mquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribucin muestral de diferencia de proporciones es aproximadamente normal
para tamaos de muestra grande (n
1
p
1
5, n
1
q
1
5,n
2
p
2
5 y n
2
q
2
5). Entonces p
1
y p
2
tienen
distribuciones muestrales aproximadamente normales, as que su diferencia p
1
-p
2
tambin
tiene una distribucin muestral aproximadamente normal.
La frmula que se utilizar para el clculo de probabilidad del estadstico de diferencia de
proporciones es:
2
2 2
1
1 1
2 1 2 1
) ( ) (
n
q P
n
q P
P P p p
Z
+

Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus
opiniones sobre la promulgacin de la pena de muerte para personas culpables de asesinato.
Se cree que el 12% de los hombres adultos estn a favor de la pena de muerte, mientras que
slo 10% de las mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias de 100
hombres y 100 mujeres su opinin sobre la promulgacin de la pena de muerte, determine la
probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las
mujeres.
Datos:
P
H
= 0.12
P
M
= 0.10
n
H
= 100
n
M
= 100
p (p
H
-p
M
0.03) = ?
- 17
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -

Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una distribucin
binomial y se est utilizando la distribucin normal.
11 . 0
100
) 90 . 0 )( 10 . 0 (
100
) 88 . 0 )( 12 . 0 (
) 02 . 0 ( 025 . 0 ) ( ) (

M
M M
H
H H
M H M H
n
q P
n
q P
P P p p
z
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de
muerte, al menos 3% mayor que el de mujeres es de 0.4562.
Actividades complementarias de aprendizaje
1. Realice un resumen del tema
Cuestionario de autoevaluacin
1. Una encuesta del Boston College const de 320 trabajadores de Michigan que fueron
despedidos entre 1979 y 1984, encontr que 20% haban estado sin trabajo durante por lo
menos dos aos. Supngase que tuviera que seleccionar otra muestra aleatoria de 320
trabajadores de entre todos los empleados despedidos entre 1979 y 1984. Cul sera la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos
dos aos, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o ms?
- 18
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
2. Teora de la estimacin
2.1. Introduccin
2.2. Estimacin y propiedades de los estimadores.
2.3. Estimacin por intervalo.
2.4. Intervalo de confianza para la media con varianza conocida y desconocida.
2.5. Intervalo de confianza para una proporcin y diferencia de proporciones.
2.6. Intervalo de confianza para diferencias de medias con varianza conocida y
desconocida.
Objetivos Particulares
Al trmino de la unidad, el alumno debe:
1. Definir el trmino Estimacin puntual
2. Definir el trmino Nivel de Confianza
3. Elaborar intervalos de confianza para la media y para la proporcin
4. Elaborar intervalos de confianza para la diferencia de medias y diferencia de
proporciones
5. Determinar el tamao de muestra para la estimacin de medias y de
proporciones de una poblacin.
SESION 6
2.1 Introduccin
En casi todas las situaciones, la poblacin es numerosa o es difcil identificar a todos sus
miembros, de modo que necesitamos manejar una muestra. En otras palabras no conocemos
el parmetro poblacional y, por tanto, queremos estimar el valor a partir de un estadstico de la
muestra. Considere el siguiente ejemplo de negocio:
1-. El turismo es una fuente importante de ingresos para muchos pases y para polos
importantes en Mxico, como por ejemplo, Cancn. Suponga que la Secretara de Turismo
de este estado quiere un estimado de la cantidad media que gastan los turistas que visitan
Cancn. Por lo que 500 turistas se seleccionan al azar en el momento que salen del pas y
se les preguntan los detalles de los gastos que hicieron durante su visita a este polo
turstico. La cantidad media que gasta la muestra de 500 turistas es un estimado del
parmetro poblacional desconocido. Es decir la media de la muestra sirve como estimado
de la media poblacional.
El objetivo principal de la estadstica inferencial es la estimacin, esto es que mediante el
estudio de una muestra de una poblacin se quiere generalizar las conclusiones al total de la
misma. Como vimos en la seccin anterior, los estadsticos varan mucho dentro de sus
distribuciones muestrales, y mientras menor sea el error estndar de un estadstico, ms
cercanos sern unos de otros sus valores.
- 19
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
La inferencia estadstica est casi siempre concentrada en obtener algn tipo de conclusin
acerca de uno o ms parmetros (caractersticas poblacionales). Para hacerlo, se requiere que
un investigador obtenga datos muestrales de cada una de las poblaciones en estudio.
Entonces, las conclusiones pueden estar basadas en los valores calculados de varias
cantidades muestrales
2.2 Estimacin y propiedades de los estimadores.
Existen dos tipos de estimaciones para parmetros; puntuales y por intervalo. Una estimacin
puntual es un nico valor estadstico y se usa para estimar un parmetro. El estadstico usado
se denomina estimador.
Un estimador puntual es un estadstico que se calcula a partir de la informacin de la muestra
y que se utiliza para calcular el parmetro de una poblacin. En la siguiente tabla se exponen
los parmetros poblacionales y sus respectivos estimadores.
Parmetro de la poblacin Estimador
Media
x
Diferencia entre la media de dos poblaciones
1
-
2
2 1 x x
Proporcin p
Diferencia entre las proporciones de dos poblaciones
1

2
p
1
- p
2
Varianza
2
s
2
Desviacin estndar s
Aunque la media muestral es til como estimador de insesgado de la media de la poblacin, no
hay manera de expresar el grado de exactitud de un estimador puntual. La probabilidad de que
la media muestral sea exactamente correcta como estimador de la media de la poblacin es de
p(x)=0.
Un intervalo de confianza para la media es un rango de valores creado a partir de los datos de
la muestra, de modo que el parmetro poblacional es probable que ocurra dentro de ese rango
en una probabilidad especfica. Esta ltima se llama Nivel de Confianza.
Por ejemplo, calculamos que el ingreso anual promedio para los trabajadores de la
construccin es de $65000. El rango de esta estimacin puede ser de $61000 a $69000.
Podemos describir la confianza que tenemos en que el parmetro de la poblacin se encuentre
en el intervalo haciendo una declaracin de probabilidad. Podemos decir, por ejemplo, que
estamos 90% seguros de que el ingreso anual medio de los trabajadores de la construccin es
entre $61000 y $69000.
En otras palabras el intervalo de confianza es un intervalo estimado construido en relacin con
la media muestral por medio del cual puede especificar la verosimilitud de que el intervalo
incluya el valor de la media poblacional.
- 20
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
2.3 Estimacin por intervalo.
Un estimado puntual, por ser un slo nmero, no proporciona por s mismo informacin alguna
sobre la precisin y confiabilidad de la estimacin. El estimado puntual nada dice sobre lo
cercano que esta de la media poblacional. Una alternativa para reportar un solo valor del
parmetro que se est estimando es calcular e informar todo un intervalo de valores factibles,
un estimado de intervalo o intervalo de confianza (IC).
Un intervalo de confianza para la media es un rango de valores creado a partir de los datos de
la muestra, de modo que el parmetro poblacional es probable que ocurra dentro de ese rango
en una probabilidad especfica. Esta ltima se llama Nivel de Confianza.
Por ejemplo, calculamos que el ingreso anual promedio para los trabajadores de la
construccin es de $65000. El rango de esta estimacin puede ser de $61000 a $69000.
Podemos describir la confianza que tenemos en que el parmetro de la poblacin se encuentre
en el intervalo haciendo una declaracin de probabilidad. Podemos decir, por ejemplo, que
estamos 90% seguros de que el ingreso anual medio de los trabajadores de la construccin es
entre $61000 y $69000.
Cuanto mayor sea el nivel de confianza podremos creer que el valor del parmetro que se
estima est dentro del intervalo.
Actividades complementarias de aprendizaje
1. Realice un resumen del tema
Cuestionario de autoevaluacin
1. Comente las diferencias entre un estimador puntual y un estimador por intervalos.
2. Investigue cules son los factores que determinan el ancho de un intervalo de
confianza.
3. Los puntos extremos de un intervalo de confianza se llaman:
a) Niveles de confianza
b) Las estadsticas de prueba
c) Los grados de confianza
d) Los lmites de confianza
- 21
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
SESION 7
Intervalo de confianza para la media con varianza conocida y desconocida.
La informacin desarrollada acerca de la forma de la distribucin muestral de medias, es
decir, la distribucin de muestreo de
x
, nos permite ubicar un intervalo que tiene una
probabilidad especfica de contener la media poblacional

. Para muestras razonablemente


grandes, los resultados del teorema del lmite central nos permiten afirmar lo siguiente:
1. Del total de las medias de las muestras de una poblacin 95% estarn a t 1.96
desviaciones estndar de la media poblacional

.
2. Del total de las medias de las muestras 99% se encontrarn a 58 . 2 t desviaciones
estndar de la media poblacional.
La desviacin estndar a la que nos referimos es la desviacin estndar de la distribucin
muestral de medias. Por lo regular, se conoce como error estndar. A los intervalos calculados
de esta manera se les llama Intervalo de Confianza de 95% e intervalo de confianza de 99%.
El nivel de confianza asociado con un intervalo de confianza indica el porcentaje de tales
intervalos que a largo plazo incluyen el parmetro que est siendo estimado.
Los intervalos de confianza se elaboran por lo general con el estimador insesgado en un
punto medio del intervalo..
Cuando est garantizado el uso de la distribucin normal de la probabilidad, el intervalo de
confianza para la media se determina mediante:
x
z x t
O cuando la de la poblacin se desconoce mediante:
x
zs x t
Los intervalos de confianza de usos ms frecuentes son los intervalos de confianza de
90%, 95% y 99%. Los valores de z requeridos junto con estos intervalos estn dados en la
siguiente tabla:
z (Nmero de unidades de desviacin
estndar
respecto a la media)
Proporcin de rea en el intervalo
x
z x t
x
zs x t
1.645 0.90
1.960 0.95
2.580 0.99
Ejemplo. Durante una semana dada, una muestra aleatoria de 30 empleados por hora
seleccionada de un gran nmero de empleados de una gran manufacturera tiene un salario
muestral de =$180.00, con una desviacin estndar muestral de s=$14.00. Estimamos el
salario medio de todos los empleados por hora de la empresa con una estimacin por intervalo
tal como para que podamos tener confianza de 95% de que el intervalo incluye el valor de la
media de la poblacin de la siguiente manera:
02 . 185 $ 98 . 174 $ ) 56 . 2 ( 96 . 1 00 . 180 96 . 1 a s x
x
t t
- 22
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
Donde
x
=$180.00 y
56 . 2
30
14

n
s
s
x
De este modo, podemos afirmar que el nivel de salarial medio de la totalidad de los empleados
es de entre $174.98 y $185.02, con un nivel de confianza de 95% en esta estimacin.
Otro ejemplo: La American Management Association quiere tener informacin sobre el
ingresos medio de los gerentes intermedios en la industria detallista. Una muestra aleatoria de
256 gerentes revela una media muestral de $45420. la desviacin estndar de esta muestra es
de $2050. La asociacin busca las respuestas a las preguntas siguientes:
a) Cul es la media poblacional?
b) Cul es el rango razonable de valores para la media poblacional?
c) Qu significan estos resultados?
De acuerdo al teorema del lmite central, si tenemos muestras grandes, la distribucin de las
medias de estas seguir la distribucin normal.
a) La media de la muestra es un estimador puntual de la media poblacional desconocida.
b) 45671 $ 45169 $ )
256
2050
( 96 . 1 45420 96 . 1 a s x
x
t t
c) Qu significa?: Supongamos que seleccionamos varias muestras de 256 gerentes,
quizs varios cientos. Para cada muestra, calculamos la media y la desviacin estndar
y luego creamos un intervalo de confianza del 95%. O sea podemos esperar que
alrededor del 95% de estos intervalos contengan el ingreso anual medio de la
poblacin.
DETERMINACIN DEL TAMAO DE MUESTRA REQUERIDO PARA LA ESTIMACIN DE
LA MEDIA.
Supongamos que se especifica el tamao deseado de un intervalo de confianza y el nivel de
confianza asociado con l. Si es conocida o puede estimarse, el tamao de muestra
requerido con base en el uso de la distribucin normal es:

2

,
`

.
|

E
z
n

Z es el valor de utilizado para el nivel de confianza especificado.
Es la desviacin estndar de la poblacin.
E es el error de muestreo de ms o menos permitido en el intervalo.
Ejemplo. Un analista de un departamento de personal desea estimar el nmero de horas de
capacitacin al ao para los supervisores de la compaa con un margen de error inferior a 3.0
horas y confianza de 90%. Con base en datos procedentes de otras divisiones, el analista
estima que la desviacin estndar de las horas de capacitacin es de =20.0 hr. El tamao de
muestra mnimo requerido es:
- 23
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
( ) ( )
121 27 . 120
0 . 3
9 . 32
0 . 3
0 . 20 645 . 1
2 2 2

,
`

.
|

]
]
]

,
`

.
|

E
z
n


Distribucin t e intervalo de confianza para la media
Anteriormente utilizamos una distribucin normal estndar para expresar el nivel de confianza.
Pero si tenemos una muestra menor a 30 y no conocemos la desviacin estndar poblacional,
entonces el teorema del lmite central no resuelve esta situacin. En estas condiciones, el
procedimiento estadstico correcto consiste en reemplazar la distribucin normal estndar por
la distribucin t. Esta distribucin presenta las siguientes caractersticas, y se basan en la
suposicin de que la poblacin de inters es normal, o casi normal:
1. Es una distribucin continua, al igual que la normal.
2. Es simtrica y tiene forma de campana, al igual que la normal.
3. No hay una sola distribucin t, sino ms bien, una familia de distribuciones t. Todas
tienen una media de 0, pero sus desviaciones estndar difieren segn el tamao de
la muestra, n. Hay una distribucin t para u tamao de muestra 20, otra para un
tamao de muestra de 22 y as, sucesivamente.
4. La distribucin t es ms extendida y plana en el centro que la distribucin normal
estndar. Sin embargo, conforme aumenta el tamao de la muestra, la distribucin t
se asemeja ms a la distribucin normal estndar, debido a que los errores al utilizar
s para estimar disminuyen con las muestras ms grandes.
Esta distribucin est asociada con los grados de libertad (gl) para un intervalo de confianza
para la media de la poblacin con base en una muestra de tamao n, gl=n-1.
Los grados de libertad indican el nmero de valores libres de variar en la muestra que sirve
de base al intervalo de confianza. A primera vista, parecera que todos los valores de la
muestra son siempre libres de variar en sus valores medidos. Pero la diferencia de la
distribucin t en comparacin como la z es que se requiere que tanto la media muestral como
la desviacin estndar muestral se fijen como estimadores paramtricos a fin de un intervalo
de confianza para medir la poblacin.
El uso de la distribucin t para inferencia sobre la media de la poblacin es adecuada
cuando es desconocida y la distribucin de muestreo de la media es normal.
Con gl el intervalo de confianza para la estimacin de la media de la poblacin cuando resulta
adecuado el uso de la distribucin t es:
x
gl
s t x t
Ejemplo: el ciclo medio de vida operativa de una muestra aleatoria de n=10 focos es de
=4000 horas, con la desviacin estndar muestral s=200 hrs. Se supone que el ciclo de vida
operativa de los focos es general tiene una distribucin aproximadamente normal. Estimamos
el ciclo medio de la vida operativa de la poblacin de focos de la que fue tomada esta muestra,
aplicando un intervalo de confianza de 95%, en esta forma:
x
gl
s t x Int t % 95 .
- 24
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -

( )( )
hr a 4143 3857
3 . 63 262 . 2 4000

t
Donde =4000 horas:
3 . 63
16 . 3
200
10
200
262 . 2
9 1



n
s
s
t t t
x
n gl
CMO DETERMINAR CUNDO UTILIZAR LA DISTRIBUCIN NORMAL O LA
DISTRIBUCION t?
Actividades complementarias de aprendizaje
1. Realice un resumen del tema
Cuestionario de autoevaluacin
1. Un analista de un departamento de personal selecciona aleatoriamente los
expedientes de 16 empleados por hora y determina que el ndice salarial medio por
hora es de $9.50. Se suponen que los ndices salariales de la compaa siguen una
distribucin normal. Si se sabe que la desviacin estndar de los ndices salariales
es de $1.00, estime el ndice salarial medio de la empresa con un intervalo de
confianza del 99%.
2. El dimetro medio de una muestra de 12 varillas cilndricas incluidas en un
embarque es de 2.345mm, con una desviacin estndar muestral de 0.048 mm. Se
supone que la distribucin de los dimetros de la totalidad de las varillas incluidas en
- 25
NO NO
NO
SI
SI
SI
La poblacin es
normal?
n es 30 ms?
Se conoce la
desviacin
estndar de la
poblacin?
Utilice una prueba
no paramtrica
Utilice la
distribucin normal
estndar
Utilice la
distribucin t
Utilice la
distribucin normal
estndar
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
el embarque es aproximadamente normal. Determine el intervalo de confianza del
95% para la estimacin del dimetro medio de todas las varillas incluidas en el
embarque.
3. El dimetro medio de una muestra de 100 varillas cilndricas incluidas en un
embarque es de 2.345mm, con una desviacin estndar muestral de 0.048 mm. Se
supone que la distribucin de los dimetros de la totalidad de las varillas incluidas en
el embarque es aproximadamente normal. Determine el intervalo de confianza del
90% para la estimacin del dimetro medio de todas las varillas incluidas en el
embarque.
SESION 8
- 26
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
2.5 Intervalo de confianza para una proporcin y diferencia de proporciones
La proporcin es una fraccin, razn o porcentaje que indica la parte de la muestra o la
poblacin que tiene un rasgo de inters en particular.
La proporcin de la poblacin se identifica como

, y se refiere al porcentaje de xito de la


poblacin. Para desarrollar un intervalo de confianza para una proporcin, necesitamos cumplir
con las suposiciones siguientes:
1. Se cumple las condiciones binomiales:
a. La informacin de la muestra es el resultado de los conteos
b. Solo hay dos resultados posibles, xito o fracaso.
c. La probabilidad de xito sigue siendo la misma de un ensayo a otro
d. Los ensayos son independientes.
2. Los valores
n
y
) 1 ( n
deben ser mayores o iguales a 5. esta condicin nos
permite recurrir al teorema del lmite central y utilizar la distribucin normal estndar,
es decir, z, para completar un intervalo de confianza.
Para desarrollar un intervalo de confianza para una proporcin de la poblacin se usa la
siguiente frmula:

p
z p t ,
Donde:
n
p p
p
) 1 (

o lo que es igual:
n
p p
z p
) 1 (
t
Ejemplo 3. Una empresa de investigacin de mercado contacta a una muestra aleatoria de 100
varones en una comunidad extensa y determina que una proporcin muestral de 0.40 prefiere
las navajas de afeitar fabricadas por el cliente de esa empresa sobre todas las dems marcas.
El intervalo de confianza de 95% para la proporcin de todos los varones de la comunidad que
prefieren las navajas de afeitar del cliente de la empresa se determina de la siguiente manera:
05 . 0 0024 . 0
100
) 60 . 0 )( 40 . 0 ( ) 1 (

n
p p
p

50 . 0 30 . 0 ) 05 . 0 ( 96 . 1 40 . 0 a z p
p
t t
Por lo tanto, con una confianza de 95% estimamos la proporcin de todos los varones de la
comunidad que prefieren las navajas del cliente de la empresa con un valor entre 0.30 y 0.50.
Determinacin del tamao de muestra requerido para la estimacin de la proporcin.
- 27
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
Una preocupacin que surge a menudo al disear un estudio estadstico es: Cuntos
elementos debe tener en una muestra?. Si la muestra es demasiado grande, se gasta mucho
dinero en recopilar la informacin. Y si por el contrario es demasiado pequea, las
conclusiones restantes sern inciertas. El tamao apropiado de la muestra depende de tres
factores:
El nivel de confianza deseado
El margen de error que el investigador va a tolerar
La variabilidad en la poblacin que se estudia
Antes de recolectar una muestra, el tamao mnimo requerido puede determinarse
especificando el nivel de confianza requerido y el error de muestreo aceptable y haciendo una
estimacin inicial de

, la proporcin poblacional desconocida:



2
2
) 1 (
E
z
n

Z es el valor usando el intervalo de confianza especificado,


es la estimacin inicial de la proporcin poblacional y


E es el error de muestreo de mas o de menos permitido en el intervalo.
Si no es posible determinar el estimado de

,
se le deber estimar en 0.50. Esta estimacin es
conservadora en tanto que representa el valor para el que se requerira del tamao de muestra
mayor. Con base en este supuesto, la formula general para el tamao de muestra se simplifica
en esta forma:

2
2

,
`

.
|

E
z
n
Ejemplo 4: en referencia al problema anterior, supongamos que con anterioridad a la
recoleccin de los datos se especifico que la estimacin del intervalo de 95% deba tener un
margen de error inferior a 0.05 y que no se hizo el juicio preliminar alguno sobre el probable
valor de

.
El tamao de muestra es mnimo por recolectar es:

385 16 . 384
) 05 . 0 ( 2
96 . 1
2
2
2

,
`

.
|

,
`

.
|

E
z
n
Intervalos de confianza para la diferencia entre dos proporciones.
Para estimar la diferencia entre las proporciones de las poblaciones, el estimador puntual
insesgado de ) ( ) (
2 1 2 1
p p es . El intervalo de confianza para la estimacin de la
diferencia entre dos proporciones poblacionales es:

2 1
) (
2 1 p p
zs p p

t
El error estndar de la diferencia entre las proporciones se determina por medios de esta
frmula:
- 28
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -

2 2
2 1 2 1
p p p p
s s s +

Ejemplo 5. En el ejemplo 3 se indico que una proporcin de 0.40 varones de una muestra
aleatoria de 100 de una comunidad extensa prefiri navajas de afeitar del cliente de la
empresa sobre todas las dems. En otra comunidad extensa 60 varones de una muestra
aleatoria de 200 prefieren las navajas del cliente de la empresa. El intervalo de confianza de
90% para la diferencia en la proporcin de varones de las dos comunidades que prefieren las
navajas del cliente de la empresa es:
197 . 0 03 . 0
) 059 . 0 ( 645 . 1 100 . 0 ) ( % 90 .
2 1
2 1
a
zs p p Int
p p

t t

Donde:
0024 . 0
100
) 60 . 0 )( 40 . 0 ( ) 1 (
1
1 1
2
1

n
p p
s
p

00105 . 0
200
) 70 . 0 )( 30 . 0 ( ) 1 (
2
2 2
2
2

n
p p
s
p

0059 . 0 00105 . 0 0024 . 0
2 2
2 1 2 1
+ +
p p p p
s s s

Actividades complementarias de aprendizaje
1. Realice un resumen del tema
Cuestionario de autoevaluacin
1. Se calcula que una poblacin tiene una desviacin estndar de 10.
Queremos estimar la media de la poblacin en dos unidades de error mximo
permisible, con un nivel de confianza del 95%. Qu tan grande debe ser la muestra?
2. .El dueo de una estacin de gas quera determinar la proporcin de
clientes que usan tarjetas de crdito o dbito para pagar la gasolina en el rea de
bombas. Entrevist a 100 clientes y descubri que 80% pagaron en el rea de
bombas.
a) Desarrolle un intervalo de confianza del 95% para la proporcin de la
poblacin
b) Interprete los resultados
3.Cierta empresa compra tazas de plstico para imprimirles logotipos de eventos
deportivos, graduaciones, cumpleaos y otras ocasiones especiales. El propietario,
recibi un envo importante esta maana. Para asegurarse de la calidad del envo,
seleccion una muestra aleatoria de 300 tazas y descubri 15 unidades defectuosas.
a) Cul es la proporcin estimada de tazas defectuosas en la poblacin?

- 29
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
SESION 9
Intervalo de confianza para diferencias de medias con varianza conocida y desconocida.
A menudo es necesario estimar la diferencia entre dos medias poblacionales, como la
diferencia entre los niveles salariales de dos empresas. El intervalo de confianza se elabora en
forma similar al usado para la estimacin de la media, excepto que el error estndar pertinente
para la distribucin de muestreo es el error estndar de la diferencia entre medias. El uso de la
distribucin normal se basa en las mismas condiciones que en el caso de la distribucin de
muestreo de media, salvo que estn implicadas dos muestras. La frmula empleada para
estimar la diferencia entre dos medias poblacionales con intervalos de confianza:

)
( 2 1
2 1
) (
x x
z x x

t
)
( 2 1
2 1
) (
x x
zs x x

t
O cuando se conocen las desviaciones estndar de las poblaciones, el error estndar de la
diferencia entre medias es:

2 2
) (
2
1 2 1 x x x x
+

Cuando se desconocen las desviaciones estndar de las poblaciones, el error estndar


estimado de la diferencia entre medias dado el uso apropiado de la distribucin normal es:

2 2
) (
2
1 2 1 x x x x
s s s +

Ejemplo 1: el salario medio semanal de una muestra de n=30 empleados de una gran empresa
manufacturera es =$280.00, con una desviacin estndar muestral de s=$14.00. En otra
gran empresa, una muestra aleatoria de n=40 empleados por hora tiene un salario medio
semanal de $270.00, con una desviacin estndar muestral de s=$10.00. El intervalo de
confianza de 99% para la estimacin de la diferencia entre los niveles salariales medios
semanales de las dos empresas es:
)
( 2 1
2 1
) ( % 99 .
x x
zs x x Int

t
Donde:
58 . 2
00 . 10 $ ) (
2 1


z
x x

77 . 17 $ 23 . 2 $
) 01 . 3 ( 58 . 2 00 . 100 $
a
t

56 . 2
)
(
1

x
s

58 . 1
)
(
2

x
s
( ) ( ) 01 . 3 58 . 1 56 . 2
2 2 2 2
) (
2
1 2 1
+ +
x x x x
s s s
As, podemos afirmar que el salario promedio semanal de la primera empresa es mayor que el
promedio de la segunda empresa por un monto de entre $2.23 y $17.7, con una confianza de
99% en esta estimacin por intervalo.
- 30
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
Distribucin t e intervalos de confianza para la diferencia de dos medias.
El uso de la distribucin t en conjuncin con una muestra es necesario cuando:
1) Se desconocen las desviaciones estndar de de la poblacin.
2) Las muestras son pequeas (n<30). Si las muestras son grandes, los valores t pueden
ser aproximados por la muestra estndar z.
3) Se supone que las poblaciones tienen una distribucin aproximadamente normal.
Cuando se usa la distribucin t para definir intervalos de confianza para la diferencia entre dos
medias, no para inferencias sobre solo una media poblacional, por lo general se requiere del
siguiente supuesto adicional:
4) las dos varianzas poblacionales (desconocidas) son iguales = .
El primer paso para determinar el error estndar de la diferencia entre medias cuando procede
el uso de la distribucin t es combinar las dos varianzas muestrales:
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1 2
+
+

n n
s n s n

El error estndar de la diferencia entre las muestras basado en el uso de la varianza


combinada estimada es
2

2
2
1
2
2 1
n n
x x

+
Con gl =n
1
+ n
2
-2 el intervalo de confianza es:

)
(
2 1
2 1
) (
x x
gl
t x x

t

Ejemplo 2: en relacin con la muestra aleatoria de n
1
=10 focos, el ciclo de vida de los focos es
1=
4600 horas con s
1
=250 hr. El ciclo de vida y la desviacin estndar de una muestra de
n
2
=8 focos de otra marca son
2=
4600 hrs y s
2
= 200 hrs. Se supone que el ciclo de vida de
ambas marcas tiene una distribucin normal.
El intervalo de confianza de 90% para estimar la diferencia entre el ciclo medio de vida til de
las dos marcas de focos es:
hr a t x x Int
x x
790 410 ) 847 . 108 ( 746 . 1 600 ) ( % 90 .
)
(
16 2 1
2 1
t t

746 . 1
600 4000 4600
16 2
2 1
2 1

+
+
t t t
x x
n n gl

- 31
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
25 . 52656
2 8 10
) 200 ( 7 ) 250 ( 9
2
) 1 ( ) 1 (
2 2
2 1
2
2 2
2
1 1 2

+
+

+
+

n n
s n s n

847 . 108
8
25 . 52656
10
25 . 52656
2
2
1
2
2 1
+ +

n n
x x

Se puede afirmar con confianza de 90% que la primera marca de focos tiene una vida media
superior a la de la segunda marca en un monto de entre 410 y 790 hrs.
Actividades complementarias de aprendizaje
1. Realice un resumen del tema
Cuestionario de autoevaluacin
1.
3. Prueba de Hiptesis
3.1. Conceptos de la teora de prueba de hiptesis.
- 32
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
3.2. Errores tipo I y II.
3.3. Prueba de hiptesis para una media con varianza conocida y desconocida.
3.4. Prueba de hiptesis para una proporcin y diferencia de proporciones.
3.5. Prueba de hiptesis para diferencia de medias con varianzas conocidas y desconocidas.
Objetivos Particulares
Al trmino de la unidad, el alumno debe:
1. Definir una hiptesis
2. Describir el procedimiento para la prueba de hiptesis
3. Realizar una prueba de hiptesis para la media con varianza conocida y
desconocida
4. Definir los errores tipo I y tipo II
5. realizar una prueba de hiptesis para la proporcin.
6. Realizar una prueba de hiptesis para la diferencia de medias y de proporciones
SESION 10
Conceptos de la teora de prueba de hiptesis.
Errores tipo I y tipo II
El propsito de la prueba de hiptesis es determinar si el valor supuesto de un parmetro
poblacional, como la media de la poblacin, debe aceptarse como viable con base en
evidencias muestrales.
Una hiptesis es una declaracin acerca de la poblacin. La informacin se usa para
determinar si la afirmacin es razonable. Las hiptesis que nos compete son las estadsticas y
la definimos:
Hiptesis: Es una afirmacin acerca de un parmetro de la poblacin que se desarrolla para
propsitos de prueba.
Prueba de Hiptesis: Procedimiento basado en las evidencias de la muestra y la teora de la
probabilidad para determinar si la hiptesis es una informacin razonable.
Hay un procedimiento de 5 pasos que sistematiza la prueba de una hiptesis, al llegar al paso
5 estamos en condiciones de rechazar o no:
PASO 1-. Establecer la Hiptesis Nula (H
0
) y la Hiptesis Alternativa (H
1
).
- 33
PASO 1
-Establecer
la hiptesis
nula y
alternativa
PASO 2
-Seleccionar
un nivel de
significancia
PASO 3
-Identificar
la estadstica
de prueba
PASO 4
-Formular
una regla de
decisin
PASO 5
-Tomar una
muestra,
llegar a una
decisin
-No Rechazar
H
0
-Rechazar H
0
-Aceptar H
1
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
La H mayscula significa hiptesis y el subndice cero implica sin diferencias. Por lo
general hay un no en la hiptesis nula, que quiere decir que no hay cambios. En trminos
generales la hiptesis nula se desarrolla para los propsitos de las pruebas; y esta se rechaza
o no se rechaza. La hiptesis nula es una afirmacin que no se rechaza a menos que la
informacin de la muestra ofrezca evidencias convincentes de que es falsa.
Es necesario aclarar que si la hiptesis nula no se rechaza con base en los datos de la
muestra, no podemos decir que la hiptesis nula sea verdadera, o sea, el hecho de no
rechazar una hiptesis no prueba que H
0
sea verdadera, significa que no rechazamos H
0
. Para
probar que la hiptesis nula es verdadera, es preciso que el parmetro poblacional sea
conocido. La hiptesis nula siempre va a contener el signo de igual que, ya que como dijimos
anteriormente es la hiptesis que se va a probar, y se necesita un valor especfico para
incluirlo en nuestros clculos.
Por otro lado, la Hiptesis Alternativa (

H
1
) describe sus conclusiones en caso de rechazar la
Hiptesis Nula. Se expresa como H
1
. tambin se conoce como hiptesis de investigacin. La
hiptesis alternativa se acepta si los datos de la muestra nos proporcionan suficientes
evidencias estadsticas de que la hiptesis nula es falsa.
En general, se define:
Hiptesis Nula (H
0
): Afirmacin acerca de un parmetro de la poblacin.
Hiptesis Alternativa (H
1
): Afirmacin que se acepta si los datos de la muestra
proporciona suficiente evidencia de que la hiptesis nula sea falsa.
PASO 2-. Seleccionar un nivel de significancia
El nivel de significancia es la probabilidad de rechazar la hiptesis nula cuando es verdadera.
Este nivel de significancia se expresa con la letra griega

, en ocasiones se le conoce como


nivel de riesgo. En trminos generales se toma la decisin de usar el nivel 0.05 (nivel del 5%) o
el nivel 0.01 (nivel 1%), o cualquier otro nivel entre 0 y 1.Por lo regular el nivel 0.05 se
selecciona para los proyectos de investigacin del consumidor, el nivel 0.01 para el
aseguramiento de la calidad y el 0.10 para encuestas polticas.
Ejemplo: suponga que una empresa que fabrica computadoras personales utiliza gran
cantidad de tarjetas con circuitos impresos. Los proveedores participan en una licitacin y el
que presenta la cotizacin ms baja obtiene un contrato considerable. Suponga que el
contrato especifica que si el departamento de aseguramiento de la calidad del fabricante de
computadoras tomar una muestra de todos los envos que llegan. Si ms de 6% de las
tarjetas de la muestra no cumple con las normas, el envo se rechaza. La hiptesis nula es que
el envo de tarjetas contiene 6% o menos tarjetas que no cumplen con las normas. La
hiptesis alternativa es que ms del 6% de las tarjetas estn defectuosas.
Una muestra de 50 tarjetas de circuitos que se recibieron el 21 de julio revel que 4 de ellas,
es decir, 8%, no cumpla con las normas. El envo se rechaz porque exceda el mximo de
6% de tarjetas que no cumplen con las normas. Si en realidad el envo no cumpla con las
normas, la decisin de regresar las tarjetas al proveedor fue correcta. Sin embargo, suponga
que las 4 tarjetas seleccionadas en la muestra de 50 eran las nicas que no cumplan con las
- 34
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
normas en un envo de 4000 tarjetas. Entonces solo el 1% eran defectuosas (4/4000=0.001).
En ese caso, menos del 6% de todo el envo no cumpla con las normas y rechazarlo fue un
error. En trmino de la prueba de hiptesis, rechazamos la hiptesis nula de que el envo
cumpla con las normas cuando deberamos haber aceptado la hiptesis nula. Al rechazar la
hiptesis nula, cometimos un error tipo I, la probabilidad de cometer este error es

.
Error Tipo I (

): Rechazar la hiptesis nula, H


0
; cuando es verdadera.
Error Tipo II (

): Aceptar la hiptesis nula, H


0
; cuando es falsa.
En el ejemplo del fabricante de computadoras personales, se cometera un Error Tipo II, si con
el desconocimiento del fabricante, un envo de tarjetas contiene 15% de tarjetas que no
cumplen con las normas, y sin embargo, lo aceptara.
La siguiente tabla resume las decisiones que el investigador podra tomar y sus posibles
consecuencias:
Hiptesis Nula
Investigador
Acepta
H
0
Rechaza
H
1
H
0
es verdadera Decisin correcta Error Tipo I
H
0
es falsa Error Tipo II Decisin Correcta
PASO 3-. Seleccionar el Estadstico de Prueba
Es un valor, determinado a partir de la informacin de una muestra, que se utiliza para
determinar si se va a rechazar la hiptesis nula.
En la prueba de hiptesis para la media cuando se conoce la desviacin estndar poblacional
o si el tamao de muestra es grande, la estadstica de prueba z se calcula de la siguiente
forma:

n
x
z

El valor z se basa en la distribucin de muestreo de


x
,
que sigue la distribucin normal cuando la muestra es razonablemente grande con una media (
x

) igual a

y una desviacin estndar


x

, que es igual a
n

. As podemos determinar lsi


la diferencia entre
x
y

es estadsticamente significativa al encontrar el nmero de


desviaciones estndar que separan a
x
de

.
PASO 4- . Formular la regla de decisin
- 35
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
Una regla de decisin es una afirmacin de las condiciones especficas en las que la hiptesis
nula se rechaza y aquellas en las que se acepta. La regin o rea de rechazo define la
ubicacin de todos esos valores que son tan grandes o tan pequeos que la probabilidad de
su ocurrencia bajo una hiptesis nula verdadera es ms bien remota.
PASO 5- Tomar una decisin
En este paso de calcula el estadstico de prueba, comparndolo con el valor crtico y tomando
la decisin de rechazar o no la hiptesis nula.
El valor crtico es el punto divisor entre la regin en la que la hiptesis nula se rechaza y
aquella en la que se acepta.
Recordemos que en un aprueba de hiptesis, slo una de las dos decisiones es posible:
aceptar o rechazar la hiptesis nula. En lugar de aceptar algunos investigadores prefieren
expresar no rechazar la hiptesis nula o decidimos no rechazar la hiptesis nula.
- 36
Antologa de Estadstica - 3er Semestre de Licenciatura en Informtica Administrativa -
bibliografia
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01b.html
- 37

You might also like