You are on page 1of 18

Estimacin.

Intervalos de Confianza para la Media


y para las Proporciones

Algunas secciones han sido tomadas de:


Apuntes de Estadstica Inferencial
Instituto Tecnolgico de Chiuhuahua

Estimacin
El objetivo principal de la estadstica inferencial es la estimacin, esto
es que mediante el estudio de una muestra de una poblacin se quiere
generalizar las conclusiones hacia el total de dicha poblacin. Como
vimos en la seccin anterior, los estadsticos pueden variar mucho
dentro de sus distribuciones muestrales. Mientras menor sea el error
estndar de un estadstico, ms cercanos sern sus valores. El Error
estandard podramos expresarlo conceptualmente como el error que se
puede cometer al intentar conocer a una poblacin por medio de una
muestra tomada de dicha poblacin.
Existen dos tipos de estimaciones para parmetros; puntuales y por
intervalo.
intervalo
Una estimacin puntual es un nico valor estadstico y se usa para
estimar un parmetro. El estadstico usado se denomina estimador.
Una estimacin por intervalo es un rango, generalmente de ancho
finito, que se espera que contenga el parmetro.

Estimacin por Intervalos


Un estimado puntual, por ser un slo nmero, no proporciona por s mismo
informacin alguna sobre la precisin y confiabilidad de la estimacin.
Por ejemplo, imagine que se usa la media de una muestra x para estimar
(estimador puntual) la resistencia real a la ruptura de toallas de papel de
cierta marca y suponga que x = 9322.7.
Debido a la variabilidad de la muestra, casi nunca se tendr el caso de que
x = . El estimador puntual nada dice sobre lo cercano que esta de . Una
alternativa para reportar el valor del parmetro que se est estimando es
calcular un intervalo de valores factibles, es decir un lmite de confianza o
intervalo de confianza (IC).

Un intervalo de confianza se calcula siempre seleccionando primero un


nivel de confianza,
confianza que es una medida del grado de confiabilidad en el
intervalo. Entonces, en el ejemplo anterior, si queremos un nivel de
confianza de 95% diramos que es posible tener cualquier valor de m
entre 9162.5 y 9482.9.
Todo est muy bien, pero
cmo sabemos estos
valores?

Un nivel de confianza de 95% implica que 95% de las muestras dara


lugar a un intervalo que incluye m o cualquier otro parmetro que se
est estimando, y slo 5% de las muestras producir un intervalo
errneo. Cuanto mayor sea el nivel de confianza podremos creer que el
valor del parmetro que se estima est dentro del intervalo.

Si, por ejemplo, queremos tener un nivel de confianza de 95% (lo


cual es muy comn), entonces usamos la distribucin normal
estndar y encontramos los valores que incluyen a 95% del rea.

Distribution Plot
Normal, Mean=0, StDev=1
0.95

0.4

Density

0.3

0.2

0.1

95% del rea. 0.0

-1.96

0
z

1.96

En el siguiente ejemplo, tomado de una simulacin efectuada con


Minitab (Macro GMeanCI, de www.duxbury.com)
se crean 100
muestras (n = 9) de una poblacin con = 80 y = 5. Para 95% de
confianza, 95 de los 100 intervalos calculados contienen a .
95% Confidence Intervals for the Mean
200

Confidence Intervals

150

100
True mean

50

10

20

30

40
50
60
Interval Number

70

80

90

100

Los intervalos que no contienen al valor de estn marcados en rojo.

Intervalos de confianza para la media


Supongamos que la estatura de los nios de 2 aos est distribuda
normalmente con una media de 90 cm y una desviacin estndar de 36
cm. Cul sera la distribucin muestral de la media para una muestra de
tamao 9? Recordemos que la media de una distribucin muestral de
medias es igual a :

= x
Y el error estndar
es:

m =

Para nuestro ejemplo, la distribucin muestral de la media tendra una


media de 90 y una desviacin estndar de 36/3 = 12. Recordemos que la
desviacin estndar de una distribucin muestral es igual al error
estndar.

La siguiente figura muestra esta distribucin en donde el rea


sombreada representa el 95% del total, encontrndose entre los
valores de 66.48 y 113.52. Estos lmites fueron calculados aadiendo y
restando 1.96 desviaciones estndar del valor de la media de 90, lo que
equivale al 95% del rea bajo una curva normal estndar, es decir:
90 - (1.96 x 12) =
90 - 23.52 = 66.48
90 + (1.96 x 12) =
90 + 23.52 = 113.52
95% del rea.

23.52

Lo que nos muestra la figura es que 95% de las medias se encontraran a


no ms de 23.52 de la media de 90 (o sea a 1.96 desviaciones estndar).
Ahora si consideramos la probabilidad de que la media de una muestra
aleatoria se encuentre a cierta distancia de la media de la poblacin,
entonces podemos decir que como 95% de la distribucin est a 23.5 de
90, la probabilidad de que la media de cualquier muestra est a 23.52 de
90 es de 0.95.

Lo anterior significa que si calculamos repetidamente la media de una


muestra, x , y consideramos un intervalo que vaya de
x - 23.52 a x + 23.52, este intervalo contendr a la media de la
poblacin 95% de las veces. En general, podemos calcular el intervalo de
confianza con la siguiente frmula:
Notar que no es otra
cosa que despejar de
= xz
la frmula para el valor
n
Z de la distribucin de
medias
Donde z es el valor de la curva estandar normal para la confianza que se
requiere. En el caso de 95% de confianza:

= x 1.96

De esta formula se puede observar que tanto el tamao de la muestra


como el valor de se deben conocer. Z se puede obtener de la tabla de
la distribucin normal a partir del nivel de confianza establecido.
Como en muchas ocasiones se desconoce en esos casos lo correcto es
utilizar otra distribucin para muestras (la llamada t de student que
veremos en la siguiente sesin) si la poblacin de donde provienen los
datos es normal.
En este caso se puede utilizar una estimacin puntual de la desviacin
estndar de la poblacin por medio de la desviacin estndar de la
muestra, es decir ( ~ s).

Ejemplos:
1. Se encuentra que la concentracin promedio de zinc de una muestra
de 36 cereales es de 2.6 gramos por miligramo. Encuentre los intervalos
de confianza de 95% y 99% para la concentracin media de zinc en el
cereal. Suponga que la desviacin estndar de la poblacin es 0.3.
Solucin:
La estimacin puntual de es x = 2.6 (el valor de la media de la
muestra). El valor de z para un nivel de confianza del 95% es 1.96, por lo
tanto:

Valores z
Valores reales

2.5

2.6

2.7

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el


intervalo ser ms amplio:

Z
Valores reales

2.47

2.6

2.73

2. Los vuelos de una empresa de aviacin tienen una duracin bimestral


aproximadamente distribuida de forma normal con una desviacin
estndar de 40 horas. Si una muestra de 30 vuelos tiene una duracin
promedio de 780 horas, encuentre los intervalos de confianza de 96%
para la media de la poblacin de todos los vuelos de esta empresa.

Con un nivel de confianza del 96% se sabe que la duracin media de los
vuelos est entre 765 y 795 horas.

Intervalos de confianza para la proporcin


Un estimador puntual de la proporcin P en un experimento binomial
est dado por la estadstica P=X/N, donde X representa el nmero de
xitos en N pruebas.
Por tanto, la proporcin de la muestra p=x/n se utilizar como
estimador puntual del parmetro P.
Si no se espera que la proporcin P desconocida est demasiado cerca
de 0 de 1, se puede establecer un intervalo de confianza para P al
considerar la distribucin muestral de proporciones.
Considerando el valor z para la distribucin de proporciones

z=

p P
P (1 P )
n

Si intentamos despejar el valor de P nos encontramos con que

P (1 P )
P = p z
n
Pero cmo podemos encontrar P si tambin est del lado derecho
de la ecuacin?
Lo que haremos es aproximar la proporcin de la poblacin por la
de la muestra, es decir sustituir P por la proporcin de la muestra
p siempre y cuando el tamao de muestra no sea pequeo.

p(1 p )
P = p z
n

Cuando n es pequea y la proporcin desconocida P se considera


cercana a 0 a 1, el procedimiento del intervalo de confianza que se
establece aqu no es confiable ya que realmente se debera emplear
la distribucin binomial, por tanto, no se debe utilizar. Para estar
seguros, se debe requerir que np y n(1-p) sea mayor o igual a 5.
El error de estimacin ser la diferencia absoluta entre p y P, y
podemos tener el nivel de confianza de que esta diferencia no
exceder el valor de

p(1 p )
z
n

Ejemplos:
1. Un fabricante de reproductores de discos compactos utiliza un
conjunto de pruebas amplias para evaluar la funcin elctrica de su
producto. Todos los reproductores de discos compactos deben pasar
todas las pruebas antes de venderse. Una muestra aleatoria de 500
reproductores tiene como resultado 15 que fallan en una o ms
pruebas. Encuentre un intervalo de confianza de 90% para la
proporcin de los reproductores de discos compactos de la poblacin
que no pasaran todas las pruebas.

n=500
p = 15/500 = 0.03
z(0.90) = 1.645

0.03(1 0.03)
P = 0.03 1.645
500
0.0237 < P < 0.0376

z=1.645 nos da un rea de


~0.05 a cada lado, si lo
buscamos en las tablas
encontraramos el valor
de 0.04998

Distribution Plot
Normal, Mean=0, StDev=1
0.4

0.3
Density

Solucin:

0.2

0.1

0.05
0.0

0.05

-1.64

0
z

1.64

Ejemplo 2.
En un estudio de 300 accidentes de automvil en una ciudad
especfica, 60 tuvieron consecuencias fatales. Con base en esta
muestra, construya un intervalo del 95% de confianza para
aproximar la proporcin de todos los accidentes automovilsticos que
en esa ciudad tienen consecuencias fatales.

Solucin:

n = 300
P= 60/300 = 0.20
Z(0.95) = 1.96

0.20(1 0.20)
P = 0.20 1.96
300

El intervalo de confianza es entonces:

Distribution Plot
Normal, Mean=0, StDev=1
0.4

0.154737 < P < 0.245263


Density

0.3

0.2

0.1

0.025
0.0

0.025

-1.96

0
z

1.96

You might also like