Professional Documents
Culture Documents
=
k
1 i
i
n .
-
n
n
f
i
i
= , se tiene que
=
=
k
1 i
i
. 1 f
- f
i
%=100 f
i
, se tiene que
=
=
k
1 i
i
. 100 % f
Ejemplo 1. Los siguientes datos corresponden al sexo de cuarenta nios que asistieron a
un centro de salud con problemas respiratorios durante el fin se semana pasado.
F M M M F F F M F F F M F M M M F M M F
F F M F F F F M F M F F M M M F F M M M
SEXO
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia
Relativa
Porcentual
Femenino 21 0,525 52,5%
Masculino 19 0,475 47,5%
Total 40
Esta tabla corresponde a una distribucin de frecuencias de atributos y puede
representarse mediante un grfico de barras, el cual corresponde al tipo ms simple de
representacin grfica y es usado en variables cualitativas o en variables discretas. Las
clases se representan en el eje horizontal y las frecuencias ene el eje vertical. En este tipo
de grficos la longitud de cada barra es proporcional a la frecuencia del atributo que
representa. Las barras deben ser del mismo ancho y especificadas en forma uniforme.
Otro tipo de grfico que se utiliza cuando se desea representar la distribucin de
frecuencias de un conjunto de datos muestrales es el grfico circular o de torta (pie-
chart). Los siguientes grficos fueron obtenidos con Excel.
Grfico 1 : Grfico de Barras y Grfico Circular ejemplo1
Esta misma idea se aplica para representar datos cuantitativos discretos cuando el
nmero de valores posibles es pequeo.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
11
Para variables cualitativas Ordinales
Tabla 3: Tabla de frecuencias para datos cualitativos ordinales o cuantitativos agrupados en clases individuales.
Notacin:
=
=
j
1 i
i j
n N
=
=
j
1 i
i j
f F .
Ejemplo 2: Los siguientes datos corresponden a la calidad de la atencin recibida por los
nios segn las madres.
B B B B B B B B B B B B B B B B B B B B
B B B B B M M M M M MB MB MB MB MB MM MM R R R
Atencin
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia
Relativa
Porcentual
Frecuencia
Absoluta
Acumulada
Frecuencia
Relativa
Acumulada
Frecuencia
Absoluta
Acumulada
Porcentual
Muy Mala 2 0,05 5,0% 2 0,05 5,0%
Mala 5 0,125 12,5% 7 0,175 17,5%
Regular 3 0,075 7,5% 10 0,25 25,0%
Buena 25 0,625 62,5% 35 0,875 87,5%
Muy Buena 5 0,125 12,5% 40 1 100,0%
Total 40
Es posible realizar una ordenacin jerarquizada de los valores de la variable y conocer la
frecuencia acumulada o porcentual para alguna clase en particular. La grfica siguiente
muestra el porcentaje de respuestas segn la calidad atencin recibida por los nios de
sus madres.
Grfico 2: Grfico de Barras y Grfico Circular ejemplo2
Para variables cuantitativas y discretas
Categora o
Clase
Concepto
o atributo
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
relativa
porcentual
Frecuencia
absoluta
acumulada
Frecuencia
relativa
acumulada
Frecuencia
relativa
acumulada
porcentual
1 c
1
n
1
f
1
f
1
% N
1
F
1
F
1
%
2 c
2
n
2
f
2
f
2
% N
2
F
2
F
2
%
: : : : : : : :
k c
k
n
k
f
k
f
k
% N
k
F
k
F
k
%
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
12
Cuando el tamao de la muestra y el recorrido de una variable discreta sea grande, o
cuando sta sea continua, conviene agrupar en intervalos de clase o grupos.
Categora o
Clase
Intervalo de
Clase
Frecuencia
absoluta
Marca de
clase
Frecuencia
relativa
Frecuencia
relativa
porcentual
Frecuencia
absoluta
acumulada
Frecuencia
relativa
acumulada
Frecuencia
relativa
acumulada
porcentual
1 ]L
0
,L
1
]
n
1
m1
f
1
f
1
% N
1
F
1
F
1
%
2 ]L
1
,L
2
]
n
2
m2
f
2
f
2
% N
2
F
2
F
2
%
: :
:
:
: : : : :
k ]L
-k1
,L
k
]
n
k
mk
f
k
f
k
% N
k
F
k
F
k
%
Tabla 4: Tabla de frecuencias para datos cuantitativos continuos (o discretos cuando el nmero de valores posibles es grande).
Notacin:
- L
i-1
: es el lmite inferior del i-simo intervalo de clase.
- L
i
: es el lmite superior del i-simo intervalo de clase.
- m
i
: es la marca de clase del i-simo intervalo de clase y corresponde al punto
medio del intervalo de clase.
Recordar que el nmero de intervalo y la longitud del intervalo se realiza mediante la
regla de Sturgers y para generar los intervalos de clase debe calcular el rango y la longitud
del intervalo. Excel y otros programas estadsticos realizan esta operacin fcilmente
entregando la distribucin de frecuencias
Ejemplo: Los siguientes datos representan el nmero de alumnos que asistieron a las 40
sesiones de clculo el semestre anterior. Estos datos han sido ordenados de menor a
mayor:
Procedimiento para obtener tabla de frecuencia
Paso 1. Se determina el rango o recorrido de la variable. Rango=X
max
- X
min
Rango = 94 - 31
Paso 2. Se decide el nmero k de clases a considerar. Una regla frecuentemente usada es
tomar: k = 1 + 3.3 log(n) Regla de Sturges
El nmero k = 1+3.3 log(40) = 6.28 ~ 7 (Otra forma k ~ n )
Paso 3. Se obtiene la amplitud o tamao del intervalo, dividiendo por el nmero de
intervalos:
k
Rango
A =
, se aproxima aumentando y manteniendo el mismo nmero de
decimales que los datos. A = 31/7 ~ 5
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
13
Paso 4. Se seleccionan los lmites de clase que definen los intervalos, de manera que las
clases sean de la misma longitud y cada observacin se clasifique sin ambigedad en una
sola clase.
Paso 5. Se cuenta el nmero de observaciones en cada clase, es decir se determina las
frecuencias de cada clase.
Clase Intervalos de clase Marca de
Clase
Frecuencia
de la clase
Frecuencia
relativa
Frecuencia
absoluta
acumulada
Frecuencia
relativa
acumulada
1 ]62.5, 67.5] 65 3 0.075 3 0.075
2 ]67.5, 72.5] 70 6 0.150 9 0.225
3 ]72.5, 77.5] 75 11 0.275 20 0.5
4 ]77.5, 82.5] 80 7 0.175 27 0.675
5 ]82.5, 87.5] 85 9 0.225 36 0.9
6 ]87.5, 92.5] 90 3 0.075 39 0.975
7 ]92.5, 97.5] 95 1 0.025 40 1
Tabla 5: Tabla de frecuencias ejemplo 3
La representacin grfica ms frecuente para datos agrupados es el histograma, el cual
corresponde a un conjunto de rectngulos cada uno de los cuales representa un intervalo
de clase. Sus bases son iguales a la amplitud del intervalo y las alturas se determinan de
manera que su rea sea proporcional a la frecuencia de cada clase.
Un til agregado al histograma es el polgono de frecuencias,
que se construye uniendo las marcas de clase de los intervalos
adyacentes. El polgono de frecuencias se utiliza para observar el
comportamiento ms suave de una distribucin de frecuencias
para posteriormente decidir cul es el mejor modelo
probabilstico posible de ajustar a la muestra.
Grfico 3: histograma ejemplo 3
Una propiedad importante que cumple el polgono de frecuencias es que el rea limitada
por el polgono y el eje de las abscisas es igual a la suma de los rectngulos que forman el
histograma. Un tercer tipo de grfico es la ojiva que se obtiene graficando la frontera
superior de cada intervalo versus la frecuencia acumulada. Este grfico permite visualizar
rpidamente las frecuencias acumuladas hasta un valor determinado de la variable.
La ojiva permite determinar los percentiles 25, 50 y 75, tambin denominados cuartiles
Q
1
, Q
2
y Q
3
respectivamente. Adems permite estimar el nmero de observaciones entre
dos valores dados.
El percentil 50 o cuartil dos, Q
2
recibe el nombre de mediana y divide a la distribucin de
frecuencias en partes iguales.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
14
Grfico 4: histograma y polgono sobrepuesto - Frecuencia Acumulada y Ojiva sobrepuesta
Ejercicio: Ingrese la informacin anterior en una planilla Excel y realice las tablas y
grficos anteriores.
1.5. Medidas de Resumen
Llamadas medidas estadsticas o estadgrafos describen y cuantifican en forma resumida
las caractersticas de la distribucin de frecuencias de un conjunto de datos de una
poblacin o muestra.
Las medidas de uso ms frecuente son:
medidas de tendencia central
medidas de dispersin
medidas de sesgo o asimetra
medidas de apuntamiento o achatamiento (agudeza)
Medidas de Tendencia Central: Determina un valor caracterstico de una distribucin de
frecuencias ubicado hacia el centro de la distribucin estas medidas son media aritmtica,
a la mediana o a la moda. Cada una de estas medidas es apropiada para ciertos propsitos
descriptivos, pero resulta completamente inadecuada para otros.
- Media aritmtica o media o promedio, es el promedio comn. Se obtiene
dividiendo la suma de todas las observaciones por el nmero de ellos.
Para datos individuales:
=
=
+ + +
=
n
1 i
i
n 2 1
x
n
1
n
x ... x x
x
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
15
Para datos agrupados en k agrupaciones o intervalos de clase:
n
m n
x
k
1 i
i i
=
=
Notacin:
i
n : frecuencia absoluta clase i -
i
m : Marca de clase i. n tamao de la muestra.
Nota: Utilizamos la marca de clase el valor aproximado de la media (cuando n es grande la aproximacin es
bastante buena).
Si el polgono de frecuencias presenta la forma de una campana simtrica entonces el
valor de x est justo en el centro de la distribucin de frecuencias y se dice que este
valor es el ms representativo de la distribucin por estar equidistante de los extremos.
- Mediana: denotada por Me, corresponde al valor central del conjunto de datos
ordenados en forma ascendente o descendente (cuartil dos, Q
2
, o percentil 50,
P
50
).
Para datos individuales: Sea x
1
, x
2
, ..., x
n
el conjunto de observaciones, entonces x
(1)
, x
(2)
,
..., x
(n)
denota al conjunto de datos ordenados en forma ascendente.
a) Si n es impar se tiene que
|
.
|
\
| +
=
2
1 n
x Me
b) Si n es par se tiene que
2
x x
Me
1
2
n
2
n
|
.
|
\
|
+ |
.
|
\
|
+
=
Para datos agrupados en clases individuales, se identifica la mediana como aquella clase
donde la frecuencia acumulada es inmediatamente mayor que (n+1)/2.
Para datos agrupados en intervalos de clase, primero se identifica el intervalo que
contiene a la mediana ]L
i-1
, L
i
], el cual corresponde al que tiene la frecuencia absoluta
acumulada que supera inmediatamente el valor (n+1)/2, entonces:
| |
|
= +
|
|
\ .
1
1
2
i
i i
i
n
N
Me L A
n
Notacin
L
i-1
: lmite inferior del intervalo que contiene a la mediana en el cual N
i
>
2
n
.
n : tamao muestral o cantidad de datos.
N
i-1
: frecuencia absoluta acumulada del intervalo anterior al intervalo que contiene a la
mediana.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
16
n
i
: frecuencia absoluta del intervalo mediano.
A
i
: amplitud del intervalo "mediano".
- Moda: se define como el valor que aparece con mayor frecuencia (pudiendo no
existir). Esta medida es ms representativa que las anteriores cuando la
distribucin de frecuencias presenta una forma inestable o sinusoidal (indicando
presencia de estratos).
Para datos agrupados en clases individuales:la moda es el valor con ms alta frecuencia.
Para datos agrupados en intervalos de clase. primero se identifica el intervalo que tiene
la mayor frecuencia absoluta, ]L
i-1
, L
i
], y se determina la moda de la siguiente forma:
i
1 i 1 i
1 i
1 i
A
n n
n
L Mo
+
+
+
+ =
Notacin
L
i-1
: lmite inferior del intervalo que contiene a la moda
n
i+1
: frecuencia absoluta acumulada del intervalo posterior al intervalo que contiene a la
moda.
n
i-1
: frecuencia absoluta acumulada del intervalo anterior al intervalo que contiene a la
moda
n
i
: frecuencia absoluta del intervalo mediano.
A
i
: amplitud del intervalo "moda".
Ejercicio. Obtenga la medidas de tendencia central para los datos del ejemplo 3 usando los
datos sin agrupar y los datos agrupados en la tabla.
Medidas de Dispersin: Cuantifican la concentracin de los datos en torno a un valor
central
- El rango o recorrido: diferencia entre la observacin de mayor valor y la de menor
valor.
- La varianza corresponde al promedio de las desviaciones al cuadrado de los datos
con respecto a la media aritmtica, se denota por V(X) o
2
X
o .
Para datos poblacionales individuales:
2 2 2
2 1 1
( )
n n
i i
i i
x n x
n n
o
= =
| |
|
\ .
= =
.
Para datos muestrales individuales:
2
2 2
1 2 1
( )
1 1
n n
i i
i i
x nx x x
s
n n
= =
| |
|
\ .
= =
.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
17
Para datos muestrales agrupados en agrupaciones o intervalos de clase:
=
=
| |
|
\ .
= =
2
2
2
1 2
1
( )
1 1
k
k
i i
i i
i
i
n m nx
m x n
s
n n
.
- Desviacin estndar corresponde a la raz cuadrada positiva de la varianza y tiene
la ventaja de que est en la misma unidad de medida de los datos.
Para datos poblacionales individuales:
2
o o = .
Para datos muestrales individuales:
2
s s = .
- Coeficiente de Variacin.
Para comparar el grado de dispersin entre dos o ms distribuciones expresadas en
distintas unidades de medida, no podemos comparar simplemente las varianzas y las
desviaciones estndar respectivas o las medias. En este caso se define un nuevo
estadgrafo de dispersin llamado coeficiente de variacin que est dado por:
% 100
x
s
CV
X
X
=
Nota: Solo para valores positivos, asegurarse que la media es positiva.
Ejercicio. Obtenga la medidas de tendencia dispersin para los datos del ejemplo 3 usando
los datos sin agrupar y los datos agrupados en la tabla.
Medidas de Posicin: Dividen a la distribucin en un cierto nmero de partes de manera
que en cada una de ellas hay la misma frecuencia.
- Cuartiles. Particionan a una distribucin de frecuencias en cuatro partes mediante
los puntos Q
1
, Q
2
, Q
3
, llamados primer, segundo y tercer cuartil. Se denomina
recorrido intercuartlico a Q = Q
3
- Q
1
(medida robusta de la dispersin de los
datos).
- Deciles. Particionan a una distribucin de frecuencias en diez partes mediante los
puntos D
1
, D
2
, ..., D
9
, llamados primer, segundo, ..., noveno decil. Se denomina
recorrido interdeclico a D = D
9
- D
1
.
- Percentiles. Particionan a una distribucin de frecuencias en cien partes mediante
los puntos P
1
, P
2
, ..., P
99
, llamados primer, segundo , ..., 99
avo
percentil.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
18
Para datos agrupados en intervalos de clase:
( | |
| (
\ .
( = +
(
(
1
1
100
i
r i i
i
nr
N
P L A
n
Ejercicio. Obtenga apartir de la tabla 3 los
cuartiles Q
1
=25%, Q
2
=50%, Q
2
=75%
Grfico 5: Grfico de caja permite visualizar los cuartiles y la media y mediana.
Grfico 6: Resumen de las medidas anteriores
Medidas de sesgo o asimetra: Indica el grado de simetra de una distribucin de
frecuencias con respecto a de una distribucin simtrica unimodal.
a) Si la distribucin de frecuencias es simtrica, entonces:
Mo Me x = = .
b) Si la distribucin de frecuencias presenta asimetra positiva, entonces
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
19
Mo Me x > >
c) Si la distribucin de frecuencias presenta asimetra negativa, entonces
Mo Me x < <
Medidas de apuntamiento: Mide el grado de apuntamiento de una distribucin de
frecuencias con respecto a de una distribucin simtrica unimodal de forma acampanada.
Ejercicio: Investigue en la internet la importancia y uso de las medida de asimetra y
apuntamiento en la administracin de empresas. (Consultar: Modelos de valoracin de
activos financieros con riesgo asimtrico)
2. Variables Aleatorias
Para poder emplear la teora de probabilidades para sacar conclusiones precisas acerca de
la poblacin, en base de una muestra extrada de esa poblacin primero debemos dirigir
nuestra atencin hacia las variables aleatorias que constituyen un eslabn entre la teora
de las probabilidades y la inferencia estadstica.
2.1. Concepto
Una variable aleatoria es una variable cuyo valor es el resultado de un evento aleatorio.
Ejemplo 1: Si se lanza una moneda tres veces y se anota el nmero de caras que se
obtienen. Los posibles resultados son: 0 caras, 1 cara, 2 caras 0 3 caras. As la variable
aleatoria es el nmero de caras y los posibles resultados son los valores de la variable
aleatoria.
Dado un experimento Dado un experimento aleatorio c, O el espacio muestral asociado
a c. Una funcin X que asigna a cada elemento e en O uno y solamente un nmero real
x = X(e), se llama variable aleatoria. Es decir, X es una funcin real, X: OIR
El dominio de la variable aleatoria X es O y el rango es un subconjunto de IR que lo
denotaremos por R
X
. El rango R
X
de la variable aleatoria X est dado por el siguiente
conjunto de nmeros reales.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
20
Consideremos el experimento aleatorio anterior. El espacio muestral est dado por:
} { sss css scs ssc scc ccs ccc , , , , csc, , , = O .
Suponga que ahora solo nos interesa el nmero de caras que sale, es decir nuestra
variable de inters es X(w): Nmero de caras que aparecen en los tres lanzamientos.
As vamos a tener que
X(ccc)=3 X(ccs) = X(csc) = X(scc) =2 X(css) = X(scs) = X(ssc) =1 X(sss)=0
Evaluamos las probabilidades de los posibles resultados de la variable aleatoria al realizar
el experimento.
} {
} {
} {
} {
8
1
( ) 0 (
8
3
csc , , ( ) 1 (
8
3
csc, , ( ) 2 (
8
1
( ) 3 (
= = =
= = =
= = =
= = =
sss P X P
ssc s cs P X P
scc s cc P X P
c cc P X P
Las variables aleatorias pueden ser discretas o continuas.
2.2. Variables aleatorias discretas
Se llama variable aleatoria discreta si el recorrido o rango de la variable aleatoria X, es un
conjunto finito o infinito numerable.
Ejemplo 2.- La variable del ejemplo 1 es una variable aleatoria discreta, porque su
recorrido es un conjunto finito, en efecto es: R
X
= {0, 1, 2, 3}.
- Propiedades de una variable aleatoria discreta
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
21
Sea X una variable aleatoria discreta con recorrido R
X
. Se llama funcin de probabilidad,
distribucin de probabilidad (tambin se llama funcin de cuanta) de la variable aleatoria
X.
La funcin definida por:
) ( ) ( x X P x p = = , que satisface las siguientes condiciones:
1 ) ( ) ; , 0 ) ( ) = e >
e
X
R x
X
x p b R x x p a
El conjunto de pares (x, p(x)), xe R
X
se llama distribucin de probabilidad de X, que se
puede representar en forma de tabla o como una expresin matemtica.
As la distribucin de probabilidad es una lista de todos los resultados posibles de algn
experimento y de la probabilidad relacionada con cada resultado.
Ejemplo 3.- Del ejemplo 1. Hallar la distribucin de probabilidad y grfico de la
distribucin de probabilidad de la variable aleatoria X: numero de caras en los tres
lanzamientos.
Solucin:
x 0 1 2 3
p(x) = P(X=x) 1/8 3/8 3/8 1/8
El grfico de la funcin de probabilidad es:
Un gran nmero de decisiones
empresariales depende de la distribucin
de probabilidad
Ejercicio: Aplique los conceptos anteriores
para resolver el siguiente caso:
Para recolectar los datos de un proyecto de investigacin, un estudiante de mercadeo en
una universidad pequea en el centro de estados unidos cont 50 cursos de negocios el
nmero de estudiantes que haban comprado recientemente discos compactos. En 12
clases no encontr estudiantes que hubieran hecho dicha compra, 3 estudiantes haban
comprado en 8 clases, 4 haban comprado en 9 clases, 5 en 15 clases y 7 estudiantes, de
las seis clases restantes haban aumentado sus colecciones de msica. El estudiante
deseaba comenzar su investigacin resumiendo sus datos. Cmo podra usted ayudarle?
0
1/8
1/4
3/8
0 1 2 3 4
P
r
o
b
a
b
i
l
i
d
a
d
d
e
X
Recorrido de X
Funcin de probablidad nmero
de caras en 3 lanzamiento de
una moneda
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
22
- Funcin de distribucin acumulada
La funcin de distribucin acumulativa de la variable aleatoria X es la probabilidad de que
X sea menor o igual a un valor especfico de x y est dada por:
( ) ( ) ( )
i
i
x x
F x p X x p x
<
= s =
Ejemplo: Hallemos la funcin de distribucin acumulada de la v.a X, cuya informacin de
probabilidad es:
Solucin:
En general, la funcin de distribucin acumulativa F(x) de una variable aleatoria discreta
es una funcin no decreciente de los valores de X, de tal manera que
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
23
) 0 ( ) 1,
) ( ) ( ),
) ( ) 1 ( )
) ( ) ( ) ( 1)
) ( ) ( ) ( 1)
i j i j
i j j i
a F x x
b F x F x si x x
c P X x F x
d P X x F x F x
e P x X x F x F x
s s
> >
> =
= =
s s = >
Ejemplo 4.- La tabla siguiente muestra la variable aleatoria X, el nmero de personas por
da que solicitan un tratamiento innecesario en el servicio de urgencia de un pequeo
hospital.
x 0 1 2 3 4 5
p(x) 0.01 0.1 0.3 0.4 0.1 ?
a) Encontrar p(5). Es decir, la probabilidad que el nmero de personas que solicitan
tratamiento innecesario en el servicio de urgencia sea de 5 personas.
b) Determinar la probabilidad que a lo ms dos personas pidan tratamientos
innecesarios en un da en el servicio de urgencia.
c) Determinar la probabilidad que por lo menos dos personas pidan tratamientos
innecesarios en un da en el servicio de urgencia.
d) Determinar la probabilidad que menos de dos personas pidan tratamientos
innecesarios en un da en el servicio de urgencia.
e) Determinar la probabilidad que entre dos y cuatro personas pidan tratamientos
innecesarios en un da en el servicio de urgencia.
Soluciones:
a) p(5)=0.09, esto es ,ya que para los valores de la variable aleatoria la suma de todas
las probabilidades es 1.
b) P(Xs2)=P(X=0)+ P(X=1)+ P(X=2)=0.01+0.1+0.3=0.41
c) P(X>2)= 1-P(X<2)= 1- P(X=0)- P(X=1)= 1-0.01-0.1= 0.89
d) P(X<2)= P(X=0)+ P(X=1)= 0.01+0.1= 0.11
e) P(2sXs4) = P(X=2)+ P(X=3)+ P(X=4) = 0.3+0.4+0.1= 0.8
Ejercicio: Sea X una variable aleatoria discreta cuya funcin de probabilidad es:
1) Complete el valor que falta para que sea una distribucin de
probabilidad.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
24
2) Calcular y representar grficamente la funcin de distribucin acumulada.
3) Calcular las siguientes probabilidades:
- Esperanza y varianza de una variable aleatoria
discreta
La funcin de probabilidad describe totalmente el comportamiento de la
variable aleatoria en el sentido de una poblacin ideal. Al considerar una
visin general de la poblacin podemos definir constantes o parmetros asociados a
cualquier variable aleatoria. Conocer estos valores numricos permite al investigador una
visin mucho ms amplia sobre la naturaleza de las variables. Los parmetros ms
conocidos son: la media o esperanza o valor esperado o promedio aritmtico, la
varianza o
2
y la desviacin estndaro.
El valor esperado de una variable aleatoria discreta con funcin de probabilidad
p(x) se denota y define por:
e
= =
X
R x
i i
x p x X E ) ( ) (
Nota: Si H(X) es una funcin de la variable aleatoria X, entonces su esperanza est dada
por:
En particular si H(X) = X
2
se tiene que:
e
= =
X
R x
i i
x p x X E ) ( ) (
2 2
La varianza de la poblacin. Se define como:
| |
2 2 2 2
) ( ) ( )) ( ( ) ( ) ( X E X E X E X E X V X Var = = = = o
La desviacin estndar de la poblacin, se define como la raz de la varianza, es
decir,
) (X V = o
Propiedades de la esperanza y la varianza: Sea x una variable aleatoria discreta
1) E(aX+b)=a E(x)+b, a y b constantes
2) Var(ax+b)= a
2
Var(x) ,
Ejemplo: Sea la v.a. X: nmero de paquetes de programas contratado por un cliente
seleccionado al azar y consideremos su funcin de probabilidad
) ( 5)
) ( 3)
) (2 5)
) (4)
a p x
b P X
c P x
d F
<
>
s s
( ( )) ( ) ( )
X
i i
x R
E H X H x p x
e
= =
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
25
x 1 2 3 4 5
P(X=x) 0,375 0,275 0,175 0,100 0,075
Suponga que el costo del servicio (Y) es una funcin nmero de paquetes contratado
segn la frmula Y=30(X+1).
Cul es el nmero esperado de paquetes de programas contrados? Cul es el valor
esperado del costo pagado por el cliente?, Cul es la varianza del nmero esperado de
paquetes?, Cul es varianza del costo pagado por el cliente?
Solucin:
a) Cul es el nmero esperado de paquetes de programas contrados?
( ) ( )
( ) (1*0, 375 2*0, 275 3*0,175 4*0,1 5*0, 075)
( ) 2, 225
X
i i
x R
E X x p x
E X
E X
e
=
= + + + +
=
b) Cul es el valor esperado del costo pagado por el cliente?
( ) ( ) (30 X 1 )
( ) (30 30) 30* ( ) 30
( ) 30*2, 225 30
( ) 97, 5
E Y E
E Y E X E X
E Y
E Y
= +
= + = +
= +
=
c) Cul es la varianza del nmero esperado de paquetes?
| |
| |
( )
2
2
2 2 2 2 2 2
2
2
2
2
( ) ( ) ( )
( ) (1 *0, 375 2 *0, 275 3 *0,175 4 *0,1 5 *0, 075)
( ) 6, 525
( ) ( ) ( )
( ) 6, 525 2, 225
( ) 1, 574
V X E X E X
E X
E X
V X E X E X
V X
V X
=
= + + + +
=
=
=
=
d) Cul es varianza del costo pagado por el cliente?
( ) (30 30)
( ) 30* ( )
( ) 30*1, 574
( ) 47, 22
V Y V X
V Y V x
V Y
V Y
= +
=
=
=
Ejercicio: Un distribuidor de aparatos electrodomsticos vende tres modelos diferentes de
congeladores verticales con capacidad de 13.5, 15.9 y 19.1 pies cbicos de espacio de
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
26
almacenaje, respectivamente. Sea X= cantidad de espacio de almacenaje que compra el
siguiente cliente. Suponga que X tiene la siguiente funcin de probabilidad.
X 13.5 15.9 19.1
P(x) 0.2 0.5 0.3
a. Calcule E(X), E(X
2
) y V(X)
b. Si el precio de un congelador con capacidad de X pies cbicos es 25X-8.5, Cul es
el precio esperado que paga el siguiente cliente por un congelador?
c. Cul es la varianza del precio 25X-8.5 que paga el siguiente cliente?
d. Suponga que si bien la capacidad nominal de un congelador es X, la capacidad real
es h(X)=X-0.01X
2
Cul es la capacidad real esperada del congelador que compra el
siguiente cliente?
2.3. Variable Aleatoria Continua
Una variable aleatoria es continua si puede tomar cualquier valor en algn intervalo (o
intervalos) del conjunto de los nmeros reales. Las variables aleatorias continuas pueden
tomar infinitos valores, resulta imposible enumerarlos todos. Luego necesitamos
determinar una expresin que nos permita calcular las probabilidades. As para este caso,
nos interesa hallar la probabilidad de la variable aleatoria X que est comprendida en un
intervalo concreto o entre determinados valores.
El clculo de las probabilidades para una variable aleatoria continua se realiza calculando
el rea bajo la curva con el uso de integrales, donde la curva se denomina funcin de
densidad.
- Funcin de densidad. Sea X una variable aleatoria continua. La funcin de
densidad de X es una funcin definidas para todos los nmeros reales tal:
1. ) ( 0 ) ( negativa no es x f >
2. El rea comprendida entre la grfica de f y el eje de las x es igual a 1.
3. Para cualquier valor real de los nmeros a y b, ) ( b X a P s s viene
representada por el rea comprendida entre la grfica de f y las rectas x = a y x =
b, y el eje x.
Nota: En el caso continua la probabilidad punto es cero, esto es, P(X=x)=0
( ) ( )
b
a
P a X b f x dx s s =
}
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
27
- Funcin de distribucin: Como en el caso de la v.a. discreta, la funcin de
distribucin proporciona la probabilidad acumulada hasta un determinado valor
de la variable, es decir, cumple las siguientes condiciones:
Nota:
a) Su valor es cero para todos los puntos situados a la izquierda del menor valor de la variable.
b) b) Su valor es 1 para todos los puntos situados a la derecha del mayor valor de la variable.
Ejemplo: Sea X el tiempo de supervivencia en aos despus de un diagnstico de
leucemia. La grfica siguiente muestra la funcin de densidad de X
a) Determine la probabilidad que el paciente sobreviva menos de 6 meses.
b) Cul es la probabilidad que el paciente sobreviva exactamente 6 meses?
c) Cul es la probabilidad que el paciente sobreviva entre un y un y medio ao?
Solucin:
a) P(X<0.5)=
}
5 . 0
0
) 5 . 0 1 ( dx x = (x-0.25x
2
)/
5 . 0
0
=0.5-0.25*0.25=0.43
b) P(X=0.5)=0
c) P(1<X<1.5)= P(X<1.5)- P(X<1)=F(1.5)-F(1) ==0,1875,
P(1<X<1.5)=
1.5
1
(1 0.5 ) x dx
}
= (x-0.25x
2
)/
1.5
1
=0,1875
( ) ( ) F x P X x = s
=
< < =
=
) ( ) 0
) ( )
) ( ) ( ) ( )
( )
) ( )
a F
b F
c P a X b F b F a
dF x
d f x
dx
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
28
Ejercicio: Si se sabe que el ingreso por ventas en una industria manufacturera, en miles de
dlares, est dada por la funcin de densidad
2
; 0<x<2
( ) 6
0 en otro caso
x
f x
+
.
Responda:
a) Cul es la probabilidad que supere los US$1200?
b) Cul es la probabilidad que sea menor a US$800?
c) Cul es la probabilidad se encuentre entre US$800 y US$1200?
2.4. Gua de estudios variable aleatoria
1) Sea X una v.a. discreta cuya funcin puntual de probabilidad es
1, 2, ,
( )
0 resto
k x x n
p x
=
=
a) Hallar el valor de k
b) Calcular la probabilidad de que X tome un valor par
2) Un examen tipo test consta de cinco preguntas con tres alternativas cada una. Un
alumno contesta al azar las cinco preguntas. Suponiendo que cada respuesta
acertada vale dos puntos, hallar la distribucin del nmero de puntos obtenidos
por el alumno.
3) Resolver el ejercicio anterior suponiendo que al alumno se le reste un punto por
cada respuesta errnea.
4) Sea X la variable aleatoria que designa el nmero de autos vendidos cada semana
por un concesionario. Se sabe que X tiene la siguiente funcin de probabilidad:
X 0 1 2 3 4 5 6 7 8 o ms
p(x) 0.04 0.04 k 0.11 0.3 0.23 0.1 0.05 0.03
a) Hallar el valor de k
b) Determine la funcin de distribucin de X
c) Calcular (2 5), ( 7) y ( 6| 3) P X P X P X X < s > s >
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
29
5) Sea X una variable aleatoria continua con funcin de distribucin
0 0
2 1
0
3 2
( )
1 1
(2 1) 1
3 2
1 1
x
x x
F x
x x
x
<
s <
+ s <
>
a) Comprobar que F es, realmente, una funcin de distribucin
b) Determinar la funcin de densidad de probabilidad de X
6) Si la ganancia de un contratista en un trabajo de construccin se puede considerar
como una variable aleatoria continua con funcin de densidad:
1
( 1) 1 5
( ) 18
0 resto
x x
f x
+ < <
Donde las unidades estn en millones de pesos.
a) Calcular la probabilidad que el contratista gane por lo menos 2000000
7) Los obreros de una empresa se acogen a tres categoras salriales: un tercio de
ellos cobra $150000 al mes, otro tercio $250000 al mes, y el resto $300000 al mes.
Por otro lado, los directivos de la empresa tambin se agrupan en tres categoras
de igual tamao, con salarios de $270000 al mes, $300000 al mes y 530000 al
mes.
a) Calcular el salario medio de cada grupo (obreros / directivos)
b) Qu grupo es ms homogneo en lo que respecta al salario?
8) Sea X una variable discreta que toma los valores 0, 1, 2 y 3 con probabilidades
1/125, 12/125, 48/125 y 64/125.
a) Encontrar E(X) y E(X
2
).
b) Utilizar los resultados de a) para obtener ( )
2
3 2 E X
(
+
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
30
3. Distribucin normal
3.1. Caractersticas de la Distribucin Normal
Esta es la distribucin ms importante de la estadstica tambin llamada gaussiana la
mayora de los mtodos estadsticos bsicos que estudiaremos se apoyan en la
distribucin normal.
Una variable aleatoria continua, tiene distribucin normal, (X ~ N (,
2
) ) si su funcin de
densidad de probabilidades es :
0 , ,
2
1
exp
2
1
) (
2
2
> < < < <
|
.
|
\
|
= o
o
to
x
x
x f
El grfico de esta funcin de probabilidad tiene forma de campana, es simtrica con
respecto a la media , Notacin. Los parmetros , o
2
corresponden a la media
aritmtica y a la varianza de la distribucin normal.
El rea bajo la curva normal es igual a 1 lo que permite usarla para el clculo de
probabilidades.
El rea sombreada sobre la curva
normal entre dos valores representa la
probabilidad de encontrarse en esta
zona.
Esta probabilidad se obtiene integrando la funcin de densidad f(x) entre los dos valores.
Regla de la probabilidad normal
( ) ( )
b
a
P a X b f x dx < < =
}
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
31
Sea X una variable aleatoria normal con media y varianza o
2
, entonces,
a) La probabilidad de que X tome un valor a una distancia mxima de su media de
una desviacin estndar es 0,68. (P ( - o < X < + o) =0,68).
b) La probabilidad de que X tome un valor a una distancia mxima de su media de dos
desviaciones estndar es 0,95. (P ( - 2o < X < + 2o) =0,95).
c) La probabilidad de que X tome un valor a una distancia mxima de su media de
tres desviaciones estndar es 0,99. (P ( - 3o < X < + 3o) =0,99).
3.2. Distribucin Normal Estandarizada
Obtener las probabilidades integrando la funcin de densidad normal f(x) es una tarea
compleja.
Sea hace uso de un cambio de variable llamado estandarizacin de la variable como:
Esta variable estandarizada Z tiene media 0 y varianza 1, es de decir que la variable z tiene
distribucin normal estndar ( Z ~ N (0,1)).
La distribucin de una variable aleatoria normal con media 0 y varianza 1 se llama
distribucin normal estndar.
Por lo tanto cuando tenemos una v.a. X que sigue una distribucin normal de media y
desviacin estndar o pasamos a otra variable Z que sigue una distribucin N (0,1)
mediante la estandarizacin de la variable.
La distribucin normal estndar se encuentra tabulada lo que permiten calcular
probabilidades de la distribucin N(0,1).
3.3. Clculo de Probabilidades
Si X ~ N( ,o
2
), estandarizando Z ~ N( 0,1),
F
X
(x) = P( X s x) = u( ) = P(Z )
La tabla el valor de probabilidad a la izquierda del valor z calculado.
X
Z
o
=
X
Z
o
=
x
o
x
o
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
32
Podemos usar la tabla para calcular las probabilidades de intervalos. Por ejemplo:
1) P(a < Z < b) = u(b) - u(a)
2) P( Z > b) = 1- P(Z sb) = 1- u(b)
3) Si b > 0, P (Z < -b) = u(-b) y P(Z > -b) = 1- u(b)
Veamos algunos ejemplos usando la tabla Tabla_Normal_Estandar
| | ( ) a P > 0,2 z
| | | | 0,2 0,2 0,5793 P z P z > = < =
| | ( ) b P > 1,27 z
| | | | 1,27 1 1,27 1 0,8980 0,1020 P z p z > = < = =
| | ( ) c P < < 0,52 1,03 z
| | | | | |
| | | | ( )
( )
0,52 1,03 1,03 0,52
1,03 1 0,52
0,8485 1 0,6985 0,5470
P z P z P z
P z P z
< < = < <
= < s
= =
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
33
3.4. Estrategia para resolver y ejercicio resuelto
1. Reconocer los elementos del enunciado
2. Definir la variable aleatoria
3. Realizar la estandarizacin de la variable con los valores
4. Plantear la probabilidad
5. Dibujar la regin del clculo de la probabilidad.
Veamos un ejercicio resuelto:
El plomo, como muchos otros elementos, est presente en el medio natural. La revolucin
industrial y la gran cantidad de automviles han incrementado la cantidad de plomo en el
medio hasta el punto de que, en algunos individuos, la concentracin de plomo puede
alcanzar niveles peligrosos. Sea X la concentracin de plomo en partes por milln en la
sangre de un individuo. Supongamos que X tiene distribucin normal con media 0,25 y
desviacin estndar 0,11. Una concentracin de 0,6 o ms es considerada
extremadamente alta.
a) Cul es la probabilidad de que si un individuo es seleccionado al azar ste
pertenezca a la categora extremadamente alta?
b) Cul es la probabilidad de que si un individuo es seleccionado al azar tenga una
concentracin de plomo entre 0,20 y 0,35?
c) Cul es la probabilidad de que si un individuo es seleccionado al azar tenga una
concentracin de plomo de por lo menos 0,45?
Solucin:
X tiene distribucin normal con media 0,25 y desviacin estndar 0,11.
V.a es X la concentracin de plomo en partes por milln en la sangre de un individuo.
Una concentracin de 0,6 o ms es considerada extremadamente alta.
a) P(X>0.6)= 1- P(X 6 . 0 s ) = 1- P(Z
11 . 0
25 . 0 6 . 0
)=u(3,18)=1
b) P(0.20 sX s 0.35) = P(
11 . 0
25 . 0 20 . 0
Z
11 . 0
25 . 0 35 . 0
)=u(0,91) - u(-0,45)= 0,8186-
0,3264=0,4922.
c) P(X>0.45)= 1- P(X 45 . 0 s ) = 1- P(Z
11 . 0
25 . 0 45 . 0
)=1-u(1,82)=0,9656
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
34
3.5. Gua de estudio distribucin normal
1) Un botnico ha observado que el ancho, X, de las hojas del lamo sigue una
distribucin normal con media 6 cm, y que el 90% de las hojas tiene un ancho
inferior a 7,5 cm. Hallar la probabilidad de que una hoja mida ms de 8 cm.
2) Las notas obtenidas en un examen por un grupo grande de alumnos se distribuye
segn una normal de media 5.5 y desviacin tpica 1.2.
a) Se obtiene A con una nota mayor que 6.2. Qu proporcin de estudiantes reciben
A?
b) Se obtiene B con una nota entre 5.3 y 6.2. Un profesor tiene un grupo de 100
alumnos, que puede verse como una muestra aleatoria del total de los
estudiantes. Hallar el nmero esperado de estudiantes de esta clase que
obtendrn una B
c) Se decide reprobar al 5% de estudiantes con notas ms bajas. Cul es la nota
mnima necesaria para no reprobar?
3) En una fbrica de turrn, la cantidad de almendra de una tableta determina su
calidad:
Calidad normal: menos de 180 gramos de almendra
Calidad extra: entre 180 y 200 gramos de almendra
Calidad superior: ms de 200 gramos de almendra.
Admitiremos que la cantidad de almendra por tableta es una variable aleatoria que
sigue una distribucin normal. Adems, sabemos que el 45% de las tabletas son de
calidad superior y el 15% de calidad normal.
a) Obtener el contenido medio de almendra por tableta
b) Obtener la desviacin estndar
c) Calcular la probabilidad de que una tableta elegida al azar tenga entre 185 y 205
gramos de almendra.
d) Hallar la probabilidad de que una tableta tomada al azar entre las de calidad
superior, tenga una cantidad de almendra inferior a 208 gramos.
e) Elegimos 150 tabletas al azar (independientemente unas de otras) cul es la
probabilidad de que al menos 2 tengan una cantidad de almendra inferior a 158
gramos?
4) Una compaa de alquiler de automviles ha determinado que la probabilidad de
que un coche necesite una revisin en un mes es de 0,3. La compaa tiene 900
coches. Cul es la probabilidad de que ms de 300 coches necesiten revisin en
un mes determinado?
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
35
5) El peso de un adulto de un cierto mamfero se distribuye segn una variable
aleatoria normal de media 100 kg y desviacin tpica 8 kg. Cul es la probabilidad
de que un adulto escogido al azar pese:
a) Menos de 90kg
b) Entre 95 y 105 kg
c) Ms de 110 kg?
4. Distribuciones Muestrales
Generalmente las poblaciones son demasiado grandes para ser estudiadas en su totalidad.
Por lo cual es necesario seleccionar una muestra representativa de un tamao manejable.
Esta muestra se utiliza luego para sacar conclusiones sobre una poblacin.
4.1. Estadsticos y Parmetros
Las caractersticas muestrales denominadas estadsticos se emplean para hacer
inferencias con respecto a las caractersticas de la poblacin Parmetros. Papel
fundamental de la inferencia estadstica.
Una vez obtenida una muestra se obtiene el
estadstico que corresponde a una funcin
de la muestra. Los estadsticos son variables
aleatorias que presentan distribuciones de
probabilidad llamadas distribuciones muestrales
Los objetos seleccionados generan n nmeros x
1
, x
2
, ..., x
n
que son los valores observados
de las variables aleatorias X
1
, X
2
, ..., X
n
.
Supongamos que estudiamos una variable X en una poblacin y sabemos que presenta
una distribucin F() , donde es el parmetro de la distribucin y es desconocido. Los
problemas de inferencia que pueden darse son: de estimacin, en los que se busca un
valor (estimacin puntual) para o un conjunto de valores posibles para el mismo
(estimacin por intervalos de confianza), y de pruebas o hiptesis, cuyo objetivo es
comprobar si es cierta o falsa cierta hiptesis formulada sobre el parmetro .
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
36
Si un estadstico lo usamos para estimar un parmetro desconocido de la poblacin (por
ejemplo la media , varianza
2
, etc.) lo llamaremos estimador de ese parmetro. Al valor
que toma una vez observada la muestra se le llama estimacin puntual del parmetro.
Para cada parmetro habr que encontrar "el mejor estimador", tratando de cometer en
la estimacin el menor error posible. El error de estimacin depende fundamentalmente
de la variabilidad poblacional y del tamao de la muestra.
Error de muestreo: Diferencia entre el parmetro y el estadstico de la muestra utilizado
para estimar el parmetro.
Los estadsticos de bsicos de inters son:
Media muestral
Varianza muestral
Proporcin muestral
Desviacin muestral
Parmetros Estadsticos o Estadgrafos
Las distribuciones muestrales que sern usadas son:
a) Teorema Central del lmite
b) Distribucin Chi. Cuadrado
c) Distribucin T- Student
d) Distribucin F de Snedecor
1 2 1
...
n
i
n i
X
X X X
X
n n
=
+ + +
= =
2
2 1
( )
1
n
i
i
X X
S
n
=
=
1 2 1
...
n
i
n i
X
X X X
p
n n
=
+ + +
= =
2
S S =
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
37
Es de bastante utilidad conocer y manejar las distribuciones normales, chi-cuadrado, t-
student y F de Snedecor en el estudio muestreo.
4.2. Tipos de distribuciones muestrales
a) Teorema Central del Lmite
El teorema central del lmite, es uno de los conceptos ms importantes en estadstica. Este
teorema justifica la importancia de la distribucin normal.
Teorema central del lmite Sea X
1
, X
2
, ,X
n
, una sucesin de variables aleatorias
independientes con E(X
i
) =
i
y varianza V(X
i
) = o
2
i
(ambos finitos).
Si Y= X
1
+ X
2 +
+ X
n
=
=
n
i
i
X
1
, entonces bajo ciertas condiciones de generales, la variable
aleatoria Z definida por
=
= =
=
n
i
i
n
i
n
i
i i
X
Z
1
2
1 1
o
tiene una distribucin aproximadamente normal estndar N(0,1), cuando n es
suficientemente grande.
La variable Y =
=
n
i
i
X
1
puede ser aproximada a la distribucin normal, cualquiera sea la
distribucin de la X
i
.
Teorema Sean X
1
, X
2
, ,X
n
, n variables aleatorias independientes idnticamente
distribuidas con E(X
i
) = y varianza V(X
i
) = o
2
(con media y varianza comn y
ambas finitas).
Si Y= X
1
+ X
2 +
+ X
n
=
=
n
i
i
X
1
, entonces la variable aleatoria:
1
/ /
n
i
i
X n
X
Z
n n
o o
=
= =
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
38
Donde
n
X
X
n
i
i
=
=
1
( X se llama media muestral) tiene una distribucin
aproximadamente normal con media cero y varianza uno (N(0, 1))
Ejemplo: Las cajas entregadas por una fbrica tienen un peso medio de 300 libras y una
desviacin estndar de 50 libras. Cul es la probabilidad de que 25 cajas tomadas al azar
y cargadas en un camin exceden de la capacidad especificada del camin, que se sabe es
de 8,200 libras? Cul es la probabilidad que el peso promedio de estas 25 cajas sea
inferior a 320 libras?
Solucin:
X tiene distribucin normal con media =300 libras y desviacin estndar o=50.
Muestra de cajas n=25
El peso promedio de las 25 cajas se distribuye normal. ( , / ) X N n o
El peso de las 25 cajas tiene distribucin normal.
1
( , / )
n
i
i
X N n n o
=
Cul es la probabilidad de que 25 cajas tomadas al azar y cargadas en un camin exceden
de la capacidad especificada del camin, que se sabe es de 8,200 libras?
P (
1
n
i
i
X
=
> 8.200) P (
8200 25*300
50 / 25
Z
> ) = 1
Estandarizando
Con seguridad al cargar las 25 cajas se exceder la capacidad del camin.
Cul es la probabilidad que el peso promedio de estas 25 cajas sea inferior a 320 libras?
P ( X < 320) P (
320 300
50 / 25
Z
> ) = u(2) = 0.9772
Estandarizando
Ejercicio: La longitud a que se puede estirar sin ruptura un filamento de Nylon es una
variable aleatoria exponencial con media de 5,000 pies. Cul es la probabilidad
(aproximada) que la longitud promedio de 100 filamentos este comprendida entre 4,750
y 5,550 pies?
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
39
a) Distribucin Chi. Cuadrado
La distribucin chi-cuadrado se denota X
2
es la distribucin muestral de la varianza
muestral (S
2
), es una distribucin sesgada a la derecha.
Estimar la varianza poblacional o la desviacin estndar requiere conocer la distribucin
chi- cuadrado. Si se escoje una muestra de tamao n de una poblacin con varianza
2
o , el
estadstico X
2
tiene distribucin chi-cuadrado con n-1 grados de libertad.
Los tres elementos principales en esta distribucin son:
El valor crtico
2
X
o
: es el valor que determina una probabilidad o a la izquierda
bajo la curva X
2
.
La probabilidad de cobertura o : rea (probabilidad) bajo la curva a la izquierda
del valor crtico.
Grados de libertad (v): indicador de la muestra (v=n-1)
Para el clculo de probabilidades se hace uso de la tabla de probabilidades para la
distribucin chi cuadrado.
La tabla contiene dos entradas:
Las filas indican las probabilidades de cobertura o y las columnas los grados de libertad
(v), los valores en el interior corresponden al valor crtico.
2
2 2
1 2
( 1)
~
n
n S
X _
o
=
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
40
Ejemplo: Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de
una poblacin normal con varianza ,, tenga una varianza muestral:
a) Mayor que 9.1
( )
( ) ( )
( )
2
2
2
2 2
2 2
2
2
,24
( 1) (24)9,1
( 9,1) ( )
6
(24)9,1
36, 4
6
36, 4 1 36, 4
36, 4 1
36, 4 ?
n S
P S P
P X P X
P X P X
P X
x
o
o
o
o
> = >
| |
> = >
|
\ .
> = s
> =
= =
Visualizando la tabla de valores de probabilidad chi- cuadrado para v= 24 grados de
libertad y valor crtico
2
X
o
= 36,4, la probabilidad a la izquierda de este valor es o = 0,95
Por lo tanto
( )
( )
2
2
36, 4 1 0, 95
36, 4 0, 05
P X
P X
> =
> =
Ejercicio: Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones,
de una poblacin normal con varianza , tenga una varianza muestral:
b) Entre 3.462 y 10.745
Recuerde que: P(a < x < b) = P(x<b) P(x<a)
b) Distribucin T- Student
La distribucin T- student se denota t
es la distribucin muestral de la media muestral
para muestras pequeas, es una curva en forma de campana con centro en cero, pero
ms dispersa que la curva normal estndar.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
41
Estimar la media muestral apartir de una poblacin normal cuando la muestra es pequea
requiere conocer la distribucin t. Si se escoge una muestra de tamao n (pequea) de
una poblacin normal con media y varianza
2
o , el estadstico t
tiene distribucin t
student con n-1 grados de libertad.
La distribucin t difiere de la normal estndar en que la varianza de t depende del tamao
de la muestra y siempre es mayor a uno. Estas distribuciones sern las mismas cuando el
tamao de la muestra tiende a infinito.
Los tres elementos principales en esta distribucin son:
El valor crtico ( t
o
): es el valor que determina una probabilidad o a la izquierda
bajo la curva t.
La probabilidad de cobertura (o ): rea (probabilidad) bajo la curva a la izquierda
del valor crtico.
Grados de libertad (v): indicador de la muestra (v=n-1)
Para el clculo de probabilidades se hace uso de la tabla de probabilidades para la
distribucin t- student.
La tabla contiene dos entradas:
Las filas indican las probabilidades de cobertura o y las columnas los grados de libertad
(v), los valores en el interior corresponden al valor crtico.
Es importante destacar que como t es simtrica alrededor de una media de cero, se tiene
que
1
t t
o o
= ; as, el valor t que deja un rea (probabilidad) de
1 o
a la derecha y por
tanto un rea de o a la izquierda, es igual al valor t negativo que deja un rea de o en
la cola derecha de la distribucin. Esto es, t
0.95
= -t
0.05
, t
0.99
=-t
0.01
.
Ejemplo: Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto
proceso en lotes es 500 gramos por milmetro de materia prima. Para verificar esta
1
~
n
x
t t
s
n
=
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
42
afirmacin toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre
t
0.05
y t
0.05
, queda satisfecho con su afirmacin. Qu conclusin extraera de una muestra
que tiene una media de 518 gramos por milmetro y una desviacin estndar de 40
gramos? Suponga que la distribucin de rendimientos es aproximadamente normal.
Solucin:
De la tabla buscamos t
0.05
=t
0, 95
con 24 grados de libertad es de 1.711. De esta forma el
fabricante queda satisfecho si de una muestra de 25 lotes el valor t se encuentra entre
1.711 y 1.711.
Se procede a calcular el valor de t:
518 500
2.25
40
25
x
t
s
n
= = =
Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener
un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02. De aqu que es probable que el fabricante concluya que el
proceso produce un mejor producto del que piensa.
Ejercicios
1) Una compaa manufacturera afirma que las bateras que utiliza en sus juegos
electrnicos duran un promedio de 30 horas. Para mantener este promedio, se
prueban 16 bateras cada mes. Si el valor t que se calcula cae entre t
0.025
y t
0.025
,
la compaa queda satisfecha con su afirmacin. Qu conclusiones debera
obtener la empresa de una muestra que tiene una media de 27,5 horas y una
desviacin estndar de 5 horas. Suponga que la distribucin de las duraciones de
las bateras es aproximadamente normal.
2) Un fabricante de cierta marca de barras de cereal bajo en grasa afirma que su
contenido promedio de grasa saturada es 0.5 gramos. En una muestra aleatoria de
8 barras de cereal de esta marca, el contenido de grasa saturada fue 0,6; 0,7; 0,7;
0,3; 0,4; 0,5; 0,4 y 0,2.
Estara de acuerdo con la afirmacin? Suponga una distribucin normal?
c) Distribucin F
La distribucin F se define como la razn de dos variables aleatorias chi - cuadradas,
dividida cada una entre sus grados de libertad.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
43
Caractersticas
- La variable aleatoria F es no negativa, es decir, los valores que asume la variable F
no son negativos
- La distribucin es sesgada hacia la derecha.
- La distribucin F tiene una apariencia muy similar a la distribucin chi-cuadrada;
sin embargo, se encuentra centrada respecto a 1.
- Presenta dos parmetros dados por los grados de libertad lo cuales proporcionan
una flexibilidad adicional con respecto a la forma de la distribucin.
La distribucin F nos permite comparar las varianzas de dos poblaciones utilizando las
varianzas muestrales de estas.
Sean
2
1
S y
2
2
S las varianzas muestrales de dos muestras independientes de tamao n
1
, n
2
tomadas de poblaciones normales
2
1
o y
2
2
o .
El estadstico F tiene distribucin F con v
1
y v
2
grados de libertad.
Los tres elementos principales en esta distribucin son:
El valor crtico
1 2
,
(1 )
v v
F o : es el valor que determina una probabilidad o a la
izquierda bajo la curva X
2
.
La probabilidad de cobertura (1 ) o : rea (probabilidad) bajo la curva a la
izquierda del valor crtico.
Grados de libertad ( v
1
, v
2
): indicador de las dos muestras ( v
1
=n
1
- 1 ,
v
2
= n
2
1)
1 2
2
1
2
1
, 2
2
2
2
(1 )
v v
S
F F
S
o
o
o
=
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
44
Para el clculo de probabilidades se hace uso de la tabla de probabilidades para la
distribucin F para distintos valores de 0,9;0,95;0,975;0,99;0,995. o =
La tabla contiene dos entradas: Las filas indican los grados de libertad v
1,
las columnas
indican los grados de libertad v
2
, los valores en el interior corresponden a las
probabilidades coberturas o a la derecha valor crtico
1 2
,
(1 )
v v
F o .
Ejemplo: Encuentre el valor de F para cada uno de los siguientes casos:
a. El rea (probabilidad) a la derecha de F, es de 0.25 con n
1
=5 y n
2
=10.
b. El rea (probabilidad) a la izquierda de F, es de 0.95 con n
1
=16 y n
2
=11.
Ejemplo: Sean s
1
2
y s
2
2
las varianzas muestrales de muestras aleatorias independientes de
tamaos n
1
=10 y n
2
=20, tomadas de poblaciones normales que poseen las mismas
varianzas, encuentre P (s
1
2
/s
2
2
2.42).
Ejercicio: Encuentre el valor de F para cada uno de los siguientes casos:
a. El rea (probabilidad) a la derecha de F es de 0.95 con n
1
=7 y n
2
=9.
b. El rea (probabilidad) a la izquierda de F, es de 0.10 con con n
1
=26 y n
2
=32
Ejercicio: Sean s
1
2
y s
2
2
las varianzas muestrales de muestras aleatorias independientes
de tamaos n
1
=25 y n
2
=31, tomadas de poblaciones normales con varianzas
1
2
=10
y
2
2
= 15, respectivamente, encuentre P (s
1
2
/s
2
2
> 1.26).(3)
A partir de las distribuciones muestrales ser posible realizar inferencias para los
siguientes estadsticos al abordar el tema de intervalos de confianza.
Media muestral
Varianza muestral
Proporcin muestral
Diferencia de medias muestrales
Cociente de Varianzas muestrales
Diferencia de Proporciones muestrales
4.3. Distribuciones muestrales de los estadsticos
Media muestral
Sea X
1
, ..., X
n
una muestra aleatoria simple (m.a.s.) de una poblacin X con E(X) = y V
ar(X) =
2
. Se puede probar que la esperanza de la media muestral est dada por:
= ) (X E y su varianza est dada por:
n
X V
2
) (
o
=
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
45
Recordemos que:
El Teorema Central del Lmite establece que:
=
=
n cuando
n
N
n
X
X
n
i
i
) , ( ~
2
1
o
Por lo tanto Sea X
1
, ..., X
n
una m.a.s. de una poblacin X con distribucin N (, ).
Entonces,
La media muestral se distribuye normal con media y varianza
2
n
o
.
Varianza muestral
Sea X
1
, ..., X
n
una m.a.s. de una poblacin X con E(X) = y Var(X) =
2
.
Sea X
1
, ..., X
n
una m.a.s. de una poblacin X con distribucin N (,
2
).
Entonces:
y
2
S y X son independientes.
(3) http://www4.ujaen.es/~dmontoro/Metodos/Temas/Tema6.pdf
Por lo tanto el cuociente
2
2
( 1) n S
o
)
) 1 (
, ( ~
N
n
p p
p p
Z
n
p p
p N p
Nota: El nmero de individuos que presentan la caracterstica en la muestra sigue una
distribucin Binomial B(n, p), que con n suficientemente grande se puede aproximar a una
2
1
~ ( , )
n
i
i
X
X N
n n
o
=
=
2
2 2
1 2
( 1)
~
n
n S
X _
o
=
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
46
N (np, np(1 - p)). Por lo tanto, la proporcin muestral sigue tambin una distribucin
Normal con los parmetros arriba indicados.
Diferencia de medias muestrales
Sea X
1
, ..., X
n1
una m.a.s de una poblacin X, e Y
1
, ..., Y
n2
una m.a.s. de una poblacin Y.
Suponemos que las poblaciones X e Y son independientes y con distribuciones normales N
(
1
,
2
1
o ) y N(
2
,
2
2
o ) respectivamente.
Se pueden presentar los siguientes casos:
(a)
2
2
2
1
o o y conocidas:
) , ( ~
2
2
2
1
2
1
2 1
n n
N Y X
o o
+
o equivalentemente
) 1 , 0 ( ~
) ( ) (
2
2
2
1
2
1
2 1 2 1
N
n n
X X
Z
o o
+
=
(b)
2 2
2
2
1
o o o = = desconocidas:
1
2 1
2 1 2 1
~
1 1
) (
+
=
n
c
t
n n
S
X X
T
donde
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1 2
+
+
=
n n
S n S n
S
c
Cociente de varianzas muestrales
Sea X
1
, ..., X
n1
una m.a.s de una poblacin X, e Y
1
, ..., Y
n2
una m.a.s. de una poblacin Y.
Suponemos que las poblaciones X e Y son independientes y con distribuciones normales N
(
1
,
2
1
o ) y N(
2
,
2
2
o ) respectivamente. Entonces,
1 , 1
2
2
2
2
1
2
1 2
~
=
n n
Y
X
F
S
S
F
o
o
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
47
Diferencia de proporciones muestrales
Sea X
1
, ..., X
n1
una m.a.s de una poblacin X, e Y
1
, ..., Y
n2
una m.a.s. de una poblacin Y.
Suponemos que las poblaciones X e Y son independientes. Denotamos por p
1
y p
2
las
proporciones poblacionales y por
2 1
, p p las correspondientes proporciones
muestrales.
) 1 , 0 ( ~
) 1 ( ) 1 (
) (
2
2 2
1
1 1
2 1 2 1
N
n
p p
n
p p
p p p p
Z
=
Utilizaremos las distribuciones muestrales anteriores en el clculo de probabilidades en
los siguientes ejercicios.
5. Estimacin de parmetros
5.1. Introduccin
Consideremos una v.a X con distribucin F
.
Vemos a continuacin dos mtodos para obtener la estimacin puntual de un parmetro:
mtodo de los momentos y mtodo de mxima verosimilitud.
5.3. Mtodos de estimacin puntual
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
48
Mtodo de los momentos: consiste en igualar momentos poblacionales a
momentos muestrales. Deberemos tener tantas igualdades como parmetros a
estimar.
Un momento poblacional de orden r esta dado por k r
r
..., , 1 ), E(X
r
= =
Momento muestral de orden r k r
n
x
M
r
i
r
i
r
..., , 1 ,
1
= =
=
r r
M =
Mtodo de mxima verosimilitud: consiste en tomar como valor del parmetro
aquel que maximice la probabilidad de que ocurra la muestra observada.
Si X una variable poblacional continua con funcin de densidad de probabilidad f(x; u
1
,
..., u
k
), siendo
i
parmetros desconocido o una variable aleatoria discreta con funcin de
probabilidad p(x; u
1
, ..., u
k
), siendo
i
parmetros desconocido.
Sea X
1
, ..., X
n
una muestra seleccionada de de una v.a. X, y sean x
1
, ..., x
n
los valores
observados de la muestra. La funcin de verosimilitud de la muestra se define as:
) ; (
) ; ( * ... * ) ; ( ) ,..., ; ( ) ,..., ; (
1
1 1 1
u
u u u u
[
=
=
= =
n
i
i
n n n
x f
x f x f x x f x x L
A ) ,..., ; (
1 n
x x L u se le llama funcin de verosimilitud.
Buscamos entonces el valor de que maximice la funcin de verosimilitud, y al valor
obtenido se le llama estimacin por mxima verosimilitud de .
5.4. Propiedades de los estimadores puntuales
- Insesgamiento: Se dice que el estadstico muestral es un estimador insesgado
del parmetro poblacional, si el valor esperado del estadstico muestral es
igual al parmetro poblacional estudiado.
El estadstico muestral u es un estimador insesgado del parmetro poblacional
de u si:
( ) E u u = , donde ( ) E u es el valor esperado del estadstico muestral u .
La figura siguiente muestra la diferencia entre un estimador sesgado y uno
insesgado.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
49
- Consistencia: Un estimador puntual es consistente si el valor del estimador
puntual tiende a estar ms cerca del parmetro poblacional a medida que el
tamao de la muestra aumenta, es decir, que una muestra grande tiende a
proporcionar un mejor estimador puntual que una muestra pequea.
La figura siguiente muestra la diferencia entre dos distribuciones muestrales,
visualizando el apuntamiento de la distribucin muestral de 1 u , vemos que
este estimador es mas consistente.
- Eficiencia: Sean dos muestras aleatorias simples de tamao n de manera que
se obtienen dos estimador puntuales insesgados de un mismo parmetro
poblacional. Se dice que un estimador puntual que presenta menor error
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
50
estndar tiene mayor eficiencia relativa. Un estimador es eficiente con
respecto a otro si presente menor error estndar.
- Suficiencia: La idea intuitiva de estadstico suciente sugiere eliminar de la
muestra aquellos elementos que no sean informativos respecto de cierto
parmetro.
5.5. Estadsticos de orden y sus propiedades
Estadsticos conocidos como ordinales, el objetivo principal de los estadsticos de orden es
ordenar los datos que sern utilizados dentro de un experimento en base a
determinados criterios de orden (Creciente o decreciente).
Se utilizan para las pruebas de rango multiple para ordenar las muestras aleatorias de
diversas poblaciones.
5.6. Estimacin por intervalos de confianza
Los intervalos de confianza son instrumentos estadsticos que sirven para medir la
incertidumbre de un parmetro.
En lugar de dar una estimacin puntual para el parmetro buscamos ahora un intervalo
[
1
(x
1
, ..., x
n
),
2
(x
1
, ..., x
n
)] que contenga al parmetro con una alta probabilidad.
Esta probabilidad recibe el nombre de nivel de confianza del intervalo, se denota por (1 -
) y la fija el investigador.
Construccin de un intervalo de confianza (I.C)
Sea X ~ F
o
o o
= + s s
1 ) (
2 / 1 2 / 1
n
z X
n
z X P
El Intervalo para al (1 - ) 100% de confianza es entonces
| |
n
z X
n
z X
o o
o o 2 / 1 2 / 1
,
+ e
Observaciones:
- El intervalo depende de la muestra seleccionada
- La amplitud del intervalo mide la precisin de la estimacin. Concretamente, el error
cometido en la estimacin de por x viene dado por e = X es menor o igual que
n
z
0
2 / 1
o
o
con una probabilidad (1 - ).
Luego para el caso anterior.
n
z e
o
o 2 / 1
s
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
52
2
2 / 1
*
|
.
|
\
|
>
e
z
n
o
o
A mayor tamao muestral n, menor amplitud, y por lo tanto mayor precisin en la
estimacin. Por otro lado, cuanto mayor es el nivel de confianza, mayor es la amplitud del
intervalo.
Ejemplo: Supongamos que llevan a cabo pruebas de la resistencia a la tensin de una
clase de largueros de aluminio utilizado en la fabricacin de alas de aeroplanos. De la
experiencia se considera una desviacin estndar de 1 kg/mm
2
. Una muestra de 10
largueros proporciona una resistencia promedio de 87.6 kg/mm
2
. Vamos a obtener un I.C.
al 95% de confianza para la resistencia promedio de esta clase de largueros.
Solucin
X = Resistencia a la tensin ~ N (, 1)
Sabemos que el I.C. al (1 -)100% es
|
n
z x
n
z x
o o
o o 2 / 1 2 / 1
, [
+ e
En este caso, el nivel de confianza es del 95%, por lo que (1 - ) = 0,95 y = 0,05. El
intervalo es por lo tanto:
(
e
10
1
96 . 1 6 . 87
= [86.98, 88.22]
5.7. Intervalo de confianza para medias, varianzas y proporciones
Intervalo de confianza para la media de una distribucin normal
Sea X
1
, ..., X
n
una m.a.s. de X ~ N (,
2
).
Varianza conocida
2
|
n
z x
n
z x
o o
o o 2 / 1 2 / 1
, [
+ e
Varianza desconocida
| |
n
S
t x
n
S
t x
n n 1 , 2 / 1 1 , 2 / 1
,
+ e
o o
Intervalo de confianza para la varianza de una normal
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
53
Sea X
1
, ..., X
n
una m.a.s. de X ~ N (,
2
).
2
1
2
2
~
* ) 1 (
=
n
S n
X _
o
(
(
e
2
2 / , 1
2
2
2 / 1 , 1
2
2
* ) 1 (
,
* ) 1 (
o o
_ _
o
n n
S n S n
Ejemplo: Un ingeniero de control de la calidad midi el espesor de la pared de 20 botellas
de vidrio de 2 litros. La media muestral result 4.05 mm y la desviacin estndar 0.08 mm.
Obtenga un intervalo de confianza al 90% para la variabilidad del espesor de la pared de
las botellas.
X = Espesor ~ N (,
2
), con , desconocidas
Soluc: o
2 e
[0,005, 0,015]
Intervalo de confianza para la diferencia de medias de dos poblaciones normales
e independientes
Sean X
1
, ..., X
n1
una m.a.s. de X ~ N (
1
,
2
1
o ) y Y
1
, ..., Y
n2
una m.a.s. de Y ~ N (
2
,
2
2
o ),
independientes.
) 1 , 0 ( ~
) (
) , ( ~
2
2
2
1
2
1
2 1 2 1
2
2
2
1
2
1
2 1 2 1
N
n n
X X
Z
a equivale que lo
n n
N X X
o o
o o
+
=
+
Se tiene que:
Si las varianzas son conocidas:
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
54
) 1 , 0 ( ~
) (
) , ( ~
2
2
2
1
2
1
2 1 2 1
2
2
2
1
2
1
2 1 2 1
N
n n
X X
Z
a equivale que lo
n n
N X X
o o
o o
+
=
+
Si las varianzas son desconocidas se cumple que:
2 1
2 1 2 1
1 1
) (
n n
S
X X
T
c
=
Los intervalos de confianza para la diferencia de medias:
Varianzas conocidas
|
(
(
(
+ e
2
2
2
1
2
1
2 / 1 2 1 2 1
) (
n n
z X X
o o
o
Varianzas desconocidas
pero iguales
(
+ e
+
2 1
2 , 2 / 1 2 1 2 1
1 1
)
2 1
n n
S t X X
c n n o
Ejemplo: El hundimiento de un petrolero en las proximidades de la costa de una
determinada regin ha provocado un gran desastre tanto econmico como ecolgico. Con
el fin de analizar la composicin del fuel que desprende el buque, han sido seleccionadas
17 galletas de chapapote a las cuales se les mide la concentracin de zinc, obtenindose
un promedio 140 mg/l, con una desviacin estndar de 30 mg/l.
(a) Obtenga un intervalo de confianza al 95% para la concentracin media de zinc en el
fuel que desprende el petrolero.
X = Composicin de cinc ~ N (,
2
), con ,
2
desconocidas
Solucin: [124,575, 155,425]
(b) Qu ocurrira al incrementar el tamao de la muestra?. Razona la respuesta.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
55
Solucin: Al incrementar el tamao de la muestra, se reduce el error de estimacin de la
media
Intervalo de confianza para el cociente de varianzas de dos poblaciones normales
e independientes
Sean ~ N (
1
,
2
1
o ) y ~ N (
2
,
2
2
o ), independientes. Suponemos que las poblaciones X e Y
son independientes y con distribuciones normales N (
1
,
2
1
o ) y N(
2
,
2
2
o )
respectivamente y sean X
1
, ..., X
n1
una m.a.s. de X y Y
1
, ..., Y
n2
una m.a.s. de Y . Entonces,
1 , 1
2
2
2
2
1
2
1 2
~
=
n n
Y
X
F
S
S
F
o
o
(
e
1 , 1 2 / 1
2
2
1 , 1 2 /
2
2
2
2
2
1
2 2
, , ,
n n
Y
X
n n
Y
X
f
S
S
f
S
S
o o
o
o
Ejemplo: Se piensa que la concentracin del ingrediente activo de un detergente lquido
para ropa est afectada por el tipo de catalizador utilizado en el proceso de fabricacin.
Por experiencias anteriores se supone que la desviacin estndar de la concentracin
activa es de 3 g/l, sin importar el tipo de catalizador utilizado. Se toman 10 observaciones
con cada catalizador y se obtienen los siguientes datos:
Cat.1 57.9 66.2 65.4 65.4 65.2 62.6 67.6 63.7 67.2 71
Cat.2 66.4 71.7 70.3 69.3 64.8 69.6 68.6 69.4 65.3 68.8
(a) Obtenga un intervalo de confianza al 90% para el cociente de varianzas?. Puede
suponerse la misma variabilidad en la concentracin con el empleo de ambos
catalizadores?.
X = Concentracin con catalizador 1 ~ N (
1
,
1
2
)
Y = Concentracin con catalizador 2 ~ N (
2
,
2
2
),
Son independientes y todos los parmetros se desconocen.
Solucin: [0,116, 1,180].
Al estar el 1 contenido en el intervalo, las varianzas podran considerarse iguales.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
56
(b) Obtenga un intervalo de confianza al 95% para la diferencia en la concentracin activa
bajo la presencia de ambos catalizadores. Depende la concentracin activa del
catalizador?.
Solucin: [6,061; 0,379]
Intervalo de confianza para una proporcin
Sea X
1
, ..., X
n
una m.a.s. de X ~ Bernoulli(p).
Para muestras grandes, la proporcin muestral
muestra la de tamao
tica caracters la con muestra la en objetos de nmero
p =
Tiene una distribucin aproximadamente normal con media p y varianza p(1-p)/n.
) 1 , 0 ( ~
) 1 (
)
) 1 (
, ( ~
N
n
p p
p p
Z
n
p p
p N p
Luego un intervalo de confianza para p esta dado por:
|
(
(
+
e
n
p p
z p
n
p p
z p p
) 1 (
,
) 1 (
2 / 1 2 / 1 o o
Tamao de la muestra para la estimacin de p.
Como en el caso de la media muestral, la cuestin del tamao de la muestra debera ser
considerada en los estudios de planificacin de un experimento.
En este caso el error de estimacin est dado por
n
p p
z e
) 1 (
*
2 / 1
=
o
y si partimos con un error de estimacin conocido y resolvemos la ecuacin anterior para
n obtenemos:
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
57
2
2
2 / 1
) 1 ( *
e
p p z
n
=
o
Sin embargo el lado derecho de esta expresin involucra el valor p . El cual lo podemos
estimar de una muestra piloto tomada de la poblacin de inters o ser estimado por
experimentos similares anteriores. Si no se toma una muestra, no tenemos el valor de
p
. Pero tenemos que la cantidad ) 1 ( p p nunca es ms grande que , y este valor es
mximo cuando 2 / 1 = p . Si asignamos el valor a p tenemos que el tamao de
muestra n est dado por:
2
2 / 1
2
2
2 / 1
2
4
|
.
|
\
|
= =
e
z
e
z
n
o o
Ejemplo: Para poder controlar la fabricacin de un producto se toman 85 muestras de un
determinado componente y se concluye que 10 de ellos no cumplen las especificaciones.
(a) Calcula un intervalo de confianza al 95% para la proporcin de defectuosos.
X = No de defectuosos ~ B (85, p)
Solucin: [0,05, 0,186]
(b) Cul debera ser el tamao de la muestra si se quiere que el error cometido al estimar
la proporcin sea menor de 0.05 con una probabilidad 0.95?.
Solucin: 160
Intervalo de confianza para la diferencia de proporciones
Sean X
1
, ..., X
n1
una m.a.s. de X ~ Bernoulli(p
1
) y Y
1
, ..., Y
n2
una m.a.s. de
Y ~ Bernoulli(p
2
).
Para construir un intervalo de confianza para p
1
- p
2
estandarizamos la variable
2 1
p p , es decir
) 1 , 0 ( ~
) 1 ( ) 1 (
) (
2
2 2
1
1 1
2 1 2 1
N
n
p p
n
p p
p p p p
Z
=
Y se obtiene el intervalo de confianza para p
1
- p
2
que est dado por:
(
2
2 2
1
1 1
2 / 1 2 1
2
2 2
1
1 1
2 / 1 2 1
) 1 ( ) 1 (
p - p ,
) 1 ( ) 1 (
p - p
n
p p
n
p p
z
n
p p
n
p p
z
o o
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
58
Ejemplo: Dos marcas de refrigeradores A y B, tienen un ao de garanta. En una muestra
aleatoria de 50 refrigeradores de la marca A, se observ que 12 de ellos tuvieron fallas
antes de cumplir la garanta. Una muestra aleatoria de 60 refrigeradores de la marca B
tambin revel que 12 fallaron antes de cumplir la garanta. Estime la diferencia real
entre las proporciones de fallas de ambas marcas durante el periodo de garanta con un
98% de confianza.
Solucin: [-0.1451, 0.2251]
5.8. Pasos para resolver un intervalo de confianza
a) Lea atentamente el enunciado del ejercicio.
b) Identifique el estadstico de inters de estudio.
c) Identifique el intervalo de confianza que se quiere estimar.
d) Identifique los datos del caso que permitan encontrar el intervalo de confianza.
e) Calcule el intervalo de confianza.
f) Comente los resultados en el contexto del problema.
g) Comente y consulte a su tutor virtual.
5.9. Gua de ejercicios de Estimacin puntual e Intervalo de confianza para medias,
varianzas y proporciones
1. El tiempo de fallo en horas de un componente electrnico (en horas) puede
modelizarse segn una distribucin Exponencial con funcin de densidad f(x) =
exp{-x}, x 0
a. Encuentra el estimador de mxima verosimilitud de , basado en una muestra
aleatoria de tamao n.
b. Encuentra el estimador de haciendo uso del mtodo de los momentos.
c. Estima el tiempo medio de las componentes en base a la informacin que
proporciona la siguiente muestra:
300, 305, 329, 325, 310, 314, 302, 356, 325, 309, 351, 305, 322, 349
2. El nmero de accidentes de trfico diarios en una localidad se puede modelar por una
distribucin de Poisson de parmetro . Una muestra de 45 das proporciona un no
medio de accidentes por da de 2 con una desviacin estndar de 1.4. Obtenga una
estimacin puntual para .
3. En la siguiente tabla se recogen 15 medidas del tiempo (en segundos) de aceleracin de
un vehculo.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
59
10.9 9.63 6.5 11.06 11.39 9.76 12.52 7.68 9.25 12.40 9.84 10.45 7.67 8.77
9.63
Suponiendo que el tiempo de aceleracin sigue una distribucin normal,
a) Obtenga un intervalo de confianza para el tiempo medio de aceleracin.
b) Calcula el tamao de muestra necesario para que el error de estimacin de la media sea
menor que 0.75 con probabilidad 0.95.
c) Se puede afirmar que la aceleracin media es de 10 segundos?.
1. Se desea comparar la variabilidad de la resistencia a la compresin de dos
cementos A y B. Para ello se fabrican 51 bloques con cada tipo de cemento a los que se
mide la resistencia a la compresin. Se obtienen los siguientes datos:
96 120
2 2
= =
B A
S S
Suponiendo que ambas poblaciones son normales e independientes, obtn un intervalo
de confianza al 90% para el cociente de varianzas. Pueden considerarse
significativamente distintas?.
2. Se tienen dos mtodos para medir la resistencia de un cable. Se seleccionan
aleatoriamente 9 cables, a los que se aplica el primer mtodo, y otros 9 cables a los que
se aplica el segundo mtodo. Los datos son:
Mt. 1 1.186 1.151 1.322 1.339 1.2 1.402 1.365 1.537 1.559
Mt. 2 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052
Obtenga un intervalo de confianza al 95% para la diferencia entre los mtodos. Pueden
considerarse diferentes?.
8. Un ingeniero qumico est interesado en comparar el rendimiento de un proceso
qumico bajo dos temperaturas distintas. La realizacin de 5 ensayos consecutivos a
cada una de las temperaturas proporcionan los siguientes rendimientos (%):
Temperatura 1 85 83 82 85 84
Temperatura 2 90 92 91 93 90
Obtenga un intervalo de confianza al 99% para la diferencia de rendimientos
promedios. Pueden suponerse los rendimientos medios iguales?.
Suponer ambas poblaciones normales e independientes.
9. Los tiempos de fallo en horas de una muestra aleatoria de 10 componentes
electrnicos de una determinada marca son:
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
60
2300 2000 1980 2500 2432
2300 2429 1970 2100 2200
Si suponemos que estos tiempos proceden de una distribucin exponencial,
a. Estima el parmetro de tal distribucin.
b. Calcula el tiempo medio de fallo de una componente de este tipo.
c. Si una componente no ha fallado pasadas 500 horas desde su puesta inicial en
funcionamiento,
cul es la probabilidad de que dure por lo menos otras 200 horas ms?.
d. Si tienen un perodo de garanta de 1000 horas, calcula la probabilidad de que una
componente falle estando en perodo de garanta. De un lote de 30 componentes,
cuntas se esperan que sean devueltas por fallar estando en garanta?.
10. Una central de productos lcteos recibe diariamente la leche de dos granjas A y B.
Con el fin de estudiar la calidad de los productos recibidos se extraen dos muestras,
una de cada granja, y se analiza el contenido de materia grasa de cada producto. Se
obtienen los siguientes resultados:
Granja A 0.32 0.29 0.30 0.28 0.33 0.31 0.30 0.29 0.33 0.32 0.30 0.29
Granja B
0.28
0.30
0.32
0.29
0.31
0.29
0.33
0.32
0.29
0.32
0.31 0.32
0.29
0.30
a. Obtenga un intervalo de confianza al 95% para el cociente de varianzas. Podran
considerarse las varianzas iguales?.
b. Obtenga un intervalo de confianza al 95% para la diferencia en el contenido graso
promedio de los productos de ambas granjas.
c. Si la central rechaza aquellos productos con un contenido graso superior a 0.32,
obtenga un intervalo de confianza al 90% para la diferencia de proporciones de
productos que habra que rechazar procedentes de ambas granjas.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I
61
GLOSARIO DE TERMINOS
Interval o de confianza: Se l l ama as a un i nterval o en el que sabemos
que est un parmetro, con un ni vel de confi anza espec fi co.
Nivel de confianza: Probabi l i dad de que el parmetro a esti mar se
encuentra en el i nterval o de confi anza.
Error de estimaci n: di ferenci a entre l a esti maci n de un parmetro y
su val or real .
BIBLIOGRAFIA
1. Canavos, G., Probabilidad y Estadstica. Aplicaciones y Mtodos. (Mac Graw Hill).
2. Apuntes, Departamento de Estadstica, Universidad de Concepcin.
3. Devore, J., Probabilidad y Estadstica para ingeniera y ciencias. (THOMSON).
REFERENCIAS
1) http://www.mat.uson.mx/~ftapia/Notas%20de%20Clase/Mis%20Notas%20Tema%
20I.pdf
2) http://estadisticaparaadministracion.blogspot.com/2011/07/aplicaciones-de-la-
estadistica-en-la.html
3) http://www4.ujaen.es/~dmontoro/Metodos/Temas/Tema6.pdf