You are on page 1of 61

ESTADISTICAS DE MERCADO

MANUAL DE ESTUDIO- MODULO I




1


INTRODUCCIN

En el curso de Estadstica Empresarial abordamos de manera profunda la estadstica
descriptiva definiendo cada uno de sus conceptos bases como: poblacin, muestra,
parmetro, estadstico, variables y escalas de medida. Conceptos que nos permitieron
comprender la tabulacin de datos, distribuciones de frecuencia, representaciones
grficas y medidas de resumen. Luego estudiamos las tablas bidimensionales y Regresin
lineal para finalizar el curso con probabilidades.

El curso de inferencia estadstica requiere como base recordar algunos conceptos
mencionados anteriormente para poder sustentar los nuevos conocimientos estadsticos
que sern abordados en este mdulo. El principal objetivo de este curso es realizar
inferencias con respecto a la poblacin basndose en la informacin contenida en una
muestra. Las poblaciones se describen mediante medidas numricas
denominadas parmetros, el objetivo de la mayora de las investigaciones estadsticas es
deducir una inferencia con respecto a uno o ms parmetros de la poblacin.

En este mdulo centraremos nuestra atencin al estudio de la estimacin de parmetros.

Comenzaremos el mdulo recordando algunos conceptos preliminares de estadstica
descriptiva dando nfasis en las medidas de resumen ya que corresponden a medidas
descriptivas de la muestra tambin llamadas estadsticos.

Siguiendo los contenidos conoceremos el concepto de variable aleatoria aplicada al
clculo de probabilidades sobre valores que tome la variable aleatoria haciendo su uso la
distribucin normal y propiedades. Le seguir el estudio de las distribuciones mustrales
las cuales sern de gran utilidad en el mdulo 2.

Finalmente trataremos los mtodos de estimacin puntual e intervalar para los distintos
parmetros de estudio.


ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


2
ESQUEMA GENERAL DEL MODULO 1























Mdulo 1
Conceptos
Preliminares
1) Importancia de la
estadstica y aplicacin
en la empresa
2) Tipos de Variables
3) Matriz de datos y
Tabulacin de datos
4) Distribucin de
Frecuencias y
representaciones
grficas
5) Medidas de Resumen
Variable Aleatoria
1) Concepto Variable
2) Aleatoria Discretas
3) Variable Aleatoria
Continua


Distribucin
Normal

1) Caractersticas
2) Distribucin Normal
Estandarizada
3) Clculo de
Probabilidades
4) Estrategia para
resolver ejercicios
resueltos
5) Gua de estudio
distribucin normal

Distribuciones
muestrales
1) Estadsticos y
Parmetros
2) Tipos de
distribuciones
muestrales
3)Distribuciones
muestrales de los
estadsticos
4) Estrategia para
resolver ejercicios y
Casos propuestos para
resolver

Estimacin de
parmetros

1) Introduccin
2) Estimacin puntual
3) Mtodos de
estimacin puntual
3) Propiedades de los
estimadores
4) Estadsticos de orden
y sus propiedades
5) Estimacin por
intervalos de confianza
para medias, varianzas
y proporciones
6) Pasos para resolver
un intervalo de
confianza
7) Gua de ejercicios de
estimacin puntual e
intervalo de confianza
para medias, varianzas
y proporciones.

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


3
OBJETIVO GENERAL


Introducir a los alumnos en los conceptos bsicos de inferencia estadstica.


CONTENIDOS

1. Conceptos Preliminares
2. Variable Aleatoria
3. Distribucin normal
4. Distribuciones Muestrales
5. Estimacin de parmetros


Conceptos Preliminares

1.1. Importancia de la estadstica y aplicacin en la empresa

La estadstica es una ciencia que se ha convertido en una herramienta imprescindible ante
la necesidad de conocimiento y anlisis de informacin.

La utilidad para el administrador de una empresa, es que a travs de la aplicacin de
procedimientos estadsticos precisos, pueden predecirse algunos sucesos futuros con
cierto grado de exactitud y eso beneficiar profundamente a la empresa.

El costo de recolectar la informacin es estratgico, ya que contribuye notablemente a
una mejor gestin. Peter Drucker "el padre del management" afirma que las mediciones
son la clave. Si usted no puede medirlo, no puede controlarlo. Si no puede controlarlo, no
puede gestionarlo. Si no puede gestionarlo, no puede mejorarlo. La falta sistemtica o
ausencia estructural de estadsticas en las organizaciones impide una administracin
cientfica de las mismas.
(1)


As pues, slo en la medida en que seamos capaces de comprender y dominar la correcta
utilizacin de los mtodos estadsticos, podremos interpretar, valorar y extraer todo el
provecho posible a los datos procedentes de nuestra empresa.

Ejemplos

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


4
Mercadeo: Qu clientes les generan los mayores beneficios?, Qu zonas o regiones son
las que generan mayores ventas en unidades monetarias y volmenes?, Cul es el nivel
de rotacin o permanencia de clientes?, En qu etapa del ciclo de vida se encuentra cada
uno de sus productos o servicios?, Cul es el nivel de satisfaccin de los clientes?.
(1)

Operaciones: Cules son las reparaciones que ms se han producido en el ltimo
trimestre?, Qu tipo de reparaciones han generado mayores egresos?, Cul es la
capacidad de los diferentes procesos en materia de costos, productividad y calidad?.
(1)

Finanzas: En el clculo del costeo de todas las operaciones, En qu momento se alcanza
el punto de equilibrio?
(1)

Ejercicio: Busque ejemplos de aplicaciones de la estadstica en el rea financiera y
administrativa.

La estadstica es la disciplina cientfica dedicada a la recoleccin, presentacin y anlisi s de
la informacin para la toma de decisiones. Al reunir informacin sobre ciertas
caractersticas de los elementos de un grupo de individuos u objetos es a menudo
inconveniente o imposible observar todo el grupo para lo cual se examina una pequea
parte llamada muestra. Si la muestra es representativa de la poblacin, su anlisis
permitir formular importantes conclusiones sobre la poblacin.

(1)
http://estadisticaparaadministracion.blogspot.com/2011/07/aplicaciones-de-la-estadistica-en-la.html

La estadstica bsica se divide en Estadstica Descriptiva y Estadstica inferencia.

Se llama estadstica descriptiva a aquella que se preocupa de describir y analizar un grupo
dado sin extraer conclusiones o inferencia sobre un grupo ms grande o poblacin.

La rama de la estadstica que se preocupa de las condiciones bajo las cuales tal inferencia
(deduccin) es vlida, se llama inferencia estadstica, como en tal conclusin no hay
seguridad absoluta se emplea el lenguaje de las probabilidades.


ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


5


Recordemos algunos trminos comunes utilizados:
Poblacin: conjunto de objetos los elementos (individuos, objetos, etc.) de inters para un
determinado problema. A los elementos que conforman la poblacin se les llama unidad
observable o unidad de observacin.

Muestra: cualquier subconjunto no vaco de la poblacin.

Se llama variable a una caracterstica que toma un valor para cada individuo u objeto de
una poblacin.

Las caractersticas numricas de la poblacin se denominan parmetros y las
caractersticas numricas de la muestra se llaman estadsticos o estadgrafos.

Dato u observacin: es el valor de la variable asociada a un elemento de la poblacin o
muestra, puede ser un nmero, palabra o smbolo.

Experimento: es el procedimiento cuyos resultados producen el conjunto de datos.

Ejercicio. Identifique la poblacin, la muestra, la variable, los datos, el experimento, el
parmetro, la estadstica, si es posible, en las aplicaciones que busco anteriormente o en
las dadas en el ejemplo.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


6
Para que utilizamos la estadstica en la empresa?
Los anlisis estadsticos son fundamentales a los efectos de gestionar y mejorar temas o
actividades tales como:

1. El control de calidad. 16. Gestin de inventarios.
2. El nivel de averas y sus frecuencias. 17. Cumplimiento de aprovisionamiento por parte
de los proveedores.
3. Los tiempos para cambios o preparacin de
herramientas.
18. Prediccin de ventas por canales de
comercializacin.
4. Los niveles de productividad de distintos
procesos, actividades y productos.
19. Proyectos de inversin.
5. Los costos correspondientes a distintos tipos de
conceptos y actividades.
20. Probabilidades para la construccin del rbol
para la Toma de Decisiones.
6. La gestin de crditos y cobranzas. 21. Evolucin de los distintos ratios econmicos
financieros y patrimoniales a lo largo del tiempo.
7. El seguimiento del flujo de fondos. 22. Estudios e investigacin de mercado.
8. Los niveles de satisfaccin de los clientes y
usuarios.
23. Tiempos de mquinas y personas por
actividad.
9. Los tipos de accidentes y sus frecuencias. 24. Cantidad y representacin porcentual de
mltiples problemas y sus efectos econmicos en
la empresa.
10. El anlisis mediante diagramas de Pareto de
defectos, costes, rentabilidades, ventas.
25. Tasa de polivalencia del personal.

11. Ventas por clientes, vendedores, zonas y
productos.
26. Productos ms demandados, a nivel global,
por zona y por canal de comercializacin.
12. Predicciones de ventas por zonas, productos,
servicios o sucursales.
27. Porcentajes de actividades generadoras de
valor agregado para los clientes finales, de valor
agregado para la empresa y carentes de valor
agregado.
13. Capacidad de los procesos en cuanto a
generacin de niveles de costes, calidad y
productividad.
28. Tiempos promedios, mximos y mnimos de
reparaciones por tipo de averas.
14. Tiempos totales de ciclos productivos. 29. Clculos de costes y en especial para el Costeo
Basado en Actividades.

15. Tiempos de respuestas. 32. Estadsticas de los personales (directivos y
empleados).
__________________________________________________________________________

(2)
Notas de Estadstica Aplicada a la Administracin, Contadura e Informtica Administrativa I. Semestre 2012-2. Dr. Francisco Javier
Tapia Moreno. Departamento de Matemticas. Universidad de Sonora.


1.2. Tipos de Variables

Dado un conjunto de datos de una variable, que denotaremos por X, las variables se
clasifican en cualitativas y cuantitativas.

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


7
Variables cualitativas (o atributos o categrica) son aquellas cuyos valores corresponden
a conceptos, atributos o cualidades, solo pueden clasificarse pero no medirse. Por
ejemplo: Al referirse a la cantidad fabricada de un cierto producto, puede ser que existan
tres fabricantes y se tienen que categorizar en el productor A, el productor B y el producto
C para poder mencionar su volumen anual de produccin. O bien, al referirse al sexo de
una persona, se tienen dos cualidades o categoras, femenino y masculino. Aqu podemos
diferenciar dos tipos de variables cualitativas:
- Nominales: (slo se etiquetan) slo permiten la clasificacin, no se puede
establecer entre ellas ningn tipo de orden, por ejemplo, color, lugar de
residencia, sexo, tamao, raza, estado civil.
- Ordinales: (se etiquetan y ordenan) toman distintos valores ordenados siguiendo
una escala establecida, por ejemplo, nivel socioeconmico, intensidad de consumo
de alcohol, das de la semana, meses del ao, grado acadmico. etc. Estas variables
regularmente estn sujetas a escalas de medicin tales como escalas de Likert,
Killip o Apgar.

Variables cuantitativas (o numricas) son aquellas cuyos valores corresponden a nmeros
reales. Por ejemplo altura, peso, nota, ingreso, nmero de hijos, nmero de parsitos en
un cm3 de sangre, contenido de glucosa en una solucin, etc. Aqu podemos diferenciar
dos tipos de variables cuantitativas:
- Discretas: (toman valores como 1, 2, 3,...) son aquellas variables que slo pueden
tomar cantidades contables (que se puedan contar) de valores distintos. Estos es,
las variables discretas slo puede tomar valores enteros y, entre un valor y otro
siempre existir un vaco o interrupcin. Ejemplos de este tipo de variables es, el
nmero de artculos fabricados en una empresa un da determinado, el nmero de
pedidos tomados en una pizzera de la localidad, el nmero de hijos en una familia,
el nmero de trabajadores en una empresa.
- Continuas son aquellas variables que tericamente pueden tomar cualquier valor
dentro de un intervalo de valores. Es decir, las variables continuas se miden
uniformemente y pueden tomar valores fraccionarios. Ejemplos de variables
continuas lo son la estatura, el tiempo realizado en la fabricacin de un artculo, la
distancia recorrida por un automvil en la entrega de un cierto producto, la
longitud de un trozo de madera

Adems de la clasificaciones se debe tener en cuenta la escala de medicin utilizada para
medir u observar las variables por existen diversos tipos de escalas que se utilizan para
clasificar ms detalladamente las variables, se dividen en 4 niveles (nominal, ordinal,
intervalo, razn).

- Escala Nominal: clasifica los datos en categoras mutuamente exclusivas. Es una
asignacin numrica a atributos sin que exista una relacin de orden o jerarqua
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


8
entre ellos. Ejemplo: estado civil, nacionalidad, sexo de las personas, material del
envase que ms le atrae al consumidor.
- Escala Ordinal: clasifica los datos en categoras que pueden ser jerarquizadas o
divididas en rangos, sin embargo no se puede determinar con precisin las
diferencias entre rangos. Existe la relacin mayor o menor que entre las categoras
de la variable. Ejemplos: el nivel socioeconmico, tamao del producto con mayor
consumo, niveles en los puestos de las empresas.
- Escala de Intervalo: en contraste con la ordinal tiene diferencias precisas entre
unidades de medida, sin embargo el cero es relativo, esto quiere decir que si en la
medida de la variable da cero no hay suficientes argumentos como para garantizar
la ausencia del mismo. Ejemplo: escala es la medicin de temperaturas con las
escalas Celsius y Fahrenheit.
- Escala de Razn: posee todas las caractersticas de la escala de intervalo y existe
un cero absoluto por lo tanto existen razones verdaderas entre diferentes
unidades de medida. Ejemplos para esta escala son: el peso, edad, velocidad, una
persona con un peso de 120 kg. tiene el doble de peso de una persona con un peso
de 60 kg.

Es importante saber distinguir entre datos cualitativos y cuantitativos porque se usan
mtodos estadsticos diferentes para ser analizarlos.

Ejercicio. Identifique las variables que investigara en uno de los ejemplos anteriores y el
tipo de escala a usar.

1.3. Matriz de datos y Tabulacin de datos.

Usualmente la informacin es presentada en una matriz de datos o planilla de datos Excel
donde cada fila representa las mediciones de un individuo u objeto en particular y cada
columna representa las variables que estn siendo estudiadas.

Por ejemplo, los datos correspondientes a una investigacin llevada a cabo para el estudio
de los trabajadores de una empresa B&C, produjeron como resultado la matriz de datos
de la Tabla 1, en donde se recopilaron las observaciones de las variables "edad", "sexo",
"estatura", "peso", antigedad, escolaridad y "estado civil" en los 100 individuos
seleccionados en la muestra.

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


9

Tabla 1

La informacin entregada en la matriz de datos de la tabla 1 es necesario organizarla
mediante la tabulacin de datos cuyo objetivo es ordenan y clasificar los datos en cuadros
numricos o tablas que implican la agrupacin de las observaciones en categoras o clases,
mutuamente excluyentes de acuerdo a caractersticas o atributos previamente definidos.
De esta manera la tabulacin de datos permite observar la distribucin de frecuencias de
ocurrencia de cada categora o clase.

Tener en cuenta que la tabulacin de datos y la descripcin grfica posterior depende
del tipo de variable de estudio.

Ejercicio: Identifique que matrices de informacin maneja diariamente y qu tipo de
tabulaciones realiza con esta informacin.
1.4. Distribucin de frecuencias y representaciones grficas.

La informacin estadstica puede constar de un gran nmero de datos u observaciones, y
mientras mayor sea su nmero, mayor es la conveniencia y necesidad de presentarla en
forma resumida, con lo cual se pierde algunos detalles, pero en cambio se aprecia mejor la
naturaleza general de la informacin. Para tal efecto, primero se deben definir categoras
o clases identificando cada dato en alguna de estas categoras. El procedimiento anterior
da origen a una agrupacin de los datos que denomina distribucin de frecuencias. Una
categora o clase es una particin o subdivisin de todos los valores posibles que tome la
variable.

La distribucin de frecuencias se resume en una tabla de frecuencias que tiene la siguiente
estructura segn si la variable es cualitativa o cuantitativa:

Para Variables cualitativas Nominales
Categora o
Clase
Concepto o
atributo
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
relativa
porcentual
1 c
1
n
1
f
1
f
1
%
2 c
2
n
2
f
2
f
2
%
: : : : :
k c
k
n
k
f
k
f
k
%
Tabla 2: Tabla de frecuencias para datos cualitativos
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


10
Notacin:
- c
i
: concepto o atributo de la i-sima clase
- n
i :
nmero de elementos de la i-sima clase se cumple que el total de elementos
en la muestra es n=

=
k
1 i
i
n .
-
n
n
f
i
i
= , se tiene que

=
=
k
1 i
i
. 1 f
- f
i
%=100 f
i
, se tiene que

=
=
k
1 i
i
. 100 % f

Ejemplo 1. Los siguientes datos corresponden al sexo de cuarenta nios que asistieron a
un centro de salud con problemas respiratorios durante el fin se semana pasado.

F M M M F F F M F F F M F M M M F M M F
F F M F F F F M F M F F M M M F F M M M

SEXO
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia
Relativa
Porcentual
Femenino 21 0,525 52,5%
Masculino 19 0,475 47,5%
Total 40

Esta tabla corresponde a una distribucin de frecuencias de atributos y puede
representarse mediante un grfico de barras, el cual corresponde al tipo ms simple de
representacin grfica y es usado en variables cualitativas o en variables discretas. Las
clases se representan en el eje horizontal y las frecuencias ene el eje vertical. En este tipo
de grficos la longitud de cada barra es proporcional a la frecuencia del atributo que
representa. Las barras deben ser del mismo ancho y especificadas en forma uniforme.
Otro tipo de grfico que se utiliza cuando se desea representar la distribucin de
frecuencias de un conjunto de datos muestrales es el grfico circular o de torta (pie-
chart). Los siguientes grficos fueron obtenidos con Excel.


Grfico 1 : Grfico de Barras y Grfico Circular ejemplo1

Esta misma idea se aplica para representar datos cuantitativos discretos cuando el
nmero de valores posibles es pequeo.

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


11
Para variables cualitativas Ordinales
Tabla 3: Tabla de frecuencias para datos cualitativos ordinales o cuantitativos agrupados en clases individuales.
Notacin:

=
=
j
1 i
i j
n N

=
=
j
1 i
i j
f F .

Ejemplo 2: Los siguientes datos corresponden a la calidad de la atencin recibida por los
nios segn las madres.

B B B B B B B B B B B B B B B B B B B B
B B B B B M M M M M MB MB MB MB MB MM MM R R R

Atencin
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia
Relativa
Porcentual
Frecuencia
Absoluta
Acumulada
Frecuencia
Relativa
Acumulada
Frecuencia
Absoluta
Acumulada
Porcentual
Muy Mala 2 0,05 5,0% 2 0,05 5,0%
Mala 5 0,125 12,5% 7 0,175 17,5%
Regular 3 0,075 7,5% 10 0,25 25,0%
Buena 25 0,625 62,5% 35 0,875 87,5%
Muy Buena 5 0,125 12,5% 40 1 100,0%
Total 40

Es posible realizar una ordenacin jerarquizada de los valores de la variable y conocer la
frecuencia acumulada o porcentual para alguna clase en particular. La grfica siguiente
muestra el porcentaje de respuestas segn la calidad atencin recibida por los nios de
sus madres.

Grfico 2: Grfico de Barras y Grfico Circular ejemplo2

Para variables cuantitativas y discretas

Categora o
Clase
Concepto
o atributo
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
relativa
porcentual
Frecuencia
absoluta
acumulada
Frecuencia
relativa
acumulada
Frecuencia
relativa
acumulada
porcentual
1 c
1
n
1
f
1
f
1
% N
1
F
1
F
1
%
2 c
2
n
2
f
2
f
2
% N
2
F
2
F
2
%
: : : : : : : :
k c
k
n
k
f
k
f
k
% N
k
F
k
F
k
%
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


12
Cuando el tamao de la muestra y el recorrido de una variable discreta sea grande, o
cuando sta sea continua, conviene agrupar en intervalos de clase o grupos.

Categora o
Clase
Intervalo de
Clase
Frecuencia
absoluta
Marca de
clase
Frecuencia
relativa
Frecuencia
relativa
porcentual
Frecuencia
absoluta
acumulada
Frecuencia
relativa
acumulada
Frecuencia
relativa
acumulada
porcentual
1 ]L
0
,L
1
]
n
1

m1
f
1
f
1
% N
1
F
1
F
1
%
2 ]L
1
,L
2
]
n
2

m2
f
2
f
2
% N
2
F
2
F
2
%
: :
:
:
: : : : :
k ]L
-k1
,L
k
]
n
k

mk
f
k
f
k
% N
k
F
k
F
k
%
Tabla 4: Tabla de frecuencias para datos cuantitativos continuos (o discretos cuando el nmero de valores posibles es grande).

Notacin:
- L
i-1
: es el lmite inferior del i-simo intervalo de clase.
- L
i
: es el lmite superior del i-simo intervalo de clase.
- m
i
: es la marca de clase del i-simo intervalo de clase y corresponde al punto
medio del intervalo de clase.

Recordar que el nmero de intervalo y la longitud del intervalo se realiza mediante la
regla de Sturgers y para generar los intervalos de clase debe calcular el rango y la longitud
del intervalo. Excel y otros programas estadsticos realizan esta operacin fcilmente
entregando la distribucin de frecuencias

Ejemplo: Los siguientes datos representan el nmero de alumnos que asistieron a las 40
sesiones de clculo el semestre anterior. Estos datos han sido ordenados de menor a
mayor:


Procedimiento para obtener tabla de frecuencia
Paso 1. Se determina el rango o recorrido de la variable. Rango=X
max
- X
min

Rango = 94 - 31
Paso 2. Se decide el nmero k de clases a considerar. Una regla frecuentemente usada es
tomar: k = 1 + 3.3 log(n) Regla de Sturges
El nmero k = 1+3.3 log(40) = 6.28 ~ 7 (Otra forma k ~ n )
Paso 3. Se obtiene la amplitud o tamao del intervalo, dividiendo por el nmero de
intervalos:
k
Rango
A =
, se aproxima aumentando y manteniendo el mismo nmero de
decimales que los datos. A = 31/7 ~ 5
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


13
Paso 4. Se seleccionan los lmites de clase que definen los intervalos, de manera que las
clases sean de la misma longitud y cada observacin se clasifique sin ambigedad en una
sola clase.
Paso 5. Se cuenta el nmero de observaciones en cada clase, es decir se determina las
frecuencias de cada clase.

Clase Intervalos de clase Marca de
Clase
Frecuencia
de la clase
Frecuencia
relativa
Frecuencia
absoluta
acumulada
Frecuencia
relativa
acumulada
1 ]62.5, 67.5] 65 3 0.075 3 0.075
2 ]67.5, 72.5] 70 6 0.150 9 0.225
3 ]72.5, 77.5] 75 11 0.275 20 0.5
4 ]77.5, 82.5] 80 7 0.175 27 0.675
5 ]82.5, 87.5] 85 9 0.225 36 0.9
6 ]87.5, 92.5] 90 3 0.075 39 0.975
7 ]92.5, 97.5] 95 1 0.025 40 1
Tabla 5: Tabla de frecuencias ejemplo 3

La representacin grfica ms frecuente para datos agrupados es el histograma, el cual
corresponde a un conjunto de rectngulos cada uno de los cuales representa un intervalo
de clase. Sus bases son iguales a la amplitud del intervalo y las alturas se determinan de
manera que su rea sea proporcional a la frecuencia de cada clase.

Un til agregado al histograma es el polgono de frecuencias,
que se construye uniendo las marcas de clase de los intervalos
adyacentes. El polgono de frecuencias se utiliza para observar el
comportamiento ms suave de una distribucin de frecuencias
para posteriormente decidir cul es el mejor modelo
probabilstico posible de ajustar a la muestra.

Grfico 3: histograma ejemplo 3

Una propiedad importante que cumple el polgono de frecuencias es que el rea limitada
por el polgono y el eje de las abscisas es igual a la suma de los rectngulos que forman el
histograma. Un tercer tipo de grfico es la ojiva que se obtiene graficando la frontera
superior de cada intervalo versus la frecuencia acumulada. Este grfico permite visualizar
rpidamente las frecuencias acumuladas hasta un valor determinado de la variable.

La ojiva permite determinar los percentiles 25, 50 y 75, tambin denominados cuartiles
Q
1
, Q
2
y Q
3
respectivamente. Adems permite estimar el nmero de observaciones entre
dos valores dados.

El percentil 50 o cuartil dos, Q
2
recibe el nombre de mediana y divide a la distribucin de
frecuencias en partes iguales.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


14












Grfico 4: histograma y polgono sobrepuesto - Frecuencia Acumulada y Ojiva sobrepuesta

Ejercicio: Ingrese la informacin anterior en una planilla Excel y realice las tablas y
grficos anteriores.

1.5. Medidas de Resumen

Llamadas medidas estadsticas o estadgrafos describen y cuantifican en forma resumida
las caractersticas de la distribucin de frecuencias de un conjunto de datos de una
poblacin o muestra.
Las medidas de uso ms frecuente son:
medidas de tendencia central
medidas de dispersin
medidas de sesgo o asimetra
medidas de apuntamiento o achatamiento (agudeza)

Medidas de Tendencia Central: Determina un valor caracterstico de una distribucin de
frecuencias ubicado hacia el centro de la distribucin estas medidas son media aritmtica,
a la mediana o a la moda. Cada una de estas medidas es apropiada para ciertos propsitos
descriptivos, pero resulta completamente inadecuada para otros.
- Media aritmtica o media o promedio, es el promedio comn. Se obtiene
dividiendo la suma de todas las observaciones por el nmero de ellos.

Para datos individuales:

=
=
+ + +
=
n
1 i
i
n 2 1
x
n
1
n
x ... x x
x

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


15
Para datos agrupados en k agrupaciones o intervalos de clase:
n
m n
x
k
1 i
i i
=
=
Notacin:
i
n : frecuencia absoluta clase i -
i
m : Marca de clase i. n tamao de la muestra.

Nota: Utilizamos la marca de clase el valor aproximado de la media (cuando n es grande la aproximacin es
bastante buena).

Si el polgono de frecuencias presenta la forma de una campana simtrica entonces el
valor de x est justo en el centro de la distribucin de frecuencias y se dice que este
valor es el ms representativo de la distribucin por estar equidistante de los extremos.

- Mediana: denotada por Me, corresponde al valor central del conjunto de datos
ordenados en forma ascendente o descendente (cuartil dos, Q
2
, o percentil 50,
P
50
).

Para datos individuales: Sea x
1
, x
2
, ..., x
n
el conjunto de observaciones, entonces x
(1)
, x
(2)
,
..., x
(n)
denota al conjunto de datos ordenados en forma ascendente.
a) Si n es impar se tiene que
|
.
|

\
| +
=
2
1 n
x Me

b) Si n es par se tiene que
2
x x
Me
1
2
n
2
n
|
.
|

\
|
+ |
.
|

\
|
+
=

Para datos agrupados en clases individuales, se identifica la mediana como aquella clase
donde la frecuencia acumulada es inmediatamente mayor que (n+1)/2.

Para datos agrupados en intervalos de clase, primero se identifica el intervalo que
contiene a la mediana ]L
i-1
, L
i
], el cual corresponde al que tiene la frecuencia absoluta
acumulada que supera inmediatamente el valor (n+1)/2, entonces:

| |

|
= +
|
|
\ .
1
1
2
i
i i
i
n
N
Me L A
n

Notacin
L
i-1
: lmite inferior del intervalo que contiene a la mediana en el cual N
i
>
2
n
.
n : tamao muestral o cantidad de datos.
N
i-1
: frecuencia absoluta acumulada del intervalo anterior al intervalo que contiene a la
mediana.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


16
n
i
: frecuencia absoluta del intervalo mediano.
A
i
: amplitud del intervalo "mediano".

- Moda: se define como el valor que aparece con mayor frecuencia (pudiendo no
existir). Esta medida es ms representativa que las anteriores cuando la
distribucin de frecuencias presenta una forma inestable o sinusoidal (indicando
presencia de estratos).

Para datos agrupados en clases individuales:la moda es el valor con ms alta frecuencia.

Para datos agrupados en intervalos de clase. primero se identifica el intervalo que tiene
la mayor frecuencia absoluta, ]L
i-1
, L
i
], y se determina la moda de la siguiente forma:
i
1 i 1 i
1 i
1 i
A
n n
n
L Mo
+
+

+
+ =
Notacin
L
i-1
: lmite inferior del intervalo que contiene a la moda
n
i+1
: frecuencia absoluta acumulada del intervalo posterior al intervalo que contiene a la
moda.
n
i-1
: frecuencia absoluta acumulada del intervalo anterior al intervalo que contiene a la
moda
n
i
: frecuencia absoluta del intervalo mediano.
A
i
: amplitud del intervalo "moda".

Ejercicio. Obtenga la medidas de tendencia central para los datos del ejemplo 3 usando los
datos sin agrupar y los datos agrupados en la tabla.

Medidas de Dispersin: Cuantifican la concentracin de los datos en torno a un valor
central
- El rango o recorrido: diferencia entre la observacin de mayor valor y la de menor
valor.
- La varianza corresponde al promedio de las desviaciones al cuadrado de los datos
con respecto a la media aritmtica, se denota por V(X) o
2
X
o .
Para datos poblacionales individuales:
2 2 2
2 1 1
( )
n n
i i
i i
x n x
n n

o
= =
| |

|
\ .
= =

.

Para datos muestrales individuales:
2
2 2
1 2 1
( )
1 1
n n
i i
i i
x nx x x
s
n n
= =
| |

|
\ .
= =


.

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


17

Para datos muestrales agrupados en agrupaciones o intervalos de clase:
=
=
| |

|
\ .
= =

2
2
2
1 2
1
( )
1 1
k
k
i i
i i
i
i
n m nx
m x n
s
n n
.


- Desviacin estndar corresponde a la raz cuadrada positiva de la varianza y tiene
la ventaja de que est en la misma unidad de medida de los datos.
Para datos poblacionales individuales:
2
o o = .

Para datos muestrales individuales:
2
s s = .

- Coeficiente de Variacin.
Para comparar el grado de dispersin entre dos o ms distribuciones expresadas en
distintas unidades de medida, no podemos comparar simplemente las varianzas y las
desviaciones estndar respectivas o las medias. En este caso se define un nuevo
estadgrafo de dispersin llamado coeficiente de variacin que est dado por:
% 100
x
s
CV
X
X
=
Nota: Solo para valores positivos, asegurarse que la media es positiva.
Ejercicio. Obtenga la medidas de tendencia dispersin para los datos del ejemplo 3 usando
los datos sin agrupar y los datos agrupados en la tabla.

Medidas de Posicin: Dividen a la distribucin en un cierto nmero de partes de manera
que en cada una de ellas hay la misma frecuencia.
- Cuartiles. Particionan a una distribucin de frecuencias en cuatro partes mediante
los puntos Q
1
, Q
2
, Q
3
, llamados primer, segundo y tercer cuartil. Se denomina
recorrido intercuartlico a Q = Q
3
- Q
1
(medida robusta de la dispersin de los
datos).

- Deciles. Particionan a una distribucin de frecuencias en diez partes mediante los
puntos D
1
, D
2
, ..., D
9
, llamados primer, segundo, ..., noveno decil. Se denomina
recorrido interdeclico a D = D
9
- D
1
.

- Percentiles. Particionan a una distribucin de frecuencias en cien partes mediante
los puntos P
1
, P
2
, ..., P
99
, llamados primer, segundo , ..., 99
avo
percentil.

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


18
Para datos agrupados en intervalos de clase:

( | |

| (
\ .
( = +
(
(

1
1
100
i
r i i
i
nr
N
P L A
n


Ejercicio. Obtenga apartir de la tabla 3 los
cuartiles Q
1
=25%, Q
2
=50%, Q
2
=75%







Grfico 5: Grfico de caja permite visualizar los cuartiles y la media y mediana.


Grfico 6: Resumen de las medidas anteriores

Medidas de sesgo o asimetra: Indica el grado de simetra de una distribucin de
frecuencias con respecto a de una distribucin simtrica unimodal.

a) Si la distribucin de frecuencias es simtrica, entonces:
Mo Me x = = .

b) Si la distribucin de frecuencias presenta asimetra positiva, entonces
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


19
Mo Me x > >
c) Si la distribucin de frecuencias presenta asimetra negativa, entonces
Mo Me x < <
Medidas de apuntamiento: Mide el grado de apuntamiento de una distribucin de
frecuencias con respecto a de una distribucin simtrica unimodal de forma acampanada.


Ejercicio: Investigue en la internet la importancia y uso de las medida de asimetra y
apuntamiento en la administracin de empresas. (Consultar: Modelos de valoracin de
activos financieros con riesgo asimtrico)

2. Variables Aleatorias

Para poder emplear la teora de probabilidades para sacar conclusiones precisas acerca de
la poblacin, en base de una muestra extrada de esa poblacin primero debemos dirigir
nuestra atencin hacia las variables aleatorias que constituyen un eslabn entre la teora
de las probabilidades y la inferencia estadstica.
2.1. Concepto

Una variable aleatoria es una variable cuyo valor es el resultado de un evento aleatorio.
Ejemplo 1: Si se lanza una moneda tres veces y se anota el nmero de caras que se
obtienen. Los posibles resultados son: 0 caras, 1 cara, 2 caras 0 3 caras. As la variable
aleatoria es el nmero de caras y los posibles resultados son los valores de la variable
aleatoria.
Dado un experimento Dado un experimento aleatorio c, O el espacio muestral asociado
a c. Una funcin X que asigna a cada elemento e en O uno y solamente un nmero real
x = X(e), se llama variable aleatoria. Es decir, X es una funcin real, X: OIR
El dominio de la variable aleatoria X es O y el rango es un subconjunto de IR que lo
denotaremos por R
X
. El rango R
X
de la variable aleatoria X est dado por el siguiente
conjunto de nmeros reales.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


20

Consideremos el experimento aleatorio anterior. El espacio muestral est dado por:
} { sss css scs ssc scc ccs ccc , , , , csc, , , = O .
Suponga que ahora solo nos interesa el nmero de caras que sale, es decir nuestra
variable de inters es X(w): Nmero de caras que aparecen en los tres lanzamientos.
As vamos a tener que
X(ccc)=3 X(ccs) = X(csc) = X(scc) =2 X(css) = X(scs) = X(ssc) =1 X(sss)=0








Evaluamos las probabilidades de los posibles resultados de la variable aleatoria al realizar
el experimento.
} {
} {
} {
} {
8
1
( ) 0 (
8
3
csc , , ( ) 1 (
8
3
csc, , ( ) 2 (
8
1
( ) 3 (
= = =
= = =
= = =
= = =
sss P X P
ssc s cs P X P
scc s cc P X P
c cc P X P

Las variables aleatorias pueden ser discretas o continuas.
2.2. Variables aleatorias discretas

Se llama variable aleatoria discreta si el recorrido o rango de la variable aleatoria X, es un
conjunto finito o infinito numerable.
Ejemplo 2.- La variable del ejemplo 1 es una variable aleatoria discreta, porque su
recorrido es un conjunto finito, en efecto es: R
X
= {0, 1, 2, 3}.
- Propiedades de una variable aleatoria discreta
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


21
Sea X una variable aleatoria discreta con recorrido R
X
. Se llama funcin de probabilidad,
distribucin de probabilidad (tambin se llama funcin de cuanta) de la variable aleatoria
X.
La funcin definida por:
) ( ) ( x X P x p = = , que satisface las siguientes condiciones:
1 ) ( ) ; , 0 ) ( ) = e >
e
X
R x
X
x p b R x x p a

El conjunto de pares (x, p(x)), xe R
X
se llama distribucin de probabilidad de X, que se
puede representar en forma de tabla o como una expresin matemtica.
As la distribucin de probabilidad es una lista de todos los resultados posibles de algn
experimento y de la probabilidad relacionada con cada resultado.
Ejemplo 3.- Del ejemplo 1. Hallar la distribucin de probabilidad y grfico de la
distribucin de probabilidad de la variable aleatoria X: numero de caras en los tres
lanzamientos.
Solucin:
x 0 1 2 3
p(x) = P(X=x) 1/8 3/8 3/8 1/8

El grfico de la funcin de probabilidad es:



Un gran nmero de decisiones
empresariales depende de la distribucin
de probabilidad

Ejercicio: Aplique los conceptos anteriores
para resolver el siguiente caso:

Para recolectar los datos de un proyecto de investigacin, un estudiante de mercadeo en
una universidad pequea en el centro de estados unidos cont 50 cursos de negocios el
nmero de estudiantes que haban comprado recientemente discos compactos. En 12
clases no encontr estudiantes que hubieran hecho dicha compra, 3 estudiantes haban
comprado en 8 clases, 4 haban comprado en 9 clases, 5 en 15 clases y 7 estudiantes, de
las seis clases restantes haban aumentado sus colecciones de msica. El estudiante
deseaba comenzar su investigacin resumiendo sus datos. Cmo podra usted ayudarle?
0
1/8
1/4
3/8
0 1 2 3 4
P
r
o
b
a
b
i
l
i
d
a
d

d
e

X
Recorrido de X
Funcin de probablidad nmero
de caras en 3 lanzamiento de
una moneda
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


22

- Funcin de distribucin acumulada
La funcin de distribucin acumulativa de la variable aleatoria X es la probabilidad de que
X sea menor o igual a un valor especfico de x y est dada por:
( ) ( ) ( )
i
i
x x
F x p X x p x
<
= s =

Ejemplo: Hallemos la funcin de distribucin acumulada de la v.a X, cuya informacin de
probabilidad es:

Solucin:















En general, la funcin de distribucin acumulativa F(x) de una variable aleatoria discreta
es una funcin no decreciente de los valores de X, de tal manera que
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


23
) 0 ( ) 1,
) ( ) ( ),
) ( ) 1 ( )
) ( ) ( ) ( 1)
) ( ) ( ) ( 1)
i j i j
i j j i
a F x x
b F x F x si x x
c P X x F x
d P X x F x F x
e P x X x F x F x
s s
> >
> =
= =
s s = >

Ejemplo 4.- La tabla siguiente muestra la variable aleatoria X, el nmero de personas por
da que solicitan un tratamiento innecesario en el servicio de urgencia de un pequeo
hospital.
x 0 1 2 3 4 5
p(x) 0.01 0.1 0.3 0.4 0.1 ?

a) Encontrar p(5). Es decir, la probabilidad que el nmero de personas que solicitan
tratamiento innecesario en el servicio de urgencia sea de 5 personas.
b) Determinar la probabilidad que a lo ms dos personas pidan tratamientos
innecesarios en un da en el servicio de urgencia.
c) Determinar la probabilidad que por lo menos dos personas pidan tratamientos
innecesarios en un da en el servicio de urgencia.
d) Determinar la probabilidad que menos de dos personas pidan tratamientos
innecesarios en un da en el servicio de urgencia.
e) Determinar la probabilidad que entre dos y cuatro personas pidan tratamientos
innecesarios en un da en el servicio de urgencia.

Soluciones:
a) p(5)=0.09, esto es ,ya que para los valores de la variable aleatoria la suma de todas
las probabilidades es 1.
b) P(Xs2)=P(X=0)+ P(X=1)+ P(X=2)=0.01+0.1+0.3=0.41
c) P(X>2)= 1-P(X<2)= 1- P(X=0)- P(X=1)= 1-0.01-0.1= 0.89
d) P(X<2)= P(X=0)+ P(X=1)= 0.01+0.1= 0.11
e) P(2sXs4) = P(X=2)+ P(X=3)+ P(X=4) = 0.3+0.4+0.1= 0.8

Ejercicio: Sea X una variable aleatoria discreta cuya funcin de probabilidad es:

1) Complete el valor que falta para que sea una distribucin de
probabilidad.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


24
2) Calcular y representar grficamente la funcin de distribucin acumulada.
3) Calcular las siguientes probabilidades:
- Esperanza y varianza de una variable aleatoria
discreta
La funcin de probabilidad describe totalmente el comportamiento de la
variable aleatoria en el sentido de una poblacin ideal. Al considerar una
visin general de la poblacin podemos definir constantes o parmetros asociados a
cualquier variable aleatoria. Conocer estos valores numricos permite al investigador una
visin mucho ms amplia sobre la naturaleza de las variables. Los parmetros ms
conocidos son: la media o esperanza o valor esperado o promedio aritmtico, la
varianza o
2
y la desviacin estndaro.
El valor esperado de una variable aleatoria discreta con funcin de probabilidad
p(x) se denota y define por:

e
= =
X
R x
i i
x p x X E ) ( ) (

Nota: Si H(X) es una funcin de la variable aleatoria X, entonces su esperanza est dada
por:

En particular si H(X) = X
2
se tiene que:

e
= =
X
R x
i i
x p x X E ) ( ) (
2 2


La varianza de la poblacin. Se define como:
| |
2 2 2 2
) ( ) ( )) ( ( ) ( ) ( X E X E X E X E X V X Var = = = = o

La desviacin estndar de la poblacin, se define como la raz de la varianza, es
decir,
) (X V = o

Propiedades de la esperanza y la varianza: Sea x una variable aleatoria discreta
1) E(aX+b)=a E(x)+b, a y b constantes
2) Var(ax+b)= a
2
Var(x) ,

Ejemplo: Sea la v.a. X: nmero de paquetes de programas contratado por un cliente
seleccionado al azar y consideremos su funcin de probabilidad
) ( 5)
) ( 3)
) (2 5)
) (4)
a p x
b P X
c P x
d F
<
>
s s
( ( )) ( ) ( )
X
i i
x R
E H X H x p x
e
= =

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


25

x 1 2 3 4 5
P(X=x) 0,375 0,275 0,175 0,100 0,075

Suponga que el costo del servicio (Y) es una funcin nmero de paquetes contratado
segn la frmula Y=30(X+1).
Cul es el nmero esperado de paquetes de programas contrados? Cul es el valor
esperado del costo pagado por el cliente?, Cul es la varianza del nmero esperado de
paquetes?, Cul es varianza del costo pagado por el cliente?
Solucin:
a) Cul es el nmero esperado de paquetes de programas contrados?
( ) ( )
( ) (1*0, 375 2*0, 275 3*0,175 4*0,1 5*0, 075)
( ) 2, 225
X
i i
x R
E X x p x
E X
E X
e
=
= + + + +
=


b) Cul es el valor esperado del costo pagado por el cliente?
( ) ( ) (30 X 1 )
( ) (30 30) 30* ( ) 30
( ) 30*2, 225 30
( ) 97, 5
E Y E
E Y E X E X
E Y
E Y
= +
= + = +
= +
=

c) Cul es la varianza del nmero esperado de paquetes?
| |
| |
( )
2
2
2 2 2 2 2 2
2
2
2
2
( ) ( ) ( )
( ) (1 *0, 375 2 *0, 275 3 *0,175 4 *0,1 5 *0, 075)
( ) 6, 525
( ) ( ) ( )
( ) 6, 525 2, 225
( ) 1, 574
V X E X E X
E X
E X
V X E X E X
V X
V X
=
= + + + +
=
=
=
=

d) Cul es varianza del costo pagado por el cliente?
( ) (30 30)
( ) 30* ( )
( ) 30*1, 574
( ) 47, 22
V Y V X
V Y V x
V Y
V Y
= +
=
=
=

Ejercicio: Un distribuidor de aparatos electrodomsticos vende tres modelos diferentes de
congeladores verticales con capacidad de 13.5, 15.9 y 19.1 pies cbicos de espacio de
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


26
almacenaje, respectivamente. Sea X= cantidad de espacio de almacenaje que compra el
siguiente cliente. Suponga que X tiene la siguiente funcin de probabilidad.
X 13.5 15.9 19.1
P(x) 0.2 0.5 0.3

a. Calcule E(X), E(X
2
) y V(X)
b. Si el precio de un congelador con capacidad de X pies cbicos es 25X-8.5, Cul es
el precio esperado que paga el siguiente cliente por un congelador?
c. Cul es la varianza del precio 25X-8.5 que paga el siguiente cliente?
d. Suponga que si bien la capacidad nominal de un congelador es X, la capacidad real
es h(X)=X-0.01X
2
Cul es la capacidad real esperada del congelador que compra el
siguiente cliente?
2.3. Variable Aleatoria Continua

Una variable aleatoria es continua si puede tomar cualquier valor en algn intervalo (o
intervalos) del conjunto de los nmeros reales. Las variables aleatorias continuas pueden
tomar infinitos valores, resulta imposible enumerarlos todos. Luego necesitamos
determinar una expresin que nos permita calcular las probabilidades. As para este caso,
nos interesa hallar la probabilidad de la variable aleatoria X que est comprendida en un
intervalo concreto o entre determinados valores.

El clculo de las probabilidades para una variable aleatoria continua se realiza calculando
el rea bajo la curva con el uso de integrales, donde la curva se denomina funcin de
densidad.

- Funcin de densidad. Sea X una variable aleatoria continua. La funcin de
densidad de X es una funcin definidas para todos los nmeros reales tal:
1. ) ( 0 ) ( negativa no es x f >
2. El rea comprendida entre la grfica de f y el eje de las x es igual a 1.
3. Para cualquier valor real de los nmeros a y b, ) ( b X a P s s viene
representada por el rea comprendida entre la grfica de f y las rectas x = a y x =
b, y el eje x.






Nota: En el caso continua la probabilidad punto es cero, esto es, P(X=x)=0

( ) ( )
b
a
P a X b f x dx s s =
}
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


27
- Funcin de distribucin: Como en el caso de la v.a. discreta, la funcin de
distribucin proporciona la probabilidad acumulada hasta un determinado valor
de la variable, es decir, cumple las siguientes condiciones:







Nota:
a) Su valor es cero para todos los puntos situados a la izquierda del menor valor de la variable.
b) b) Su valor es 1 para todos los puntos situados a la derecha del mayor valor de la variable.

Ejemplo: Sea X el tiempo de supervivencia en aos despus de un diagnstico de
leucemia. La grfica siguiente muestra la funcin de densidad de X

a) Determine la probabilidad que el paciente sobreviva menos de 6 meses.
b) Cul es la probabilidad que el paciente sobreviva exactamente 6 meses?
c) Cul es la probabilidad que el paciente sobreviva entre un y un y medio ao?


Solucin:
a) P(X<0.5)=
}

5 . 0
0
) 5 . 0 1 ( dx x = (x-0.25x
2
)/
5 . 0
0
=0.5-0.25*0.25=0.43
b) P(X=0.5)=0

c) P(1<X<1.5)= P(X<1.5)- P(X<1)=F(1.5)-F(1) ==0,1875,
P(1<X<1.5)=
1.5
1
(1 0.5 ) x dx
}
= (x-0.25x
2
)/
1.5
1
=0,1875

( ) ( ) F x P X x = s
=

< < =
=
) ( ) 0
) ( )
) ( ) ( ) ( )
( )
) ( )
a F
b F
c P a X b F b F a
dF x
d f x
dx
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


28
Ejercicio: Si se sabe que el ingreso por ventas en una industria manufacturera, en miles de
dlares, est dada por la funcin de densidad
2
; 0<x<2
( ) 6
0 en otro caso
x
f x
+

.
Responda:
a) Cul es la probabilidad que supere los US$1200?
b) Cul es la probabilidad que sea menor a US$800?
c) Cul es la probabilidad se encuentre entre US$800 y US$1200?





2.4. Gua de estudios variable aleatoria

1) Sea X una v.a. discreta cuya funcin puntual de probabilidad es


1, 2, ,
( )
0 resto
k x x n
p x
=
=



a) Hallar el valor de k
b) Calcular la probabilidad de que X tome un valor par

2) Un examen tipo test consta de cinco preguntas con tres alternativas cada una. Un
alumno contesta al azar las cinco preguntas. Suponiendo que cada respuesta
acertada vale dos puntos, hallar la distribucin del nmero de puntos obtenidos
por el alumno.

3) Resolver el ejercicio anterior suponiendo que al alumno se le reste un punto por
cada respuesta errnea.

4) Sea X la variable aleatoria que designa el nmero de autos vendidos cada semana
por un concesionario. Se sabe que X tiene la siguiente funcin de probabilidad:

X 0 1 2 3 4 5 6 7 8 o ms
p(x) 0.04 0.04 k 0.11 0.3 0.23 0.1 0.05 0.03

a) Hallar el valor de k
b) Determine la funcin de distribucin de X
c) Calcular (2 5), ( 7) y ( 6| 3) P X P X P X X < s > s >

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


29
5) Sea X una variable aleatoria continua con funcin de distribucin

0 0
2 1
0
3 2
( )
1 1
(2 1) 1
3 2
1 1
x
x x
F x
x x
x
<

s <

+ s <

>



a) Comprobar que F es, realmente, una funcin de distribucin
b) Determinar la funcin de densidad de probabilidad de X

6) Si la ganancia de un contratista en un trabajo de construccin se puede considerar
como una variable aleatoria continua con funcin de densidad:


1
( 1) 1 5
( ) 18
0 resto
x x
f x

+ < <



Donde las unidades estn en millones de pesos.

a) Calcular la probabilidad que el contratista gane por lo menos 2000000

7) Los obreros de una empresa se acogen a tres categoras salriales: un tercio de
ellos cobra $150000 al mes, otro tercio $250000 al mes, y el resto $300000 al mes.
Por otro lado, los directivos de la empresa tambin se agrupan en tres categoras
de igual tamao, con salarios de $270000 al mes, $300000 al mes y 530000 al
mes.

a) Calcular el salario medio de cada grupo (obreros / directivos)
b) Qu grupo es ms homogneo en lo que respecta al salario?

8) Sea X una variable discreta que toma los valores 0, 1, 2 y 3 con probabilidades
1/125, 12/125, 48/125 y 64/125.

a) Encontrar E(X) y E(X
2
).
b) Utilizar los resultados de a) para obtener ( )
2
3 2 E X
(
+





ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


30
3. Distribucin normal

3.1. Caractersticas de la Distribucin Normal

Esta es la distribucin ms importante de la estadstica tambin llamada gaussiana la
mayora de los mtodos estadsticos bsicos que estudiaremos se apoyan en la
distribucin normal.

Una variable aleatoria continua, tiene distribucin normal, (X ~ N (,
2
) ) si su funcin de
densidad de probabilidades es :

0 , ,
2
1
exp
2
1
) (
2
2
> < < < <

|
.
|

\
|

= o
o

to
x
x
x f


El grfico de esta funcin de probabilidad tiene forma de campana, es simtrica con
respecto a la media , Notacin. Los parmetros , o
2
corresponden a la media
aritmtica y a la varianza de la distribucin normal.



El rea bajo la curva normal es igual a 1 lo que permite usarla para el clculo de
probabilidades.

El rea sombreada sobre la curva
normal entre dos valores representa la
probabilidad de encontrarse en esta
zona.

Esta probabilidad se obtiene integrando la funcin de densidad f(x) entre los dos valores.



Regla de la probabilidad normal
( ) ( )
b
a
P a X b f x dx < < =
}
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


31
Sea X una variable aleatoria normal con media y varianza o
2
, entonces,
a) La probabilidad de que X tome un valor a una distancia mxima de su media de
una desviacin estndar es 0,68. (P ( - o < X < + o) =0,68).
b) La probabilidad de que X tome un valor a una distancia mxima de su media de dos
desviaciones estndar es 0,95. (P ( - 2o < X < + 2o) =0,95).
c) La probabilidad de que X tome un valor a una distancia mxima de su media de
tres desviaciones estndar es 0,99. (P ( - 3o < X < + 3o) =0,99).

3.2. Distribucin Normal Estandarizada

Obtener las probabilidades integrando la funcin de densidad normal f(x) es una tarea
compleja.

Sea hace uso de un cambio de variable llamado estandarizacin de la variable como:



Esta variable estandarizada Z tiene media 0 y varianza 1, es de decir que la variable z tiene
distribucin normal estndar ( Z ~ N (0,1)).

La distribucin de una variable aleatoria normal con media 0 y varianza 1 se llama
distribucin normal estndar.

Por lo tanto cuando tenemos una v.a. X que sigue una distribucin normal de media y
desviacin estndar o pasamos a otra variable Z que sigue una distribucin N (0,1)
mediante la estandarizacin de la variable.

La distribucin normal estndar se encuentra tabulada lo que permiten calcular
probabilidades de la distribucin N(0,1).

3.3. Clculo de Probabilidades

Si X ~ N( ,o
2
), estandarizando Z ~ N( 0,1),

F
X
(x) = P( X s x) = u( ) = P(Z )

La tabla el valor de probabilidad a la izquierda del valor z calculado.

X
Z

o

=
X
Z

o

=
x
o
x
o

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


32






Podemos usar la tabla para calcular las probabilidades de intervalos. Por ejemplo:

1) P(a < Z < b) = u(b) - u(a)
2) P( Z > b) = 1- P(Z sb) = 1- u(b)
3) Si b > 0, P (Z < -b) = u(-b) y P(Z > -b) = 1- u(b)

Veamos algunos ejemplos usando la tabla Tabla_Normal_Estandar





















| | ( ) a P > 0,2 z
| | | | 0,2 0,2 0,5793 P z P z > = < =
| | ( ) b P > 1,27 z
| | | | 1,27 1 1,27 1 0,8980 0,1020 P z p z > = < = =
| | ( ) c P < < 0,52 1,03 z
| | | | | |
| | | | ( )
( )
0,52 1,03 1,03 0,52
1,03 1 0,52
0,8485 1 0,6985 0,5470
P z P z P z
P z P z
< < = < <
= < s
= =
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


33

3.4. Estrategia para resolver y ejercicio resuelto

1. Reconocer los elementos del enunciado
2. Definir la variable aleatoria
3. Realizar la estandarizacin de la variable con los valores
4. Plantear la probabilidad
5. Dibujar la regin del clculo de la probabilidad.

Veamos un ejercicio resuelto:
El plomo, como muchos otros elementos, est presente en el medio natural. La revolucin
industrial y la gran cantidad de automviles han incrementado la cantidad de plomo en el
medio hasta el punto de que, en algunos individuos, la concentracin de plomo puede
alcanzar niveles peligrosos. Sea X la concentracin de plomo en partes por milln en la
sangre de un individuo. Supongamos que X tiene distribucin normal con media 0,25 y
desviacin estndar 0,11. Una concentracin de 0,6 o ms es considerada
extremadamente alta.

a) Cul es la probabilidad de que si un individuo es seleccionado al azar ste
pertenezca a la categora extremadamente alta?
b) Cul es la probabilidad de que si un individuo es seleccionado al azar tenga una
concentracin de plomo entre 0,20 y 0,35?
c) Cul es la probabilidad de que si un individuo es seleccionado al azar tenga una
concentracin de plomo de por lo menos 0,45?

Solucin:
X tiene distribucin normal con media 0,25 y desviacin estndar 0,11.
V.a es X la concentracin de plomo en partes por milln en la sangre de un individuo.
Una concentracin de 0,6 o ms es considerada extremadamente alta.
a) P(X>0.6)= 1- P(X 6 . 0 s ) = 1- P(Z
11 . 0
25 . 0 6 . 0
)=u(3,18)=1

b) P(0.20 sX s 0.35) = P(
11 . 0
25 . 0 20 . 0
Z
11 . 0
25 . 0 35 . 0
)=u(0,91) - u(-0,45)= 0,8186-
0,3264=0,4922.

c) P(X>0.45)= 1- P(X 45 . 0 s ) = 1- P(Z
11 . 0
25 . 0 45 . 0
)=1-u(1,82)=0,9656

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


34
3.5. Gua de estudio distribucin normal

1) Un botnico ha observado que el ancho, X, de las hojas del lamo sigue una
distribucin normal con media 6 cm, y que el 90% de las hojas tiene un ancho
inferior a 7,5 cm. Hallar la probabilidad de que una hoja mida ms de 8 cm.

2) Las notas obtenidas en un examen por un grupo grande de alumnos se distribuye
segn una normal de media 5.5 y desviacin tpica 1.2.

a) Se obtiene A con una nota mayor que 6.2. Qu proporcin de estudiantes reciben
A?
b) Se obtiene B con una nota entre 5.3 y 6.2. Un profesor tiene un grupo de 100
alumnos, que puede verse como una muestra aleatoria del total de los
estudiantes. Hallar el nmero esperado de estudiantes de esta clase que
obtendrn una B
c) Se decide reprobar al 5% de estudiantes con notas ms bajas. Cul es la nota
mnima necesaria para no reprobar?

3) En una fbrica de turrn, la cantidad de almendra de una tableta determina su
calidad:

Calidad normal: menos de 180 gramos de almendra
Calidad extra: entre 180 y 200 gramos de almendra
Calidad superior: ms de 200 gramos de almendra.

Admitiremos que la cantidad de almendra por tableta es una variable aleatoria que
sigue una distribucin normal. Adems, sabemos que el 45% de las tabletas son de
calidad superior y el 15% de calidad normal.
a) Obtener el contenido medio de almendra por tableta
b) Obtener la desviacin estndar
c) Calcular la probabilidad de que una tableta elegida al azar tenga entre 185 y 205
gramos de almendra.
d) Hallar la probabilidad de que una tableta tomada al azar entre las de calidad
superior, tenga una cantidad de almendra inferior a 208 gramos.
e) Elegimos 150 tabletas al azar (independientemente unas de otras) cul es la
probabilidad de que al menos 2 tengan una cantidad de almendra inferior a 158
gramos?

4) Una compaa de alquiler de automviles ha determinado que la probabilidad de
que un coche necesite una revisin en un mes es de 0,3. La compaa tiene 900
coches. Cul es la probabilidad de que ms de 300 coches necesiten revisin en
un mes determinado?
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


35

5) El peso de un adulto de un cierto mamfero se distribuye segn una variable
aleatoria normal de media 100 kg y desviacin tpica 8 kg. Cul es la probabilidad
de que un adulto escogido al azar pese:

a) Menos de 90kg
b) Entre 95 y 105 kg
c) Ms de 110 kg?

4. Distribuciones Muestrales

Generalmente las poblaciones son demasiado grandes para ser estudiadas en su totalidad.
Por lo cual es necesario seleccionar una muestra representativa de un tamao manejable.
Esta muestra se utiliza luego para sacar conclusiones sobre una poblacin.

4.1. Estadsticos y Parmetros

Las caractersticas muestrales denominadas estadsticos se emplean para hacer
inferencias con respecto a las caractersticas de la poblacin Parmetros. Papel
fundamental de la inferencia estadstica.





Una vez obtenida una muestra se obtiene el
estadstico que corresponde a una funcin
de la muestra. Los estadsticos son variables
aleatorias que presentan distribuciones de
probabilidad llamadas distribuciones muestrales

Los objetos seleccionados generan n nmeros x
1
, x
2
, ..., x
n
que son los valores observados
de las variables aleatorias X
1
, X
2
, ..., X
n
.

Supongamos que estudiamos una variable X en una poblacin y sabemos que presenta
una distribucin F() , donde es el parmetro de la distribucin y es desconocido. Los
problemas de inferencia que pueden darse son: de estimacin, en los que se busca un
valor (estimacin puntual) para o un conjunto de valores posibles para el mismo
(estimacin por intervalos de confianza), y de pruebas o hiptesis, cuyo objetivo es
comprobar si es cierta o falsa cierta hiptesis formulada sobre el parmetro .

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


36
Si un estadstico lo usamos para estimar un parmetro desconocido de la poblacin (por
ejemplo la media , varianza
2
, etc.) lo llamaremos estimador de ese parmetro. Al valor
que toma una vez observada la muestra se le llama estimacin puntual del parmetro.
Para cada parmetro habr que encontrar "el mejor estimador", tratando de cometer en
la estimacin el menor error posible. El error de estimacin depende fundamentalmente
de la variabilidad poblacional y del tamao de la muestra.

Error de muestreo: Diferencia entre el parmetro y el estadstico de la muestra utilizado
para estimar el parmetro.

Los estadsticos de bsicos de inters son:

Media muestral


Varianza muestral


Proporcin muestral


Desviacin muestral


Parmetros Estadsticos o Estadgrafos







Las distribuciones muestrales que sern usadas son:

a) Teorema Central del lmite
b) Distribucin Chi. Cuadrado
c) Distribucin T- Student
d) Distribucin F de Snedecor

1 2 1
...
n
i
n i
X
X X X
X
n n
=
+ + +
= =

2
2 1
( )
1
n
i
i
X X
S
n
=

=

1 2 1
...
n
i
n i
X
X X X
p
n n
=
+ + +
= =

2
S S =
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


37
Es de bastante utilidad conocer y manejar las distribuciones normales, chi-cuadrado, t-
student y F de Snedecor en el estudio muestreo.

4.2. Tipos de distribuciones muestrales
a) Teorema Central del Lmite
El teorema central del lmite, es uno de los conceptos ms importantes en estadstica. Este
teorema justifica la importancia de la distribucin normal.

Teorema central del lmite Sea X
1
, X
2
, ,X
n
, una sucesin de variables aleatorias
independientes con E(X
i
) =
i
y varianza V(X
i
) = o
2
i
(ambos finitos).
Si Y= X
1
+ X
2 +
+ X
n
=

=
n
i
i
X
1
, entonces bajo ciertas condiciones de generales, la variable
aleatoria Z definida por


=
= =

=
n
i
i
n
i
n
i
i i
X
Z
1
2
1 1
o



tiene una distribucin aproximadamente normal estndar N(0,1), cuando n es
suficientemente grande.
La variable Y =

=
n
i
i
X
1
puede ser aproximada a la distribucin normal, cualquiera sea la
distribucin de la X
i
.

Teorema Sean X
1
, X
2
, ,X
n
, n variables aleatorias independientes idnticamente
distribuidas con E(X
i
) = y varianza V(X
i
) = o
2
(con media y varianza comn y
ambas finitas).
Si Y= X
1
+ X
2 +
+ X
n
=

=
n
i
i
X
1
, entonces la variable aleatoria:



1
/ /
n
i
i
X n
X
Z
n n

o o
=

= =

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


38
Donde
n
X
X
n
i
i

=
=
1
( X se llama media muestral) tiene una distribucin
aproximadamente normal con media cero y varianza uno (N(0, 1))

Ejemplo: Las cajas entregadas por una fbrica tienen un peso medio de 300 libras y una
desviacin estndar de 50 libras. Cul es la probabilidad de que 25 cajas tomadas al azar
y cargadas en un camin exceden de la capacidad especificada del camin, que se sabe es
de 8,200 libras? Cul es la probabilidad que el peso promedio de estas 25 cajas sea
inferior a 320 libras?

Solucin:
X tiene distribucin normal con media =300 libras y desviacin estndar o=50.
Muestra de cajas n=25
El peso promedio de las 25 cajas se distribuye normal. ( , / ) X N n o
El peso de las 25 cajas tiene distribucin normal.
1
( , / )
n
i
i
X N n n o
=


Cul es la probabilidad de que 25 cajas tomadas al azar y cargadas en un camin exceden
de la capacidad especificada del camin, que se sabe es de 8,200 libras?
P (
1
n
i
i
X
=

> 8.200) P (
8200 25*300
50 / 25
Z

> ) = 1
Estandarizando

Con seguridad al cargar las 25 cajas se exceder la capacidad del camin.

Cul es la probabilidad que el peso promedio de estas 25 cajas sea inferior a 320 libras?

P ( X < 320) P (
320 300
50 / 25
Z

> ) = u(2) = 0.9772

Estandarizando

Ejercicio: La longitud a que se puede estirar sin ruptura un filamento de Nylon es una
variable aleatoria exponencial con media de 5,000 pies. Cul es la probabilidad
(aproximada) que la longitud promedio de 100 filamentos este comprendida entre 4,750
y 5,550 pies?

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


39



a) Distribucin Chi. Cuadrado

La distribucin chi-cuadrado se denota X
2
es la distribucin muestral de la varianza
muestral (S
2
), es una distribucin sesgada a la derecha.

Estimar la varianza poblacional o la desviacin estndar requiere conocer la distribucin
chi- cuadrado. Si se escoje una muestra de tamao n de una poblacin con varianza
2
o , el
estadstico X
2
tiene distribucin chi-cuadrado con n-1 grados de libertad.




Los tres elementos principales en esta distribucin son:
El valor crtico
2
X
o
: es el valor que determina una probabilidad o a la izquierda
bajo la curva X
2
.
La probabilidad de cobertura o : rea (probabilidad) bajo la curva a la izquierda
del valor crtico.
Grados de libertad (v): indicador de la muestra (v=n-1)



Para el clculo de probabilidades se hace uso de la tabla de probabilidades para la
distribucin chi cuadrado.

La tabla contiene dos entradas:
Las filas indican las probabilidades de cobertura o y las columnas los grados de libertad
(v), los valores en el interior corresponden al valor crtico.

2
2 2
1 2
( 1)
~
n
n S
X _
o

=
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


40
Ejemplo: Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de
una poblacin normal con varianza ,, tenga una varianza muestral:
a) Mayor que 9.1
( )
( ) ( )
( )
2
2
2
2 2
2 2
2
2
,24
( 1) (24)9,1
( 9,1) ( )
6
(24)9,1
36, 4
6
36, 4 1 36, 4
36, 4 1
36, 4 ?
n S
P S P
P X P X
P X P X
P X
x
o
o
o
o

> = >
| |
> = >
|
\ .
> = s
> =
= =

Visualizando la tabla de valores de probabilidad chi- cuadrado para v= 24 grados de
libertad y valor crtico
2
X
o
= 36,4, la probabilidad a la izquierda de este valor es o = 0,95
Por lo tanto
( )
( )
2
2
36, 4 1 0, 95
36, 4 0, 05
P X
P X
> =
> =

Ejercicio: Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones,
de una poblacin normal con varianza , tenga una varianza muestral:

b) Entre 3.462 y 10.745


Recuerde que: P(a < x < b) = P(x<b) P(x<a)


b) Distribucin T- Student

La distribucin T- student se denota t

es la distribucin muestral de la media muestral
para muestras pequeas, es una curva en forma de campana con centro en cero, pero
ms dispersa que la curva normal estndar.

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


41
Estimar la media muestral apartir de una poblacin normal cuando la muestra es pequea
requiere conocer la distribucin t. Si se escoge una muestra de tamao n (pequea) de
una poblacin normal con media y varianza
2
o , el estadstico t

tiene distribucin t
student con n-1 grados de libertad.




La distribucin t difiere de la normal estndar en que la varianza de t depende del tamao
de la muestra y siempre es mayor a uno. Estas distribuciones sern las mismas cuando el
tamao de la muestra tiende a infinito.

Los tres elementos principales en esta distribucin son:
El valor crtico ( t
o
): es el valor que determina una probabilidad o a la izquierda
bajo la curva t.
La probabilidad de cobertura (o ): rea (probabilidad) bajo la curva a la izquierda
del valor crtico.
Grados de libertad (v): indicador de la muestra (v=n-1)



Para el clculo de probabilidades se hace uso de la tabla de probabilidades para la
distribucin t- student.

La tabla contiene dos entradas:
Las filas indican las probabilidades de cobertura o y las columnas los grados de libertad
(v), los valores en el interior corresponden al valor crtico.

Es importante destacar que como t es simtrica alrededor de una media de cero, se tiene
que
1
t t
o o
= ; as, el valor t que deja un rea (probabilidad) de
1 o
a la derecha y por
tanto un rea de o a la izquierda, es igual al valor t negativo que deja un rea de o en
la cola derecha de la distribucin. Esto es, t
0.95
= -t
0.05
, t
0.99
=-t
0.01
.

Ejemplo: Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto
proceso en lotes es 500 gramos por milmetro de materia prima. Para verificar esta
1
~
n
x
t t
s
n

=
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


42
afirmacin toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre
t
0.05
y t
0.05
, queda satisfecho con su afirmacin. Qu conclusin extraera de una muestra
que tiene una media de 518 gramos por milmetro y una desviacin estndar de 40
gramos? Suponga que la distribucin de rendimientos es aproximadamente normal.
Solucin:
De la tabla buscamos t
0.05
=t
0, 95
con 24 grados de libertad es de 1.711. De esta forma el
fabricante queda satisfecho si de una muestra de 25 lotes el valor t se encuentra entre
1.711 y 1.711.
Se procede a calcular el valor de t:
518 500
2.25
40
25
x
t
s
n

= = =
Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener
un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02. De aqu que es probable que el fabricante concluya que el
proceso produce un mejor producto del que piensa.
Ejercicios

1) Una compaa manufacturera afirma que las bateras que utiliza en sus juegos
electrnicos duran un promedio de 30 horas. Para mantener este promedio, se
prueban 16 bateras cada mes. Si el valor t que se calcula cae entre t
0.025
y t
0.025
,
la compaa queda satisfecha con su afirmacin. Qu conclusiones debera
obtener la empresa de una muestra que tiene una media de 27,5 horas y una
desviacin estndar de 5 horas. Suponga que la distribucin de las duraciones de
las bateras es aproximadamente normal.
2) Un fabricante de cierta marca de barras de cereal bajo en grasa afirma que su
contenido promedio de grasa saturada es 0.5 gramos. En una muestra aleatoria de
8 barras de cereal de esta marca, el contenido de grasa saturada fue 0,6; 0,7; 0,7;
0,3; 0,4; 0,5; 0,4 y 0,2.
Estara de acuerdo con la afirmacin? Suponga una distribucin normal?


c) Distribucin F

La distribucin F se define como la razn de dos variables aleatorias chi - cuadradas,
dividida cada una entre sus grados de libertad.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


43
Caractersticas
- La variable aleatoria F es no negativa, es decir, los valores que asume la variable F
no son negativos
- La distribucin es sesgada hacia la derecha.
- La distribucin F tiene una apariencia muy similar a la distribucin chi-cuadrada;
sin embargo, se encuentra centrada respecto a 1.
- Presenta dos parmetros dados por los grados de libertad lo cuales proporcionan
una flexibilidad adicional con respecto a la forma de la distribucin.
La distribucin F nos permite comparar las varianzas de dos poblaciones utilizando las
varianzas muestrales de estas.
Sean
2
1
S y
2
2
S las varianzas muestrales de dos muestras independientes de tamao n
1
, n
2

tomadas de poblaciones normales
2
1
o y
2
2
o .

El estadstico F tiene distribucin F con v
1
y v
2
grados de libertad.






Los tres elementos principales en esta distribucin son:
El valor crtico
1 2
,
(1 )
v v
F o : es el valor que determina una probabilidad o a la
izquierda bajo la curva X
2
.
La probabilidad de cobertura (1 ) o : rea (probabilidad) bajo la curva a la
izquierda del valor crtico.
Grados de libertad ( v
1
, v
2
): indicador de las dos muestras ( v
1
=n
1
- 1 ,
v
2
= n
2
1)



1 2
2
1
2
1
, 2
2
2
2
(1 )
v v
S
F F
S
o
o
o
=
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


44
Para el clculo de probabilidades se hace uso de la tabla de probabilidades para la
distribucin F para distintos valores de 0,9;0,95;0,975;0,99;0,995. o =

La tabla contiene dos entradas: Las filas indican los grados de libertad v
1,
las columnas
indican los grados de libertad v
2
, los valores en el interior corresponden a las
probabilidades coberturas o a la derecha valor crtico
1 2
,
(1 )
v v
F o .
Ejemplo: Encuentre el valor de F para cada uno de los siguientes casos:
a. El rea (probabilidad) a la derecha de F, es de 0.25 con n
1
=5 y n
2
=10.
b. El rea (probabilidad) a la izquierda de F, es de 0.95 con n
1
=16 y n
2
=11.
Ejemplo: Sean s
1
2
y s
2
2
las varianzas muestrales de muestras aleatorias independientes de
tamaos n
1
=10 y n
2
=20, tomadas de poblaciones normales que poseen las mismas
varianzas, encuentre P (s
1
2
/s
2
2
2.42).
Ejercicio: Encuentre el valor de F para cada uno de los siguientes casos:
a. El rea (probabilidad) a la derecha de F es de 0.95 con n
1
=7 y n
2
=9.
b. El rea (probabilidad) a la izquierda de F, es de 0.10 con con n
1
=26 y n
2
=32
Ejercicio: Sean s
1
2
y s
2
2
las varianzas muestrales de muestras aleatorias independientes
de tamaos n
1
=25 y n
2
=31, tomadas de poblaciones normales con varianzas
1
2
=10
y
2
2
= 15, respectivamente, encuentre P (s
1
2
/s
2
2
> 1.26).(3)
A partir de las distribuciones muestrales ser posible realizar inferencias para los
siguientes estadsticos al abordar el tema de intervalos de confianza.

Media muestral
Varianza muestral
Proporcin muestral
Diferencia de medias muestrales
Cociente de Varianzas muestrales
Diferencia de Proporciones muestrales

4.3. Distribuciones muestrales de los estadsticos

Media muestral
Sea X
1
, ..., X
n
una muestra aleatoria simple (m.a.s.) de una poblacin X con E(X) = y V
ar(X) =
2
. Se puede probar que la esperanza de la media muestral est dada por:
= ) (X E y su varianza est dada por:
n
X V
2
) (
o
=
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


45
Recordemos que:
El Teorema Central del Lmite establece que:

=

=
n cuando
n
N
n
X
X
n
i
i
) , ( ~
2
1
o



Por lo tanto Sea X
1
, ..., X
n
una m.a.s. de una poblacin X con distribucin N (, ).
Entonces,




La media muestral se distribuye normal con media y varianza
2
n
o
.

Varianza muestral
Sea X
1
, ..., X
n
una m.a.s. de una poblacin X con E(X) = y Var(X) =
2
.

Sea X
1
, ..., X
n
una m.a.s. de una poblacin X con distribucin N (,
2
).
Entonces:



y
2
S y X son independientes.
(3) http://www4.ujaen.es/~dmontoro/Metodos/Temas/Tema6.pdf
Por lo tanto el cuociente
2
2
( 1) n S
o

se distribuye Chi- cuadrado con n-1 grados de


libertad.

Proporcin muestral
Sea X
1
, ..., X
n
una m.a.s. de una poblacin X. Sea p la proporcin de inviduos en la
poblacin que presentan una determinada caracterstica, y p la proporcin muestral.

) 1 , 0 ( ~
) 1 (

)
) 1 (
, ( ~
N
n
p p
p p
Z
n
p p
p N p



Nota: El nmero de individuos que presentan la caracterstica en la muestra sigue una
distribucin Binomial B(n, p), que con n suficientemente grande se puede aproximar a una
2
1
~ ( , )
n
i
i
X
X N
n n
o

=
=

2
2 2
1 2
( 1)
~
n
n S
X _
o

=
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


46
N (np, np(1 - p)). Por lo tanto, la proporcin muestral sigue tambin una distribucin
Normal con los parmetros arriba indicados.
Diferencia de medias muestrales
Sea X
1
, ..., X
n1
una m.a.s de una poblacin X, e Y
1
, ..., Y
n2
una m.a.s. de una poblacin Y.
Suponemos que las poblaciones X e Y son independientes y con distribuciones normales N
(
1
,
2
1
o ) y N(
2
,
2
2
o ) respectivamente.

Se pueden presentar los siguientes casos:

(a)
2
2
2
1
o o y conocidas:
) , ( ~
2
2
2
1
2
1
2 1
n n
N Y X
o o
+
o equivalentemente
) 1 , 0 ( ~
) ( ) (
2
2
2
1
2
1
2 1 2 1
N
n n
X X
Z
o o

+

=


(b)
2 2
2
2
1
o o o = = desconocidas:
1
2 1
2 1 2 1
~
1 1
) (

+

=
n
c
t
n n
S
X X
T


donde

2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1 2
+
+
=
n n
S n S n
S
c

Cociente de varianzas muestrales
Sea X
1
, ..., X
n1
una m.a.s de una poblacin X, e Y
1
, ..., Y
n2
una m.a.s. de una poblacin Y.
Suponemos que las poblaciones X e Y son independientes y con distribuciones normales N
(
1
,
2
1
o ) y N(
2
,
2
2
o ) respectivamente. Entonces,

1 , 1
2
2
2
2
1
2
1 2
~

=
n n
Y
X
F
S
S
F
o
o

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


47

Diferencia de proporciones muestrales
Sea X
1
, ..., X
n1
una m.a.s de una poblacin X, e Y
1
, ..., Y
n2
una m.a.s. de una poblacin Y.
Suponemos que las poblaciones X e Y son independientes. Denotamos por p
1
y p
2
las
proporciones poblacionales y por
2 1
, p p las correspondientes proporciones
muestrales.

) 1 , 0 ( ~
) 1 ( ) 1 (
) (
2
2 2
1
1 1
2 1 2 1
N
n
p p
n
p p
p p p p
Z


=

Utilizaremos las distribuciones muestrales anteriores en el clculo de probabilidades en
los siguientes ejercicios.

5. Estimacin de parmetros

5.1. Introduccin

Consideremos una v.a X con distribucin F

con desconocido. En este tema vemos cmo


dar una estimacin puntual para el parmetro y cmo construir un intervalo de
confianza para el mismo, dos formas segn se coment de estimar el parmetro.

5.2. Estimacin puntual

Sea X una variable poblacional continua con funcin de densidad de probabilidad
f(x; u
1
,..., u
k
), siendo
i
parmetros desconocido o una variable aleatoria discreta con
funcin de probabilidad p(x; u
1
, ..., u
k
), siendo
i
parmetros desconocidos.

El problema de estimacin puntual consiste en, seleccionada una muestra X1, ..., Xn,
encontrar el estadstico T (X1, ..., Xn) que mejor estime el o los parmetro
i
. Una vez
observada o realizada la muestra, con valores x
1
, ..., x
n
, se obtiene la estimacin puntual
de , T (x1, ..., xn) = u

.

Vemos a continuacin dos mtodos para obtener la estimacin puntual de un parmetro:
mtodo de los momentos y mtodo de mxima verosimilitud.


5.3. Mtodos de estimacin puntual

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


48
Mtodo de los momentos: consiste en igualar momentos poblacionales a
momentos muestrales. Deberemos tener tantas igualdades como parmetros a
estimar.

Un momento poblacional de orden r esta dado por k r
r
..., , 1 ), E(X
r
= =
Momento muestral de orden r k r
n
x
M
r
i
r
i
r
..., , 1 ,
1
= =

=

r r
M =


Mtodo de mxima verosimilitud: consiste en tomar como valor del parmetro
aquel que maximice la probabilidad de que ocurra la muestra observada.
Si X una variable poblacional continua con funcin de densidad de probabilidad f(x; u
1
,
..., u
k
), siendo
i
parmetros desconocido o una variable aleatoria discreta con funcin de
probabilidad p(x; u
1
, ..., u
k
), siendo
i
parmetros desconocido.
Sea X
1
, ..., X
n
una muestra seleccionada de de una v.a. X, y sean x
1
, ..., x
n
los valores
observados de la muestra. La funcin de verosimilitud de la muestra se define as:

) ; (
) ; ( * ... * ) ; ( ) ,..., ; ( ) ,..., ; (
1
1 1 1
u
u u u u
[
=
=
= =
n
i
i
n n n
x f
x f x f x x f x x L


A ) ,..., ; (
1 n
x x L u se le llama funcin de verosimilitud.

Buscamos entonces el valor de que maximice la funcin de verosimilitud, y al valor
obtenido se le llama estimacin por mxima verosimilitud de .

5.4. Propiedades de los estimadores puntuales

- Insesgamiento: Se dice que el estadstico muestral es un estimador insesgado
del parmetro poblacional, si el valor esperado del estadstico muestral es
igual al parmetro poblacional estudiado.

El estadstico muestral u es un estimador insesgado del parmetro poblacional
de u si:

( ) E u u = , donde ( ) E u es el valor esperado del estadstico muestral u .

La figura siguiente muestra la diferencia entre un estimador sesgado y uno
insesgado.

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


49
















- Consistencia: Un estimador puntual es consistente si el valor del estimador
puntual tiende a estar ms cerca del parmetro poblacional a medida que el
tamao de la muestra aumenta, es decir, que una muestra grande tiende a
proporcionar un mejor estimador puntual que una muestra pequea.

La figura siguiente muestra la diferencia entre dos distribuciones muestrales,
visualizando el apuntamiento de la distribucin muestral de 1 u , vemos que
este estimador es mas consistente.














- Eficiencia: Sean dos muestras aleatorias simples de tamao n de manera que
se obtienen dos estimador puntuales insesgados de un mismo parmetro
poblacional. Se dice que un estimador puntual que presenta menor error
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


50
estndar tiene mayor eficiencia relativa. Un estimador es eficiente con
respecto a otro si presente menor error estndar.

- Suficiencia: La idea intuitiva de estadstico suciente sugiere eliminar de la
muestra aquellos elementos que no sean informativos respecto de cierto
parmetro.



5.5. Estadsticos de orden y sus propiedades


Estadsticos conocidos como ordinales, el objetivo principal de los estadsticos de orden es
ordenar los datos que sern utilizados dentro de un experimento en base a
determinados criterios de orden (Creciente o decreciente).

Se utilizan para las pruebas de rango multiple para ordenar las muestras aleatorias de
diversas poblaciones.

5.6. Estimacin por intervalos de confianza

Los intervalos de confianza son instrumentos estadsticos que sirven para medir la
incertidumbre de un parmetro.

En lugar de dar una estimacin puntual para el parmetro buscamos ahora un intervalo
[
1
(x
1
, ..., x
n
),
2
(x
1
, ..., x
n
)] que contenga al parmetro con una alta probabilidad.

Esta probabilidad recibe el nombre de nivel de confianza del intervalo, se denota por (1 -
) y la fija el investigador.

Construccin de un intervalo de confianza (I.C)

Sea X ~ F

, con desconocido. Una variable aleatoria con una distribucin de


probabilidad especfica y un parmetro desconocido.

Seguimos los siguientes pasos para construir un I.C. para :

1. Seleccionamos una m.a.s. X
1
, ..., X
n
.
2. Buscamos un estadstico que incluya el parmetro a estimar y que tenga
distribucin conocida. (distribuciones muestrales de los estadsticos)
3. Fijamos el nivel de confianza (1 - ).
4. Encontramos
1
(x
1
, ..., x
n
) y
2
(x
1
, ..., x
n
) tal que:
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


51
5. P (
1
(x
1
, ..., x
n
)
2
(x
1
, ..., x
n
)) 1
6. Diremos entonces que [
1
(x
1
, ..., x
n
),
2
(x
1
, ..., x
n
)] es un I.C. para al (1 - )100% de
confianza.
Eso significa que de cada 100 intervalos que pudieran obtenerse (segn distintas
muestras que pudieran haber sido seleccionadas al azar), (1 - )100% contendran el
verdadero valor del parmetro .

Ejemplo: Construimos un I.C. al (1 - )100% de confianza para la media de una normal
con varianza conocida
2
0
o .

n
X
Z
0
o

=



P (-z
1-o/2

n
X
0
o

z
1-o/2
) = 1-o

o
o

o
o o
= + s s

1 ) (
2 / 1 2 / 1
n
z X
n
z X P



El Intervalo para al (1 - ) 100% de confianza es entonces
| |
n
z X
n
z X
o o

o o 2 / 1 2 / 1
,

+ e


Observaciones:
- El intervalo depende de la muestra seleccionada
- La amplitud del intervalo mide la precisin de la estimacin. Concretamente, el error
cometido en la estimacin de por x viene dado por e = X es menor o igual que
n
z
0
2 / 1
o
o
con una probabilidad (1 - ).

Luego para el caso anterior.
n
z e
o
o 2 / 1
s

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


52

2
2 / 1
*
|
.
|

\
|
>

e
z
n
o
o


A mayor tamao muestral n, menor amplitud, y por lo tanto mayor precisin en la
estimacin. Por otro lado, cuanto mayor es el nivel de confianza, mayor es la amplitud del
intervalo.

Ejemplo: Supongamos que llevan a cabo pruebas de la resistencia a la tensin de una
clase de largueros de aluminio utilizado en la fabricacin de alas de aeroplanos. De la
experiencia se considera una desviacin estndar de 1 kg/mm
2
. Una muestra de 10
largueros proporciona una resistencia promedio de 87.6 kg/mm
2
. Vamos a obtener un I.C.
al 95% de confianza para la resistencia promedio de esta clase de largueros.

Solucin
X = Resistencia a la tensin ~ N (, 1)
Sabemos que el I.C. al (1 -)100% es
|
n
z x
n
z x
o o

o o 2 / 1 2 / 1
, [

+ e


En este caso, el nivel de confianza es del 95%, por lo que (1 - ) = 0,95 y = 0,05. El
intervalo es por lo tanto:

(

e
10
1
96 . 1 6 . 87
= [86.98, 88.22]

5.7. Intervalo de confianza para medias, varianzas y proporciones

Intervalo de confianza para la media de una distribucin normal

Sea X
1
, ..., X
n
una m.a.s. de X ~ N (,
2
).

Varianza conocida
2

|
n
z x
n
z x
o o

o o 2 / 1 2 / 1
, [

+ e

Varianza desconocida
| |
n
S
t x
n
S
t x
n n 1 , 2 / 1 1 , 2 / 1
,

+ e
o o



Intervalo de confianza para la varianza de una normal

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


53
Sea X
1
, ..., X
n
una m.a.s. de X ~ N (,
2
).

2
1
2
2
~
* ) 1 (

=
n
S n
X _
o


(
(


e

2
2 / , 1
2
2
2 / 1 , 1
2
2
* ) 1 (
,
* ) 1 (
o o
_ _
o
n n
S n S n


Ejemplo: Un ingeniero de control de la calidad midi el espesor de la pared de 20 botellas
de vidrio de 2 litros. La media muestral result 4.05 mm y la desviacin estndar 0.08 mm.
Obtenga un intervalo de confianza al 90% para la variabilidad del espesor de la pared de
las botellas.

X = Espesor ~ N (,
2
), con , desconocidas

Soluc: o
2 e
[0,005, 0,015]

Intervalo de confianza para la diferencia de medias de dos poblaciones normales
e independientes

Sean X
1
, ..., X
n1
una m.a.s. de X ~ N (
1
,
2
1
o ) y Y
1
, ..., Y
n2
una m.a.s. de Y ~ N (
2
,
2
2
o ),
independientes.

) 1 , 0 ( ~
) (
) , ( ~
2
2
2
1
2
1
2 1 2 1
2
2
2
1
2
1
2 1 2 1
N
n n
X X
Z
a equivale que lo
n n
N X X
o o

o o

+

=
+

Se tiene que:

Si las varianzas son conocidas:

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


54
) 1 , 0 ( ~
) (
) , ( ~
2
2
2
1
2
1
2 1 2 1
2
2
2
1
2
1
2 1 2 1
N
n n
X X
Z
a equivale que lo
n n
N X X
o o

o o

+

=
+

Si las varianzas son desconocidas se cumple que:

2 1
2 1 2 1
1 1
) (
n n
S
X X
T
c


=



Los intervalos de confianza para la diferencia de medias:

Varianzas conocidas
|
(
(

(
+ e

2
2
2
1
2
1
2 / 1 2 1 2 1
) (
n n
z X X
o o

o
Varianzas desconocidas
pero iguales
(

+ e
+
2 1
2 , 2 / 1 2 1 2 1
1 1
)
2 1
n n
S t X X
c n n o


Ejemplo: El hundimiento de un petrolero en las proximidades de la costa de una
determinada regin ha provocado un gran desastre tanto econmico como ecolgico. Con
el fin de analizar la composicin del fuel que desprende el buque, han sido seleccionadas
17 galletas de chapapote a las cuales se les mide la concentracin de zinc, obtenindose
un promedio 140 mg/l, con una desviacin estndar de 30 mg/l.

(a) Obtenga un intervalo de confianza al 95% para la concentracin media de zinc en el
fuel que desprende el petrolero.
X = Composicin de cinc ~ N (,
2
), con ,
2
desconocidas

Solucin: [124,575, 155,425]


(b) Qu ocurrira al incrementar el tamao de la muestra?. Razona la respuesta.

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


55
Solucin: Al incrementar el tamao de la muestra, se reduce el error de estimacin de la
media

Intervalo de confianza para el cociente de varianzas de dos poblaciones normales
e independientes
Sean ~ N (
1
,
2
1
o ) y ~ N (
2
,
2
2
o ), independientes. Suponemos que las poblaciones X e Y
son independientes y con distribuciones normales N (
1
,
2
1
o ) y N(
2
,
2
2
o )
respectivamente y sean X
1
, ..., X
n1
una m.a.s. de X y Y
1
, ..., Y
n2
una m.a.s. de Y . Entonces,

1 , 1
2
2
2
2
1
2
1 2
~

=
n n
Y
X
F
S
S
F
o
o


(

e
1 , 1 2 / 1
2
2
1 , 1 2 /
2
2
2
2
2
1
2 2
, , ,
n n
Y
X
n n
Y
X
f
S
S
f
S
S
o o
o
o



Ejemplo: Se piensa que la concentracin del ingrediente activo de un detergente lquido
para ropa est afectada por el tipo de catalizador utilizado en el proceso de fabricacin.
Por experiencias anteriores se supone que la desviacin estndar de la concentracin
activa es de 3 g/l, sin importar el tipo de catalizador utilizado. Se toman 10 observaciones
con cada catalizador y se obtienen los siguientes datos:

Cat.1 57.9 66.2 65.4 65.4 65.2 62.6 67.6 63.7 67.2 71
Cat.2 66.4 71.7 70.3 69.3 64.8 69.6 68.6 69.4 65.3 68.8

(a) Obtenga un intervalo de confianza al 90% para el cociente de varianzas?. Puede
suponerse la misma variabilidad en la concentracin con el empleo de ambos
catalizadores?.
X = Concentracin con catalizador 1 ~ N (
1
,
1
2
)
Y = Concentracin con catalizador 2 ~ N (
2
,
2
2
),
Son independientes y todos los parmetros se desconocen.

Solucin: [0,116, 1,180].

Al estar el 1 contenido en el intervalo, las varianzas podran considerarse iguales.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


56

(b) Obtenga un intervalo de confianza al 95% para la diferencia en la concentracin activa
bajo la presencia de ambos catalizadores. Depende la concentracin activa del
catalizador?.

Solucin: [6,061; 0,379]

Intervalo de confianza para una proporcin

Sea X
1
, ..., X
n
una m.a.s. de X ~ Bernoulli(p).

Para muestras grandes, la proporcin muestral

muestra la de tamao
tica caracters la con muestra la en objetos de nmero
p =


Tiene una distribucin aproximadamente normal con media p y varianza p(1-p)/n.
) 1 , 0 ( ~
) 1 (

)
) 1 (
, ( ~
N
n
p p
p p
Z
n
p p
p N p


Luego un intervalo de confianza para p esta dado por:

|
(

(
+

e

n
p p
z p
n
p p
z p p
) 1 (
,
) 1 (

2 / 1 2 / 1 o o

Tamao de la muestra para la estimacin de p.
Como en el caso de la media muestral, la cuestin del tamao de la muestra debera ser
considerada en los estudios de planificacin de un experimento.
En este caso el error de estimacin est dado por
n
p p
z e
) 1 (
*
2 / 1

=
o

y si partimos con un error de estimacin conocido y resolvemos la ecuacin anterior para
n obtenemos:
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


57
2
2
2 / 1
) 1 ( *
e
p p z
n

=
o


Sin embargo el lado derecho de esta expresin involucra el valor p . El cual lo podemos
estimar de una muestra piloto tomada de la poblacin de inters o ser estimado por
experimentos similares anteriores. Si no se toma una muestra, no tenemos el valor de
p
. Pero tenemos que la cantidad ) 1 ( p p nunca es ms grande que , y este valor es
mximo cuando 2 / 1 = p . Si asignamos el valor a p tenemos que el tamao de
muestra n est dado por:

2
2 / 1
2
2
2 / 1
2
4
|
.
|

\
|
= =

e
z
e
z
n
o o


Ejemplo: Para poder controlar la fabricacin de un producto se toman 85 muestras de un
determinado componente y se concluye que 10 de ellos no cumplen las especificaciones.

(a) Calcula un intervalo de confianza al 95% para la proporcin de defectuosos.
X = No de defectuosos ~ B (85, p)

Solucin: [0,05, 0,186]

(b) Cul debera ser el tamao de la muestra si se quiere que el error cometido al estimar
la proporcin sea menor de 0.05 con una probabilidad 0.95?.
Solucin: 160
Intervalo de confianza para la diferencia de proporciones
Sean X
1
, ..., X
n1
una m.a.s. de X ~ Bernoulli(p
1
) y Y
1
, ..., Y
n2
una m.a.s. de
Y ~ Bernoulli(p
2
).

Para construir un intervalo de confianza para p
1
- p
2
estandarizamos la variable
2 1
p p , es decir
) 1 , 0 ( ~
) 1 ( ) 1 (
) (
2
2 2
1
1 1
2 1 2 1
N
n
p p
n
p p
p p p p
Z


=
Y se obtiene el intervalo de confianza para p
1
- p
2
que est dado por:
(


2
2 2
1
1 1
2 / 1 2 1
2
2 2
1
1 1
2 / 1 2 1
) 1 ( ) 1 (
p - p ,
) 1 ( ) 1 (
p - p
n
p p
n
p p
z
n
p p
n
p p
z
o o
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


58

Ejemplo: Dos marcas de refrigeradores A y B, tienen un ao de garanta. En una muestra
aleatoria de 50 refrigeradores de la marca A, se observ que 12 de ellos tuvieron fallas
antes de cumplir la garanta. Una muestra aleatoria de 60 refrigeradores de la marca B
tambin revel que 12 fallaron antes de cumplir la garanta. Estime la diferencia real
entre las proporciones de fallas de ambas marcas durante el periodo de garanta con un
98% de confianza.

Solucin: [-0.1451, 0.2251]

5.8. Pasos para resolver un intervalo de confianza

a) Lea atentamente el enunciado del ejercicio.
b) Identifique el estadstico de inters de estudio.
c) Identifique el intervalo de confianza que se quiere estimar.
d) Identifique los datos del caso que permitan encontrar el intervalo de confianza.
e) Calcule el intervalo de confianza.
f) Comente los resultados en el contexto del problema.
g) Comente y consulte a su tutor virtual.


5.9. Gua de ejercicios de Estimacin puntual e Intervalo de confianza para medias,
varianzas y proporciones

1. El tiempo de fallo en horas de un componente electrnico (en horas) puede
modelizarse segn una distribucin Exponencial con funcin de densidad f(x) =
exp{-x}, x 0
a. Encuentra el estimador de mxima verosimilitud de , basado en una muestra
aleatoria de tamao n.
b. Encuentra el estimador de haciendo uso del mtodo de los momentos.
c. Estima el tiempo medio de las componentes en base a la informacin que
proporciona la siguiente muestra:

300, 305, 329, 325, 310, 314, 302, 356, 325, 309, 351, 305, 322, 349

2. El nmero de accidentes de trfico diarios en una localidad se puede modelar por una
distribucin de Poisson de parmetro . Una muestra de 45 das proporciona un no
medio de accidentes por da de 2 con una desviacin estndar de 1.4. Obtenga una
estimacin puntual para .

3. En la siguiente tabla se recogen 15 medidas del tiempo (en segundos) de aceleracin de
un vehculo.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


59

10.9 9.63 6.5 11.06 11.39 9.76 12.52 7.68 9.25 12.40 9.84 10.45 7.67 8.77
9.63
Suponiendo que el tiempo de aceleracin sigue una distribucin normal,

a) Obtenga un intervalo de confianza para el tiempo medio de aceleracin.
b) Calcula el tamao de muestra necesario para que el error de estimacin de la media sea
menor que 0.75 con probabilidad 0.95.
c) Se puede afirmar que la aceleracin media es de 10 segundos?.

1. Se desea comparar la variabilidad de la resistencia a la compresin de dos
cementos A y B. Para ello se fabrican 51 bloques con cada tipo de cemento a los que se
mide la resistencia a la compresin. Se obtienen los siguientes datos:
96 120
2 2
= =
B A
S S
Suponiendo que ambas poblaciones son normales e independientes, obtn un intervalo
de confianza al 90% para el cociente de varianzas. Pueden considerarse
significativamente distintas?.

2. Se tienen dos mtodos para medir la resistencia de un cable. Se seleccionan
aleatoriamente 9 cables, a los que se aplica el primer mtodo, y otros 9 cables a los que
se aplica el segundo mtodo. Los datos son:

Mt. 1 1.186 1.151 1.322 1.339 1.2 1.402 1.365 1.537 1.559
Mt. 2 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052

Obtenga un intervalo de confianza al 95% para la diferencia entre los mtodos. Pueden
considerarse diferentes?.

8. Un ingeniero qumico est interesado en comparar el rendimiento de un proceso
qumico bajo dos temperaturas distintas. La realizacin de 5 ensayos consecutivos a
cada una de las temperaturas proporcionan los siguientes rendimientos (%):

Temperatura 1 85 83 82 85 84
Temperatura 2 90 92 91 93 90

Obtenga un intervalo de confianza al 99% para la diferencia de rendimientos
promedios. Pueden suponerse los rendimientos medios iguales?.
Suponer ambas poblaciones normales e independientes.

9. Los tiempos de fallo en horas de una muestra aleatoria de 10 componentes
electrnicos de una determinada marca son:

ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


60
2300 2000 1980 2500 2432
2300 2429 1970 2100 2200
Si suponemos que estos tiempos proceden de una distribucin exponencial,
a. Estima el parmetro de tal distribucin.
b. Calcula el tiempo medio de fallo de una componente de este tipo.
c. Si una componente no ha fallado pasadas 500 horas desde su puesta inicial en
funcionamiento,
cul es la probabilidad de que dure por lo menos otras 200 horas ms?.
d. Si tienen un perodo de garanta de 1000 horas, calcula la probabilidad de que una
componente falle estando en perodo de garanta. De un lote de 30 componentes,
cuntas se esperan que sean devueltas por fallar estando en garanta?.

10. Una central de productos lcteos recibe diariamente la leche de dos granjas A y B.
Con el fin de estudiar la calidad de los productos recibidos se extraen dos muestras,
una de cada granja, y se analiza el contenido de materia grasa de cada producto. Se
obtienen los siguientes resultados:

Granja A 0.32 0.29 0.30 0.28 0.33 0.31 0.30 0.29 0.33 0.32 0.30 0.29
Granja B

0.28

0.30

0.32

0.29

0.31

0.29

0.33

0.32

0.29

0.32

0.31 0.32

0.29

0.30

a. Obtenga un intervalo de confianza al 95% para el cociente de varianzas. Podran
considerarse las varianzas iguales?.
b. Obtenga un intervalo de confianza al 95% para la diferencia en el contenido graso
promedio de los productos de ambas granjas.
c. Si la central rechaza aquellos productos con un contenido graso superior a 0.32,
obtenga un intervalo de confianza al 90% para la diferencia de proporciones de
productos que habra que rechazar procedentes de ambas granjas.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO I


61
GLOSARIO DE TERMINOS

Interval o de confianza: Se l l ama as a un i nterval o en el que sabemos
que est un parmetro, con un ni vel de confi anza espec fi co.

Nivel de confianza: Probabi l i dad de que el parmetro a esti mar se
encuentra en el i nterval o de confi anza.

Error de estimaci n: di ferenci a entre l a esti maci n de un parmetro y
su val or real .

BIBLIOGRAFIA

1. Canavos, G., Probabilidad y Estadstica. Aplicaciones y Mtodos. (Mac Graw Hill).
2. Apuntes, Departamento de Estadstica, Universidad de Concepcin.
3. Devore, J., Probabilidad y Estadstica para ingeniera y ciencias. (THOMSON).

REFERENCIAS

1) http://www.mat.uson.mx/~ftapia/Notas%20de%20Clase/Mis%20Notas%20Tema%
20I.pdf

2) http://estadisticaparaadministracion.blogspot.com/2011/07/aplicaciones-de-la-
estadistica-en-la.html

3) http://www4.ujaen.es/~dmontoro/Metodos/Temas/Tema6.pdf

You might also like