Professional Documents
Culture Documents
La estadstica tiene su origen en la palabra Estado, pues este era el encargado de realizar la
cuantificacin y anlisis de la riqueza que tenan, los cuales estaban en funcin a fines
econmicos y militares, expresados en recursos econmicos, infraestructura y sobre los
cules tomaban decisiones.
Actualmente la estadstica es una ciencia y ya no es reservada al estado pues est
relacionada y aplicada a prcticamente todas las dems ciencias. La razn es evidente, es
necesario recolectar informacin y analizarla y eso es justamente lo que hace la estadstica,
proporciona tcnicas precisas de recoleccin de datos y proporciona mtodos especficos
para el anlisis de los mismos , su utilidad la entendemos mejor si tenemos en cuenta que
los quehaceres y decisiones diarias embargan cierto grado de incertidumbre, esta ciencia
trabaja con ella y nos orienta para tomar las decisiones con un determinado grado de
confianza, en este sentido la asignatura de Estadstica tiene la finalidad de incursionarlos
dentro de esta ciencia como herramienta para la toma de decisiones en su desarrollo
profesional.
La asignatura est dividida en tres Unidades Didcticas: en la Primera Unidad Didctica
ingresaremos a conocer a la Ciencia Estadstica tocando temas de Estadstica descriptiva
como conceptos bsicos, organizacin y presentacin de datos y medidas descriptivas. En la
Segunda Unidad Didctica desarrollaremos los temas de Estadstica Inferencial
empezaremos conociendo los mtodos de muestreo para realizar estimacin de parmetros y
pruebas de hiptesis; y en la Tercera Unidad Didctica los Mtodos de Pronstico aplicando
anlisis de regresin y de correlacin. En la parte final se hace entrega del manual del
programa estadstico SPSS el cul se desarrollar en las clases de laboratorio pero es
necesario que le dediquemos algunas horas adicionales en casa para poder reforzar su
aplicacin. Del mismo modo se presenta una gua rpida del Excel en comandos estadsticos,
sobre todo para la construccin de tableros de frecuencia y su representacin, para su
posterior anlisis e interpretacin.
Este material llega a sus manos con la intensin de guiarlos en su aprendizaje en esta
asignatura, pero as mismo debe ser complementada con la bibliografa propuesta en el
silabo del curso.
El Autor
UNIDAD DIDCTICA I
ESTADSTICA DESCRIPTVA
INTRODUCCIN
En esta primera unidad para poder entender a la Ciencia Estadstica empezaremos por una
de sus ramas principales como es la Estadstica Descriptiva.
La Estadstica Descriptiva se ocupa, como su nombre lo indica, de describir las caractersticas
de una muestra o de una poblacin a travs de recopilar, organizar, presentar y resumir datos que
facilite la interpretacin y as extraer conclusiones de su comportamiento.
En el Tema 01 iniciamos con conceptos bsicos para poder entendernos en un lenguaje
comn; en el Tema 02 conoceremos los diferentes mtodos de organizacin y presentacin de datos
mediante tablas de frecuencias y grficos estadsticos; para el Tema 03 aplicaremos medidas
descriptivas que nos permitan resumir un conjunto de datos.
APRENDIZAJES ESPERADOS
Conoce y aplica eficientemente mtodos y tcnicas de estadstica descriptiva como herramientas
para la toma de decisiones y valora reflexivamente su importancia en su quehacer profesional.
CONTENIDOS
Tema 1: Introduccin a la estadstica
Tema 2: Organizacin y presentacin de datos
Tema 3: Medidas descriptivas
TEMA 01
1.1 INTRODUCCIN A LA ESTADSTICA
1.1.1 DEFINICIN
El trmino estadstica se deriva de la palabra latina status, que significa estado. Los primeros
usos de la estadstica tienen que ver con la recopilacin de datos y la elaboracin de grficas
para describir diversos aspectos de un estado o un pas. En 1662, Jhon Graunt public
informacin estadstica acerca de los nacimientos y los decesos. Al trabajo de Graunt siguieron
estudios de tasas de mortalidad y de enfermedad, tamao de poblaciones, ingresos y tasas de
desempleo. En la actualidad los hogares, gobiernos y empresas se apoyan en la estadstica para
dirigir sus acciones.
Para muchas personas, estadstica significa descripciones numricas. Lo anterior puede
verificarse fcilmente al escuchar, un domingo cualquiera, a un comentarista de televisin narrar
un juego de ftbol. Sin embargo, en trminos ms precisos, la estadstica es el estudio de los
fenmenos aleatorios.
Uno de los aspectos ms importantes en estadstica es la posibilidad de obtener conclusiones
basadas en los datos observados. Este proceso se conoce como inferencia estadstica. Si una
conclusin obtenida para un indicador econmico importante, una posible concentracin de
cierto contaminante o si se pretende establecer una relacin entre la incidencia de cncer
pulmonar y el fumar, es muy probable que dicha conclusin est basada en la inferencia
estadstica.
1.1.2 RAMAS DE LA ESTADSTICA
La estadstica se divide en dos ramas que no son independientes; por el contrario, son
complementarias y entre ambas dan la suficiente ilustracin sobre una posible realidad futura,
con el fin de que quien tenga poder de decisin, tome las medidas necesarias para transformar
ese futuro o para mantener las condiciones existentes.
En atencin a su metodologa, por sus procedimientos y alcances bien definidos, la ciencia
estadstica se clasifica en:
1.1.2.1 ESTADSTICA DESCRIPTIVA O DEDUCTIVA:
1.1.3 OBJETIVOS
Los objetivos de la estadstica pueden ser clasificados en tres grandes captulos: descripcin,
anlisis y prediccin.
1.1.3.1 Descripcin de grandes colecciones de datos empricos reducindolos a un pequeo
nmero de caractersticas que concentra la parte ms importante y significativa de la
informacin proporcionada por los datos.
La descripcin supone que los datos que vienen expresados en su forma natural deben
ser clasificados y presentados sistemticamente en cuadros o tablas como una pequea
reduccin de datos, esto se obtiene cuando el comportamiento y caractersticas de los
datos se expresan por un conjunto de indicadores, medidas de resumen o estadgrafos.
La estadstica se inicia estudiando el problema, puesto que es un trabajo preliminar de
casi todas las investigaciones estadsticas; de este modo tanto como la reduccin como
la descripcin de la informacin se estudia en la Estadstica Descriptiva.
Es importante anotar que la descripcin estadstica de los fenmenos o hechos es el
primer aspecto al cual se redujo la ciencia estadstica durante mucho tiempo,
aplicndose especialmente a los datos demogrficos, sociales econmicos, etc.
1.1.3.2 Anlisis estadstico de datos experimentales y de los fenmenos observados, toda la
investigacin estadstica incluye un problema de anlisis, con el objeto de formarse un
concepto de la poblacin o universo y adoptar decisiones; en este caso no es necesario
observar toda a una poblacin sino que ser suficiente elegir una muestra
representativa. La preocupacin del anlisis estadstico es inferir propiedades para una
poblacin sobre la base de resultados muestrales conocidos. Aqu se presenta varios
problemas que presentan la Estadstica, la estimacin estadstica, el clculo de
probabilidades, las pruebas estadsticas, etc. stos son aspectos que corresponde
esencialmente a la Inferencia Estadstica.
Todo anlisis debe suponer la eleccin adecuada de una muestra representativa, la que
ser estudiada en detalle para obtener conclusiones o resultados, que dentro de ciertos
mrgenes de aceptacin sean vlidas a toda la poblacin de la cual fue elegida la
muestra.
1.1.3.3 Prediccin o comportamiento de los fenmenos en el futuro, lo cual constituye la
mxima aspiracin prctica de toda ciencia. Este objetivo de prediccin y previsin est
implcito tanto en la descripcin como en el anlisis estadstico, puesto que en general
interesa orientar la toma de decisiones con vigencia y afecto en el futuro.
Naturalmente que las estimaciones y proyecciones dependen del grado de conocimiento
del comportamiento del pasado y presente de las variables en estudio.
Para concretar estos objetivos, la Estadstica se vale por una parte del censo, que
recopila datos del todo, analiza la distribucin y variacin de las caractersticas de los
elementos que componen una poblacin claramente definida; por otra parte del
muestreo, que permite estimar o inferir caractersticas de un todo considerando una
parte representativa. Basndose en el anlisis de experiencias y evaluaciones pasadas y
actuales, hace estimaciones de fenmenos y caractersticas para un futuro, propone
valores esperados. La estadstica tambin se vale de una serie de artificios matemticos
y del clculo de probabilidades, para definir sobre la validez de supuestos, construir
modelos y mtodos estadsticos.
1.1.4.5 DATO
Es el valor, respuesta o registro que adquiere una caracterstica o variable asociado a un
elemento de la poblacin o muestra, como resultado de la observacin, entrevista o
recopilacin en general. Puede ser un nmero, una palabra o un smbolo.
1.1.4.6 VARIABLE
Es una caracterstica estudiada de las unidades estadsticas. Podemos mencionar los
siguientes tipos:
a. Segn la Naturaleza de la Variable
a.1 Variables Cualitativas o Estadsticas de Atributos
Cuando expresan una cualidad, caracterstica o atributo, sus datos se expresan
mediante una palabra, no es numrico. Por ejemplo: estado civil, los colores, lugar
de nacimiento, profesiones, actividad econmica, causas de accidentes, etc.
a.2 Variables Cuantitativas
Cuando el valor de la variable se expresa por una cantidad. El dato o valor puede
resultar de la operacin de contar o medir; por ejemplo: edad, nmero de hijos por
familia, ingresos, viviendas por centro poblado, niveles de desempleo, produccin,
utilidades de empresas, etc.
Las variables cuantitativas pueden ser: Discreta y Continua.
a.1.1 Variable Discreta
Cuando el valor de la variable resulta de la operacin de contar, su valor est
representado slo por nmeros naturales (enteros positivos); Ejemplos: hijos por
familia, nmero de accidentes por da, trabajadores por empresa, poblacin por
distritos, habitaciones por vivienda, etc.
a.1.2 Variable Continua
Cuando la variable es susceptible de medirse, es toda variable cuyo valor se
obtiene por medicin o comparacin con una unidad o patrn de medida. Las
variables continuas pueden tener cualquier valor dentro de su rango o recorrido,
por tanto se expresa por cualquier nmero real; Ejemplos: rea de parcelas,
ingresos monetarios, produccin de maz, peso, tiempo de servicios, horas
trabajadas, niveles de empleo, etc.
Ejemplo:
El diario nacional La Voz tiene 600 empleados, de los cuales el 35% son mujeres. Se realiza un
estudio a 100 de estos empleados. Se encontr que la edad promedio en el grupo analizado es
de 35 aos, que el 25% han estudiado en provincias, que 60 de estos trabajadores tienen a lo
ms 4 hijos y que 15 trabajadores ganan ms de $4000.
a. Identifique la poblacin, muestra y unidad elemental.
Poblacin:
Muestra:
Unidad de elemental o unidad de anlisis:
Informacin
Tipo
Escala
Edad
Lugar de estudio
Nmero de hijos por empleado
Sueldo
c.
Parmetro
En cada uno de los siguientes casos determine usted si el resultado es: parmetro,
observacin, variable, dato, informacin, estadstico o resultado de una inferencia estadstica.
a. El gerente del diario nacional La Voz observ que el Sr. Juan Tenorio, uno de los 600
empleados elegidos al azar, es casado, tiene 3 hijos, cuenta con grado de instruccin
superior y su ingreso mensual es de $1 500.
b.
Grado de instruccin
Superior
c.
Ejemplo:
La gerencia de relaciones pblicas de la empresa distribuidora de agua potable ha
realizado una campaa para promover el ahorro del agua potable de los hogares de Lima
Metropolitana y mejorar as la imagen de la empresa. Para determinar si la campaa ha dado
resultado, se realiz una encuesta a una muestra de hogares de Lima Metropolitana
obtenindose la siguiente informacin:
3
Poblacin
Muestra
Unidad
elemental
ACTIVIDAD N1
Presente de manera formal los siguiente:
PRIMERA PARTE: EJERCICIOS
1. Mediante un organizador de conocimientos resuma el contenido tratado en el Tema 01.
2. Los clientes que se suscriben al diario local La Voz deben llenar un formato con
informacin personal. Algunos de los datos solicitados se presentan a continuacin.
Clasifique cada una de ellos indicando el tipo de variable y su respectiva escala de medicin.
Profesin
Centro de labores
Direccin
Estado civil
Nacionalidad
Nmero de hijos
Fecha de nacimiento
Edad
Ingreso mensual
familiar
Grado de
instruccin
Nmero de telfono
Nmero de DNI
a.
b.
c.
d.
e.
f.
4. Se quiere hacer un estudio sobre las caractersticas ms importantes que debe tener una
pagina Web de un diario local.
b. Elabore un cuestionario que podra ser utilizado en el estudio, precisando para cada una
de ellas el tipo de variable y escala de medicin.
5. Analistas y Consultores realiz un estudio de mercado en el distrito de El Tambo con la
finalidad de analizar las posibilidades de instalar cabinas de Internet en la zona. Seleccion
una muestra de 200 hogares, encuestndoles sobre lo siguiente:
a.
b.
c.
d.
Ingreso familiar
Nmero de miembros de la familia
Grado de instruccin del jefe de la familia
Si tienen Internet en el hogar.
Del estudio de la muestra se encontr que el promedio del ingreso familiar es de 2500 soles,
el 30 % de hogares tienen Internet. Responda lo siguiente:
a.
b.
c.
d.
6. Un diario local desea analizar qu tanta gente que adquiere el diario, estara interesada por
que se ofrezcan recetas de comidas tpicas de diferentes regiones del pas. Para ello de un
total de 2000 personas suscritas al diario, de las cuales el 70% son hombres. Se selecciona
aleatoriamente a 300 de las personas suscritas y se les consulta al respecto. Se encontr
que al 60% tiene mucho inters en recetas de comida tpica, 5 personas tienen su
restaurante, la edad promedio de las personas entrevistadas es de 30 aos, 10 de ellas
proceden de la Selva.
10
TEMA 02
1.2 ORGANIZACIN Y PRESENTACIN DE DATOS
La siguiente fase a la recoleccin de datos es la crtica de campo, lo que significa realizar la
validacin y consistencia de los datos obtenidos durante el trabajo de campo, con la finalidad que en
la fase de Organizacin y Clasificacin de los Datos sea consistente y veraz los datos a
procesarse, analizarse y con la cual se va tomar decisiones.
1.2.1 CONCEPTOS BSICOS
Para iniciar la organizacin de datos definiremos algunos conceptos:
1.2.1.1 Clase
Es una divisin de la variable. Se denota como subndice con la letra i y el nmero total de
clases con m.
1.2.1.2 Frecuencia
Es las veces que se repite una clase de la variable. stas son: Simples y Acumuladas
a. Frecuencia Simple: Es aquella frecuencia que slo correspondes a una clase de la
variable entre ellas tenemos:
a.1 Frecuencia Absoluta Simple
La frecuencia absoluta simple de la clase ci es el nmero fi, de observaciones que
presentan una modalidad perteneciente a esa clase.
m
f
i 1
hi
fi
n
Obsrvese que fi es el tanto por uno de observaciones que estn en la clase ci.
m
Tambin cumple:
h
i 1
pi hi *100
m
Cumple lo siguiente:
p
i 1
100
Fi f1 f 2 .... f i f k
k 1
11
Hi
i
Fi
h1 h2 ... hi hk
n
k 1
Pi H i *100 p1 p2 ... pi pk
k 1
fi
hi
pi
X1
X2
..
.
Xm
Total
f1
f2
.
.
fm
N
h1=f1/n
h2=f2/n
.
.
hm =fm/n
1
p1 =h1*100
p2 =h2*100
.
.
pm=hm*100
100
b. Variable cuantitativa
b.1 Cuantitativa Discreta
Si los datos son discretos y no hay mucha variabilidad se presentarn directamente
cada valor de la variable y sus respectivas frecuencias. El procedimiento ms simple
es listar los n datos en forma ascendente y luego elaborar la tabla de distribucin de
frecuencias indicando para cada valor de la variable su respectiva frecuencia con la
que aparece en la serie.
CLASE
X1
X2
X3
.
Xm
Total
fi
f1
f2
f3
.
.
fm
N
Fi
F1 = f 1
F2 = F1 + f 2
F3= F2 + f3
Fm = n
hi
h1=f1/n
h2=f2/n
h3=f3/n
.
.
hm=fm/n
1
12
Hi
H1 = h1
H2 = H1 + h2
H3= H2 + h3
Hm = 1
pi
p1
p2
p3
.
.
Pm
100
Pi
P1 = p1
P2 = P1 + p2
P3= P2 + p3
Pm = 100
Partiendo del dato de menor valor Xmin se determinan cada uno de los lmites de
intervalos sumando la amplitud de clase a cada valor obtenido.
Si los datos son cuantitativos discretos se cumple el punto anterior, pero tambin se
puede tomar todos los lmites de intervalos cerrados si el valor del lmite superior de
un intervalo es una unidad menor que el lmite inferior del siguiente intervalo.
5. Calcule la marca de clase o centro de clase X:
yi>
xi
X1= Mn + Mn+a
Mn Mn +a
2
X2= Mn +a+ Mn+2a
Mn+a Mn+2a
2
X3= Mn +2a+ Mn+3a
Mn+2a Mn+3a
2
.
.
.
.
Xm= Mn +ka+ Mx
Mn+ka Mx
2
Total
fi
Fi
hi
Hi
pi
Pi
f1
F 1 = f1
h1=f1/n
H1 = h1
p1
P1 = p1
p2
P2 = p1 +
p2
f2
F2 = f1 + f2 h2=f2/n H2 = h1 + h2
f3
F3
h3=f3/n
H3
p3
P3
.
.
.
.
.
.
Hm = 1
pm
Pm = 100
.
.
.
.
fm
Fm = n
hm
100
13
INTERRUPCIONES
3 0 1 2 2 5
15
0.2885
28.85
0.1538
15.38
0.1154
11.54
0.0385
3.85
0.0192
1.92
Total
52
100
De donde podemos interpretar que es usual que se produzcan tres o menos interrupciones por
semana en el sistema de red de dicha universidad.
Ejemplo: El jefe de la Oficina de Rentas de una Municipalidad ha realizado un estudio sobre los
impuestos que pagan los vecinos del distrito. La tabla en Excel muestra los pagos de impuestos,
en nuevos soles de 48 viviendas elegidas al azar en el 2013.
145,1
151,0
159,0
195,6
216,3
225,9
227,1
231,2
252,5
257,1
259,2
262,5
303,6
305,8
315,4
315,5
196,9
202,6
204,9
206,1
234,8
238,4
239,9
241,1
265,2
271,0
286,7
288,1
317,2
320,2
324,8
331,1
206,5
208,0
208,0
209,3
242,9
244,0
247,7
249,5
289,1
291,0
291,9
294,5
331,7
344,6
346,7
351,1
La tabla de frecuencias para la variable pago por impuestos municipales ao 2013 sera:
Mximo
351,1
Mnimo
145,1
Rango
206
48
6,585
08
7
k (entero)
w (Amplitud)
N. de decimales de los datos
datos
w (redondeada)
14
29,42
86
1
29,5
[145,1
]174,6
]204,1
]233,6
]263,1
]292,6
]322,1
;
;
;
;
;
;
;
Marca de clase
174,6]
204,1]
233,6]
263,1]
292,6]
322,1]
351,6]
fi
3
3
10
12
7
7
6
48
159,8
5
189,3
5
218,8
5
248,3
5
277,8
5
307,3
5
336,8
5
Total
hi
0,0625
0,0625
0,2084
0,2500
0,1458
0,1458
0,1250
Fi
3
6
16
28
35
42
48
Hi
0,0625
0,1250
0,3334
0,5834
0,7292
0,8750
1,0000
f2 = 3
F2 = 6
h3 = 0,2084
H3 = 0,3334
Ejercicio
A continuacin, se muestra el tiempo de servicio, en meses, de los trabajadores del rea de servicios
de una gran empresa. Usando la regla de Sturges construya la tabla de distribucin de frecuencias,
10
16
21
21
23
24
25
31
31
33
38
39
39
40
40
40
40
40
43
43
43
43
43
44
44
44
46
46
47
48
Solucin
Clculo de los lmites de los intervalos
Mximo
Mnimo
Rango
Cantidad de datos (n)
k (por regla de Sturges)
k (entero)
w (Amplitud)
N. de decimales de los datos
w (redondeada)
15
51
51
52
53
53
53
53
53
54
54
55
55
55
55
55
57
57
58
62
65
Marca de clase
fi
hi
Fi
Hi
Interprete:
[yi-1 yi>
[xi-1 xi>
[x1
x2>
[x2
x3>
[x3
x4>
[xm-1
... ..
[yn-1 yn>
fi.
f11
f12
f13
f14
f1n
f1.
f21
f22
f23
f24
f2n
f2.
f31
f32
f33
f34
f3n
f3.
fm1
fm2
fm3
fm4
fmn
fm.
f.1
f.2
f.3
f.4
f.n
xm>
f.j
16
De igual manera se puede construir tablas bivariantes para frecuencias relativas o porcentuales
de acuerdo a las necesidades de presentacin de informacin.
Ejemplo:
Distribucin de individuos
por gnero
musical
y grado
identificacin
del candidato.
Tabla de contingencia
Identifi
ca al candi
dato * de
Gnero
musical
Identif ica al
candidat o
Plenamente
Medianamente
No ident if ica
Total
Recuent o
% de I dent if ica al
candidat o
% de Gnero musical
% del total
Recuent o
% de I dent if ica al
candidat o
% de Gnero musical
% del total
Recuent o
% de I dent if ica al
candidat o
% de Gnero musical
% del total
Recuent o
% de I dent if ica al
candidat o
% de Gnero musical
% del total
Gnero musical
Reggaet on
Vals
Cumbia
149
97
55
Total
301
49.5%
32.2%
18.3%
100.0%
84.2%
35.1%
12
63.0%
22.8%
30
58.5%
12.9%
35
70.8%
70.8%
77
15.6%
39.0%
45.5%
100.0%
6.8%
2.8%
16
19.5%
7.1%
27
37.2%
8.2%
4
18.1%
18.1%
47
34.0%
57.4%
8.5%
100.0%
9.0%
3.8%
177
17.5%
6.4%
154
4.3%
.9%
94
11.1%
11.1%
425
41.6%
36.2%
22.1%
100.0%
100.0%
41.6%
100.0%
36.2%
100.0%
22.1%
100.0%
100.0%
Los datos tambin pueden ser representados en barras apiladas de porcentajes donde la
cantidad para cada valor de la variable elegida para el eje horizontal representa el total parcial (o
el 100%) y las cantidades (o los porcentajes) de la segunda variable van a dar lugar a dicha
cantidad (o el 100%).
Distribucin de individuos
segn identificacin de un
candidato por gnero musical
100%
80%
9%
7%
4%
50%
37%
40%
18%
19%
6%
7%
30%
60%
40%
4%
3%
84%
63%
20%
20%
59%
35%
1%
8%
23%
10%
13%
0%
0%
Reggaeton
Plenamente
Vals
Reggaeton
Cumbia
Medianamente
Plenamente
Vals
Medianamente
Cumbia
No identifica
17
18
Fuente: DATUM
19
Fuente: DATUM
Fuente: DATUM
d. Histograma de Frecuencias:
Es un grfico de barra pero unidas. Se utiliza bsicamente para mostrar la
distribucin de frecuencias de variables cuantitativas. El histograma se construye
dibujando barras contiguas que tienen como base la amplitud de cada intervalo y
como alturas las frecuencias respectivas.
20
e. Polgono de Frecuencias:
Es un grfico poligonal cerrado. Se utiliza bsicamente para mostrar la distribucin
de frecuencias de variables cuantitativas. Para la construccin de un polgono de
frecuencias, se marcan los puntos medios (marcas de clase) de cada uno los
intervalos en la parte superior de cada barra del histograma de frecuencias, los
cuales se unen con segmentos de recta.
Frecuencia de Visitas externas a la Piscina de un Colegio Privado
21
Precio (Dlares)
h. Pictograma:
Tiene la caracterstica de que las unidades de la variable se debe representar con
smbolos que lo identifique y su tamao va en relacin a la frecuencia de la
categora de la variable
i. Pirmide:
Se utiliza principalmente para presentar la distribucin de la poblacin por grupos
etreos y gnero
Varn
Mujer
+70
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15%
10%
5%
0%
5%
10%
15%
22
j. Mapa:
Se utiliza principalmente para presentar informacin estadstica por zonas geogrficas
de un pas, regin, etc.
k. Diagrama de Pareto
El diagrama de Pareto es una representacin grfica que permite identificar y
seleccionar los aspectos prioritarios que hay que tratar en un determinado problema.
Tambin se conoce como diagrama ABC o Ley de las prioridades 20-80, que dice: el
80% de los problemas que ocurren en cualquier actividad son ocasionados por el 20%
de los elementos que intervienen en producirlos. Sirve para conseguir el mayor nivel
de mejora con el menor esfuerzo posible. El objetivo de esta representacin es
clasificar dichos elementos es en dos grupos: los pocos vitales y los muchos triviales.
Los pasos para la elaboracin del diagrama de Pareto son:
Construya
23
Ahora debemos agregar el eje secundario. Para ello se selecciona la grfica de lnea y
en las opciones de Formato elige trazar el eje secundario.
24
Ahora que tenemos un diagrama de Pareto bsico podemos terminar dndole algn
formato especial y de manera opcional agregar una lnea que muestre una constante
del 80%
ACTIVIDAD N2
Resuelva los ejercicios propuestos a continuacin utilizando el archivo ACTIVIDAD N2 y presntelos
de manera formal, puedes realizar el trabajo en el Excel o de manera analtica. Para ambos casos
presenta el desarrollo paso por paso, tablero de frecuencia, grfico y tres interpretaciones por cada
caso.
1. Los sistemas de cmputo colapsan por muchas razones, entre ellas las fallas de hardware o
software, errores del operador, sobrecargas del sistema mismo y a otras causas. Los resultados
obtenidos en un estudio acerca de las causas de colapso en una muestra de 98 sistemas de
cmputo se encuentran en la hoja Colapso. Suponga que se debe priorizar entre las dos
principales causas de colapso de los sistemas de cmputo. Elaborar un grfico adecuado que
permita establecer una estrategia apropiada.
2. El tiempo de inactividad es la cantidad del tiempo en el que un sistema de computadora no opera
debido a una falla de hardware y software. Cuando el sistema se encuentra inactivo durante ms
de una hora todos los archivos de trabajo actuales se pierden. Los datos agrupados en la hoja
Inactividad corresponden a los tiempos de inactividad (en minutos) registrados en una muestra
de 30 y 28 sistemas de computadoras del turno maana y tarde respectivamente.
Turno maana
i
1
2
3
4
5
6
Lim Inf
20.5
25.5
30.5
35.5
40.5
45.5
Lim Sup
25.5
30.5
35.5
40.5
45.5
50.5
Marca
23
28
33
38
43
48
30
Turno tarde
f
28
a. Construir el polgono de frecuencias para los datos agrupados del turno maana y tarde en un
solo grfico.
b. Elaborar un informe sustentado en el grfico obtenido en el punto anterior.
3. Una distribuidora de circuitos integrados para computadoras vende su producto en lotes de 100
circuitos. Para la inspeccin de calidad se examinan 20 circuitos elegidos al azar de cada lote y
se rechaza en caso de encontrar ms de 4 circuitos defectuosos. Los datos en la hoja Circuitos
muestra el nmero de circuitos defectuosos luego de inspeccionar 52 lotes. Construir una tabla de
distribucin frecuencias para la variable en estudio.
4. Se quiere comparar los resultados obtenidos por tres operadores, en cuanto a los tiempos (en
minutos) utilizados en el restablecimiento de servicio de redes en el sistema de una importante
entidad bancaria. Los resultados obtenidos se encuentran en la hoja Operador.
a. Construir las tablas de distribucin de frecuencias para los tres operadores por separado. Use
la regla de Sturges.
b. Construir los histogramas respectivos. Use la frecuencia relativa simple para cada grfico.
c. Elaborar un informe sustentado en los grficos obtenidos en el punto anterior.
5. El jefe del rea de sistemas de una empresa realiz un estudio para analizar el tiempo que
demoran los empleados en detectar y resolver un problema informtico de software o hardware.
25
El estudio trata de estudiar las diferencias de tiempos en los turnos de trabajo A y B de una
empresa. La hoja Tiempo muestra los datos obtenidos para una muestra de 40 problemas
informticos presentados en el turno A y 100 problemas informticos presentados en el turno B.
a. Construir la tabla de distribucin de frecuencias para el turno A. Use la regla de Sturges.
b. Construir los histogramas respectivos. Use la frecuencia relativa simple para cada grfico.
c. Elaborar un informe sustentado en los grficos obtenidos en el punto anterior.
6. Se tiene informacin sobre los problemas de soporte tcnico encontrados durante la instalacin y
configuracin de Exchange 2000 Server y Exchange Server 2003. Construya un grfico apropiado
para poder identificar los problemas principales. Los datos se encuentran en la hoja Instalacin.
La descripcin de los problemas mencionados y la tabla de distribucin de frecuencias se
muestran a continuacin.
Problema
A
B
C
D
E
F
Otros
Descripcin
Error de actualizacin de Exchange Server 5.5
Permisos insuficientes
Problemas con el sistema de nombres de dominio (DNS)
Forestprep o Domainprep no finalizaron correctamente
Permisos de Active Directory insuficientes
Falta el contenedor de conexiones de Active Directory
Otros problemas
Problema
A
B
C
D
E
F
Otros
f
200
150
100
50
30
20
10
560
h
0.357
0.268
0.179
0.089
0.054
0.036
0.018
F
200
350
450
500
530
550
560
H
0.357
0.625
0.804
0.893
0.946
0.982
1.000
ACTIVIDAD ADICIONAL
1. Alpha Soft es una compaa dedicada a brindar servicios informticos a empresas que deseen
tener una presencia firme y contundente en la red. Esta compaa se dedica al tendido de redes
LAN, instalacin de equipos, servidores y toda una gama de productos tecnolgicos que puedan
resultar imprescindibles para una empresa. Como parte de un estudio realizado por Alpha Soft se
analiza la informacin correspondiente a las siguientes variables:
I.
II.
III.
IV.
V.
26
com.pe
org.pe
edu.pe
gob.pe
net.pe
Otros
285
106
64
26
3
16
0.570
0.212
0.128
0.052
0.006
0.032
57.0
21.2
12.8
5.2
0.6
3.2
500
f
20
15
8
6
2
1
52
27
TEMA 03
1.3 MEDIDAS DESCRIPTIVAS
En los temas anteriores, se trat sobre la clasificacin, ordenacin y presentacin de datos
estadsticos en distribuciones de frecuencia, limitando el anlisis de la informacin a su interpretacin
porcentual.
Una distribucin de frecuencias presenta siempre varios valores. Si tratamos de saber cules de
estos valores por s solos definen mejor al conjunto, no es posible decidir por cual de ellos.
El anlisis estadstico propiamente dicho, parte de la bsqueda de parmetros sobre los cuales pueda
recaer la representacin de toda la informacin, realizndose esta representacin en las medidas
descriptivas o tambin denominadas medidas de resumen.
Las principales medidas descriptivas se clasifican en:
1.3.1 Medidas de Tendencia Central y Posicin1.3.3 Medidas de Asimetra
1.3.2 Medidas de Dispersin1.3.4 Medidas de Kurtosis
x
b. Clculo de la Media
La media, media aritmtica o promedio de un conjunto de datos es la suma de dichos valores
dividida entre el nmero total de datos.
Datos no agrupados
28
Media poblacional:
1
N
xi Media muestral: x
1
N
i 1
1 n
xi
n i 1
Datos agrupados
Media poblacional:
i 1
/
i
f i Media muestral: x
1 k /
xi f i
n i 1
Ejemplo :
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas de
la ciudad fueron:
10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 17
13 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39
Calcule e interprete la media.
Solucin:
Obtenemos
10 12 40 10 30 ... 39
20.125
32
xi f i
n
X xi hi
10
15
20
40
24
15
12
Solucin:
Completando la siguiente tabla para el clculo de la media aritmtica
N de Plizas
1
2
3
4
5
6
7
8
9
Total
Vendedores
2
10
15
20
40
24
15
12
2
29
Xi*fi
2
20
45
80
200
144
105
96
18
710
El promedio es:
fi
710
5.07
140
Interpretacin:
El nmero de plizas que se venden en promedio en dicha empresa es 5.
Ejemplo 3: Variable Continua
El siguiente cuadro muestra las ventas registradas en 388 facturas de la Empresa
Pasaly, calcule e interprete la venta promedio por factura.
Montos
Facturas
1 500 - 2 900
27
2 900 - 5 700
58
5 700 - 8 700
216
8 700 - 11 000
52
11 000 - 14 000
23
14 000 - 17 000
12
Solucin:
Completando la siguiente tabla para el clculo de la media aritmtica
Montos
Facturas
Xi
Xi*fi
1 500 - 2 900
27
2200
59400
2 900 - 5 700
58
4300
249400
5 700 - 8 700
216
7200
1555200
8 700 - 11 000
52
9850
512200
11 000 - 14 000
23
12500
287500
14 000 - 17 000
12
15500
Total
388
El promedio es:
186000
2849700
fi
2849700
7344.59
388
- La suma de las diferencias cuadrticas de los datos, con respecto a la Media Aritmtica,
es mnima.
- La media aritmtica de una constante es la misma constante.
- Si a cada uno de los resultados le sumamos o le restamos una constante k , la Media
Aritmtica queda alterada en esa constante.
- Si cada uno de los datos se multiplica por una constante k, entonces la media aritmtica
queda multiplicada por esa constante
- La media aritmtica de la suma o diferencia de dos variables es la suma o diferencia de
sus medias.
30
17
39
18
40
n 32
16
2 2
Se elige los valores centrales de la variable que tiene la posicin i=16 y i=17 que para
el ejercicio son 18 y 18
31
La mediana ser:
Me
18 18
Me 18
2
Interpretacin:
El 50% de las pequeas empresas han invertido como mximo 18 mil nuevos soles al
ao.
Ejemplo: Si el nmero de datos es impar
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas de
la ciudad fueron:
10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 17 18
13 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39
Calcule e interprete la mediana.
Solucin:
Primero debemos ordenar los datos en forma ascendente (de menor a mayor)
10
18
10
19
10
20
11
20
12
21
13
22
13
25
14
26
14
27
14
28
15
30
15
30
16
30
17
30
17
39
18
40
18
n 33
16,5
2 2
Mediana muestral: me
donde
Li
Li
wN
Fi 1
fi 2
w n
Fi 1
fi 2
32
N de
Plizas
Vendedores
10
15
20
40
24
15
12
n 140
70
2
2
Entonces ubicamos en la tabla el valor que tenga la posicin 70, para eso calculamos
la frecuencia acumulada. Como regla prctica se busca el primer valor en el F
acumulado que contenga a al n/2, en este caso es el F5 cuyo valor es 87 siendo
mayor que 70 por primera vez en el acumulado.
N de
Plizas
Vendedores
Fi
10
12
15
27
20
47
40
87
24
111
15
126
12
138
140
Me 5
Interpretacin:
El 50% de los vendedores vende 5 o ms plizas .
33
Montos
Facturas
1 500 - 2 900
27
2 900 - 5 700
58
5 700 - 8 700
216
8 700 - 11 000
52
11 000 - 14 000
23
14 000 - 17 000
12
Me Li j w j
n / 2 F j 1
debemos encontrar la
fj
La clase mediana es aquella que contiene a la mitad de del conjunto de datos, esto es
el que contenga la posicin
n 388
acumulada:
Montos
Facturas
Fi
27
27
1 500 - 2 900
2 900 - 5 700
58
85
5 700 - 8 700
216
301
8 700 - 11 000
52
353
11 000 - 14 000
23
376
14 000 - 17 000
12
388
Total
388
194 85
Me 5700 3000(
) 7213.9
216
Interpretacin:
____________________________________________________________________
____________________________________________________________________
1.3.1.3 MODA
Entendemos por moda el valor de la variable que ms veces se repite, y en una distribucin
de frecuencias el valor con mayor frecuencia absoluta simple
Puede darse el caso de que no haya moda (amodal), slo una (unimodal), dos modas
(bimodal) o varias modas (multimodal).
a. Simbologa
Se simboliza con Mo
b. Clculo de la Moda
b.1 Para Datos no agrupados
En este caso la determinacin de la moda es inmediata por simple observacin. Aquel
valor de la variable con mayor frecuencia es la moda.
34
Ejemplo:
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas de
la ciudad fueron:
10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 17
13 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39
Calcule e interprete la moda.
Solucin:
Buscamos el valor que ms se repita, en este caso es:
Mo 30
Interpretacin: Las pequeas empresas con mayor frecuencia han invertido 30 mil
nuevos soles al ao.
b.2 Para Datos Agrupados
El primer paso es identificar el intervalo con mayor frecuencia absoluta simple. Dicho
intervalo ser el que contenga el valor de la moda.
d1
w
d1 d 2
d1
Moda muestral: mo L i w
d
d
2
1
Moda poblacional: Mo Li
Vendedores
10
15
20
40
24
15
12
9
Calcular e interpretar la Moda.
Solucin:
El clculo es bastante sencillo, slo ubicamos el valor que tenga la mayor frecuencia,
que para el ejercicio es: Mo 5
Interpretacin:
En dicha empresa es usual vender 5 plizas por semana.
35
Facturas
1 500 - 2 900
27
2 900 - 5 700
58
5 700 - 8 700
216
8 700 - 11 000
52
11 000 - 14 000
23
14 000 - 17 000
12
Montos
Facturas
Solucin:
1 500 - 2 900
27
2 900 - 5 700
58
5 700 - 8 700
216
8 700 - 11 000
52
11 000 - 14 000
23
14 000 - 17 000
12
d1
mo L i w
d1 d 2
216 58
7172.05
mo 5700 3000
(216 58) (216 52)
Interpretacin: El monto de facturacin que ms se repite es de 7172.05
Ejemplo: Las medidas de tendencia central se pueden obtener para los datos
agrupados del turno maana de una empresa respecto al tiempo de produccin de
cierto producto de la siguiente forma:
36
Turno maana
h
F
H
0.0333 1 0.0333
0.1000 4 0.1333
0.0000 4 0.1333
0.0667 6 0.2000
0.6667 26 0.8667
0.1333 30 1.0000
30
1 6 /
1
xi f i 1235 41.17 minutos
30 i 1
30
5 30
18
Moda muestral: mo 40.5 5
43.15 minutos
18 16
Media muestral:
37
xw
xw
i 1
n
w
i 1
donde
Ejemplo: Una empresa tiene tres turnos de trabajo en sus dos locales. Los trabajadores en
cada uno de estos turnos participan de acuerdo a la siguiente tabla:
Turno
Maana
Tarde
Noche
Salario
por hora
(S/.)
12
15
18
Local 2
50
20
10
40
35
25
Local 1:
xw
Local 2:
xw
12 50 15 20 18 10
50 20 10
12 40 15 35 18 25
40 35 25
38
n 1
.k
100
Identificacin:
Si la posicin del centil es un nmero entero, el centil buscado ser el dato que ocupa dicha
posicin en la serie ordenada.
Si la posicin del centil no es un valor entero, es decir, el centil est entre dos valores
ubicados consecutivamente, entonces el valor del centil se obtiene de la siguiente expresin:
n
.k
100
Identificacin:
Identificamos primero la clase en la que se encuentra el centil Pk. El valor del centil se
determina por al siguiente expresin:
Pk Li
w n.k
(
F)
f 100
donde:
Li : lmite inferior de la clase del centil.
f : frecuencia de la clase del centil.
F : frecuencia acumulada de la clase que precede a la clase del centil.
w : amplitud de clase.
n : nmero de datos.
Ejemplo
Como ejemplo efectuamos el clculo del primer cuartil Q1. En primer lugar tomemos los datos
no agrupados correspondientes a las edades de los 80 estudiantes entrevistados cuyos
resultados se encuentran en la siguiente tabla:
39
Estudiante
peso
estudiante
peso
estudiante
peso
estudiante
peso
1
2
3
4
5
6
9
10
11
12
13
14
15
16
1
1
19
20
45
4
51
51
52
52
53
53
54
54
55
55
56
56
5
5
5
5
5
59
21
22
23
24
25
26
2
2
29
30
31
32
33
34
35
36
3
3
39
40
59
59
60
60
60
60
61
61
61
61
62
62
62
62
63
63
63
63
64
64
41
42
43
44
45
46
4
4
49
50
51
52
53
54
55
56
5
5
59
60
64
64
65
65
65
65
66
66
66
66
6
6
6
6
6
6
6
6
6
69
61
62
63
64
65
66
6
6
69
0
1
2
3
4
5
6
9
0
69
0
0
1
2
3
4
5
5
6
6
9
0
1
4
5
Solucin:
El primer cuartil Q1 es equivalente al 25 centil P25,
Localizacin:
n +1
80 + 1
.k=
. 25 = 20,25a
100
100
Identificacin:
Est entre el dato 20 y el dato 21 , como ambos datos tienen un valor de 59, entonces el
valor del primer cuartil es 59.
Ahora consideremos los mismos datos pero agrupados en clases . El primer cuartil Q1 es:
Clase
45 51
51 57
57 63
63 69
69 75
75 81
81 87
Marca
de clase f F
x
48
4 4
54
13 17
60
21 38
66
23 61
72
8 69
78
8 77
84
3 80
Localizacin:
n
. 25 = 20o
100
El dato 20 se encuentra en la clase 57 63.
Identificacin:
Q1 P25 57
6 80 . 25
(
17) 58,86
20 100
40
Vendedores
10
15
20
40
24
15
12
Total
140
Vendedores
Fi
10
12
15
27
20
47
40
87
24
111
15
126
12
138
140
Q1 P25 4
1. Q1=
5. D9=
41
2. Q2=
6. P5=
3. Q3=
7. P78=
4. D1=
8. P99=
Facturas
1 500 - 2 900
27
2 900 - 5 700
58
5 700 - 8 700
216
8 700 - 11 000
52
11 000 - 14 000
23
14 000 - 17 000
12
Total
388
Pi Li j w j
i %n
25(388)
frecuencia acumulada:
Montos
Facturas
Fi
1 500 - 2 900
27
27
2 900 - 5 700
58
85
5 700 - 8 700
216
301
8 700 - 11 000
52
353
11 000 - 14 000
23
376
14 000 - 17 000
12
388
Total
388
42
97 85
) 5866.7
216
Interpretacin: Hay un 25% de facturas con montos menores o iguales que 5866.7.
1. Q1=
5. D9=
2. Q2=
6. P55=
3. Q3=
7. P78=
4. D1=
8. P99=
ACTIVIDAD N3
Resuelve formalmente los siguientes problemas con la ayuda del Excel o de manera analtica y
presntalos en el folder del curso.
1.
Los datos mostrados en la siguiente tabla corresponden a la vida (en aos) de 48 bateras
similares de automvil de la marca Enigma. El fabricante de las bateras garantiza que stas
duran tres aos.
2,2
3,4
2,5
3,3
4,7
1,7
4,1
1,6
4,3
3,1
3,8
2,3
3,5
3,1
3,4
3,7
3,2
2,6
4,5
3,3
3,6
4,4
2,6
3,2
3,2
3,8
2,9
3,2
3,9
3,5
3,7
3,1
3,3
4,1
3,0
4,3
3,0
4,7
3,9
2,0
4,2
4,8
2,6
3,7
3,1
3,4
3,5
4,0
b. Elabore la tabla de distribucin de frecuencias tomando en cuenta que se desea que los
datos estn agrupados en intervalos, que el lmite inferior del primer intervalo sea 1,5
aos y que la amplitud de intervalo sea de medio ao.
c. Elabore el histograma y la ojiva correspondiente.
d. Con los datos ofrecidos, es posible saber qu porcentaje de la produccin de bateras
marca Enigma supera el periodo de garanta indicado por el fabricante?. Sustente su
respuesta.
e. Tomando en cuenta la tabla de distribucin de frecuencias, calcule las medidas de
tendencia central.
f. Elabore un breve informe con las conclusiones del anlisis de los resultados obtenidos.
43
2.
En una planta que fabrica 4 modelos de motos y se quiere resolver un problema de fallas
reportadas en las ltimas 12 semanas, para lo cual se recopil la siguiente informacin:
Falla de frenos
Falla de transmisin
Falla de encendido
Falla en las luces
Falla de ensamblaje
Falla en la suspensin
Falla en acabados
Modelo M18
3
6
3
2
8
4
3
Modelo M19
12
42
9
6
61
3
38
Modelo M20
4
1
2
1
9
4
2
Modelo M21
9
30
6
3
28
2
18
Utilizando el diagrama de Pareto, analice los datos presentados y decida cul es la estrategia
ms conveniente para enfrentar los problemas en la planta.
3.
Las notas que obtuvieron 120 alumnos en el examen parcial de Nivelacin de Matemticas
son presentadas parcialmente en la siguiente tabla:
Clase
6-
Marca
de clase
xi
frecuencia
absoluta
fi
frecuencia
relativa
hi
0,15
Frec. abs.
acumulada
Fi
Frec. rel.
acumulada
Hi
0,45
0,70
13,5
0,10
a. Si se desea analizar el rendimiento que han tenido los alumnos en dicho examen, defina
con precisin la poblacin objetivo, la unidad de anlisis, la variable, su tipo y su escala de
medicin.
b. Complete la tabla de distribucin de frecuencias y luego elabore la ojiva correspondiente
e indique qu porcentaje de las notas se encuentren aproximadamente en el intervalo [4, 14].
c.
4.
8,05
8,72
8,72
8,80
9,55
9,70
9,73
9,80
9,80
9,84
Ubicacin antigua
9,84
9,87
9,87
9,95
9,97
9,98
9,98
10,00
10,01
10,02
10,03
10,05
10,05
10,12
10,15
10,15
10,26
10,26
10,29
10,55
8,51
8,65
8,68
8,72
8,78
8,80
8,82
8,82
8,83
9,14
Ubicacin nueva
9,19
9,55
9,27
9,60
9,35
9,63
9,36
9,64
9,37
9,70
9,39
9,75
9,43
9,85
9,48
9,87
9,49
9,95
9,54
9,98
10,01
10,03
10,05
10,05
10,09
10,10
10,12
10,12
10,15
10,15
a. Elabore las tablas de distribucin de frecuencias de los datos de ambas muestras de tal
manera que permita su comparacin apropiadamente.
44
Marca A
684
831
859
893
922
939
972
1 016
Marca B
697
835
860
899
924
943
977
1 041
720
848
868
905
926
946
984
1 052
773
852
870
909
926
954
1 005
1 080
821
852
876
911
938
971
1 014
1 093
819
907
952
994
1 016
1 038
1 096
1 153
836
912
959
1 004
1 018
1 072
1 100
1 154
888
918
962
1 005
1 020
1 077
1 113
1 174
897
942
986
1 007
1 022
1 077
1 113
1 188
903
943
992
1 015
1 034
1 082
1 116
1 230
a. Agrupe los datos de cada muestra en clases y elabore las respectivas tablas de
b.
c.
d.
e.
6.
distribucin de frecuencias.
Compare en un solo cuadro los polgonos de frecuencias de ambas muestras. Interprete.
Grafique las ojivas de cada muestra en una misma grfica.
Calcule la media, mediana y moda de cada marca.
Elabore un breve informe en el que presente el anlisis y las conclusiones de los
resultados obtenidos.
Modelos de automviles
estadounidenses
Nmero
Porcentaje
1
4,0
2
8,0
3
12,0
4
16,0
8
32,0
11
44,0
17
68,0
21
84,0
23
92,0
25
100,0
25
100,0
Modelos de automviles
Europeos
Nmero
Porcentaje
1
1,4
4
5,6
19
26,4
32
44,4
54
75,0
61
84,7
68
94,4
68
94,4
70
97,2
71
98,6
72
100,0
45
DM
i 1
xi x
DM
46
x
i 1
x fi
n
1.3.2.4 VARIANZA
La varianza es uno de los parmetros ms importantes en estadstica paramtrica, se
puede decir que, teniendo conocimiento de la varianza de una poblacin, se ha
avanzado mucho en el conocimiento de la poblacin misma.
Numricamente definimos la varianza, como desviacin cuadrtica media de los datos
con respecto a la media aritmtica.
La varianza nos mide la mayor o menor representatividad de la media aritmtica:
- Si la varianza es grande nos indica gran dispersin, la media aritmtica no es
representativa.
- Si casi todos los valores estn muy cercanos a la media aritmtica entonces la
varianza se acercar a cero, con lo que se dice que la serie es concentrada.
- La varianza nunca puede ser negativa.
De su forma de clculo se desprenden dos problemas:
- Se expresa en unidades cuadradas (nuevos soles cuadrados, minutos cuadrados,
etc.)
- Si la media aritmtica no es una buena medida de tendencia central, la varianza que
se basa en ella tampoco ser una buena medida de dispersin.
a. Simbologa
2
S : Varianza de la muestra
2
: Varianza de la Poblacin
b. Clculo de la Varianza
b.1 Para Datos no Agrupados
- Varianza de la Muestra
s2
- Varianza de la Poblacin
x x
n
i 1
x
N
n 1
i 1
Ejemplo:
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas
de la ciudad fueron:
10
13
12
17
40
21
10
14
30
15
14
19
16
27
20
22
25
14
28
11
30
13
26
15
30
18
10
20
18
30
17
39
Calcule la varianza
Solucin:
x
n
Para aplicar:
s2
i 1
n 1
debemos calcular
X 20,125
(10 20,125)^2 (12 20,125)^2 (40 20,125)^2 (10 20,125)^2 ... (39 20,125)^2
31
2018,390625
s2
31
2
s 65,109375 miles de nuevos soles 2
s2
47
x
m
s2
i 1
- Varianza de la Poblacin
x fi
n 1
x
i 1
fi
2
Solucin:
s2
10
15
20
40
24
15
12
Total
140
x
m
Para aplicar:
Vendedores
i 1
x fi
debemos calcular
n 1
X 5.07
Vendedores
2
10
15
20
40
24
15
12
2
Total
140
x
m
La varianza es:
s2
i 1
x f i
(Xi-X)^2 * fi
33.15
94.34
64.36
22.96
0.20
20.69
55.79
102.92
30.87
425.29
n 1
48
425.29
=3.06
139
Facturas
1 500 - 2 900
2 900 - 5 700
58
5 700 - 8 700
216
8 700 - 11 000
52
11 000 - 14 000
23
14 000 - 17 000
12
Total
388
Solucin:
x
m
Para aplicar:
27
s2
i 1
x fi
debemos calcular
n 1
X 7344.59
Facturas
Xi
(Xi-MEDIA )^2 * fi
1 500 - 2 900
27
2200
714603769.2
2 900 - 5 700
58
4300
537632639.5
5 700 - 8 700
216
7200
4515753.91
8 700 - 11 000
52
9850
326408121.9
11 000 - 14 000
23
12500
611299802.2
14 000 - 17 000
12
15500
798128547.2
Total
388
2992588634
x
m
La varianza es:
s2
i 1
x f i
2
n 1
2992588634
7732787.17
387
s s2
Con lo que la desviacin estndar o tpica vendr dada en las mismas unidades que los
valores de la variable.
- La desviacin estndar o tpica siempre es positiva porque la varianza tambin lo es.
- La desviacin estndar o tpica es la medida de dispersin ptima, ms exacta, ms estable
y ms utilizada, sirviendo de base para las medidas de asimetra, estadsticos tpicas y
correlacin.
- Cuanto ms se acerca a cero la desviacin ms concentrada es la serie.
- Suele decirse que cuando la desviacin estndar o tpica es menor que la media aritmtica
la serie es concentrada y s la desviacin estndar o tpica es mayor que la media aritmtica
la serie es dispersa.
Ejemplo :
49
Vendedores
2
10
15
20
40
24
15
12
Total
140
Solucin:
s s2
Facturas
1 500 - 2 900
27
2 900 - 5 700
58
5 700 - 8 700
216
8 700 - 11 000
52
11 000 - 14 000
23
14 000 - 17 000
12
Total
388
Solucin:
50
CV
S
*100
X
X 20,125 y
s 8.069038047
Entonces
CV
8.069038047
*100
20,125
CV 40,09%
Interpretacin: La inversin de las pequeas empresas en altamente dispersas (heterognea)
Ejemplo: Variable Discreta
Se selecciona al azar 140 vendedores de una gran compaa de seguros. A continuacin se
muestra el nmero de plizas vendidas durante una semana. Calcular e interpretar el
coeficiente de variacin
N de
Plizas
1
Vendedores
2
10
15
20
40
24
15
12
Total
140
51
Solucin:
Para calcular el coeficiente de variacin, debemos calcular la media y la desviacin estndar,
por los ejercicios anteriores tenemos:
X 5.07
s 1.75
Entonces
1.75
* 100
5.07
CV 34.52
CV
Facturas
1 500 - 2 900
27
2 900 - 5 700
58
5 700 - 8 700
216
8 700 - 11 000
52
11 000 - 14 000
23
14 000 - 17 000
12
Total
388
Solucin:
Para calcular el coeficiente de variacin, debemos calcular la media y la desviacin estndar,
por los ejercicios anteriores tenemos:
X 7344.59 y s 2780.79
Entonces
2780.79
* 100
7344.59
CV 37.86
CV
x Mo
s
En distribuciones asimtricas se verifica que : x Mo 3( x Me) , entonces el ndice de
As
asimetra es:
As
3( x Me)
s
Interpretacin:
Si As = 0, La distribucin es simtrica, esto es x Me Mo
Si As > 0, La distribucin es asimtrica positiva, esto es Mo Me x
Si As < 0, La distribucin es asimtrica negativa, esto es x Me Mo
52
Ejemplo:
La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas de la ciudad
fueron:
10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 17
13 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39
Calcule e interprete el coeficiente de asimetra.
Solucin:
Para calcular el coeficiente de asimetra, debemos calcular la media, la mediana y la desviacin
estndar, por los ejercicios anteriores tenemos:
X 20,125
Entonces:
Me 18
s 8.069038047
3(20,125 18)
8,06903847
As 0,790057001
As
Vendedores
2
10
15
20
40
24
15
12
Total
140
Solucin:
Para calcular el coeficiente de asimetra, debemos calcular la media, mediana y la desviacin
estndar, por los ejercicios anteriores tenemos:
Me
y
s
X
Entonces:
As
As
Ejemplo: Variable Continua
El siguiente cuadro muestra las ventas registradas en 388 facturas de la Empresa Pasaly,
calcule e interprete el coeficiente de variacin.
53
Montos
Facturas
1 500 - 2 900
27
2 900 - 5 700
58
5 700 - 8 700
216
8 700 - 11 000
52
11 000 - 14 000
23
14 000 - 17 000
12
Total
388
Solucin:
Para calcular el coeficiente de asimetra, debemos calcular la media, mediana y la desviacin
estndar, por los ejercicios anteriores tenemos:
Me
y
s
X
Entonces:
As
As
1.3.4. MEDIDAS DE CURTOSIS
La curtosis es la caracterstica de una distribucin de frecuencias en la cual se compara la
dispersin de los datos observados cercanos al valor central con la dispersin de los datos
cercanos a ambos extremos de la distribucin, Se aplica cuando la distribucin es simtrica.
Se calcula mediante:
P75 P25
0.5
P90 P10
Interpretacin:
Si K tiende a 0 la distribucin es normal o mesocrtica
Si K tiende a 0.5 es leptocrtica
Si K tiende a -0.5 es platicrtica
Ejemplo 2: Variable Discreta
Se selecciona al azar 140 vendedores de una gran compaa de seguros. A continuacin se
muestra el nmero de plizas vendidas durante una semana. Calcule e interprete el coeficiente
de curtosis.
N de
Plizas
1
Vendedores
2
10
15
20
40
24
15
12
Total
140
54
Solucin:
Para calcular el coeficiente de curtosis, debemos calcular:
P10 =
P75=
P25 =
P90 =
Entonces
K
K
Ejemplo: Variable Continua
El siguiente cuadro muestra las ventas registradas en 388 facturas de la Empresa Pasaly,
calcule e interprete el coeficiente de curtosis.
Montos
Facturas
1 500 - 2 900
27
2 900 - 5 700
58
5 700 - 8 700
216
8 700 - 11 000
52
11 000 - 14 000
23
14 000 - 17 000
12
Total
388
Solucin:
Para calcular el coeficiente de curtosis, debemos calcular:
P10 =
P75=
P25 =
P90 =
Entonces:
K
K
Ejemplo Adicional:
De los datos registrados sobre el turno maana de una empresa.
i
1
2
3
4
5
6
Lim Inf
20.5
25.5
30.5
35.5
40.5
45.5
Lim Sup
25.5
30.5
35.5
40.5
45.5
50.5
Marca
23
28
33
38
43
48
f
1
3
0
2
20
4
30
Turno maana
h
F
0.0333
1
0.1000
4
0.0000
4
0.0667
6
0.6667
26
0.1333
30
Se obtiene:
55
H
0.0333
0.1333
0.1333
0.2000
0.8667
1.0000
1. La central telefnica de una empresa desea conocer el gasto mensual en que incurre debido a las
llamadas que efectan sus empleados luego de las 6 p.m., hora en que finalizan las labores. Para
esto registra al azar y durante el mes de enero el tiempo de duracin (en minutos) de las
llamadas efectuadas entre las 6 p.m. y las 7 p.m. Los datos obtenidos, segn el tipo de telfono al
que se llama, se encuentran en la hoja Llamadas.
a. Cul es la duracin mnima de una llamada hacia un telfono celular para considerarla
dentro del grupo del 15% de las llamadas que le ocasionan mayor gasto a la empresa?
b. Se puede afirmar que existe mayor homogeneidad en la duracin de las llamadas realizadas
hacia un telfono celular en comparacin a las realizadas hacia un telfono fijo?
Lim Inf
20
25
30
35
40
45
50
Lim Sup
25
30
35
40
45
50
55
f
8
12
12
18
14
11
5
80
3. Los datos en la hoja Supermercados corresponden a los montos y el tipo de pago realizados por
una muestra de clientes de una cadena de supermercados. Los directivos de esta empresa
pidieron tomar la muestra para conocer el comportamiento de los pagos de sus clientes.
a. Construya en un mismo grfico los diagramas de cajas para los montos segn el tipo de
pago indicando la presencia de datos atpicos en la muestra.
b. Determinar el tipo de simetra que presentan los montos segn el tipo de pago segn lo
observado en el grfico anterior.
c. Indique que medio de pago es ms homogneo.
4. Textiles Enigma es un gran proveedor de fibras para industriales textiles en diversas partes del
mundo y tiene un control de calidad estricto sobre la resistencia de sus fibras. ltimamente ha
habido quejas de sus clientes sobre la irregularidad en la resistencia de dichas fibras debido a
problemas de produccin. El gerente de produccin ha tomado los datos del equipo de control de
calidad que realiz en pruebas de resistencia de fibras provenientes de las dos mquinas. Los
resultados, expresados en kilogramos, fueron los siguientes:
Mquina 1
1,19
2,53
1,34
2,55
1,43
2,5
Mquina 2
2,29
1,3
1,46
2,35
1,50
2,36
3,19
3,31
3,3
56
2,
2,93
3,12
3,64
3,66
3,9
1,45
1,52
1,3
1,9
1,9
2,0
2,09
2,12
2,13
2,30
2,40
2,52
a.
b.
c.
d.
e.
f.
g.
2,5
2,5
2,5
2,66
2,6
2,6
2,94
2,99
3,00
3,01
3,0
3,12
3,46
3,4
3,4
3,61
3,0
3, 1
3,
3,
4,00
4,43
4,63
5,0
1,53
1,64
1,6
1,
1,9
2,14
2,14
2,14
2,1
2,21
2,24
2,2
2,41
2,42
2,42
2,4
2,50
2,53
2,54
2,63
2,2
2,3
2,3
2,4
3,14
3,19
3,20
3,22
3,22
3,40
3,42
3,50
3,53
3,59
3,61
3,63
3,9
4,00
4,00
4,01
4,13
4,32
4,34
4,46
4,52
4,64
4,5
5,4
57
UNIDAD DIDCTICA II
INFERENCIA ESTADSTICA
INTRODUCCIN
Recordemos que los objetivos de la Estadstica Descriptiva son obtener informacin a partir de un
conjunto de datos, presentar dicha informacin de manera ordenada (cuadros y grficos) que facilite
la interpretacin. Cabe preguntarse ahora cmo relacionamos la informacin que obtenemos de la
Estadstica Descriptiva con el fenmeno aleatorio real que estamos observando, teniendo en cuenta
que el estudio solo es referente a unos cuantos datos (muestra) y no a todos (poblacin)?
Se trata de hacer una generalizacin (inferencia) de la informacin obtenida a travs de una muestra,
a una poblacin.
La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga del estudio de los
mtodos para la obtencin del modelo de probabilidad (forma funcional y parmetros que determinan
la funcin de distribucin) que sigue una variable aleatoria de una determinada poblacin, a travs de
1
una muestra (parte de la poblacin) obtenida de la misma
Se iniciar el estudio de esta segunda unidad didctica como la Teora de Muestreo que est
orientada a desarrollar destrezas y obtener conocimientos para lograr una muestra representativa.
El segundo tema de esta unidad se refiere a la Estimacin de Parmetros, en el que se abordar el
proceso de utilizar datos muestrales para estimar los valores de parmetros desconocidos de una
poblacin.
El cuarto tema es referente a las pruebas de hiptesis, cuyo objetivo es evaluar proposiciones o
afirmaciones acerca de los valores de los parmetros de la poblacin.
APRENDIZAJES ESPERADOS
Conoce mtodos y tcnicas de estadstica inferencial y los aplica eficientemente como herramientas
para la toma de decisiones y valora reflexivamente su importancia como herramienta en los diversos
campos de la ciencia.
CONTENIDOS
Tema 1: Mtodos de Muestreo
Tema 2: Estimaciones
Tema 3: Prueba de Hiptesis
http://es.wikipedia.org/wiki/Estad%C3%ADstica_inferencial
58
TEMA 01
2.1 MTODOS DE MUESTREO
Las investigaciones estadsticas de una poblacin se basan generalmente en el anlisis de una
muestra de sta, debido a muchos motivos, por ser una poblacin grande, por los costos, etc., por lo
tanto es importante que la muestra elegida sea representativa con la finalidad de realizar inferencias a
la poblacin de donde fue seleccionada y que sus resultados sean confiables, entonces nos
planteamos la pregunta de qu manera se debe seleccionar la muestra?, qu criterios se debe
tener en cuenta para seleccionar un mtodo de seleccin de muestra?, etc.
Responder a estas preguntas es el objetivo de este captulo. Para introducirnos en la Teora de
Muestreo es importante tener claros algunos conceptos bsicos e incluirlos en nuestro lenguaje.
2.1.1 Conceptos Bsicos
2.1.1.1 Muestreo:
Son mtodos empleados para la seleccin de elementos representativos de la
poblacin que conformarn una muestra.
2.1.1.2 Unidades de muestreo:
Son aquellas que contienen las unidades de anlisis de la poblacin y que se utilizarn
para confeccionar o seleccionar la muestra.
2.1.1.3 Marco Muestral
Es la lista de unidades o elementos del muestreo. En ella se debe definir y enumerar
los elementos sobre los cuales se realizan las inferencias estadsticas en el muestreo
probabilstico y debe ser tal que:
- Cada elemento de la poblacin figure en l.
- Cada elemento de la poblacin figure una sola vez.
- Slo contenga los elementos de la poblacin.
Es importante la construccin de un marco muestral lo ms perfecto posible a fin de
que exista una correspondencia biunvoca entre las unidades muestrales poblacionales
y las listas fsicas que lo conforman. Entre los factores que contribuyen a distorsionar la
calidad de un buen marco muestral estn:
a. Elementos faltantes.
b. Unidades ocultas por estar pareadas con otras.
c. Unidades muestrales repetidas.
d. Elementos extraos.
Entre algunos ejemplos de marcos muestrales pueden ser: mapas, listas de clientes,
listado de empresas, gua de telfonos, etc.
2.1.1.4 Nivel de Confianza:
Es la probabilidad de que el intervalo construido en torno a un estadstico capte el
verdadero valor del parmetro. Se simboliza por (1 - ).
2.1.1.5 Diseo Muestral:
Es un conjunto de procedimientos que sirven para determinar la muestra, el tamao de
la muestra y la confiabilidad de sta.
Se debe de seguir los siguientes pasos:
- Definir la poblacin: incluye la especificacin de la unidad de muestreo, el alcance
geogrfico de la investigacin y el momento y el perodo de tiempo en que se realiza
el estudio.
- Identificar el marco muestral.
- Determinar el mtodo de muestreo: Se debe tener en cuenta las caractersticas de la
poblacin, la forma de recoleccin de informacin.
- Determinar el tamao de la muestra.
- Seleccin material de la muestra: Comprende la eleccin de los componentes de la
muestra (se suele hacer mediante nmeros aleatorios, sistemtica, etc.), adems se
debe localizar materialmente la muestra, es decir la localizacin fsica de las
unidades.
59
60
llamar una muestra a cualquier grupo de miembros de una poblacin por el simple
hecho de formar parte de dicha poblacin.
Para que sea aceptable para propsitos estadsticos, una muestra debe representar la
poblacin y debe tener confiabilidad medible. Adems, el plan de muestreo debe ser
prctico y eficiente. A continuacin se presenta algunos criterios para aceptar un
mtodo muestral:
a. Probabilidad de Seleccin de cada Unidad.
Se debe seleccionar la muestra para que represente adecuadamente a la poblacin
que cubre. Esto significa que cada unidad (hogar, persona o cualquiera otra unidad)
debe tener una probabilidad de seleccin mayor que cero.
b. Confiabilidad Medible
Una de las condiciones ms importante del muestreo probabilstico es la capacidad
de poder medir la confiabilidad de las estimaciones provenientes de la muestra. Es
decir, adems de proporcionar estimaciones sobre las caractersticas de la
poblacin (totales, promedios, porcentajes, etc.), la muestra debe arrojar medidas
sobre la precisin de estas estimaciones. Estas medidas de precisin pueden
utilizarse para indicar el error mximo que se puede esperar de dichas estimaciones
si los procedimientos se siguen de acuerdo a las especificaciones y si la muestra es
moderadamente grande. No se puede estimar la precisin de las estimaciones si la
seleccin aleatoria no se lleva acabo de manera tal que se conozca de antemano la
probabilidad de seleccin de cada unidad seleccionada.
c. Viabilidad
Una tercera caracterstica es que el plan muestral sea prctico. Debe ser lo
suficiente simple y directo para que pueda implementarse de la manera en que se
planific. Un plan muestral, por ms atractivo que se vea escrito en papel, es slo
til si se puede implementar en el campo.
d. Economa y Eficiencia
Para terminar, el diseo muestral debe ser eficiente. Entre todos los mtodos
mustrales que satisfacen los tres criterios mencionados anteriormente, vamos
naturalmente a elegir el mtodo que proporcione la informacin requerida a un costo
mnimo. Aunque esta no sea una caracterstica esencial de un plan muestral
aceptable, es claramente una caracterstica muy deseable.
Esta caracterstica presupone que se utilizarn de la manera ms eficiente posible
todas las instalaciones y recursos, tales como oficinas, mapas, datos estadsticos,
conocimientos personales, teora del muestreo, etc.
Para la seleccin de una muestra se cuenta con diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y
mtodos de muestreo no probabilsticos.
2.1.2.3 El proceso de muestreo:
Las principales etapas para seleccionar una muestra son las siguientes:
- Definicin de la Poblacin.
- Seleccin del Marco Muestral.
- Definicin de las unidades muestrales.
- Eleccin del mtodo de muestreo.
- Determinacin del tamao de muestra.
- Seleccin de la muestra.
2.1.3 Mtodos de Muestreo Probabilsticos
Los mtodos de muestreo probabilsticos se basa en que todos los elementos de la poblacin
tienen una probabilidad conocida de ser elegidos para formar parte de la muestra y,
consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de
ser elegidas. Slo estos mtodos de muestreo probabilsticos nos aseguran la
representatividad de la muestra extrada y son, por tanto, los ms recomendables. Dentro de
los mtodos de muestreo probabilsticos encontramos los siguientes tipos:
61
62
63
este mtodo, aunque no todos los grupos son muestreados, cada grupo tiene una
igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria.
b. Ventajas:
- Es muy eficiente cuando la poblacin es muy grande y dispersa. Reduce costos.
- No es preciso tener un listado de toda la poblacin, slo de las unidades primarias
de muestreo.
c. Desventajas:
- El error estndar es mayor que en el muestreo aleatorio simple o estratificado.
- El clculo del error estndar es complejo
2.1.3.5 Muestreo Polietpico o multietpico
Muestreo en el que se procede por varias etapas: se obtiene una muestra de unidades
primarias (UPM), ms amplias que las siguientes; de cada unidad primaria se toman,
para una submuestra, unidades secundarias (USM), y as sucesivamente hasta llegar a
las unidades ltimas o ms elementales. Se le puede considerar como una
modificacin del muestreo por conglomerados cuando no forman parte de la muestra
elementos o unidades de todos los conglomerados, sino que, una vez seleccionados
estos, se efectan submuestras dentro de cada uno de ellos.
2.1.3.6 Muestreo Doble
Muestreo que consta de dos fases; en la primera, de las cuales se toma una muestra
muy amplia a la que se analiza algn aspecto que es fundamental para la segunda
fase; esta segunda fase, la constituye un muestreo cualquiera de la primera.
2.1.4 Mtodos de muestreo no probabilsticos
A veces, el muestreo probabilstico resulta excesivamente costoso y se acude a mtodos no
probabilsticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues
no se tiene certeza de que la muestra extrada sea representativa, ya que no todos los sujetos
de la poblacin tienen una probabilidad conocida de ser elegidos. En general se seleccionan a
los sujetos siguiendo determinados criterios procurando que la muestra sea representativa.
2.1.4.1 Muestreo por cuotas:
Consiste en dividir a la poblacin en estratos o categoras, y se asigna una cuota para
las diferentes categoras y, a juicio del investigador, se selecciona las unidades de
muestreo. La muestra debe ser proporcional a la poblacin, y en ella debern tenerse
en cuenta las diferentes categoras. El muestreo por cuotas se presta a distorsiones, al
quedar a criterio del investigador la seleccin de las categoras.
Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la
poblacin y/o de los individuos ms "representativos" o "adecuados" para los fines de la
investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado,
pero no tiene el carcter de aleatoriedad de aqul.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de
individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de
25 a 40 aos, de sexo femenino y residentes en el Tambo. Una vez determinada la
cuota se eligen los primeros que se encuentren que cumplan esas caractersticas. Este
mtodo se utiliza mucho en las encuestas de opinin.
2.1.4.2 Muestreo por conveniencia
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos.
La seleccin de las unidades de muestra se deja principalmente al entrevistador. Con
frecuencia se selecciona a los entrevistados porque se encuentran en el lugar
adecuado en el momento oportuno. Es muy frecuente su utilizacin en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
64
Los elementos de la poblacin se seleccionan con base a juicio del investigador. Con
su juicio o experiencia, elige los elementos que incluir en la muestra, por que cree que
son representativos de la poblacin de inters o son de alguna manera apropiados. El
caso ms frecuente de este procedimiento el utilizar como muestra los individuos a los
que se tiene fcil acceso (los profesores de universidad emplean con mucha frecuencia
a sus propios alumnos). Un caso particular es el de los voluntarios.
2.1.4.4 Bola de nieve
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as
hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente
cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc.
Tambin este tipo de muestreo se inicia con una muestra tomada al azar pero que
luego se va depurando por referencia de los primeros contactados, de ese modo se
pueden estudiar diferentes poblaciones en relacin al producto que se est
presentando. Este mtodo por ende permite evaluar las "subpoblaciones especficas"
que muchas veces se descartan porque tienen un volumen muy pequeo en cuanto a
poblacin y sera antieconmico desarrollar productos para poca gente.
ACTIVIDAD N5
1. Elabore una ficha tcnica sobre el tema de investigacin que est trabajando.
2. Construya un organizador de conocimientos sobre el tema MTODOS DE MUESTREO
65
TEMA 02
2.2 ESTIMACIN DE PARMETROS
Cuando se selecciona una muestra la intencin primaria es conocer y analizar a la poblacin de
donde fue seleccionada, entonces es a partir de nuestros resultados muestrales que estimamos los
resultados de la poblacin a este proceso se le llama la Estimacin de parmetro, siendo este uno de
los mtodos ms importantes de la estadstica inferencial.
i ,
que se
exprese en funcin de la muestra aleatoria y que tenga por objetivo aproximar el valor
de i .
Obsrvese que el estimador no es un valor concreto sino una variable aleatoria, ya que
aunque depende unvocamente de los valores de la muestra observados, la eleccin de
la muestra es un proceso aleatorio.
2.2.1.2 Estimacin
Una vez que la muestra ha sido elegida, se denomina estimacin el valor numrico
que toma el estimador sobre esa muestra.
Se puede estimar mediante:
- Estimacin puntual: Consiste en determinar un posible valor para el parmetro
poblacional.
- Estimacin por intervalos: Consiste en determinar un posible rango de valores o
intervalo, en los que pueda precisarse, con una determinada probabilidad, que el
valor de un parmetro.
2.2.1.3 Estimacin por intervalos de confianza
La estimacin confidencial o por intervalos consiste en determinar un posible rango de
valores o intervalo, en los que pueda precisarse, con una determinada probabilidad,
que el valor de un parmetro se encuentra dentro de esos lmites.
La Estimacin por intervalos consiste en asociar a cada muestra un intervalo que se
sospecha que debe contener al parmetro. A ste se le denomina intervalo de
confianza
Evidentemente esta tcnica no tiene porqu dar siempre un resultado correcto. A la
probabilidad de que hayamos acertado al decir que el parmetro estaba contenido en
dicho intervalo se la denomina nivel de confianza. Tambin se denomina nivel de
significacin a la probabilidad de equivocarnos.
2.2.2 Intervalo de confianza para una media poblacional
2.2.2.1 Si se conoce la varianza poblacional
Cuando queremos estimar la media de la poblacin
66
x z1
x z
x z1
Este intervalo es vlido tambin cuando la poblacin se distribuye como una normal
con varianza poblacional conocida y el tamao de muestra es n2.
Los casos anteriores se presentarn poco en la prctica, ya que lo usual es que sobre
una poblacin quizs podamos conocer si se distribuye normalmente, pero el valor
exacto de los parmetros y no son conocidos. De ah nuestro inters en buscar
intervalos de confianza para ellos.
2.2.2.2 Si se desconoce la varianza poblacin
Para un tamao de muestra grande (n30) el estadstico que ms nos va a ayudar es
X , el intervalo de confianza al (1-)% estar dado por:
z1 s
2
z1 s
2
Pero para estimar una media poblacional cuando la poblacin de donde se seleccion
la muestra es normal y con un tamao de muestra pequeo (n<30). Su intervalo de
confianza al (1-)% es:
t1
, ( n 1)
t1
, ( n 1)
( z / 2 t / 2 ).s
n
n
0,05 , el error estndar
N
N n
y los lmites de confianza se calculan con la siguiente
N 1
frmula.
x ( z / 2 t / 2 ).s
s N n
s N n
x ( z1 / 2 t1 / 2 ).s
n N 1
n N 1
p(1 p)
p(1 p)
p p z1
2
n
n
67
p z1
p(1 p)
n
p q N n
p q N n
p p Z1 / 2
n N 1
n N 1
p Z1 / 2
(n 1) s 2
12
;n 1
(n 1) s 2
;n 1
68
EJERCICIOS RESUELTOS
1. Un artculo publicado en un diario local indica que el tiempo promedio empleado por los
hogares de Lima Metropolitana en ver televisin en el horario de 8 p.m. a 11 p.m. es de 7,75
horas. Suponga que el tiempo tiene una distribucin aproximadamente normal con desviacin
estndar de 3,45 horas. Para corroborar dicha afirmacin un grupo de estudiantes selecciona una
muestra de 180 hogares de L.M. y obtuvo que el tiempo promedio fue de 7,42 horas por semana.
Ser cierta la afirmacin publicada por el diario local al 96% de confianza?
Solucin:
i) La estimacin puntual de es
x Z1 / 2
3,45
3,45
7,42 (2,05)
180
180
6,8928 7,9472
Interpretacin: Con un 96% de confianza entre 6,8928 y 7,9472 horas por semana se encontrar
la media del tiempo empleado por todos los hogares de Lima Metropolitana en ver televisin en el
horario de 8 p.m. a 11 p.m. por lo tanto es cierta la afirmacin publicada en el diario local.
2. Se tienen 50 000 trabajadores de construccin civil empadronados en el Ministerio de Trabajo,
de los cuales se tom una muestra aleatoria de 400 y se analiz el ingreso diario. Si la media de
los trabajadores encuestados es de 74 soles diarios con una desviacin estandar de 10.68 soles,
construya un intervalo de confianza del 90% para el ingreso diario de todos los trabajadores de
construccin civil.
Solucin
i) x =74; n=400 ;N=50 000 y s=10.68
ii) 1- = 0,90 = 0.1 entonces:
iii)
x Z1 / 2
Z 1 / 2 = Z(0.90) = 1.645
N n
x Z1 / 2
N 1
n
N n
N 1
10.68
50000 400
10.68
50000 400
x
74 (1.645)
x
50000 1
50000 1
400
400
v) IC ( ) 73.13 74.87
iv) IC ( ) 74 (1.645)
3. El jefe del rea de prensa de un diario desea evaluar la habilidad de su equipo de trabajo en el
digitado de una misma noticia. Para realizar dicho estudio selecciona al azar una muestra
aleatoria de redactores obteniendo los siguientes resultados (en minutos):
3,2
6,3
4,8
7,9
5,3
8,2
9,1
7,9
6,3
6,9
8,2
9,3
6,5
8,6
9,6
6,8
10,3
10,1
8,6
9,0
Asumiendo que los tiempos se distribuyen normalmente. Halle e interprete un intervalo del
95% de confianza para el tiempo medio utilizado en el tipeado de una noticia.
Solucin:
i) La estimacin puntual para es x =7,645 siendo s= 1.8597
69
t /2;n1 =2.0930
iii)
IC ( ) 7,645 2,0930
(1,8597)
(1,8597)
7,645 2,0930
20
20
6.7746 8.1130
iv) Interpretacin: Con un 95% de confianza entre 6.7746 y 8.1130 minutos se encontrar la media
del tiempo utilizado por todos los redactores en el digitado de una noticia.
4. Pamela, estudiante de estadstica para Ciencias de la Empresa piensa que el gasto promedio
semanal en fotocopias de los estudiantes de su facultad es de 3.5 soles. Para verificar si es cierto
lo que est pensando ha elegido al azar una muestra de 9 estudiantes de un total de 120
estudiantes que llevan el curso de estadstica para comunicadores, resultando los siguientes
gastos:
3,5
2,5
1,9
1,7
2,5
3,4
2,9
1,6
1,5
Si la variable aleatoria objeto de estudio sigue una distribucin normal. Con un intervalo de
confianza del 96% para la media del gasto semanal en fotocopias por estudiante ser cierto
lo que piensa Pamela?
Solucin:
i) n=9; N=120; 1-=0.96
ii) x =2.3889 siendo s= 0.7639 y n/N=0.0758>0.05
iii)
t /2;n1 =2.44898
iv)
N n
n 1;
N 1
2
0,7639 120 9
2,3889 2,44898
120 1
9
IC ( ) x t
s
n
1,7866 2,9912
v) Conclusin: Con un nivel de confianza del 96% se puede decir que el gasto promedio semanal
en fotocopias de los estudiantes de su facultad es menor a 3.5 soles, por lo que podramos decir
que lo que piensa Pamela no es cierto.
5. Un fabricante de bateras para automviles afirma que sus bateras durarn, en promedio, tres
aos con una varianza de un ao. Si cinco de estas bateras tienen duraciones de 1.9, 2.4, 3.0, 3.5
y 4.2 aos, construya un intervalo de confianza del 95% para
Solucin
2
i) s = 0,815, n=5
2
2
ii) El valor X 1-/2 , es un valor X con 5-1 grados de libertad, que deja un rea de 0,025 a la
2
izquierda y por lo tanto un rea de 0,975 a la derecha, es X 0,975 = 0,484; de la misma forma, el
2
2
valor X /2 es igual a X 0,025 = 11,143.
(5 1)(0.815)
(5 1)(0.815)
2
11.143
0.484
2
iv) 0.3 6.7
iii)
70
v) Interpretacin: Con 95% de confianza entre 0,3 y 6,7 se encontrar la varianza de la duracin
de las bateras. S es posible considerar como vlida la afirmacin del fabricante porque el
intervalo hallado contiene a la unidad.
2.2.8 Determinacin del Tamao de Muestra
Existen tres factores que determinan el tamao de una muestra; ninguno tiene alguna relacin
directa con el tamao de la poblacin. Estos son:
- El grado de confianza elegido.
- El mximo error permitido.
. La variacin de la poblacin.
2.2.8.1 Muestreo Aleatorio Simple
a. Para estimar la media poblacional
Poblacin infinita
z
n 2
E
2
z 2 2 N
E 2 ( N 1) z 2 2
n0
n
1 0
N
Donde:
E: Es el error permitido;
Z: El valor estndar normal asociado con el grado de confianza elegido,
: La desviacin de la poblacin, obtenida de estudios anteriores, experiencias
previas o se puede estimar la desviacin estndar muestral mediante un estudio
piloto
no: Tamao de muestra calculada de una poblacin infinita
N: Tamao de poblacin
Se dice que una poblacin es finita si la relacin n/N > 5%
2.2.8.2 Para estimar la proporcin poblacional
Poblacin infinita
z 2 pq
n 2
E
Donde:
E:
Z,
P:
q:
N:
poblacin finita
z 2 pqN
n 2
E ( N 1) z 2 pq
Es el error permitido;
El valor estndar normal asociado con el grado de confianza elegido,
La proporcin de xito de la poblacin, obtenida de estudios anteriores, experiencias
previas o se puede estimar la proporcin de xito muestral mediante un estudio
piloto.
La proporcin de fracaso de la poblacin se obtiene por complemento de p, esto
q=1p
Tamao de poblacin
EJERCICIOS RESUELTOS
6. Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en
una industria. Se conoce que el peso de un saco que se llena con este instrumento es una variable
71
aleatoria con distribucin normal. Si se supone que la desviacin tpica del peso es de 0,5 kg.
Determine el tamao de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95
de que el estimado y el parmetro se diferencien modularmente en menos de 0,1 kg.
Solucin
i) e=0.1;
ii) Z1 1,96
0.5; 0.05
0,51,96
iii) n
96,4
0,1
iv) Evidentemente un tamao de muestra no puede ser fraccionario por lo que se debe aproximar
por exceso. El tamao de muestra sera de 97.
7. En un lote de frascos para medicina, con una poblacin de 8000 unidades, se desea estimar la
media de la capacidad en centmetros cbicos de los mismos. A travs de un premuestro de
tamao 35 se ha estimado que la desviacin estndar es de 2 centmetros cbicos. Si queremos
3
tener una precisin 0.25 cm , y un nivel de significancia del 5%. De que tamao debe de ser la
muestra?
Solucin
3
i) e=0.25 cm ;
ii) Z1 1,96
2cm 3 ; 0.05
N . 2 Z 2 2
iii)
iv)
v)
Ne 2 Z 2 2
8000(2) 2 (1.96) 2
8000(0.25) 2 (2) 2 (1.96) 2
122931.2
239
515.37
vi) Solo faltara muestrear 204 frascos, pues los datos de los 35 frascos del premuestreo siguen
siendo vlidos.
8. En una investigacin, se desea determinar en que proporcin los nios de una regin toman
leche en el desayuno. Si se sabe que existen 1500 nios y deseamos tener una precisin del 10
%, con un nivel de significancia del 5%. De que tamao debe de ser la muestra?
Solucin
0.05
i) N=1500; e=10%=0.1;
ii) p = 0.5 y q = 0.5
iii) Z1 1,96
2
iv)
N . p.q.Z 2 2
N .e 2 p.q.Z 2 2
1500(0.5)(0.5)(1.96) 2
1500(0.1) 2 (0.5)(0.5) / 1.96) 2
vi) n 90 . Se deben muestrear 90 nios.
v)
ACTIVIDAD N6
Resuelve los ejercicios propuestos pares y presntelos de manera formal.
72
EJERCICIOS PROPUESTOS
1. Estimacin de una Media Poblacional
1. Para tratar de estimar la media de consumo por cliente, en un gran restaurante, se reunieron
datos de 49 clientes durante un periodo de 3 semanas
a. Suponga que la desviacin estndar de la poblacin es de $2.50, cul es el error
estndar de la muestra?
b. Con nivel de confianza de 95%, Cul es el margen de error?
c. Si la media de la muestra es de $22.60 dlares, cul es el intervalo de confianza de 95%
de la media de la poblacin?
2. Un analista de bolsa de valores afirma que posee un mtodo excepcionalmente preciso para
pronosticar las subidas de la cotizacin de acciones. En un periodo de tiempo dado, las
acciones cuya compra recomend tuvieron las siguientes subidas (en dlares) en su
cotizacin:
2,53 1,58 3,022,761,252,251,75 2,25
Estime la media de todas las subidas de las acciones mediante un intervalo de confianza del
98%.
3. Se pretende conocer la renta anual de un grupo de 100 familias. Para ello se extrae una
muestra aleatoria simple con los siguientes resultados expresados en miles de dlares: 132,
154, 202, 705, 181.2, 160, 190, 125, 118.7. Estime con una confianza del 95% y supuesta
normalidad de la media poblacional por puntos y mediante un intervalo de confianza.
4. Una gran empresa desea estudiar mediante muestreo las compras de los clientes a los que
factura entre 6 000 y 18 000 dlares en mercancas. Para ello, de un total de 750 clientes
seleccionan una muestra aleatoria de tamao 100, en la que resulta una facturacin media de
11 720 dlares con una desviacin tpica de 3 000 dlares. Estime el promedio de las ventas
para todos los clientes por intervalos al 90% y 95%.
5. Jess es un corredor de la Bolsa de Valores y tiene curiosidad acerca de la cantidad de
tiempo que existe entre la colocacin de una orden de venta y su ejecucin. Jess hizo un
muestreo de 45 rdenes y encontr que el tiempo medio para la ejecucin fue de 24,3
minutos, con una desviacin estndar de 3,2 minutos. Ayude a Jess en la construccin de
un intervalo de confianza de 95% para el tiempo medio en la ejecucin de una orden.
6. Un directivo de cierta empresa ha comprobado que los resultados obtenidos en los test de
aptitud por los solicitantes de un determinado puesto de trabajo siguen una distribucin
normal con una desviacin tpica de 32,4 puntos. La media de las calificaciones de una
muestra aleatoria de nueve test es de 187,9 puntos. Calcule un intervalo de confianza del
80% para la calificacin media poblacional del grupo de solicitantes actual.
7. Un fabricante produce anillos para los pistones de un motor de automvil. Se sabe que el
dimetro del anillo esta distribuido aproximadamente de manera normal, y que tiene una
desviacin estndar = 0.001 mm. Una muestra aleatoria de 15 anillos tiene un dimetro
promedio de x = 74.036 mm.
a. Construya un intervalo de confianza bilateral del 99% para el dimetro promedio del
anillo.
b. Construya un limite inferior de confianza del 95% para el dimetro promedio del anillo.
8. En un estudio hecho para determinar el tiempo medio necesario para el montaje de cierta
pieza de una maquina, 40 trabajadores hicieron un promedio de 42.5 minutos con una
desviacin tpica de 3.8 minutos. Usar los datos para construir un intervalo de confianza de
98% de tiempo promedio verdadero necesario para montar la maquina.
73
9. De una poblacin de 1500 empleados de una empresa se seleccion una muestra al azar de
150 para participar en una encuesta. Entre los comprendidos en la muestra, 120 manifestaron
que estaban satisfechos por completo con todas las condiciones laborales de la empresa.
Construya el intervalo de confianza del 98% para la proporcin real que opina de esta
manera.
10. Generalmente los estudios de factibilidad de proyectos requiere de una medida de la
demanda para determinar la rentabilidad potencial de un bien o servicio. En un estudio para
determinar la factibilidad de aumentar la programacin de televisin con apoyo del gobierno,
un investigador encontr que 70 de 180 viviendas con televisor seleccionadas totalmente al
azar ven programas con apoyo gubernamental al menos dos horas a la semana. Encuentre
un intervalo de confianza del 90% para la proporcin de viviendas con televisor que ven al
menos 2 horas a la semana de programas patrocinados por el gobierno.
11. Un auditor decide estimar el porcentaje de morosos de una empresa. De los 600 deudores
selecciona aleatoriamente a 150, de los que 60 son morosos. Con esta informacin estime
mediante un intervalo del 95% de confianza la proporcin poblacional de morosos. Exprese el
error de estimacin.
12. Una muestra de 70 ejecutivos de una empresa fue investigada con respecto al pobre
desempeo que sta tuvo en noviembre, 65% de los ejecutivos crea que la disminucin en
las ventas se debi al alza inesperada de la temperatura, lo cual trajo como consecuencia
que los consumidores retardaran la adquisicin de productos de invierno. Encuentre el
intervalo de confianza para esta porcin, dado un nivel de confianza igual a 0,95.
13. Una industria de carnes est pensando en lanzar al mercado un nuevo tipo de carne molida
de pollo. Para esto se tom una muestra de 75 amas de casa y encontr que a 45 de ellas no
les gust este tipo de carne. Encuentre un intervalo de confianza del 99% para la verdadera
proporcin de amas de casa que les gust este tipo de carne. Interprete el resultado.
14. Una marca de lavadoras quiere saber la proporcin de amas de casa que preferiran usar su
marca. Toman al azar una muestra de 100 amas de casa y 20 dicen que la usaran. Calcula
un intervalo de confianza del 95% para la verdadera proporcin de amas de casa que
preferiran dicha lavadora.
3. Estimacin de una varianza poblacional
15. Las siguientes son las velocidades de 10 digitadores seleccionados al azar de una empresa,
los datos siguientes son el nmero de palabras digitadas por minuto:
66 37 18 31 35 63 73 83 68 80
Supongamos que las velocidades estn normalmente distribuidas y construya el intervalo de
confianza del 95% para la varianza poblacional.
16. Una mquina produce piezas metlicas en forma cilndrica. Para estimar la variabilidad de los
dimetros, se toma una muestra aleatoria de 10 piezas producidas por la mquina
encontrando los siguientes dimetros en centmetros:
10.1 9.7 10.3 10.4 9.9 9.8 9.9 10.1 10.3 9.9
17. En computacin, carga de trabajo se define como un conjunto de solicitudes de recursos de
entrada-salida (E/S) durante un periodo dado. La carga de trabajo se compara con la
medicin llamada contenido relativo de E/S. La instalacin MVS de lote comercial promedio
es la base de esta medicin y se le asigna un contenido relativo de E/S de 1. Otras
instalaciones se califican en relacin con consultora grande, en periodos de una hora
seleccionados aleatoriamente:
3.4
3.6
4.0
0.4
2.0
3.0
3.1
4.1
1.4
2.5
1.4
2.0
3.1
1.8
1.6
3.5
2.5
1.7
5.1
0.7
4.2
1.5
3.0
3.9
3.0
Construir un intervalo de confianza de 95% de la desviacin estndar del contenido relativo
E/S de esta instalacin
74
75
TEMA 03
2.3 PRUEBA DE HIPTESIS
La inferencia estadstica utiliza dos mtodos muy importantes uno de ellos se ha visto en el captulo
anterior como estimar los parmetros de una poblacin a partir de valores de una muestra, pero otro
de los mtodos muy importantes es la Prueba de Hiptesis que se utiliza para tomar decisiones de los
parmetro de la poblacin en base a datos de una muestra. Para iniciar este captulo primero es
importante tener claro algunos conceptos bsicos.
2.3.1 Conceptos Bsicos
2.3.1.1 HIPTESIS
Cualquier afirmacin o conjetura que se hace a cerca de algo.
2.3.1.2 HIPTESIS ESTADSTICA
Cualquier afirmacin o conjetura que se hace a cerca de la distribucin de una o ms
poblaciones
Ejemplo:
El promedio ponderado de los alumnos de UCCI en el semestre 2002-2 es superior a
14.
2.3.1.3 HIPTESIS SIMPLE
Cualquier hiptesis estadstica que especifica completamente la distribucin de la
poblacin, especifica la forma de la distribucin y el valor de su parmetro.
Ejemplo:
El ingreso mensual promedio de los empleados de cierta empresa es de 900 nuevos
soles, suponiendo que los ingresos se distribuyen normalmente con desviacin
estndar de 30.
2.3.1.4 HIPTESIS COMPUESTA
Cualquier hiptesis estadstica que NO especifica completamente la distribucin de la
poblacin
Ejemplo:
El ingreso mensual promedio de los empleados de cierta empresa es SUPERIOR a 900
nuevos soles, suponiendo que los ingresos se distribuyen normalmente con desviacin
estndar de 30.
2.3.2 Hiptesis Nula y Alternativa
2.3.2.1 HIPTESIS NULA (H0)
Es la hiptesis que es aceptada provisionalmente como verdadera y cuya validez ser
sometida a comprobacin
2.3.2.2 HIPTESIS ALTERNATIVA (H1)
Es una hiptesis contraria a la hiptesis nula, se acepta en caso que la hiptesis nula
sea rechazada.
2.3.3 PLANTEAMIENTO DE HIPTESIS
1) H0: = 0
H1: 0
2) H0: 0
H1: > 0
3) H0: 0
H1: < 0
76
H0 VERDADERA
H0 FALSA
CORRECTO
1-
ERROR TIPO I
ERROR TIPO II
CORRECTO
(1-)
Nivel de Significacin ()
Es la probabilidad de cometer un error
de tipo I
= P(error tipo I)
= P(rechazar H0 cuando es
verdadera)
Prueba de Hiptesis
unilateral o Prueba de una
cola
H0: = 0 y H1 : > 0
77
X o
/ n
t n 1
X
s/ n
x
. Siendo el valor presente en la hiptesis nula.
n
p HIPOTESIS
HIPOTESIS (1 HIPOTESIS )
n
El tamao de muestra de muestra debe ser lo suficientemente grande para que la prueba sea
vlida. Como regla prctica: np
4 , nq 4 y p q 1 .
2.3.11 PRUEBA DE ASEVERACIN PARA LA VARIANZA.
Para aplicar una prueba de hiptesis relativa a la varianza de una poblacin se debe asumir
que la distribucin Ji-cuadrada se da siempre y cuando se trate de poblaciones normales y el
estadstico de prueba es la variable Ji-cuadrada con (n-1) grados de libertad y que se expresa
como:
(n 1)s 2
2
2
El proceso que sigue una prueba de hiptesis para la varianza es el mismo que utilizamos en
las anteriores secciones, es muy usual aplicar esta prueba cuando se require comprobar el
grado de variabilidad de un proceso.
EJERCICIOS RESUELTOS
1. Fumar cigarros de la marca X produce en promedio 0.6 mg de nicotina. El departamento de
ingeniera del fabricante propone un filtro nuevo que supuestamente reducir la produccin de
nicotina. Se toma una muestra de 50 cigarros con el nuevo filtro y se encuentra que el
promedio de nicotina es de 0.55 mg. Con una desviacin estndar de 0.56. Debe aceptarse la
aseveracin del departamento de ingeniera con un nivel de significacin de 2.5 por ciento?
Tomado de Estadstica aplicada a la Administracin y Economa, Alfredo Daz Mata, Captulo 9, pg. 279. Primera Edicin.
Solucin
i) El parmetro de inters es la media de la poblacin , se desea probar:
H0:
H1:
0.60
0.60
78
Donde
X o
/ n
0.55 0.60
0.6313
0.56 / 50
iv) El valor calculado o estimador -0.6313 se encuentra a la derecha del valor crtico 1.96, o
sea se encuentra en la regin de aceptacin.
v) Por lo tanto existe evidencia estadstica para aceptar la hiptesis nula y se concluye que los
nuevos filtros no reducen la nicotina que producen los cigarros de la marca X.
2. Los cientficos han citado al benceno, un disolvente qumico de uso comn en la sntesis de
plsticos como un posible agente causante de cncer. Ciertos estudios han demostrado que
las personas que trabajan con benceno durante ms de cinco aos tienen una incidencia de
leucemia 20 veces mayor que la de la poblacin en general. En consecuencia el gobierno
recomienda que el nivel mximo permisible de benceno en dicho lugar de trabajo se baje de 10
partes por milln (ppm) a 1 ppm. Supongamos que una fbrica de artculos de acero, que
expone diariamente a sus trabajadores al benceno, est siendo investigada por una
certificadora de calidad, para ello se examinan 20 muestras de aire tomadas durante un
perodo de un mes para determinar el contenido de benceno, obteniendo en el anlisis una
media de 2.1 ppm y una desviacin estndar de 1.7 ppm.
La fbrica de artculos de acero estara haciendo caso omiso a la recomendacin? Utilice un
nivel de confianza del 0.95.
Tomado de Probabilidad y Estadstica para Ingeniera y Ciencias, William Mendenhall, Captulo 9, pg. 441. Cuarta Edicin.
Solucin
i) El parmetro de inters es la media de la poblacin , se desea probar:
H0:
H1:
1
>1
79
X o
s/ n
2.1 1
t
2.89
1.7 / 20
Solucin
i) El parmetro de inters es una proporcin de la poblacin , se desea probar:
H0: = 0.95
H1: < 0.95
Donde es la verdadera proporcin de todos los puentes de autopista de acero
intemperizado que muestran un buen desempeo, siendo la prueba unilateral izquierda.
ii) El nivel de significancia es =0.05, lo que nos permite calcular el valor crtico z y ubicarlo en
la grfica que corresponde a una prueba de hiptesis unilateral izquierda.
iii)
x
54
, por lo que utilizando los datos del problema: p
0.9
n
60
80
p HIPOTESIS
HIPOTESIS (1 HIPOTESIS )
n
0.9 0.95
1.78
0.95.(1 0.95)
60
v) Se puede rechazar la hiptesis nula con =0.05, ya que el valor calculado o estimador -1.78
cae a la izquierda del -1.645 lo que indica que se encuentra en la regin de rechazo.
vi) Por lo tanto, existe evidencia estadstica para sustentar la hiptesis de que la proporcin de
puentes de autopista de acero intemperizado que tienen buen desempeo es menor que 0.95.
4. Se sabe que el contenido en gramos de un producto fabricado por una compaa,
no rene las especificaciones si la varianza de un lote de produccin se aleja demasiado
hacia arriba o hacia debajo de 6.5. Comprobar si un gran lote de produccin rene las
especificaciones, si una muestra aleatoria de 20 unidades extrada aleatoriamente de dicho
lote arroj una varianza de 7.3. Utilizar un nivel de significacin del 5%. Se sabe que el
contenido del producto se distribuye normalmente.
Tomado de Estadstica, Hugo Gmez Giraldo, Captulo 8, pg. 238.
Solucin
2
i) H 0 :
=6.5
2
Ha :
6.5
ii) La prueba es bilateral con un nivel de significacin: = 0.05, el valor crtico ji-cuadrado es:
2
iii) El criterio de decisin ser el siguiente: Si el valor de X calculado es menor que 8.90652
o mayor que 32.8523, se rechaza la hiptesis nula de que la varianza sigue siendo de 6.5, con
un nivel de significacin del 5%.
2
iv) El estadstico de prueba se calcula teniendo en cuenta n=20, s =7.3 y utilizando la frmula:
(n 1) s 2
(20 1).x7.3
21.34
6.5
ACTIVIDAD N7
Realice las pruebas de hiptesis de los problemas propuestos y presntelos de manera formal.
PROBLEMAS PROPUESTOS
1. Un convenio trabajador direccin exige una produccin media de 50 unidades. Una muestra
de 150 das revela una media de 47,3 con desviacin tpica de 5,7 unidades. Poner = 5% y
determine si cumple esta clusula del contrato.
2. Un nmero de una revista dedicada a los negocios deca que la gente tardaba 34 horas de
promedio en aprender un nuevo programa informtico de contabilidad. Est respaldada esta
81
afirmacin al nivel del 10%, si 35 personas emplearan una media de 40,58 horas, con una
desviacin tpica de 19, 7 horas?
3. En un artculo de Fortune se debata la creciente tendencia a que los empleados demanden
a sus empresas por incumplir las promesas en relacin son los beneficios sanitarios propuestos
y conclua que el juicio medio se entablaba por 115 000 dlares. 42 juicios dieron una media de
114 412 dlares. Si se supone una desviacin estndar de 14 000 dlares. Est respaldada la
hiptesis al nivel del 7%?
4. Una muestra aleatoria de diez estudiantes dio las siguientes cifras en horas para el tiempo
que pasan estudiando durante la semana previa a los exmenes finales.
28 ; 57 ; 42 ; 35 ; 61 ; 39 ; 55 ; 46 ; 49 ; 38.
Un grupo de profesores considera que el tiempo medio debera ser como mnimo de 40 horas.
Pruebe si los profesores estn en lo cierto con un nivel del significacin de 7%.
5. La ASPEC pide a los viajeros ejecutivos que califiquen los aeropuertos internacionales que
tienen oportunidad de utilizar, la calificacin mxima posible es 10. Una revista de turismo
desea calificar a los aeropuertos segn la calificacin que reciben de los ejecutivos, los
aeropuertos que obtengan una calificacin promedio de 7 o mas se consideraran de un servicio
optimo. Suponga que a una muestra aleatoria de 12 ejecutivos se les pidi calificar al
Aeropuerto Jorge Chvez obtenindose las siguientes calificaciones: 7, 8, 10, 8, 6, 9, 6, 7, 7, 8,
9 y 8, se ver que la media para estos datos es: 7.75 y su desviacin estndar 1.215;
considerando un nivel de significancia de 0.05, se puede afirmar que el Aeropuerto Jorge
Chvez ofrece un servicio optimo?
6. De una muestra de 361 propietarios de pequeos comercios que quebraron en un perodo
determinado, 105 no tuvieron asesoramiento profesional antes de abrir el negocio. Por
experiencia se sabe que lo que ha venido ocurriendo es que a lo sumo el 25% de los comercios
que no reciben asesoramiento quiebran. Analice si estos resultados prueban que ha habido un
aumento en el porcentaje de quiebras
7. Un fabricante afirma que al menos el 95% del equipo que ha surtido para cierta fbrica
cumple con las especificaciones. Se examina una muestra de 700 piezas de equipo y se
encuentra que 53 de ellas son defectuosas. Puede decirse que los datos proporcionan
suficiente evidencia para rechazar la afirmacin del fabricante? Use el nivel de significacin de
3%
8. La poltica de una empresa es restringir al 25% la proporcin de reclamos resueltas a favor
del asegurado. De las ltimas 1122 plizas, 242 compensaron por completo al asegurado; Si
1- = 90%. Se est cumpliendo la poltica?.
9. En su calidad de nuevo directivo en informacin de la empresa 3M, su jefe le ha pedido que
determine si los envos de la fbrica salen a tiempo. Como muchos otros encargos del mundo
real, ste es algo impreciso y usted se pregunta qu quera decir exactamente su jefe. Por fin
decide contrastar la hiptesis de que el 95% como mnimo de todos los envos cumplen los
requisitos de plazo. Para guardarse las espaldas, fija = 1%. Despus tome una muestra de
112 expediciones y encuentra que 104 de ella no se han retrasado. Qu le dir a su jefe?
10. Un supervisor de control de calidad en una enlatadora sabe que la cantidad exacta
contenida en cada lata vara, pues hay ciertos factores imposibles de controlar que afectan la
cantidad de llenado. El llenado medio por lata es importante pero igualmente importante es la
2
2
variacin de la cantidad de llenado. Si
es grande, algunas latas contendrn muy
poco y otras, demasiado. Las agencias reguladoras especifican que la desviacin estndar de
la cantidad de llenado debe ser menor que 0.1 onzas. El supervisor de control de calidad
muestre n=10 latas y midi la cantidad de llenado en cada una. Los datos se reproducen a
continuacin.
7.96
7.9
7.98
8.01
7.97
7.96
8.03
8.02
8.04
8.02
Esta informacin proporciona con un nivel de significancia del 0.05 pruebas suficientes de que
82
83
MTODOS DE PRONSTICOS
INTRODUCCIN
En esta tercera unidad iniciaremos nuestro estudio los temas de Anlisis de Correlacin, anlisis
de Regresin Lineal Simple, no Lineal Simple.
La regresin y la correlacin son dos tcnicas estrechamente relacionadas que comprenden una
forma de estimacin de una relacin existente en la poblacin. Este anlisis, comprende el anlisis
de los datos muestrales para saber si y cmo se relacionan entre s dos o mas variables de una
poblacin.
Para finalizar esta tercera unidad tocaremos el tema de Series de Tiempo, denominado tambin
Series Cronolgicas; stas se definen como un conjunto de observaciones ordenadas en trminos de
tiempo.
El objetivo de analizar tales datos es determinar si se presentan ciertos patrones histricos o pautas
no aleatorias, para predecir acontecimientos futuros.
APRENDIZAJES ESPERADOS
Conoce mtodos y tcnicas de pronstico y los aplica eficientemente como herramientas para la
toma de decisiones y valora reflexivamente su importancia como herramienta en la contabilidad.
CONTENIDOS:
Tema 1: Anlisis Correlacin
Tema 2: Anlisis de Regresin
84
TEMA 01
3.1 ANLISIS DE CORRELACIN
3.1.1 DEFINICIN
Un grupo de tcnicas para medir la magnitud de la relacin entre dos variables.
3.1.2 DIAGRAMA DE DISPERSIN
Utilizada para representar grficamente la relacin entre dos variables
Grficamente se pueden tener alguno de estos casos:
40
40
30
30
20
20
10
10
0
0
10
20
30
10
20
20
30
100
80
60
40
20
0
0
10
30
10
20
30
No existe Correlacin
Correlacin no lineal
3.1.3 COEFICIENTE DE CORRELACIN LINEAL (r)
Una medida de la magnitud de la relacin lineal entre dos variables. Se calcula mediante:
n x
n xy x y
2
x n y 2 y
2
Ninguna
correlacin
Moderada
correlacin
positiva
Moderada
correlacin
negativa
Fuerte
correlacin
negativa
-1
Correlacin
positiva
perfecta
Dbil
correlacin
positiva
Dbil
correlacin
negativa
- 0.5
Fuerte
correlacin
positiva
0.5
85
H0 : 0 H0 : 0
Estadstico de Prueba
n2
1 r2
86
TEMA 2
3.2 ANLISIS DE REGRESIN
El anlisis de regresin y correlacin reconoce que puede existir alguna relacin entre dos o ms
variables.
Esto es una variable depende de otra u otras variables.
Denotando como:
Y f (X )
Y f (X )
3.2.2 FORMAS DE REGRESIN
Regresin Simple: Cuando se relacionan una variable dependiente con una independiente.
Dos variables pueden relacionarse en forma de:
- Regresin Lineal Simple
- Regresin No Lineal Simple
Regresin Mltiple: Cuando se relacionan una variable dependiente con dos o ms
independientes
3.2.3 SUPUESTOS DE LA REGRESIN Y CORRELACIN
- Para cada valor de x hay un grupo de valores de y, y estos valores y estn distribuidos
normalmente.
- Toda las medias de estas distribuciones normales de Y estn sobre la lnea de regresin.
- Las desviaciones estndar de estas distribuciones normales son iguales.
- Los valores de y son estadsticamente independientes.
40
35
30
25
20
15
10
5
0
y a bx
10
87
y b x
n
20
30
s y,x
(y y
est
)2
n2
y est t / 2;n 2 s yx
( x x) 2
( x) 2
2
x
y est t / 2;n 2 s yx 1
( x x) 2
( x) 2
2
x n
y ab
100
80
60
40
20
0
REGRESIN POTENCIAL
y ax b
10
20
30
REGRESIN POLINOMIAL
y a0 a1 x a2 x 2 ... ak x k
REGRESIN CUADRTICA
y a0 a1 x a2 x 2
ACTIVIDAD N8
1. Realice el anlisis de regresin y correlacin para los ejercicios propuestos
2. Utilizando datos de la empresa o institucin donde labora, realice un anlis de regresin y
correlacin, exponga sus resultados
88
EJERCICIOS PROPUESTOS
1. El gerente de ventas de COPIADORAS SUPER que tienen una gran fuerza de ventas en el
pas quiere determinar si hay alguna relacin entre el nmero de llamadas de ventas hechas
en un mes y el nmero de copiadoras vendidas en ese mes.
El gerente selecciona una muestra aleatoria de 10 representantes y determina el nmero de
llamadas de ventas hechas por cada representante el mes pasado y el nmero de copiadoras
que vendi. La informacin se muestra a continuacin:
Llamadas de ventas
20 40 20 30 10 10 20 20 20 30
Copiadoras vendidas
30 60 40 60 30 40 40 50 30 70
a. Represente grficamente la relacin entre las dos variables.
b. Determine el grado de relacin entre las variables.
c. Calcule la variacin del nmero de copiadoras vendidas que se debe a la variacin al
nmero de llamadas de venta.
d. Realice la Prueba de hiptesis respecto al coeficiente de correlacin.
e. Determine la ecuacin de regresin (recta de regresin).
f. Cul es el nmero esperado de venta de copiadoras para un empleado que hace 20
llamadas?
g. Determine el error estndar de estimacin.
h. Determine el intervalo de confianza del 95% para todos los representantes que hicieron 20
llamadas.
i. Determine el intervalo de prediccin del 95% para una representante del norte del pas que
hizo 20 llamadas.
2. Los siguientes datos son las ventas (miles de dlares) de una estacin de gasolina y la
cantidad de automviles atendidos.
AUTOS ATENDIDOS
276 265 264 285 255 232 238 271 224 203 230
VENTAS
2.1
2.3 2.3 2.3 2.5 2.1 1.9 2.4 1.8 1.2 2.2
a. Represente grficamente la relacin entre las dos variables.
b. Determine el grado de relacin entre las variables.
c. Calcule la variacin ventas que se debe a la variacin al nmero de autos que se atienden.
d. Realice la Prueba de hiptesis respecto al coeficiente de correlacin.
e. Determine la ecuacin de regresin (recta regresin).
f. Cul es la venta si se atienden 300 automviles?
g. Determine el error estndar de estimacin.
h. Determine el intervalo de confianza para las ventas promedio cuando se atienden 300
automviles del 95%.
i. Determine el intervalo de prediccin del 95% para las ventas promedio cuando se atienden
300.
3. Un fabricante de pantalones sabe que un presupuesto considerable para anunciar en
televisin su producto crear una demanda de ste entre los compradores de los almacenes.
La tabla muestra las cantidades (en miles de dlares) que se gastan para anunciar la lnea de
otoo durante los ltimos ocho aos y las unidades vendidas (en miles vendidas) de cada
lnea para el otoo.
Gastos en Publicidad (miles de $)
50 65 75 100 125 140 170 195
Pantalones Vendidos (miles de Unidades)
45 60 80 95 120 150 145 190
a. Represente grficamente la relacin entre las dos variables
b. Determine el grado de relacin entre las variables
c. Calcule la variacin ventas que se debe a la variacin de los gastos en publicidad.
d. Realice la Prueba de hiptesis respecto al coeficiente de correlacin
e. Determine la ecuacin de regresin (recta regresin).
f. Cul es la venta de pantalones si se gasta 160 mil dlares en publicidad?
g. Determine el error estndar de estimacin
h. Determine el intervalo de confianza para las ventas de pantalones cuando se gasta 160 mil
dlares en publicidad del 95%.
i. Determine el intervalo de prediccin del 95% para las ventas promedio de pantalones
cuando gastan 160 mil dlares en publicidad
89
ANEXO N1
90
BARRA DE MENS
BARRA DE HERRAMIENTAS
91
BARRA DE FRMULAS
LIBRO DE TRABAJO
(celdas)
BARRA DE ESTADO
Operador
Adicin
Sustraccin
Multiplicacin
Divisin
Potenciacin
Radicacin
+
*
/
^
Exponentes fraccionarios
92
Se aaden los argumentos entre parntesis. En el caso de las frmulas estadsticas es frecuente
que los argumentos sean rangos.
1.6
A.
B.
C.
D.
A
B
C
D
Funciones estadsticas
FUNCIN
DESCRIPCIN
Frecuencias
CONTAR
CONTAR.BLANCO
CONTAR.SI
CONTARA
FRECUENCIA
PERMUTACIONES
COMBINAT
PROBABILIDAD
93
Promedios
MEDIA.ACOTADA
MEDIA.ARMO
MEDIA.GEOM
MEDIANA
MODA.UNO
PROMEDIO
PROMEDIOA
Medidas de dispersin
Devuelve la covarianza, el promedio de los productos de las
desviaciones pareadas
Calcula la desviacin estndar basada en una muestra
DESVEST.M
Calcula la desviacin estndar de una muestra, incluidos
DESVESTA
nmeros, texto y valores lgicos
Calcula la desviacin estndar de la poblacin total
DESVEST.P
Calcula la desviacin estndar de la poblacin total,
DESVESTPA
incluidos nmeros, texto y valores lgicos
Devuelve la suma de los cuadrados de las desviaciones
DESVIA2
Devuelve el promedio de loas desviaciones absolutas de la
DESVPROM
media de los puntos de datos
Calcula la varianza de una muestra
VAR.S
Calcula la varianza de una muestra, incluidos nmeros, texto
VARA
y valores lgicos
Calcula la varianza en funcin de toda la poblacin
VAR.P
Calcula la varianza de la poblacin total, incluidos nmeros,
VARPA
texto y valores lgicos
Medidas de posicin, asimetra y curtosis
Devuelve la asimetra de una distribucin
COEFICIENTE.ASIMETRIA
Devuelve el cuartil de un conjunto de datos
CUARTIL
Devuelve la curtosis de un conjunto de datos
CURTOSIS
Devuelve la jerarqua de un nmero en una lista de nmeros
JERARQUIA
Devuelve el K-simo mayor valor de un conjunto de datos
K.ESIMO.MAYOR
Devuelve el K-simo menor valor de un conjunto de datos
K.ESIMO.MENOR
Devuelve el valor mximo de una lista de argumentos
MAX
Devuelve el valor mximo de una lista de argumentos,
MAXA
incluidos nmeros, texto y valores lgicos
Devuelve el valor mnimo de una lista de argumentos
MIN
Devuelve el valor mnimo de una lista de argumentos,
MINA
incluidos nmeros, texto y valores lgicos
Devuelve el K-simo percentil de los valores de un rango
PERCENTIL
Devuelve el rango de un valor en un conjunto de datos como
RANGO.PERCENTIL
porcentaje del conjunto
Distribuciones discretas
Devuelve el valor menor cuya desviacin binomial
INV.BINOM
acumulativa es menor o igual que un valor de un criterio
Devuelve la probabilidad de una variable aleatoria discreta
DISTR.BINOM.N
siguiendo una distribucin binomial
Devuelve la probabilidad para una variable aleatoria discreta
DISTR.HIPERGEOM.N
siguiendo una distribucin hipergeomtrica
Devuelve la distribucin binomial negativa o Pascal
NEGBINOM.DIST
Devuelve la distribucin de Poisson
POISSON.DIST
Distribuciones continuas
Devuelve un nmero aleatorio mayor o igual que 0 y menor
ALEATORIO
que 1 distribuido uniformemente. Es voltil
Devuelve un nmero aleatorio entero distribuido
ALEATORIO.ENTRE
uniformemente entre los lmites que se especifique
Devuelve la probabilidad de una variable aleatoria continua
DISTR.CHICUAD
siguiendo una distribucin chi cuadrado de cola izquierda
Devuelve la probabilidad de una variable aleatoria continua
DISTR.CHICUAD.CD
siguiendo una distribucin chi cuadrado de cola derecha
Devuelve la funcin de distribucin beta acumulativa
DISTR.BETA.N
COVAR
94
INV.BETA.N
DISTR.EXP.N
DISTR.F.CD
DISTR.F.N
INV.F
INV.F.CD
DISTR.GAMMA.N
INV.GAMMA
DISTR.NORM.N
DISTR.NORM.ESTAND.N
INV.NORM.ESTAND
INV.NORM
DISTR.T.2C
DISTR.T.N
DISTR.T.CD
INV.T
INV.T.2C
DIST.WEIBULL
NORMALIZACION
Regresin
COEF.DE.CORREL
COEFICIENTE.R2
CRECIMIENTO
ERROR.TIPICO.XY
ESTIMACION.LINEAL
ESTIMACION.LOGARITMICA
INTERSECCION.EJE
PENDIENTE
PRONOSTICO
TENDENCIA
Pruebas
INTERVALO.CONFIANZA.NORM
INTERVALO.CONFIANZA.T
PRUEBA CHICUAD
95
INV.CHICUAD
INV.CHICUAD.CD
PRUEBA.F.N
PRUEBA.FISHER.INV
PRUEBA.T
PRUEBA.Z
96
Las Herramientas para anlisis de datos incluyen las herramientas que se describen a continuacin.
Para tener acceso a estas herramientas, haga clic en Anlisis de datos en el grupo Anlisis de la
ficha Datos.
97
98
99
Al hacer clic sobre cualquier parte del grfico aparecer el men Herramienta de grficos, con sus
opciones Diseo, Presentacin, Formato. Elegimos Presentacin.
A B
A: En el botn Ttulo del grfico, seleccionamos la ubicacin del ttulo encima del grfico y
escribimos: Distribucin de alumnos segn edad.
B: En el botn Rtulos del eje, escogeremos Eje X y Eje Y, segn corresponda y escribiremos su
etiqueta.
100
C: El botn Etiquetas de datos activa la posicin donde irn los valores de cada barra.
Finalmente el grfico quedar de la siguiente manera:
FRECUENCIAS
DISTRIBUCIN DE ALUMNOS
SEGN EDAD
40
20
29
12
0
18 a 19
20 a 21
21 a 22
23 a mas
EDAD
Grfico de sectores: Repita los mismos pasos llevados a cabo para realizar el grfico de barras,
pero teniendo cuidado de seleccionar ahora los valores de la variable Edad y la frecuencia
relativa.
Para hacer que los valores de las etiquetas se muestren en porcentaje, haga doble clic en
cualquier etiqueta y aparecer la ventana Formato de etiqueta de datos y en ella seleccione la
opcin Nmero y elija Porcentaje con dos posiciones decimales. Finalmente Cerrar.
El resultado ser:
11.54%
23.08%
55.77%
18 a 19
20 a 21
101
21 a 22
23 a mas
En la ventana de FRECUENCIA ingrese en Datos el rango de los datos que se desea contar. En
Grupos ingrese el rango de celdas de las categoras de la variable Nmero de hermanos.
102
En la barra de men elija la opcin Insertar, seleccione el tipo Lnea-Lnea con marcadores:
103
Se muestra lo siguiente
20
18
16
14
12
10
Series1
8
6
4
2
0
1
DISTRIBUCIN DE ALUMNOS,
SEGN NMERO DE HERMANOS
20
Frecuencias
15
10
5
0
1
Nmero de hermanos
Para cambiar los valores del eje X dar clic derecho sobre el grfico y elegir Seleccionar origen
de datos Editar.
104
105
Para hacer los bastones, seleccionar el rea del grfico y en herramientas de grfico, la opcin
Lneas Lneas de unin.
DISTRIBUCIN DE ALUMNOS,
SEGN NMERO DE HERMANOS
Frecuencias
20
15
10
5
0
1
Nmero de hermanos
Ahora slo falta colocar las etiquetas de datos en el men Herramientas de grficos
Etiquetas de datos. Finalmente quedar:
Frecuencias
20
19
15
DISTRIBUCIN DE ALUMNOS,
SEGN NMERO DE HERMANOS
11
10
10
0
1
Nmero de hermanos
106
Tabla de frecuencias:
Para ello, elegimos la variable Gastos de alimentacin y procedemos a calcular el rango, nmero de
intervalos y amplitud de intervalo.
Elija una celda y obtenga:
Nmero de datos =CONTAR(L4:L55)
Valor mximo =MAX(L4:L55)
Valor mnimo =MIN(L4:L55)
Rango = Calcule la diferencia entre el mximo y
mnimo valor.
Nmero
de
intervalos
=REDONDEAR(1+3.322*LOG10(52),0).
Recuerde que el nmero de intervalos es entero
redondeado al valor ms cercano.
Amplitud
=REDONDEAR.MAS(AQ23/AP24,0).
Recuerde que la amplitud del intervalo se redondea
por exceso usando la misma cantidad de cifras
decimales que las utilizadas por los datos.
Ahora genere los lmites de cada uno de los intervalos. En una
celda libre elija como el lmite inferior del primer intervalo el
valor mnimo. A partir de este valor genere los dems lmites
sumando la amplitud hasta completar los lmites inferiores y
superiores de los intervalos. Obtenga la marca de clase de
cada intervalo que es el promedio de los respectivos lmites.
Obtenga las frecuencias utilizando la metodologa vista en el
ejercicio anterior, considerando como Datos el rango de los
datos que se desea contar y como Grupos los lmites
superiores de los intervalos. Para ello, elegimos insertar
funcin haciendo clic en
y aparecer la siguiente
ventana:
107
108
Para que se junten los rectngulos, hacer clic en una barra y elegir Dar formato a serie de
datos, luego en Acho del intervalo 0%.
10
5
0
1
Para que aparezcan los lmites de cada clase se procede de la siguiente manera: Haga clic con el
botn derecho en una barra y elija Seleccionar casos.
109
10
5
0
70
146
222
298
374
450
526
Y para finalizar colocar el ttulo del grfico, los rtulos del eje X e Y y de ser el caso modificar el
formato del eje vertical, el cual puede estar en porcentaje en caso de tratarse de la frecuencia
relativa.
DISTRIBUCIN DE ALUMNOS,
SEGN GASTOS EN ALIMENTACIN
23
Frecuencias
25
20
15
10
9
6
3
450
526
70
146
222
298
374
Gastos en alimentacin
110
De una manera similar debe construirse el polgono de frecuencias y la ojiva, tal como se muestra
a continuacin, teniendo en cuenta en agregar una amplitud a la izquierda y derecha de los
valores extremos pero con frecuencia absoluta igual a cero.
DISTRIBUCIN DE ALUMNOS,
SEGN GASTOS EN ALIMENTACIN
Frecuencias
30
23
20
10
9
3
6
1
0
32
De manera similar para la ojiva, agregamos una categora a las frecuencias absolutas
acumuladas que empiece con cero.
60
44
32
40
20
50
51
52
35
9
0
0
70
111
Realice un anlisis de los tipos de errores que se presentan en la entrega a destiempo de los pedidos
y ayude al gerente a decidir cules son las causas principales de este problema.
Solucin:
Ordene las categoras de la tabla segn la frecuencia en orden descendente.
Como las dos ltimas categoras tienen una cantidad muy baja podemos unirlas en otro rubro
denominado Otros. As tenemos:
Seleccionar las celdas que contienen la frecuencia absoluta (f i) y frecuencia porcentual (Pi).
112
Elegimos como tipo de grfico Columnas, el cual est marcado por defecto.
120
100
80
Series1
60
Series2
40
20
0
1
Ahora pulsamos con el botn derecho del mouse en cualquiera de las barras P i. Clic en Cambiar
tipo de grfico en serie y elegimos tipo de grfico Lneas y Aceptar.
113
80
60
Series1
40
Series2
20
0
1
En primer lugar, la escala de valores de la izquierda, cuyo valor mximo viene siendo 120 cuando
debera de ser 100. Para ello, clic con el botn derecho del mouse sobre la lnea del eje Y.
Seleccionar Dar formato a ejes. Seleccionar Opciones de eje Opciones de eje y dar el valor
mximo 100. Clic en Cerrar. Aparecer:
100
90
80
70
60
50
40
30
20
10
0
Series1
Series2
114
Luego pulsamos con el botn derecho del mouse sobre cualquiera de los puntos de la lnea y
elegimos la opcin Dar formato a serie de datos. En el recuadro Opciones de serie,
seleccionar Eje secundario. Luego Cerrar.
120.00
80
100.00
80.00
60
60.00
40
40.00
20
20.00
0.00
1
115
Series1
Series2
Se procede igual que en el paso anterior para modificar los valores del eje de la derecha que est
entre 0 y 120, debiendo de estar entre 0 y 100.
100
100.00
90
90.00
80
80.00
70
70.00
60
60.00
50
50.00
Series1
40
40.00
Series2
30
30.00
20
20.00
10
10.00
0.00
1
Ahora colocaremos los valores sobre los puntos de la lnea. Modificaremos los valores de los
rtulos y agregaremos el ttulo del grfico.
100
90
80
70
60
50
40
30
20
10
0
86.17
92.55
76.60
71
63.30
48
37.77
25
18
12
14
100.00
90.00
80.00
70.00
60.00
50.00
40.00
30.00
20.00
10.00
0.00
Porcentaje
Frecuencias
Otros
Tipo de error
116
Tabla de contingencia:
Seleccione el rango de datos de las variables SEXO y DEPORTE FAVORITO. De ser necesario,
copiarlas en otra parte de la hoja una junto a la otra. Active en la barra de men la opcin
Insertar y luego Tabla dinmica.
117
Luego copie la tabla y pguela en otra posicin. Recuerde pegar slo los valores. Puede darle el
formato final.
10
Varn
5
0
Voley
Hacer doble clic en el rea del grfico y aparecer la pestaa Herramientas de grficos.
Agregar el ttulo, etiquetas de datos y rtulos de ejes. Quedar de la siguiente forma:
17
15
10
5
7
3
7
1
0
Basket
Ciclismo
Ftbol
Ninguno
Deporte
Mujer
118
Varn
Otros
Voley
Series1
20
40
60
80
100
Marque cualquiera de los puntos azules y de clic con el botn derecho del mouse. Marque la opcin
Agregar lnea de tendencia del men desplegable.
Luego cerrar. Adems puede agregar el ttulo del grfico y rotular los ejes. Finalmente quedar como
se muestra.
Estaturas
2.00
1.50
1.00
0.50
0.00
0
20
40
60
Pesos
119
80
100
En Nmero1 ingrese el rango correspondiente a los datos y luego haga clic en Aceptar.
120
121
Ahora, en la parte inferior de las tres columnas vamos a crear un cuadro donde calcularemos dichos
valores, haciendo uso de las funciones estadsticas de Excel. As tenemos:
Luego creamos otra tabla donde se calculan las dimensiones del grfico:
A
B
C
D
E
122
A: Est dado por el mismo valor del cuartil 1 calculado en la tabla superior.
B: Est dado por la diferencia entre la mediana y el cuartil 1 de la tabla superior.
C: Est dado por la diferencia entre el cuartil 3 y la mediana de la tabla superior.
D: Est dado por la diferencia entre el mximo y el cuartil 3 de la tabla superior.
E: Est dado por la diferencia entre el cuartil 1 y el mnimo de la tabla superior.
Ahora vamos a realizar el grfico. Para ello, seleccionamos los nombres de variable y presionando
CTRL los valores de A, B y C.
A
B
C
D
E
Luego elegimos el men Insertar y elegimos grfico de Columnas agrupadas.
500
400
300
Series3
Series2
200
Series1
100
0
ALIMENTACION
123
MOVILIDAD
DIVERSION
500
400
300
200
100
0
Series3
CLI
C
Series2
Series1
124
700
600
500
400
300
200
100
0
Series3
Series2
Series1
Ahora hacemos lo mismo en la parte inferior de las barras para modificar el grfico. Seleccionamos
haciendo clic en cualquier rectngulo que se encuentra bajo las barras y aparecer nuevamente
Herramientas de grficos, seleccionamos nuevamente Barras de error, Ms opciones de las
barras de error y ahora elegimos en Mostrar los valores Menos y en Cuanta de error hacemos
clic en Personalizado.
700
600
500
400
300
200
100
0
Series3
Series2
Series1
125
700
600
500
400
300
200
100
0
ALIMENTACION
MOVILIDAD
DIVERSION
Mantener
este
orden
126
700
600
ALIMENTACI
N
500
400
MOVILIDAD
300
200
DIVERSIN
100
0
Q1 MIN Me MAX Q3
Luego, en la barra de men escoger Insertar, luego Diseo y finalmente Cambiar entre filas y
columnas. El grfico cambiar a:
700
600
500
400
300
200
100
0
Q1
MIN
Me
MAX
Q3
Marque cualquiera de las lneas horizontales y haga clic con el botn derecho del mouse.
Elija la opcin Formato de serie de datos. Luego aparece la siguiente ventana:
En ella elija la opcin Color de lnea y marque la Sin lnea.
Con esto eliminar la lnea horizontal. Hay que repetir este proceso
hasta eliminar todas las lneas.
El grfico quedar como sigue:
700
600
500
Q1
400
MIN
300
Me
200
MAX
100
Q3
0
ALIMENTACIN
127
MOVILIDAD
DIVERSIN
Luego d clic en el grfico y elija la opcin Anlisis, Barras ascendentes o descendentes y nos
dar como resultado:
700
600
500
400
300
200
100
0
Q1
MIN
Me
MAX
Q3
Luego para hacer los bigotes de las cajas, se selecciona Anlisis, Lneas y luego Lneas de
mximos y mnimos.
700
600
500
400
300
200
100
0
Q1
MIN
Me
MAX
Q3
n
P k pk .qnk
k
Donde:
p = Probabilidad del xito
q = Probabilidad del fracaso
n = Nmero de ensayos
128
Varianza: 2x n.p.q
Ejemplo 1:
Un examen de Estadstica de eleccin mltiple contena 20 preguntas y cada una de ellas tena 5
alternativas de respuesta. Si un estudiante desconoca todas las respuestas correctas y contest su
examen al azar: a) Cul es la probabilidad de que conteste correctamente 5 preguntas?, b) Cul es
la probabilidad de que conteste correctamente a lo ms 5 preguntas?
Solucin a):
Hacer clic en Insertar funcin.
Cuando se abre el cuadro de dilogo, elegir la categora Estadsticas y la funcin DISTR.BINOM.N y
pulsar Aceptar.
129
Solucin b):
Repetir todos los pasos anteriores, pero con la nica diferencia de que ahora ingresamos 1 en la
casilla Acumulado.
k=5
n = 20
p = 1/5 = 0.2
En el recuadro
Acumulado digitar 1
para hallar la
probabilidad P(X<5),
es decir la probabilidad
acumulada de
contestar
correctamente 0, 1, 2,
3, 4 5 preguntas.
r N r
x n x
P x
; (para 0 x r)
N
n
Donde:
N = Tamao de la poblacin
r = Nmero de xitos en la poblacin
x = Nmero de xitos que son de inters
n = Nmero de ensayos
Propiedades:
r
Media: x n
N
r N n
r
Varianza: 2x n 1
N
N
N 1
Ejemplo 2:
En un lote de 150 computadoras de la marca IBM, existen 40 computadoras con el disco duro
daado. Un comprador desea adquirir todo el lote, pero lo har siempre y cuando, al elegir 60
computadoras al azar, al probarlas a lo ms 3 de ellas estn daadas. Calcule: Cul es la
probabilidad de que 2 de las computadoras estn daadas?, b) Cul es la probabilidad de que el
comprador no adquiera el lote?
Solucin a):
Hacer clic en Insertar funcin.
Cuando se abre el cuadro de dilogo,
DISTR.HIPERGEOM.N y pulsar Aceptar.
elegir
130
la
categora
Estadsticas
y la
funcin
Excel mostrar:
Lo cual indica que la probabilidad de encontrar slo 2 computadoras daadas es muy baja.
Solucin b):
Para no aceptar el lote, se debe cumplir que X>3, es decir, encontrar ms de 3 computadoras
daadas en la muestra de 60 computadoras.
Para calcular dicha probabilidad haremos uso del suceso complementario, es decir, a la probabilidad
del espacio muestral que es igual a 1, le restamos la probabilidad acumulada para x=0; x=1; x=2; x=3.
131
completarlo de la
X .e
P x
x!
; e 2,71828
Donde:
= Nmero promedio de ocurrencias por intervalo.
x = Nmero de xitos que se esperan.
Propiedades:
Media aritmtica = x
Varianza = 2x
Ejemplo 3:
En una farmacia del distrito de El Tambo se observ que en las ltimas 84 horas de atencin al
pblico (12 horas diarias durante una semana), 1 176 personas han ingresado a la farmacia. Se
desea conocer la probabilidad de que 8 personas ingresen en el lapso de una hora de atencin al
pblico.
132
Solucin:
Al observar que 1176 personas han ingresado a la farmacia en 84 horas, podemos ver que dicho
promedio no est en funcin de una hora, tal como lo pide la pregunta. Por lo tanto, convertimos el
promedio a una hora: 1 176/84 = 14 personas por hora.
Hacer clic en Insertar funcin.
Cuando se abre el cuadro de dilogo, elegir la categora Estadsticas y la funcin POISSON.DIST y
pulsar Aceptar.
Aparecer la ventana:
x=8
= 14
En el recuadro
Acumulado digitar 0
para hallar la
probabilidad P(X=8), es
decir la probabilidad de
que ingresen a la
farmacia exactamente 8
personas en una hora.
Excel mostrar:
133
a)
b)
c)
d)
Solucin a):
Seleccione Insertar funcin y elija la categora Estadsticas y la funcin DISTR.NORM.N, luego pulse
Aceptar.
En el recuadro
Acumulado digitar 1
para que calcule la
probabilidad
acumulada.
Excel mostrar:
Solucin b):
Para calcular P(191 < X < 209) se calcular la diferencia: P(X < 209) P(X < 191)
En la barra de frmulas ingrese:
134
En el recuadro
Acumulado digitar 1
para que calcule la
probabilidad
acumulada.
Excel mostrar:
Solucin c):
La probabilidad de que un vaso se derrame es P(X>230), entonces aplicando el complemento
tenemos:
P(X>230) = 1-P(X<230) = 1-DISTR.NORM.N(230,200,15,1) = 1-0,97725 = 0,02275
Solucin d):
El clculo requiere utilizar la funcin inversa dado que el dato es la probabilidad y la incgnita es el
valor de la variable.
Seleccione Insertar funcin y elija la categora Estadstica y en ella la funcin INV.NORM
135
Excel mostrar:
Que viene a ser el valor debajo del cual se obtiene el 25% de refrescos con menor
contenido.
136
ANEXO N2
137
IBM SPSS Statistics es un software estadstico muy utilizado para trabajos de investigacin en
ciencias sociales y en empresas de investigacin de mercado. Originalmente fue creado como el
acrnimo de Statistical Package for the Social Sciences. Fue creado en 1968 por Norman H. Nie, C.
Hadlai Hull y Dale H. Bent. Originalmente el programa fue creado para grandes computadoras. En
1970 se publica el primer manual de usuario del programa y en 1984 sale la primera versin para
computadoras personales.
Es un sistema amplio y flexible de anlisis estadstico y gestin de informacin que es capaz de
trabajar con datos procedentes de distintos formatos, generando desde sencillos grficos de
distribuciones y estadsticos descriptivos hasta anlisis estadsticos complejos que nos permitirn
descubrir relaciones de dependencia e interdependencia, establecer clasificaciones de sujetos y
variables, predecir comportamientos, etc. Su aplicacin fundamental est orientada al anlisis
multivariante de datos experimentales.
138
La ventana Vista de datos contiene el archivo de datos sobre el que se basa la mayor parte de las
acciones que es posible llevar a cabo con el SPSS. El Editor de datos se abre automticamente
cuando se entra en el SPSS. En esta ventana las filas indican los casos y las columnas las variables.
Cada celda corresponde al valor que una determinada variable adopta en un cierto caso.
Mientras que en la ventana Vista de variables se define la estructura de las variables que
comprende la tabla de datos.
En esta ventana se describen las caractersticas de cada una de las variables con que se est
trabajando. En ella, las filas corresponden a cada variable y las columnas nos permiten acceder a sus
caractersticas.
Nombre: Limitado a 64 caracteres, no puede incluir espacios ni caracteres especiales como *, $,
, etc.
Tipo de variable:
139
Anchura: Establece el nmero de cifras o dgitos que contendr cada dato, incluidas las cifras
decimales.
Decimales: Establece el nmero de cifras decimales que sern consideradas en cada dato.
Etiqueta: Con esta opcin usted puede asignar un nivel ms descriptivo a sus variables ya que la
opcin Nombre no le permite utilizar ms de 64 caracteres por variable.
Valores: Con esta opcin usted puede asignar valores numricos a todas sus variables
categricas, es decir, codificarlas.
Perdidos: Esta opcin le permite asignar un valor alternativo cuando se encuentren celdas vacas
en los datos.
Medida: Esta opcin le permitir especificar si la escala de la variable es de tipo ordinal, nominal
o de escala.
140
Otra ventana que aparece en SPSS es El Visor de resultados, en la cual se recoge toda la
informacin (estadsticos, tablas, grficos, etc.) que el SPSS genera como consecuencia de las
acciones que lleva a cabo. Permite editar los resultados y guardarlos para su uso posterior.
141
Se debe escribir el cdigo en el recuadro Valor y en el recuadro Etiqueta se debe digitar el nombre
que se le asigna al valor. Finalmente se da un clic en el botn Aadir.
La estructura propiamente dicha de la base de datos de nuestra encuesta quedar de la siguiente
manera:
142
El botn
Especifique el nombre en el recuadro Nombre de Archivo, por defecto SPSS guarda los archivos
con extensin sav.
1.5 Leer/Importar un archivo de datos:
143
SPSS nos permite abrir una base de datos creada en el mismo programa (leer) como bases de
datos creadas en otros programas similares (importar) tales como Excel, Lotus, dBase, etc. Para
ello ingrese a la opcin Archivo de la barra de mens y elija la opcin Abrir y la sub opcin
datos.
144
1.1. Variables:
Esta opcin, accesible desde el cono ubicado en la barra de herramientas estndar, permite
obtener informacin de las variables que intervienen en el archivo de trabajo activo. Al presionar
en l resulta el siguiente cuadro de dilogo.
145
Permite insertar una variable (en blanco) en la posicin en que se encuentra el cursor,
desplazando todas las columnas hacia la derecha y nombrando a dicha variable por
defecto.
146
Se pueden ordenar los casos de acuerdo a una o ms variables, ya sea en forma ascendente o
descendente, tanto numrica como alfabticamente.
147
La primera opcin del cuadro es Analizar todos los casos, no crear los grupos; esta opcin nos
permite trabajar con todos los casos de la base y calcular los resultados de los estadsticos
empleando la totalidad de los casos u observaciones. La segunda opcin corresponde a
Comparar los grupos; esta opcin nos permite comparar los resultados de los procedimientos que
se realicen con el programa para las categoras de la variable de agrupacin; para realizar la
comparacin el programa realiza los clculos solamente con los datos de cada categora y
presenta los resultados de forma comparativa; es decir ubica de forma jerrquica los resultados
de cada categora (por ejemplo: tabla categora 1, tabla categora 2, grfico categora 1, grfico
categora 2, estadstico categora 1, estadstico categora 2).
148
La tercera opcin corresponde a Organizar los resultados por grupos; esta opcin es muy similar
a la opcin anterior, con la diferencia que los resultados de los procedimientos que se realicen
con el programa se representan en forma organizada (Por ejemplo: Tabla Cat1, Grfico Cat1,
Estadstico Cat1, Tabla Cat2, Grfico Cat2, Estadstico Cat2). Esta opcin es bastante til si
nosotros deseamos hacer un anlisis separado de la muestra por algn tipo de rangos, como
por ejemplo el gnero, la regin, la fecha, etc.
149
Para realizar la segmentacin de archivo debemos seleccionar una de las dos ltimas opciones,
de manera que se active la casilla Grupos basados en; una vez se activa se ingresa en ella la
variable o las variables que deseamos utilizar como rango y finalmente hacemos clic en Aceptar.
Despus de segmentar el archivo, cada procedimiento (tablas, grficos o estadsticos) que se
realice con el programa, mostrar los resultados de acuerdo a la segmentacin.
1.8. Seleccionar casos:
A travs de esta opcin, podemos seleccionar solamente los casos que cumplan con los criterios
que el investigador imponga; por ejemplo, las personas del gnero femenino. A su vez, este
procedimiento nos brinda la oportunidad de pedirle al programa que tome un fragmento de los
casos de forma aleatoria. Al activar la seleccin de casos el programa realiza los clculos de los
procedimientos slo con los casos que hayan sido seleccionados.
Podemos seleccionar solamente a las mujeres de la base de datos anterior. Para ello elegimos la
opcin Si se satisface la condicin. En ella, se elige la variable que servir como condicin para
la seleccin, que en nuestro caso es el sexo del encuestado. Seguidamente, teniendo elegida la
variable la igualamos al valor 2 que viene a ser la codificacin con la que se creo la base de
datos.
Con esto habremos seleccionado slo a las mujeres que conforman la base de datos, lo cual se
ver reflejado en la Ventana de datos con una tarja sobre los registros correspondientes a
varones.
A partir de ahora, toda operacin que se realice, ya sea clculo de un estadgrafo, tabla o grfico
se har nicamente con los registros de datos correspondientes a mujeres.
150
151
Si ahora deseamos seleccionar a todas las mujeres que tienen como distrito de residencia El
Tambo, SPSS cuenta con la posibilidad de crear condiciones compuestas, haciendo uso del
operador lgico ampersand &. Para ello ingresamos la condicin compuesta:
El resultado ser:
Los recuadros
muestran los
registros que
quedaron
seleccionados,
donde slo
aparecen
mujeres que
viven en El
Tambo.
152
En ella podemos elegir las variables que servirn para hacer el clculo e indicar la nueva variable
que contendr el resultado.
153
154
La primera opcin es Valores antiguos y nuevos. En esta ventana se especifica cules son los
valores antiguos que han de ser remplazados y cules son los valores nuevos que remplazarn.
En este caso elegimos el recuadro Valor antiguo y la quinta opcin Rango, INFERIOR hasta
valor, ya que deseamos que recodifique a las personas que leyeron de 0 libros a 2 libros,
inclusive. En dicho casillero ingresamos el nmero 2. Luego, en el recuadro Valor nuevo,
elegimos la opcin Valor y asignamos 0. Finalmente, hacemos clic en Aadir. Finalmente
elegimos Continuar y SPSS mostrar la recodificacin.
de
un
los
Es
un
155
En diferente variable:
Ahora suponga que queremos recodificar a las personas que han ledo exactamente 3 libros con
el nmero 99. Pero esta vez, queremos recodificar en una nueva variable. Originalmente la base
es:
Seguidamente
seleccionamos la ventana
Valores antiguos y
nuevos haciendo clic en
el botn.
Dicha ventana al igual
que la anterior nos
pedir cules son los
valores antiguos que
sern remplazados y
cules
los
valores
nuevos que remplazarn
a los anteriores.
156
Ahora elegimos el recuadro Valor antiguo y en la opcin Valor ingresamos el nmero 3 (esto
porque slo queremos remplazar a los que leyeron exactamente 3 libros) y en Valor nuevo,
ingresamos 99 en la opcin Valor. Luego presionamos el botn Aadir y finalmente Continuar.
SPSS crear una nueva variable con el nombre especificado y en ella realizar la recodificacin.
157
OPCIN GRFICOS:
Tipo de grfico. Los grficos de sectores muestran la contribucin
de las partes a un todo. Cada sector de un grfico de este tipo
corresponde a un grupo, definido por una nica variable de
agrupacin. Los grficos de barras muestran la frecuencia de
cada valor o categora distinta como una barra diferente,
permitiendo comparar las categoras de forma visual. Los
histogramas tambin cuentan con barras, pero se representan a
lo largo de una escala de intervalos iguales. La altura de cada
barra es el recuento de los valores que estn dentro del intervalo
para una variable cuantitativa. Los histogramas muestran la
forma, el centro y la dispersin de la distribucin. Una curva
normal superpuesta en un histograma ayuda a juzgar si los datos
estn normalmente distribuidos.
OPCIN FORMATO:
158
Marcamos la opcin Mostrar tablas de frecuencias para que SPSS genere automticamente la
tabla de frecuencias para la variable elegida. Luego, en Grficos elegimos Barras y en Valores del
grfico elegimos Frecuencias. El resultado ser:
SEXO DEL ENCUESTADO
Frecuencia
Vlidos
Porcentaje
Porcentaje
Porcentaje
vlido
acumulado
MUJER
14
46,7
46,7
46,7
VARN
16
53,3
53,3
100,0
Total
30
100,0
100,0
159
La Ventana de resultados nos permite editar los grficos y las tablas para personalizar an ms los
resultados. Para ello, elija la tabla y haga doble clic, se activar el Editor de tablas, el cual se ver
como una lnea punteada alrededor de la tabla.
Ahora podemos cambiar el tipo de fuente y su tamao, colores y dems caractersticas concernientes
nicamente a las tablas de frecuencias.
Para ello haga clic en el botn derecho del ratn, aparecer la siguiente ventana:
160
161
El resultado ser:
La ventana de resultados tambin permite modificar las propiedades de los grficos a travs del
Editor de grficos, desde donde podr cambiar el aspecto como los colores, agregar las etiquetas de
valores a cada categora de la variable, generar grficos tridimensionales, etc.
Al hacer doble clic sobre cualquier parte del grfico se activa el Editor de grficos;
162
Etiquetas de
datos
Color de
relleno y de
borde
3.5 Histograma:
163
Los histogramas nos permiten identificar diversos parmetros como la dispersin, la distribucin y la
concentracin de los datos en una variable de Escala. Este tipo de grficos generan una
representacin visual del comportamiento de los datos, permitiendo observar rasgos caractersticos
como la zona o rango de mayor concentracin, la amplitud, los valores extremos, etc.
Para elaborar el histograma de la variable ESTATURA de nuestra base de datos, elegimos la opcin
Histograma de la ventana Grficos.
Al seleccionar la opcin Mostrar curva normal en el histograma se sobrepone una curva normal
con la finalidad de comparar si los datos tienen a distribuirse de forma uniforme. El resultado ser:
164
ARRASTRAR
ARRASTRAR
165
166
El resultado ser:
167
168
Pero si ahora quisiramos obtener la misma tabla, pero agrupada de acuerdo a la variable SEXO,
tendremos que ingresar dicha variable en la ventana Capa 1 de 1.
El resultado mostrado ser el que se presenta en la tabla siguiente, donde la variable SEXO ha
servido para separar o agrupar los resultados en la tabla de contingencia.
Elegimos
otra
variable de
agrupacin
para la
Capa 2
El resultado ser:
169
Tabla de contingencia ESTADO CIVIL DEL ENCUESTADO * DISTRITO DE RESIDENCIA DEL ENCUESTADO *
SEXO DEL ENCUESTADO * TRABAJA EL ENCUESTADO?
Recuento
TRABAJA
EL
ENCUESTAD
O?
SEXO DEL
ENCUESTADO
VARN
MUJER
Total
ESTADO CIVIL
DEL
ENCUESTADO
Total
ESTADO CIVIL
DEL
ENCUESTADO
Total
ESTADO CIVIL
DEL
ENCUESTADO
SOLTERO(A)
CASADO(A)
UNIN LIBRE
DIVORCIADO(
A)
VARN
NO
MUJER
2
1
SOLTERO(A)
1
0
5
1
CASADO(A)
1
1
0
1
1
0
1
1
0
2
0
2
2
2
2
3
2
1
0
2
3
1
0
2
0
1
1
1
0
0
7
6
3
1
3
1
1
1
1
4
3
2
1
5
2
2
2
0
6
5
3
2
2
1
0
0
0
1
1
1
1
1
0
0
1
0
1
1
0
1
11
4
3
4
1
12
10
6
5
1
7
2
1
1
0
11
4
1
1
0
3
0
2
1
0
2
1
0
0
1
23
7
4
3
5
2
1
1
1
5
4
2
2
7
2
2
2
0
6
6
3
3
3
1
1
0
0
2
1
3
1
1
0
0
1
0
1
1
0
1
16
5
4
4
1
14
12
8
7
1
10
0
13
0
5
0
2
1
30
SOLTERO(A)
CASADO(A)
UNIN LIBRE
DIVORCIADO(
A)
SOLTERO(A)
CASADO(A)
UNIN LIBRE
DIVORCIADO(
A)
SOLTERO(A)
CASADO(A)
UNIN LIBRE
VIUDO(A)
Total
Total
ESTADO CIVIL
DEL
ENCUESTADO
SOLTERO(A)
CASADO(A)
UNIN LIBRE
DIVORCIADO(
A)
VIUDO(A)
Total
VARN
ESTADO CIVIL
DEL
ENCUESTADO
SOLTERO(A)
CASADO(A)
UNIN LIBRE
DIVORCIADO(
A)
Total
Total
MUJER
ESTADO CIVIL
DEL
ENCUESTADO
SOLTERO(A)
CASADO(A)
UNIN LIBRE
VIUDO(A)
Total
Total
ESTADO CIVIL
DEL
ENCUESTADO
1
1
2
Total
ESTADO CIVIL
DEL
ENCUESTADO
Total
Total
ESTADO CIVIL
DEL
ENCUESTADO
SOLTERO(A)
CASADO(A)
UNIN LIBRE
DIVORCIADO(
A)
VIUDO(A)
Total
170
La ventana Estadsticos
mostrar:
MEDIDAS DE
TENDENCIA
CENTRAL
MEDIDAS DE
POSICION
RELATIVA
MEDIDAS DE
DISPERSIN
MEDIDAS DE
ASIMETRA Y
CURTOSIS
171
El resultado ser:
Para emplear cualquiera de los estadsticos del procedimiento Frecuencias slo basta con activarlo
haciendo clic sobre la casilla que se encuentra a la izquierda de cada medida, de manera que
aparezca en ella un visto bueno. Podemos seleccionar todos los estadsticos que deseemos, teniendo
como nica limitante el nivel de medida de cada variable.
Una vez obtenidos los estadsticos slo queda interpretarlos para poder describir mejor nuestro
conjunto de datos.
172
REFERENCIAS BIBLIOGRFICAS
Estadstica
Aplicada.
Centro
de
Investigacin
173