Professional Documents
Culture Documents
Distribuciones de Frecuencias
Es usual presentar la ordenacin de datos muy numerosos, en forma agrupada y ordenada, en
clases o categoras. Determinar el nmero de individuos que pertenecen a cada clase, se
denomina, Frecuencia de Clase.
Una disposicin tabular o Tabla de Datos, junto con las correspondientes frecuencias de clase, se
llama Distribucin de Frecuencias, o Tabla de Frecuencias.
Para confeccionar estas Tablas de Frecuencias, debemos considerar las siguientes situaciones:
Si la variable que estamos midiendo, es de tipo Discreto, asumen valores de un conjunto
finito, entonces podemos realizar la distribucin en columnas, en las cuales se registran los
valores de la variable y las frecuencias asociadas a ellas.
Si la variable que estamos midiendo, es de tipo Continuo, pueden tomar cualquier intervalo
determinado por los nmeros reales, no tiene sentido tabularla para cada una de las
observaciones, dado que es muy improbable que la variable bajo estudio tome el mismo valor
durante el experimento. Dicho de otro modo, cuando en una distribucin de frecuencias haya
muchos valores distintos de la variable, conviene agruparlos en Intervalos o Clases.
Agrupacin de Intervalos
Se debe considerar:
Recorrido o Campo de Variacin de la Variable(RANGO): Es la diferencia entre el mayor y el
menor valor que ella toma.
Es decir: Valor mximo valor mnimo
Nmero de Intervalos:
Debe cumplir con dos condiciones:
a.- Resumir la informacin
b.- Conservar el detalle de la muestra
Existen diferentes criterios que permiten determinar el nmero de intervalos. Uno de ellos
corresponde a determinar la raz cuadrada del tamao de la muestra
n
Nmero de intervalos =
Tamao o amplitud de los Intervalos:
Dependen de la cantidad de datos de la muestra y de su recorrido.
c=
Rango de la muestra
nmero de int ervalos
Ejemplos :
Variable Tipo Discreto
Los siguientes datos corresponden a las edades (en aos) de un grupo de 34 personas:
45 36 72 54 45 72 48 62 38 43 48 64 43 36 54 72 64
60 70 38 64 60 70 48 72 62 72 48 54 64 70 43 60 45
Tabla de frecuencias que corresponde es:
Edad
N de personas
36
2
38
2
43
3
45
3
48
4
54
3
60
3
62
2
64
4
70
3
72
5
34
Variable Tipo Continuo
Despus de medir los resultados obtenidos en una prueba para postular a un cargo administrativo
dentro de una empresa. de 40 personas, resultaron los siguientes valores de la variable:
154 178 150 166 181 175 163 175 150 162
152 155 161 165 160 159 160 168 162 162
163 155 157 161 162 155 167 164 165 158
158 163 166 167 156 164 170 176 172 160
Rango de la muestra = 181 - 150 = 31
Si elige intervalos de cuatro puntos de diferencia entre los valores extremos, de cada intervalo
entonces:
31:4 = 7,75 aprox. 8 intervalos
Tabla de Frecuencias:
Intervalo
150-154
154-158
158-162
162-166
166-170
170-174
174-178
178-182
N de personas
3
6
8
11
5
2
3
2
Tablas de Frecuencias
Para facilitar el resumen de la informacin contenida en las Tablas de Frecuencias, es necesario
definir algunos conceptos:
a)
n f i f1 f 2 .......... f m
i 1
c)
Frecuencia Relativa ( h
i)
d)
Frecuencia Relativa Porcentual
Corresponde a la Frecuencia Relativa multiplicada por 100.
h i 100
e)
Frecuencia Absoluta Acumulada
Corresponde a los valores una vez ordenados que van siendo agregados a travs de las distintas
clases o categoras.
Fi f 1 f2 ................ f k
Propiedad a cumplir : Fm = n
f)
Frecuencia Relativa Acumulada
Corresponde a la Frecuencia Absoluta acumulada partido por el total de observaciones.
Hi
Fi
n
Propiedad a cumplir:
H m % 100%
Intervalos o clases
Para Tablas, en que la variable est representada por Intervalos, es necesario definir algunos
otros conceptos que nos sern de utilidad ms adelante.
a)
4
El smbolo que define una Clase, como el 150-154, en nuestro ejemplo, se llama Intervalo de
Clase. Los nmeros extremos, 150 y 154 se llama lmite inferior de clase (150) y lmite superior
de clase (154).
b)
Fronteras de Clase o lmites reales
Si se dan alturas con precisin de 1 cm., el intervalo de clase 150-154 incluye tericamente todas
las medidas desde 149,5 a 154,5. Estos nmeros se llaman Fronteras de Clase o Lmites Reales de
Clase. En la prctica, los lmites reales se obtienen promediando el lmite superior de un intervalo
con el inferior del siguiente.
c)
Marca de Clase
150-154
154-158
158-162
162-166
166-170
170-174
174-178
178-182
152
156
160
164
168
172
176
180
Observacin :
3
6
8
11
5
2
3
2
hi 100
Hi %
3
9
17
28
33
35
38
40
7,5%
15 %
20 %
27,5%
12,5%
5%
7,5%
5%
7,5 %
22,5 %
42,5 %
70,0 %
82,5 %
87,5 %
95,0%
100,0%
c)
Ojiva
Otra representacin grfica de las Tablas de Frecuencias es la Ojiva, la diferencia entre sta y el
Histograma, o el Polgono de Frecuencias, es que la Ojiva representa la distribucin de
frecuencias acumuladas por debajo de cualquiera de las fronteras de clase superiores respecto de
dicha frontera.
Por ejemplo
PROBLEMAS RESUELTOS
1. Dadas las siguientes variables, clasifquelas, en atributos, variables discretas o continuas:
a)
Valor de la U.F.
b)
Sueldo de un asistente judicial, en la Regin Metropolitana
c)
Nmero de cargas familiares de un grupo de trabajadores
d)
Nmero de personas que ingresa diariamente a un banco
e)
Valor de dlar
f)
Nmero de fojas, que contiene un expediente judicial
g)
Nacionalidad de los asistentes a un evento musical
6
Solucin:
a) Variable continua
b) Variable continua
c) Variable discreta
d) Variable discreta
e) Variable continua
f) Variable discreta
g) Atributo
2) Los siguientes datos corresponden al nmero de empleados que tienen demanda por pensin
alimenticia, en veinte empresas del rubro metalrgico:
5
2
3
1
0
4
2
3
2
3
1
2
3
2
2
0
1
0
5
4
H i , el primer valor
La quinta columna corresponde a la frecuencia relativa acumulada
acumulado es igual al primer valor de la frecuencia relativa, los siguientes valores , se obtienen a
partir de sumas acumuladas.
Nmero
Empleadosf i (Nmero
0
1
2
3
4
5
Totales:
3
3
6
4
2
2
20
Empresas) F i
3
6
12
16
18
20
hi 100
15%
15 %
30 %
20%
10 %
10 %
100%
Hi
15 %
30 %
60 %
80 %
90 %
100 %
c) Qu tanto por ciento de las empresa presentan entre dos y tres demandas por pensin
alimenticia?
d) Nmero de empresas que presentan a lo menos cuatro trabajadores con problemas
judiciales.
Solucin :
a) Doce empresas, presentan menos de tres trabajadores con demanda alimenticia, esto se
obtiene, considerando la suma de ninguno, uno y dos trabajadores que cumplen esta condicin.
b) 15% de las empresas no tienen problemas judiciales, esto lo obtenemos directamente a partir
de la tabla.
c) El cincuenta por ciento de las empresas presentan entre dos y tres demandas judiciales, esto
corresponde a la suma de la frecuencia relativa de dos y tres trabajadores.
d) Cuatro empresas presentan a lo menos cuatro trabajadores con problemas judiciales, que
corresponde a la suma de las frecuencias absolutas de cuatro y cinco trabajadores.
Represente grficamente la informacin anterior.
3) La siguiente informacin nos proporciona el nmero de causas que ingresan en un da
determinado a la corte de apelaciones , presentadas por 50 abogados de diferentes empresas:
5
8
4
10
20
12
3
11
15
17
8
15
7
4
14
25
18
9
8
11
4
14
12
5
3
10
9
14
12
4
15
6
10
11
1
23
7
11
14
18
2
6
14
8
12
0
21
4
9
10
Nmero
i 1
de causasMarca de clase xi
xi
0-5
5 10
10 -15
15 -20
20 -25
Totales:
2,5
7,5
12,5
17,5
22,5
f i (N
de abogados) F i
10
13
17
6
4
50
10
23
40
46
50
hi %
Hi
20% 20%
26% 46 %
34% 80 %
12% 92 %
8% 100 %
100%
8
Qu cantidad de abogados ingresa menos de 10 causas?
Entre que rango varan el mayor nmero de causas que presentan estos profesionales?
Solucin:
Observando los valores de la tabla de distribucin, podemos responder las interrogantes
anteriores, en forma similar al problema anterior
30 abogados ingresan entre 5 y 15 menos de 15 causas.
92% de los abogados ingresan menos de 20 causas.
23 abogados ingresan menos de 10 causas
Diecisiete abogados presentan entre 10 y menos de 15 causas
PROBLEMAS PROPUESTOS
1. La siguiente informacin corresponde a los sueldos de 40 empleados de la empresa XXX
HISTOGRAMA
% de em pleados
sueldos de em pleados
30%
28%
26%
24%
22%
20%
18%
16%
14%
12%
10%
8%
6%
4%
2%
0%
620 - 665
665 - 710
710 - 755
755 - 800
800 - 845
845 - 890
Ingresos
Media =
Donde :
xi
xi
= i 1
n
xi
i 1
x i f i
i 1
34 33 44 29 45 25 210
35
6
6
Se interpreta como que la mayora de las personas tiene edad cercana a los 35 aos.
10
X
Ejemplo :
x1 n1 x 2 n 2 ... x k n k
n 1 n 2 ... n k
1)
x i x 0
i 1
2) k x =
3)
kx
k x k x
; k R
; k R
Ejemplo :
Los siguientes datos corresponden a las edades de 8 personas:
x i : 35, 25, 36, 45, 36, 39, 40, 26.
35 25 36 43 36 39 40 26
35
8
40 30 41 48 41 44 45 31
Cul ser la media dentro de 5 aos? x =
40
8
ii)
556 600
= 578
2
11
2 F i1
M e = L IR + c
fi
Donde
L i : Es el lmite inferior del intervalo o clase.
C : es la amplitud del intervalo
F i 1 : Es la frecuencia acumulada del intervalo anterior.
f i : es la frecuencia absoluta de la clase o intervalo.
Profundidad de Mediana
d(Me )
n 1
2
6, 7 , 8 , 9 , 9 y 10
d( Me)
significa
6 1
3,5
2
Esto
que, la mediana est a la mitad entre la porciones de datos tercera y cuarta. Luego
Me = 8,5
Ejemplo : La siguiente distribucin de frecuencias representa el nmero de das durante un
ao, que los empleados y obreros de una compaa manufacturera, estuvieron
ausentes del trabajo debido a enfermedad.
N de
inasistencias
02
35
68
9 11
12 - 14
n = 50
N de empleados ( f
i )
5
12
20
10
3
n
2
50
5
17
37
47
50
25
25 17
= 6,7
20
M e = 5,5 + 3
Interpretacin :
Para este grupo de 50 empleados , el 50% de las inasistencias se
encuentra en 6,7 7 das.
Moda ( M o ) : La moda de un conjunto de datos
valor de mayor frecuencia.
12
Si hay dos datos que tienen la misma frecuencia, y esta frecuencia es la ms alta, los dos
valores son moda. En tal caso la distribucin se denomina bimodal . Si ningn valor se
repite, no hay moda.
Ejemplo : Los siguientes valores representan los sueldos ( en miles de pesos)
funcionarios de la empresa G. E: 600, 556, 356, 700, 450, 659. 450 , 450.
de 8
Ejemplo :
IR
1
1
+ c
N de empleados ( f
i )
5
12
20
10
3
2 = f 3 f 4 = 20 10 = 10
M o = 5,5 + 3 8 10 = 6.83
Interpretacin:
El nmero de inasistencias que ocurre mms se repite para la
muestra de 50 empleados es de 6,8 = 7 das
El valor denominado moda, no siempre es un valor de la muestra.
COMPARACIN ENTRE MEDIA, MEDIANA, Y MODA.
i) Si la distribucin de frecuencias de la variable es simtrica, las tres medidas coinciden.
ii) Si la distribucin es unimodal y es sesgada a la derecha ( asimtrica positiva) , entonces
Mo<Me < x
13
iii) Si la distribucin es unimodal y es sesgada a la izquierda
entonces
( asimtrica negativa ) ,
x < Me < Mo
Ejemplo 2:
p n
100 F i1
Pp= Li+ c
fi
fi
6
5
16
Fi
6
11
27
14
40 50
50 60
60 70
70 - 80
i)
10
5
5
8
Determinar el percentil 40 .
n = 55
p n
100
37
42
47
55
40 55
100
22
100 11
P 40 = 30 + 10
16
= 36,875 = 36,88
b) Cuartiles :
Medida de localizacin que divide la poblacin o muestra en cuatro partes
iguales.
Q1= Valor de la variable que deja a la izquierda el 25% de la distribucin.
Q j LIR 4
fi
Su expresin es :
Observacin :
25
=Q
50
=Q
75
=Q
nj
10
LIR
F
i 1
f
Observacin :
decir :
Me=P
50
=Q
=D
EJEMPLO:
Dada la siguiente distribucin de frecuencia , calcular Q 1 , Q3 , D3 y P45
Li-1
45
55
65
75
85
Li
55
65
75
85
95
ni
6
10
19
11
4
Ni
6
16
35
46
50
15
es muy
Clculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al
25% de N=50, corresponde al 2 intervalo. (50/4 = 12.5)
Anlogamente calculemos Q3, Buscamos ahora en la misma columna el correspondiente al 75
%de N que en este caso es el 4 intervalo (3.50/4=37.5)
16
Si los datos estn agrupados en intervalos, se hace la diferencia entre el lmite inferior
del primer intervalo y el lmite superior del ltimo intervalo.
Esta medida no es muy til, ya que depende de los valores extremos y por error puede
aparecer un valor muy grande o muy pequeo.
b) Desviacin estndar y Varianza:
i)
x i x
ii)
La varianza corresponde a la
x i x 2 f i
V(x) = x 2
c)
x 2
s=
sx
x
100%
donde: s
APLICACIONES
1) Los sueldos promedios expresados en pesos en las secciones de una empresa son,
respectivamente: A : $ 150.900, B :$ 273.500 y C : $ 361.000. Si el nmero de empleados en
cada seccin es: 160, 91 y 30 respectivamente.
a) Determine el sueldo promedio de los empleados de la empresa.
b) Determine el sueldo promedio de los empleados, si en la seccin B hay un
reajuste del 4,5%.
2)
A cada persona que se presenta como candidato para un trabajo de ensamble es una
empresa de muebles, se le aplica una prueba de aptitudes mecnicas. Una parte de la prueba
consiste en ensamblar un armario con base e instrucciones numeradas. En la siguiente
distribucin de frecuencias se tiene una muestra de los tiempos que necesitaron 42 personas
para ensamblar el armario.
Tiempo
( mn)
14
47
7 10
4
8
14
17
10 13
13 16
16 - 19
a)
b)
c)
d)
e)
f)
g)
9
5
2
----------------------------------9
-- 7
---------------------------------------------------------------------------------------------0
a)
b)
c)
d)
e)
f)
4)
10
15
20
25
30
35
Ingresos
Los siguientes datos corresponden a los ingresos percibidos por los trabajadores
departamento de ventas de una empresa: ( en miles de pesos)
SUELDOS
NMERO DE
EMPLEADOS
240 290
290 340
340 390
12
390 440
25
440 490
490 540
Marca
de
Clase
del
18
- 100
- 120
- 140
- 160
- 180
- 200
PAS
B
Ingresos Anuales
Poblacin
remunerada
30000
80000
40000
10000
4000
1000
60 - 90
90 - 120
120 - 150
150 - 180
180 - 210
210 - 240
240 - 270
Poblacin
remunerada
10000
20000
50000
20000
15000
10000
4000
6) Los siguientes datos corresponden a los tiempos (en minutos) que demoran los clientes en una
cafetera.
tiempo
N de clientes
20-40
10
40-60
15
60-80
25
80-100
100-120
120-140
ni
19
100-150
10
150-200
25
200-250
30
250-300
300-350
Antes de construir una presa sobre el ro Colorado, el Army Corps of Engineers efectu una
serie de pruebas para medir el flujo de agua ms all del sitio propuesto por la obra. Los
resultados de las pruebas son:
Frecuencia
7
21
32
49
58
41
27
11
20
16
14
12
10
8
6
4
2
-9
-
11
6
a)
b)
c)
d)
e)
15
12
10
15
20 25
4
30
35
40
11)
Los siguientes datos corresponden a los ingresos percibidos por los trabajadores del
departamento de ventas de una empresa ( en miles de pesos )
SUELDOS
240
290
340
390
440
490
a)
b)
c)
d)
290
340
390
440
490
540
NUMERO DE
EMPLEADOS
2
4
12
25
3
2
Calcular el ingreso promedio mensual del departamento de ventas. Realice la mejor grfica.
Calcular la varianza.
Calcular el coeficiente de variacin.
Encontrar las medidas de tendencia central para los sueldos.
a)
b)
fi
10
20
30
15
5
13) Dado el conjunto de los siguientes valores en (US$) ganados por un grupo de amigos en un
cierto juego: yi = ( 2 , 6 , 4 , 2 , 5 , 3 , 2 , 0 ,1 , 3 )
Calcular el valor de los estadgrafos de posicin.
14) Sean las siguientes tasas de inters correspondientes a prstamos hipotecarios otorgados por
una cierta entidad financiera de Santiago.
8,5
7,5
8,25
8,2
7,5
9 8,5
7,75
8,5
8,5
9,06
7,6
8,1
9,2
7,09
21
b) Calcular la desviacin estndar y el coeficiente de variacin para la muestra.