You are on page 1of 22

\ .

~ {))
)'7 . c.{- l

Frecuencia
Marca de (x- ,u) (xi- ,ur ; x (x- ,u y
clase
11 49.5 -127.5 16256.25 178818.75
12 149.5 -27 .5 756.25 9075
14 249.5 72.5 5256.25 73587.5
1 349.5 172.5 29756.25 29756.25
2 449.5 272.5 74256.25 148512.5
Total =40 ; x(x-,uY =439750

Sustituyendo los valores obtenidos en la tabla anterior de operaciones en la formula;


tenemos que:

439750
(f= = -J10993.75 = 104.85
40

. Por lo que la Desvia.cin Estndar poblacional es: 104.85 niveles de nicotina.

2. ~hora con_sidera la misma tabla de Distribucin de Frecuen cias del ejemplo anterior
de los 40 valores que resume los niveles de nicotina de fumadores y calcule la
Desviacin Estndar muestra!.

Nicotina Frecuencia
0-99 11
100-199 12
200-299 14
300-399 1
400-499 2
Total ; = 40
SOLUCION:

Primero tenemos que hacer el clculo de la media poblacional.

_ ;XX
X= = 177 Media Muestra! = x= 177
N

; x(x, -~Y
1
-
Ahora se realizan los clculos pedidos por la expresin: .S
-v n-1

CAPITULO IV
Frecuencia
Marca de
clase
(x,- ~) (x - ~Y J; x (x- ~Y
11 49.5 -127.5 16256.25 178818.75
12 149.5 -27.5 756.25 9075
14 249.5 72.5 5256.25 73587 .5
1 349.5 172.5 29756.25 29756.25
2 449.5 272.5 74256.25 148512.5
Total =40 ; x (x,- xY =439750

Sustituyendo los valores obtenidos en la tabla anterior de operaciones en la formula;


tenemos que:

s= Lh x (x - ~Y = ~ 439750 = ")1 1275.64 1 = 106.19


n -1 39

Por lo que la Desviacin Estndar muestra! es: 106.19 niveles de nicotina.

CAPITULO IV
EJERCICIOS:

l. Considrese las siguientes mediciones (en litros) para 2 muestras de jugo de


na ranja embotellado por las compaas A y B.

Mue stra A 0.9 7 1.00 0 .94 1.03 1.11


Muestra B 1.06 1.01 0.88 0.91 1.14

Tratando los datos como una muestra aleatoria, calcular la varianza de los datos, as
como su desviacin estndar e interpretar sus resultados.

SOLUCIN:

Media para la Muestra A:


- - 0.97+1.00+0.94+1:03+1.11..:.. .5.05 -'
x- . ..-. -5- -l.
o
5 . . 1 1tros

Media para la Muestra B: _;: = J..0 6 +l. O1+ 0 88 + 0 91 + l.l


4
= ~ = 1.00 litros
5 5 -

Para A:

X
l
(x;- ,x) (x; - _;:) 2
0.97
1.00
. -0:04
-0.01
0 .0016
0.0001
s2 = ~ _; ._ .--

0.94 -0.07 0.0049 n -1


1.03 0.02 0.0004
1.11 0.1 0 .01

X= l.} :L(x; _ _;:y= 0.017

S
2
=
(\ - ~ = -0.017- = 0.00425
A n- 1 4

S~ = 0.00425 Varianza Muestra!

S4 = 0.065 Desviacin Estndar

Para B:

CAPIT ULO lV
X
1
(x - x) (x - ~) 2

1.06
1.01
0.06
0.01
0.0036
0.0001
I(x.- ~f
S -1 = __1::...__ _
0.88 -0.12 0 .0144 n -l
0.91 -0.09 0.0081
1.14 0.14 0.0196
X= 1.00 (xi - xY= o.o4ss

?
s -
-k- ~ f 0.0458
= --1=--- - = - - = o.OII45
B n-l 4

S~ = 0.01145 Varianza Muestra!

S8 = 0.107 Desviacin Estndar

Conclusin:

A raz del anlisis anterior de desviaciones; se puede concluir que, existe mayor
confiabilidad en comprar las b'atellas de jugo de naranja de la compaa o marca A ya
que sus datos estn mas cercanos a la media. Es deir no existe tanta dispersin en la
muestra.

En otras palabras, tenemos que:

SA=0.065 < S 8 = 0.l07 Por lo que el promedio en litros de


embotellamiento de juego de naranja de la marca
XA =J.OJ XB = 1.00
A es mucho ms confiable que la marca B, por lo
que se recomienda la compra de la marca A.

2 . Los tiempos perdidos, en minutos, que diez pacientes esperaron en el consultorio A


y Consultorio B de un medico antes de recibir tratamiento fueron:

CAPIT ULO IV
Consultorio A Consultorio B
5 8
11 9
9 10
5 15
10 20
15 25
6 10
10 6
5 5
10 4

Tratando los datos co mo una m uestra aleatoria, calcular la varianza de los datos as
como su desviacin estndar e interpretar sus r esultados.
SOLUCIN:

Media para el Consultorio A:

x=5+11+9+5+10 + 15+6+10+5+ 10 = 86 = 8 _6 minutos


10 lO

Media para el Consultorio B:

- 8 + 9 + 1o+ 15 + 20 + 25 + 1o+ 6 + 5 + 4 1 12 12 .
x= =- = 1 . mmutos
. 10 1o

Para A:

X-
l.
(x,- x) (xi - X:Y s2 = 2:(x-~)2
5 -3.61 13 .0321 n- I
11 2.39 5.7121
9 0 .39 0.1521 ?
s- =
2: (x - ~) 2 98.40 1
= - - = 10.93
5 -3 .61 13.0321
A n-J 9
10 1.39 1.9321
15 6.39 40.8321
6 - 2 .61 6.8121
10 1. 39 l. 9321 S~ = 10.93 Varianza
5 -3.61 13.0321
10 1.39 1.9321
x=8.61 _ (xi - -xy = 98.4o 1 SA = 3.3066 Desviacin Estndar

Para B :

X-
I
( X1 - ~)

CAPITULO IV
8
9
-3.2
-2.2
10.24
4.84 s2 = L:(x - ~)2
10 -1.2 1.44 n-1
15 3.8 14.44
L:(x -~)
20 8.8 77.44 2
? 417.6
25 13.8 190.44 s 8- = =- - = 46.4
10 -1.2 1.44 n -1 9
6 -5.2 27.04
5 -6. 2 38.44 S~ = 46.4 Varianza
4 -7.2 51.84
X= 11.2 _L(x, -xY = 417.6
SB =6.812 Desviacin Estndar

Conclusin:

A raz del anlisis anterior de desviaciones, se puede decir que, existe mayor
confiabilidad en los tiempos de espera del consultorio A que en el consultorio 8 ya que
sus datos estn ms cercanos a la media. Es decir no existe tanta dispersin en la
muestra.

En otras palabras, tenemos que:

Por lo que el promedio del tiempo de espera en el


consultorio A, es mas representativo o confiable
XA=8.6J XB = JJ.2 que el tiempo promedio de espera del consultorio
B, y esto debido a que existe mayor dispersin en
las datos del consultorio B que en el consultorio A.

CAPITULO IV
OTRAS MEDIDAS DE DISPERSION

CUARTILES, DECILES Y PERCENTILES

Anteriormente se explico el concepto de la mediana, la cual consiste en dividir un


conjunto de datos en dos partes iguales. Cuando surge la necesidad de dividir a un
conjunto de datos en mas partes iguales, se da origen a nuevas medidas de posicin,
las cuales son denominadas: Cuartiles, Deciles y Percentiles; esto debido a la
necesidad de diferentes situaciones de orden.

De forma generalizada, se puede decir que son medidas de ubicacin de los


valores que dividen a un conjunto de observaciones en partes iguales.

CUARTILES: Medidas posicinales que dividen un conjunto de datos en cuatro partes


iguales. Esto es;

25%
50% 75%

>- Q, = Valor abajo del cual se encuentra el 25% de las observaciones (es dedr el

25% de las observaciones son menores que el primer cuartil.

Para ser mas precisos, al menos el 25/o de los valores o-rdenados son

menores o iguales que . Q1 y al menos el 75/o de los valores son mayores o

iguales que Q 1

>- Q 2 = El 50% de las observaciones son mayores que la mediana y 50% son
menores a la media.

O asimismo separa el 50/o inferior de las observaciones del 50/o superior.

r .\PITI IJ n IV
>- Q3 = Valor abajo del cual se encuentran el 75% de las observaciones (es deci r

que un 75% de las observaciones son menores que el tercer cuartil).

Para ser mas precisos al menos el 75/o de las observaciones son m enores o

iguales que Q3 , y al menos el 25/o de los valores son mayores o iguales que

DECilES: Son medidas de posicin que dividen a un conjunto de datos en diez partes
iguales. Esto es;

10% 20% 30% 40% 50% 60% 70% 80% 90%


1 1 1 1 1 1 1 1
01 02 03 04 Os O 07 Os Og
6

PERCENTilES: Son medidas posicinales que dividen a un conjunto de datos en 100


parte iguales. Esto es;

. . .

Para saber con exactitud la posicin de un cuartil, decil o percentil-.para datos no


agrupados se utiliza la siguiente expresin:

p
Ubicacin del Centil = L = (n + l) -
P lOO
Donde:

LP =Ubicacin del centil deseado


n =Nu mero de Observaciones
P = El centil o percentil a calcular

En el procedimiento para calcular el valor especfico de un cuartil 1 decil o percentil


despus de calcular su posicin/ en datos no agrupados existen dos casos:

CAPITULO IV
> Caso 1: Cuando LPes un numero entero o "n" es impar, se busca

nicamente la posicin resultante en los datos ya acomodados en forma


ascendente.

Ejemplo de Cuartiles:

A continuacin se presentan las comisiones (en dlares), obtenidas en el mes pasado


por una muestra de 15 corredores de la empresa Smith Barney, en Oakland California.

$2038 $1758 $1721 $1637 $2097 $2047 $2205 $1787


$2287 $1940 $2311 $2054 $2406 $1471 $1460

Calcular el primero, segundo y tercer cuartil de las comisiones en cuestin. Interpretar


sus resultados .

SOLUCION:

Primero se tienen que ordenar los datos en forma ascendente; es decir-: 1460, 1471,

-- . p
-
1637, 1721,1758, 1787, 1940, 2038, 2047; 2054, 2097, 2205, 2287, 2311, 2406.
.

Posteriormente se realiza el clculo de: LP= (n + 1) -


100
Donde:

n = 15

25
--L 2 -=:= (15 + 1) - =4
) 100
"Por lo que el primer cuartil se encuentra en la cuarta posicin de los datos ordenadas

ascendentemente. Esto es: Q 1 = 1721

Para Q2 tenemos que:


n = 15
50
- 2 = P = 50 = Mediana
O L 50 =(15+1) - =8
100
Por lo que el segundo cuartil se encuentra en la octava posicin de los datos ordenadas

ascendentemente. Esto es: Q2 = 2038


Para Q3 tenemos;

CA PITULO I V
n = 15
Q, = p = 75
~o

Por lo que el tercer cuartil se encuentra en la doceava posicin de los datos ordenadas
ascendentemente. Esto es:

3 = 2205

Interpretacin de los resultados o_btenidos del primer o, segundo y tercer cuartil:

. 25%
so% - 75%
Q, Q2 Q3
1460 1471 1637 1721 1758 1787 1940 2038 2047 2054 2097 2205 2287 2311 2406

~ Que el 25/o .de las comisiones (en dlares) obtenidas el mes pasado de los
corredores de la empresa Smith Barrer son menores o igua.les a 1721.

>- Que l 50/o de las comisiones (en dlares) obtenidas el mes pasado de los
corredores de la empresa Smith Barrer son menores o iguales a 2038.

);. Que el 75/o de las comisiones (e dlares) obtenidas el mes pasado de los
corredores de la empresa Smith Barrer son menores o iguales a 2205.

>- Caso 11: Cuando LP es un numero fraccionario o "n" es par, se localiza


la posicin del entero en los datos ordenados ascendentemente, se
calcula la distancia entre el valor del entero y el valor subsecuente de
este y a esa distancia obtenida se le multiplicara la parte fraccionaria

que resulto al calcular LPy por ultimo se le sumara el resultado del


producto al valor de la posicin resultante.

CAPITULO IV
':\

Ejemplo:

Supongamos ahora que n=20 y se quisiera calcular el primer cuartil, de tal forma que
ahora se tiene que:
25 ~
Lp =(20+1) - = 5.2)
100
Entonces se localiza la posicin 5 (que es la parte entera del valor resultante) en los
datos ordenados ascendentemente y despus se ter~dra que mover 0.25 (que es la
parte fraccionaria) de distancia entre el quinto y sexto valor.

Ejemplo:

Supngase el siguiente conjunto de datos {91, 75, 61, 1O1,43, 104}. Obtener el primer,

segundo y tercer cuartil.

SOLUCIN:

Ordenamos en forma ascendente. 43, 61 , 75, 91 , 101, 104

Para Q1 .

L,)- = (6 +. 1) -25 = L 75
. - 100

Distancia= 61-43=18 ;._.;~(I8X0.75)=13.5

El valor de 13.5 se le suma al primer valor de los datos. Esto es: 43 + 135= 56.5

Por lo que Q1 = 56.5

L 50 = (6+1) SO =3.5
100

Distancia= 91-75 = 16

El valor de 8 se le suma al tercer valor de los datos. Esto es: 75 + 8 = 83

CAPITU LO IV
Por lo que Q2 = 83

75
L 1 - = (6 + 1) - = 5.25
, lOO

Dista ncia= 104-101 = 3

(3Xo.25)= o.75

El valor de 3 se le suma al quinto valor de los datos . Esto es: 10 1 + 0.75 = 101.7 5.

Por lo que Q3 = 101.75

Interpretacin de los resultados obtenidos del primero, segundo y tercer curtil:

2 5% 50% 7 5%

~1 ol 2 3
1
43 56.5 61 75 83 91 101 10 1. 7 5 104
.,.,

>- _Que el 25/o de los datos en estudio son menores o iguales a 56.5.

>- Que el 50/o de los datos en estudio son menores o iguales a 83 .

>- Que el 75/o de los datos en estudio son menores o iguales a 101.75.
Ejemplo de Deciles:

Calcular el cuarto decil del ejemplo ant erior.

Solucin:

Donde

D4 =P = 40

C APIT ULO IV
"

n = 6

40
L 4 =(6+ 1) - =2 .8
lOO
Distancia= 75 - 61=14

(14Xo .s) = 11.2

El valor de 11.2 se le suma al segundo dato de los valores. EstQ es: 61+11.2 =72.2

Por Jo que el D 4 = 72.2

Interpretacin de los resultados obte nidos del cuarto decil:

40%
1 1 1 . 1 1 1 1
Dg

> Que el 40/o de Ios datos en estudio son mt?nores o iguales a 72 .2.

Ejemplo de perce ntiles:

Calcular el 33 percentil del ejemplo anterior.

P33 =P = 33

n = 6

33
L- = (6 + 1) lOO = 2.3 1
~
2

Distancia= 75 - 61=14

(14Xo.31)= 4.34

CAPITULO IV
61 + 4.34 = 65.34
Por lo que el P33 = 65.34

Interpretacin de los resultados obten idos del percentil 33:

33%
1 1 1"" 1
Pgg
6 5 .34

> El 33/o de los datos en estudio son menores o iguales a 65.34.

CA PITULO IV
CUARTILES, DECILES Y PERCENTILES DE DATOS AGRUPADOS .

Para clculo de cua rt iles, decile s o p ercent il es, en d atos ag r upados se tomara en
consi d eracin primeramente la siguien t e t abla de relaciones, la cual marca la posicin :

CUARTILES DECILES PERCENTILES

N D=N P.= N
Ql = -~ 1
10
1
100

2 = 2: = ~
D =2N
2
p
2
= 2N
10 100

O =3N D =3N p = 3N
- 3 4 3
1o 3
100
. . . ... . . . ....~

-- ... ..
... ..
- -

D = 9N P. _ 99 N _
99
9
. 10 - l 00

..

Posteriormente se utili zara la misma frmula que se ocup en la mediana, con una
pequea modificaci n. Esto es;

- -Faa
Qa = Li +
aN
4
.
1 C.
fm
r
Do nde

a = es el N del cuartil deseado . Es decir a= 1,2 3

L; = Limite real de la clas e donde se en cu e ntra u bicado el cu a rtil


faa = Frecuencia acumu lada an t eri o r a la cla se donde se encuentra el cuartil
fm = Frecuencia / que posee el intervalo de cl ase donde se encu entr a el cuartil
Ej e mplo Cu artil es:

CAPITI II.O fV
Sea la siguiente tabla de una distribucin de frecuencias de alturas de 100 alumnos de
la universidad X.

ALTURAS #DE Marca de


(in) ESTUDIANTES clase
60 - 62 5 61
63-65 lB 64
66- 68 42 67
69-71 27 70
72-74 8 __ 73
TOTAL 100
/ - 1~
q o.
a) Calcular el primer cuartil Q1 o el 25% de los datos e interpretar su resulta~.

Soluci6n: -

Contamos desde:

Q,< ~1~0~1 - -
-l
- - - Faa
Qa = Li + aN4
. C.
fin
J

Donde:
L = 65.5
- ____ : ;
r
aN = 1x 100 !'; 5
4 4

f aa = 23

fm = 42 ; c=3

Sustituyendo los valores:

Q1 = 65 .5 + 2_ (3) = 65.5 + ~ = ~5.64 in


42 42

,_ Por lo que el 25/o de los alumnos tienen una altura menor o igual a 65.64 in.

b) Calcular el seg undo cuartil e interpretar su resultado

CAPITULO IV
Q2 = 2N = 200 =SO
fJ
o = Li +
-aN - Faa
4
j. c.
4 4 fin
l
v' - a

Don de:

L1 = 65 .5

aN = 2 X 100 =so'
-4 4
J:aa = 23 fm = 42 c=3
1

Sustituyendo los valores :


27
o?
- -
= 65.5 + (3) = 65.5 +!!. = 67.43
42 42
m

~ Por lo que el 50/o de los alumnos tienen u na altura menor o igual a 67.43 in .

l
e ) Calcular el tercer cuartil e interpretar su resultado

-- - -Faa _
O, = 3N = 3(100) = 75 Q" ~ L; +
aN
4 fm . c.
_, 4 4

Dond e :-
l
L -= 68.5
1

aN = 3 x 100 = 7 5
4 4

f
Jm = 27 ' c=3

Sustituyendo los valo res:

3 = 68.5
10
27
30
+ - (3) = 68.5+ - = 69.61
27
In

> Por lo que el 75/o de los alumnos tienen una altura m enor o igual a 69 .61in.

Eje mplo Deci les y Percentiles :

CAPITULO IV
Sea la siguiente tabla de distribucin de frecuencias del salario de 65 empleados de
una fbrica.

SAlARIO #DE
EMPlEADOS
250.00-259.99 8
260.00-269.99 10
270.00-279.99 16
280.00-289.99 14
290.00- 299.99 10
300 .00-309.99 5
310.00-319 .99 2
Total 65

a) Calcular el primero, segundo, tercero y quinto Decil, e interpretar sus resultados.

Solucin:

Primer Decil D 1 ~

Partiendo de: D 1 = N
10
65
D1 = = 6.5
1o .
65
D 1 = 249.995 +. (1 O)= 258.12
. 8

Segundo Decil D 2 ;

D , = 2N = 2(65) =l 3
- 10 . 10

D;--= ;59.995 + 2_(10) =264.995


- 10

D = 3N = 3(65) = 19 _5
3
1O lO
D, = 269.995 +!.S (10) = 270.933
J 16

Quinto Decil D 5 ;

CA PITULO IV
D. = SN = 5(65) = 32 _5
) 1o 10
14 5
D5 = 269.995 + (10)= 279.06
16

Interpretacin de los resultados obten idos:

> El 10/o de los empleados gana $258.12 o menos


> El 20/o de los empleados gana $264.00 o menos
> El 30/o de los empleados gana $270 .93 o menos
> El 50/o de los empleados gana $279.06 o m enos

b) Ca lcul ar el percentil 35 y 60 e interpretar:: sus resuJtados.

Percentil 35 P35 :

p _ = 35N = 35(65) = 22 _75


3
) 100 100
4 75 - -
p 35 = 269.995 + - -- (10) = 272.96
16

Percentil 60 P60 :

p :~- 6of.r -= 6o(65) = 39 .


60
l 00 100
5
p 60 = 27 9.995 + - (1 '0) = 283.57
14

Interpretacin de los resultados obtenidos:

> El 35/o de los empleados cobran $272.96 o menos.


> El 60/o de los empleados cobran $ 2 83.57 o menos.

RANGO SEMI- INTERCUARTIL

CAPIT U LO I V
Conocido tambin como "desviacin cuartilica", de un conjunto de datos, el cual se
denota por Q y se puede definir como una medida de dispersin que elimina la
influencia de los valores extremos de los datos. Esto es:

Donde Q1 y Q es el primer y tercer cuartil.


3

El rango semi-intercuartil se utiliza para calcular el intervalo donde un porcentaje de


datos puede caer. Asimismo en ocasiones se utiliza como media de dispersin.

El rango intercuartlico sencillamente es: la diferencia entre el tercer y el primer


cuartil, es decir;

Esto nos dice en cuntas unidades de los valores que toma la variable se concentra el
cincuenta por ciento central de los casos

Ejemplos:

1. Sea la siguiente tabla de una distribucin de frecuencias de alturas de 100 alumnos


de la universidad X.

AlTURAS #DE
{in) ESTUDIANTES
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
TOTAl 100

Calcular el semi-intercuartil de dichos datos e interpretar sus resultados.

SOLUCIN:

1 2
= 65.5 + - (3)
42
6
= 65.5 + -
42
= 65. 64 In

CAPIT ULO IV
30
Q3 = 68.5 + .!_2_ (3) = 68.5 + = 69.61 m
27 27

Por lo que:

o=
~
3-2
Q = 69.61-65 .64 = 1.985
2

Q = 1.99 Semi - intercuartil o desviacin cuartil

Interpretacin del resultado;

25% 50% 75%

Calculando la media promedia, tenemos que;

~= Q + Q3 =
65 64 69 61
+ = 67.63 Media Promedio de las Alturas
2 2

>:- El 50% de las alturas caen en el rango 67:63 1.98 m

Por lo que el rango es: .-.o>

(65.65,69.61). El cual indica que el 50% dEdas alturas de los 1O estudiantes caen en

este intervalo.

2. Considrese la siguiente tabla de Distribucin de frecuencia de los salarios de 65


emp leados de una empresa .

CAPITULO IV
SALARIO #DE EMPLEADOS
250 .00- 2S9.99 8
260.00-269.99 10~
270.00-279.99 16
280.00-289.99 14
290.00-299.99 10
300.00-309.99 S
310.00-319 .99 2
Total 6S

Calcular el semi-intercuartil e interpretar su resultado.

1 = 259.995 + 81025 (10)= 268.25


3 = 0 75
289.995 + (1 o)= 290.75
42

290.75-268.25
Por lo tanto se tiene que: Q= . 2 .
= .$ 11. 25

Interpretadn del resultado;


25% 50% 75%

Q +Q .
M= 1 3 = 268.25 + 290.75 = 279 _50
2 2

>- El 50% de los empleados cobran en e l rango 279.50 11.25

Por lo que el rango es:

(268.25, 290.75). El cual indica que el SO% de los empleados cobran en este intervalo.

DISPERSION ABSOLUTA Y RELATIVA

Todas las medidas de dispersin definidas anteriormente, tienen un inconveniente en


comn. Todas ellas vienen expresadas en la misma unidad de med ida que la variable

CAPITULO IV