You are on page 1of 15

MEDIDAS DE DISPERSIN

Se llama dispersin de un conjunto de datos al grado en que los diferentes valores


numricos de los datos tienden a extenderse alrededor del valor medio utilizado.
Este grado se mide por medio de los indicadores estadsticos llamados medidas de
dispersin.
Si los valores observados de la variable estn muy concentrados alrededor de un
promedio, ste es muy representativo; pero si los valores estn muy dispersos con
respecto a un promedio ste pierde representatividad. En consecuencia, el valor del
promedio no siempre es suficiente y, en numerosos casos, es necesaria otra medida
que proporcione el grado de dispersin de los datos de la distribucin.
Para clarificar la necesidad de las medidas de dispersin se utiliza el tpico caso
estadstico del pollo: si una persona se come dos pollos y otra ninguna, la
conclusin basada exclusivamente en las medidas de posicin, es que cada
persona come un pollo de media, es evidente, que en estos casos es necesario
utilizar otra medida que cuantifique la dispersin de los datos. Otro ejemplo seria
comparar dos familias con ingresos diarios similares: 10,000 y 11,000 quetzales, con
otras dos familias con ingresos muy dispares: 6,000 y 15,000. La media es la misma
en las dos distribuciones: 10,500 quetzales, pero en el primer caso la media es
mucho ms representativa que en el segundo, por ser menor su dispersin
Las diversas medidas de dispersin que van a tratarse son: Rango, Desviacin
Media, Varianza, Desviacin Estndar y Coeficiente de Variacin.

La medida de dispersin o de variabilidad es un solo nmero que representa el


desarrollo o el valor de la dispersin en un conjunto de datos.
Estos nmeros nos van a indicar ciertos aspectos del conjunto de datos que no
expresan las medidas de tendencia central.

CLASIFICACIN DE LAS MEDIDAS DE DISPERSIN


Se clasifican en dos grupos:
1. Absolutas: Es imprescindible utilizarlas con un promedio. Tienen el
inconveniente que no permiten comparaciones entre distribuciones de
diferentes promedios.
2. Relativas: Tienen significado propio. Se obtienen por cocientes entre
magnitudes de las mismas dimensin, por lo que sus valores son
adimensionales,

lo

que

permite

comparaciones

entre

distribuciones

heterogneas.

MEDIDAS ABSOLUTAS
RANGO O AMPLITUD
Se define como rango a la diferencia entre los dos valores extremos de la variable.
R= xmax xmin
R= Rango
Xmax= Valor mximo
Xmin= Valor mnimo

Es una medida de dispersin que viene expresada en la misma unidad que la


variable; cuanto mayor sea el recorrido, mayor ser el campo de variacin de la
variable y, por tanto, su dispersin. Est forma de medir la dispersin es muy poco
precisa; solo se tiene en cuenta dos de las observaciones que, adems, son las
extremas, las ms imprecisas. No obstante, se utiliza frecuentemente por dar una
idea de la variabilidad de los datos de una forma muy sencilla e inmediata.
Ejemplo 1:
En una compaa de seguros se han registrado los tiempos necesarios para
proceder en 7 demandas por seguro contra incendio. Los tiempos en das son: 2, 5,
4, 3, 8, 7, 5.
Resolucin: al calcular la amplitud de este grupo de datos tenemos que: 8-2= 6; por
lo que la amplitud o rango de los datos es igual a 6 das.
Ejemplo 2:
Calcular el rango de los siguientes valores: 12, 6,7, 10,18, 4, 3, 9
Solucin: R= 18 - 3 = 15
Ejemplo 3:
Los siguientes datos representan la rentabilidad del patrimonio de 25 empresas en
la cartera de un inversor.

Valor Mximo: 22.1

Valor Mnimo: -8.1

RANGO= VALOR MXIMO VALOR MNIMO


=22.1- (-8.1)
= 30.2
VARIANZA
Si en lugar de utilizar valores absolutos para eliminar el problema del signo de las
desviaciones, se elevan estas al cuadrado, se obtiene una nueva medida de
dispersin

conocida como varianza o variancia. Si se obtiene de los valores

muestrales se expresa como S2, y por 2 si lo es de los valores de la poblacin o de


variables aleatorias.
La varianza se puede definir como la media aritmtica de las desviaciones de los
valores obtenidos de la variable con respecto a su media aritmtica elevadas al
cuadrado. Ecuacin:

Ejemplo 1:
Obtener la varianza de la siguiente muestra, que nos indica el nmero de
cigarros que son consumidos en promedio al da por un conjunto de 20
encuestados.

10

10

La media es igual a

x
n

77
3.85
20

a continuacin reportamos la tabla de la diferencia de cuadrados xi x :


2

3.422

0.02

37.82

4.62

14.82

0.02

8.12

25

25

25

25

25

25

37.82

3.42

0.022

3.42

0.722

3.42

1.32

25

25

25

25

25

14.82 0.722 4.622


25

1.322 17.22 14.82


5

25

25

Por lo que

171.83
8.5915
20

DESVIACIN MEDIA
Igual que a la media se le asocia la desviacin tpica como medida de dispersin, a
la mediana se le asocia la desviacin media; para su obtencin se hallan los valores
absolutos de las diferencias entre cada valor y la mediana, se ordenan en sentido

creciente o decreciente y la desviacin media es el valor de la diferencia que ocupa


la posicin central.
La desviacin media tiene la ventaja, como la mediana, de no verse afectada por
datos extremos. A las medidas que tienen esta propiedad se les llama medidas
robustas o resistentes. Si se conoce la mediana y la desviacin media de datos no
agrupados se sabe que, al menos el 50% de los datos estn en el intervalo.
Las caractersticas principales de la desviacin media son:
Se usan todos los valores en su clculo.
No se influencia por valores extremos
Los valores absolutos son difciles de manipular
Para averiguar la desviacin media no hay ms que sumar las desviaciones de
cada una de las desviaciones sin tener en cuenta el signo y dividir el total por el
nmero de casos.

D.M. = x
N

Ejemplo 1:
Los pesos de una muestra de cajas que contienen libros de una librera son: 103,
97, 101, 106, 103. Encontrar la desviacin media.
X = 102

X X 103 102 ... 103 102

n
5
1 5 1 4 5

2.4
5

MD

Ejemplo 2:
Calcula la desviacin media en el conjunto de datos siguientes:
1,1,1,1,2,2,2,2,3,3,4,5,5,5,6,6,7,8,8,8,9,9,10,10.
Solucin:
La posicin de la mediana ser la 12ava, con lo que el valor ser 5. Los valores
absolutos de las diferencias entre cada valor y la mediana 5 son:
4,4,4,4,3,3,3,3,2,2,1,0,0,0,1,1,2,3,3,3,4,4,5, que ordenados son:
0,0,0,1,1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,4,4,5. La mediana de este nuevo conjunto
de las diferencias es la desviacin media, que en este caso ser el valor
correspondiente a la posicin 12ava= 3.

DESVIACIN TPICA O ESTNDAR


La desviacin estndar, tpica o desviacin cuadrtica media, es la media
cuadrtica de las desviaciones con respecto al promedio aritmtico, tambin la
podemos definir como la raz cuadrada de la media de las desviaciones de la media
de una distribucin elevada al cuadrado.

La desviacin estndar representa la variabilidad promedio de una distribucin,


porque mide el promedio de las desviaciones de la media. Debemos tomar en
cuenta, que mientras mayor sea la dispersin alrededor de la media en una
distribucin, mayor ser la desviacin estndar.
En una serie de datos simples la frmula que utilizaremos ser:

S=

(x - )
N

s= Desviacin tpica o estndar


x2= La suma de los valores elevados al cuadrado
X2= La media elevada al cuadrado
N= Al nmero total de valores

En una serie de datos agrupados la frmula que utilizaremos ser:


S=

f (x - )
N

Ejemplo 1:
Si S= 4.4 nos indica una mayor variabilidad que si S= 204
Ejemplo 2:
En un test de inteligencia realizado a una muestra de 200 personas, se han obtenido los
resultados siguientes:

Puntuacin

30 - 40

40 - 50

50 - 60

60 - 70

70 - 80

80 - 90

Nmero de personas

18

76

70

22

Calcula la media y las desviacin tpica.

a) Es una variable continua, debemos hallar la marca de clase para cada intervalo
sumando los valores extremos y dividiendo entre dos.

Intervalos

Marca de clase x i

Frecuencia f i

xi.fi

x i 2. f i

30 - 40

35

210

7350

40 50

45

18

810

36450

50 60

55

76

4180

229900

60 70

65

70

4550

295750

70 80

75

22

1650

123750

80 - 90

85

680

57800

200

12080

751000

MEDIDAS RELATIVAS
COEFICIENTE DE VARIACIN
Hasta ahora, nos hemos referido nicamente a medidas absolutas de la dispersin,
pero la medida ms usada para la dispersin relativa, o variacin relativa, es el
llamado coeficiente de variacin que no es ms que la desviacin estndar
dividida entre la media aritmtica, expresado el cociente en porcentaje, as:
V=

(s ) 100

Si se comparan dos distribuciones que utilizan las mismas unidades sus


dispersiones se pueden calcular mediante la desviacin tpica siempre que sus
medias aritmticas sean iguales o muy prximas. En el caso contrario se utiliza el
coeficiente de variacin que cuanto menor sea, menor ser la dispersin y, por
tanto mayor ser la representatividad de la media aritmtica.
El coeficiente de variacin mide la dispersin relativa, como cociente entre la
dispersin absoluta y el promedio. El coeficiente de variacin se puede representar
en % multiplicndolo por 100,
El coeficiente de variacin solo se debe calcular para variables con todos los
valores positivos. Todo ndice de variabilidad es esencialmente no negativo.
Debemos trabajar con variables positivas, para tener la seguridad de que la media
es mayor que cero.
Debemos tener en cuenta que el coeficiente de variacin es independiente de las
unidades utilizadas, por lo que es til para comparar distribuciones en donde las

unidades pueden ser diferentes. Pero tambin tenemos que tener en cuenta que el
coeficiente de variacin deja de ser til cuando la

est prxima al cero.

Ejemplo 1:
Los salarios semanas de los trabajadores de dos compaas estn determinados
as: en la primera el salario promedio es de Q565.00 y la deviacin estndar es de
22.80. En la segunda el salario promedio es de Q654.00 y su desviacin estndar
es de 25.6. En qu compaa hay mayor coeficiente de variacin?
Solucin:
1. Compaa

2. Compaa

V= 22.8 x 100 = 4.04%


565

V= 25.6 x 100 = 3.92%


654

La comparacin de salarios de las dos empresas nos muestra un coeficiente de


variacin en el que en la primera compaa no hay un coeficiente de variacin que
sea significativa.
Ejemplo 2:
Dada la distribucin de edades (medidas en aos) en un colectivo de 100 personas,
obtener:
1.
La variable tipificada Z.
2.
Valores de la media y varianza de Z.
3.
Coeficiente de variacin de Z.
Horas trabajadas

Num. empleados

0 -- 4

47

4 -- 10

32

10 -- 20

17

20 -- 40

4
100

Solucin:
Para calcular la variable tipificada

partimos de los datos del enunciado. Ser necesario calcular en primer lugar la
media y desviacin tpica de la variable original (X= aos).
li-1 -- li
xi
ni
xi ni
xi2 ni
0 -- 4

47

94

188

4 -- 10

32

224

1.568

10 -- 20

15

17

255

3.825

20 -- 40

30

120

3.600

n=100

693

9.181

A partir de estos valores podremos calcular los valores tipificados para las marcas de
clase de cada intervalo y construir su distribucin de frecuencias:

zi

ni

zi ni

zi2 ni

-0,745

47

-35,015

26,086

0,011

32

0,352

0,004

1,220

17

20,720

25,303

3,486

13,944

48,609

n=100

0,021

100,002

A pesar de que no se debe calcular el coeficiente de variacin sobre variables que


presenten valores negativos (y Z los presenta), lo calculamos con objeto de ilustrar
el porqu:

Es decir, el coeficiente de variacin no debe usarse nunca con variables tipificadas.

CONCLUSIONES

Las medidas de dispersin tienen como finalidad estudiar hasta que punto,
para una determinada distribucin de datos, las medidas de posicin
representan bien el conjunto de datos de la distribucin.

Las medidas de dispersin complementan la informacin proporcionada por


las medidas de posicin. Indican si los valores se encuentran ms o menos
prximos a la medida de posicin.

Las medidas de dispersin describen la localizacin en una escala ordenada

Las medidas de dispersin nos indican datos de la muestra de forma


agrupada o dispersa.

BIBLIOGRAFA
Autor: Santiago Fernndez
Estadstica Descriptiva
Paginas: 133,189,190,191,193,194,195.196.

197.198.199.200.201.202.203
Edition: 2, illustrated
Publicado por ESIC Editorial
Ao 2002

Autor: Grupo Editorial Zantmar


Introduccin a la Estadstica
Pginas: 85, 86, 90, 91, 98
Ediciones Zantmar, S.A.
Primera Edicin
Ao 2007

Autor: Zaragoza, Jos


Estadstica Aplicada a la Educacin
Pginas: 52, 53, 54, 55, 56, 57, 58, 59
Editorial Ministerio de Educacin Pblica
Segunda Edicin
Ao 1960

You might also like