You are on page 1of 24

Medidas de tendencia

central y medidas de
dispersin

Ing. Jess Medina

Objetivos
El participante ser capaz de calcular
medidas de tendencia central
partiendo de datos sin agrupar.
El participante ser capaz d calcular
medidas de dispersin.

Medidas de tendencia central


Medidas de Posicin: son aquellos valores numricos que nos permiten o
bien dar alguna medida de tendencia central, dividiendo el recorrido de
la variable en dos, o bien fragmentar la cantidad de datos en partes
iguales. Las ms usuales son la media, la mediana, la moda, los cuartiles,
quintiles, deciles y percentiles. Pueden ser de dos tipos: de tendencia
central o de tipismo.
Medidas de Dispersin: se llaman medidas de dispersin aquellas que
permiten retratar la distancia de los valores de la variable a un cierto
valor central, o que permiten identificar la concentracin de los datos en
un cierto sector del recorrido de la variable. Se trata de coeficientes para
variables cuantitativas. Las ms usuales son el desvo estndar y la
varianza.

La Media
medias de los diferentes conjuntos. Es posible hallar la media de La idea
de media o promedio (tambin llamada media aritmtica) formaliza el
concepto intuitivo de punto de equilibrio de las observaciones. Es decir,
es el punto medio del recorrido de la variable segn la cantidad de valores
obtenidos.
Ese valor tiene varias propiedades importantes. Si se suma la distancia de
todos los valores respecto de la media, esa suma da cero. Si se toman una
cantidad cualesquiera de conjuntos de valores, cada uno con su respectiva
media, la media del conjunto general es igual a la suma de cada una de las
un conjunto de valores de una variable a partir de tomar la distancia de las
observaciones a un valor cualquiera (pertenezca o no al recorrido de la
variable) si a un conjunto de observaciones de una variable se le realiza
una operacin matemtica usando un valor constante, entonces la media
del nuevo grupo de valores as obtenidos es igual a la aplicacin de la
misma operacin matemtica usando ese valor constante sobre la media
original.

El clculo de la Media
Dado un conjunto de observaciones
la media se representa mediante
y se obtiene dividiendo la suma de
todos los datos por el nmero de ellos, es decir:

La interpretacin de la media como centro (o punto de equilibrio) de los datos


se apoya en una propiedad que afirma que la suma de las desviaciones

de un conjunto de observaciones a su media es igual a cero; es decir, puede


probarse que

Media aritmtica (I)

La media aritmtica de un conjunto de datos es el cociente entre la suma


de todos los datos y el nmero de estos.
Ejemplo: las notas de Juan el ao pasado fueron:
5, 6, 4, 7, 8, 4, 6
La nota media de Juan es:

Hay 7 datos
que suman 40

5 6 4 7 8 4 6 40

5,7
Nota media =
7
7

Media aritmtica (II)

Clculo de la media aritmtica cuando los datos se repiten.


1. Se multiplican los datos por sus frecuencias absolutas respectivas, y
se suman.
2. El resultado se divide por el total de datos.
Ejemplo. Las notas de un grupo de alumnos fueron:
Notas Frecuencia Notas x
absoluta F. absoluta
3
5
15
5
8
40
6
10
60
7
2
14
Total
25
129

Datos por frecuencias

Media

129
5,1
25

Total de datos

Mediana
La mediana, a diferencia de la media no busca el valor central del recorrido de
la variable segn la cantidad de observaciones, sino que busca determinar
el valor que tiene aquella observacin que divide la cantidad de
observaciones en dos mitades iguales. Por lo tanto es necesario atender a
la ordenacin de los datos, y debido a ello, este clculo depende de la
posicin relativa de los valores obtenidos. Es necesario, antes que nada,
ordenar los datos de menor a mayor (o viceversa).

en caso que N sea impar

La mediana

La mediana de un conjunto de datos es un valor del mismo tal que el nmero de


datos menores que l es igual al nmero de datos mayores que l.

Ejemplo:

Los pesos, en kilogramos, de 7 jugadores de un


equipo de ftbol son: 72, 65, 71, 56, 59, 63, 72

1. Ordenamos los
56, 59, 63, 65, 71, 72, 72
datos:
2. El dato que queda en el centro es
La mediana vale 65.
65.
Caso:

Si el nmero de datos fuese par, la mediana es la


media aritmtica de los dos valores centrales.

Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es:
63 65
64
2

Moda
La moda, es aquel dato, aquel valor de la
variable que ms se repite; es decir, aquel
valor de la variable (que puede no ser un
nico valor) con una frecuencia mayor.

La moda

La moda de un conjunto de datos es el dato que ms se repite.


Ejemplo.

Una zapatera ha vendido en una semana los zapatos


que se reflejan en la tabla:

N de calzado
N de personas

38
16

El nmero de zapato ms
vendido, el dato con mayor
frecuencia absoluta, es el 41.

39
21

40
30

41
35

42
29

43
18

44
10

45
7

Lo compran 35 personas
La moda es 41.

Cuartil, Quintiles, Deciles,


Percentiles
La mediana, como vimos, separa en dos mitades el conjunto
ordenado de observaciones. Podemos a su vez subdividir
cada mitad en dos, de tal manera que resulten cuatro
partes iguales. Cada una de esas divisiones se conoce
como Cuartil y lo simbolizaremos mediante la letra Q
agregando un subndice segn a cual de los cuatro cuartiles
nos estemos refiriendo. Se llama primer cuartil (Q1) a la
mediana de la mitad que contiene los datos ms pequeos.
Este cuartil, corresponde al menor valor que supera o que
deja por debajo de l a la cuarta parte de los datos. Se
llama tercer cuartil (Q3) a la mediana de la mitad formada
por las observaciones ms grandes. El tercer cuartil es el
menor valor que supera o que deja por debajo de l a
las tres cuartas partes de las observaciones. Con esta
terminologa, la mediana es el segundo cuartil (Q2) y el
cuarto cuartil (Q4) coincide con el valor que toma el ltimo
dato, luego de ordenados.

Medidas de Dispersin
El desvo estndar
Es posible identificar conjuntos de datos que a pesar de ser muy
distintos en trminos de valores absolutos, poseen la misma media.
Una medida diferencial para identificar esos conjuntos de datos es
la concentracin o dispersin alrededor de la media.
Una manera de evitar que los distintos signos se compensen es
elevarlas al cuadrado, de manera que todas las desviaciones sean
positivas. La raz cuadrada del promedio de estas cantidades recibe
el nombre de desvo estndar, o desviacin tpica y es representada
por la siguiente frmula:

A mayor valor del coeficiente del desvo estndar, mayor dispersin de los datos con respecto a
su media. Es un valor que representa los promedios de todas las diferencias individuales de las
observaciones respecto a un punto de referencia comn, que es la media aritmtica. Se entiende
entonces que cuando este valor es ms pequeo, las diferencias de los valores respecto a la
media, es decir, los desvos, son menores y, por lo tanto, el grupo de observaciones es ms
homogneo que si el valor de la desviacin estndar fuera ms grande. O sea que a menor
dispersin mayor homogeneidad y a mayor dispersin, menor homogeneidad.
La Varianza
El cuadrado de la desviacin estndar recibe el nombre de varianza y se representa por . La
suma de los cuadrados de los desvos de la totalidad de las observaciones, respecto de la media
aritmtica de la distribucin, es menor que la suma de los cuadrados de los desvos respecto de
cualquier otro valor que no sea la media aritmtica.
Si observamos, veremos que la varianza no es ms que el desvo estndar al cuadrado.
Precisamente la manera de simbolizarla es.
Por lo mismo, el desvo estndar puede definirse como la raz cuadrada de la varianza

8 cms.

Aqu tenemos 9 rectngulos cuya altura es de 8 centmetros (y todos


tienen la misma base).
Existe alguna variacin respecto de su altura entre estos rectngulos?
Cul es el promedio de la altura de estos rectngulos?
8+8+8+8+8+8+8+8+8
9

72
=8
9

10 cms
6 cms
8 cms.

El quinto rectngulo y el octavo rectngulo en un acto de rebelda


cambiaron su altura. El quinto rectngulo, ahora de color rojo, mide 10
centmetros, y el octavo rectngulo, de color azul, mide 6 centmetros?
Cul es el nuevo promedio de estos 9 rectngulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9

72
=8
9

... el mismo promedio! Pero... ha habido variacin?

10 cms
6 cms
8 cms.

El rectngulo rojo tiene +2 centmetros sobre el promedio, y el


rectngulo azul tiene 2 centmetros bajo el promedio. Los otros
rectngulos tienen cero diferencia respecto del promedio.
Si sumamos estas diferencias de la altura respecto del promedio,
tenemos
0+0+0+0+2+0+02+0 =0
Este valor nos parece indicar que no ha habido variabilidad! Y sin
embargo, ante nuestros ojos, sabemos que hay variacin.

10 cms
6 cms
8 cms.

Una forma de eliminar los signos menos de aquellas diferencias que


sean negativas, esto es de aquellos mediciones que estn bajo el
promedio, es elevar al cuadrado todas las diferencias, y luego sumar...
02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 8
Y este resultado repartirlo entre todos los rectngulos, es decir lo
dividimos por el nmero de rectngulos que es 9
02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 =
9

8
9

= 0,89

10 cms
6 cms
8 cms.

Se dice entonces que la varianza fue de 0,89


Observemos que las unidades involucradas en el clculo de la varianza
estn al cuadrado. En rigor la varianza es de 0,89 centmetros cuadrados.
De manera que se define

0,89 0,943
La raz cuadrada de la varianza se llama desviacin estndar

10 cms
6 cms
8 cms.

Que la desviacin estndar haya sido de 0,943 significa que en promedio la


altura de los rectngulos variaron (ya sea aumentando, ya sea
disminuyendo) en 0,943 centmetros.
Es claro que esta situacin es en promedio, puesto que sabemos que
los causantes de la variacin fueron los rectngulos quinto y octavo.
Esta variacin hace repartir la culpa a todos los dems rectngulos
que se portaron bien.
La desviacin estndar mide la dispersin de los datos respecto del
promedio

10 cms
8 cms.
8 cms.8 cms.
8 cms.
8 cms.
7 cms.
6 cms
4 cms

Cul es la varianza y la desviacin estndar de las alturas de los rectngulos?


En primer lugar debemos calcular el promedio
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
= 7,44
9
Luego debemos calcular la varianza

10 cms
8 cms.

8 cms.

8 cms.

8 cms.

7 cms.

4 cms

0,56

-3,44

0,56

0,56

2,56

0,56 -0,44

8 cms.
6 cms

-1,44
0,56

7,44
Promedio
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 22,2224
=
9
9
Este es el valor de la varianza

= 2,469

10 cms
8 cms.

8 cms.

8 cms.

8 cms.

4 cms

7 cms.

8 cms.
6 cms

7,44
Promedio
Si la varianza fue de 2,469, entonces la desviacin estndar es de...

2, 469 1,57
Lo que significa que, en promedio, los rectngulos se desviaron ms o
menos (ms arriba o ms abajo) en 1,57 centmetros.

Para entender la varianza necesariamente debe saber:


Sumar
Restar
Multiplicar
Dividir
Potencia de orden 2
Raz cuadrada
Y es claro que esto no es suficiente (salvo que queramos que aprenda de
memoria los clculos). Necesitamos estimular su imaginacin para que
vea la variabilidad existente en la naturaleza.
Entregue una lista de fenmenos en que un mismo atributo tenga
variabilidad si se mide este atributo a un nmero de individuos u objetos.

You might also like