You are on page 1of 9

CARACTERSTICAS DE UNA DISTRIBUCIN DE FRECUENCIAS INTRODUCCIN

El estudio de las caractersticas de una distribucin pretende resumir la informacin de los datos, tablas y/o representaciones grficas en un conjunto de medidas que la caracteriza, bien como complemento al conocimiento de la distribucin, bien porque nos sea suficiente el conocimiento parcial, puntual y no total, de la misma. En ocasiones estas medidas nos van a facilitar las comparaciones entre distribuciones correspondientes a poblaciones, subpoblaciones o muestras diferentes. Estas medidas suelen tambin a veces denominarse estadsticos o estadgrafos. Las principales caractersticas de una distribucin de frecuencias se suelen clasificar en los siguientes grupos: Posicin, dispersin, forma y concentracin (ver esquema de la pgina siguiente). Las medidas de posicin sirven para situar una distribucin. Se les suele dar mayor importancia a las denominadas medidas de tendencia central o promedios por suministrar un valor central representativo de toda la distribucin. Las medidas de dispersin indican el grado de esparcimiento de los datos de una distribucin. Son de especial importancia en el desarrollo de la estadstica la varianza y su raz cudrada positiva, la desviacin tpica. Las medidas de forma: Dos distribuciones que posean un mismo valor central e idntico grado de dispersin, pueden diferir en lo que respecta a la forma o aspecto de sus representaciones grficas (ej: diagramas de barras o histogramas). Las medidas de forma nos permiten caracterizar de manera ms precisa a una distribucin de frecuencias. Fundamentalmente se agrupan en dos clases: aquellas que miden la simetra o asimetra de la distribucin y aquellas que miden su apuntamiento (curtosis), aunque hemos de tener en cuenta que medidas de las consideradas anteriormente tambin tienen su influencia en la determinacin de la forma de la distribucin.

CARACTERSTICAS DE LAS DISTRIBUCIONES: SU MEDIDA


MEDIA ARITMTICA MEDIDAS DE TENDENCIA CENTRAL O PROMEDIOS MEDIDAS DE POSICIN MEDIDAS NO CENTRALES CUANTILES MEDIA ARMNICA MEDIA GEOMTRICA MEDIA CUADRTICA MEDIANA MODA CUARTILES QUINTILES DECILES CENTILES OTROS OTRAS MEDIDAS DE LOCALIZACIN

Re corridos o Rangos Absolutas Medidas de Dispersin Re lativas

Re corrido Total o Rango Total Re corridos Intercuant li cos

Desviacion es Medias Pr omedios de desviacion es Desviacion es Absolutas Medias Desviacion es Potenciale s Medias Coeficient e de Apertura Re corridos Re lativos Re corrido Semi int ercuartli co Coeficient es de var iacin
NDICE DE FISHER

ASIMETRA MEDIDAS DE FORMA APUNTAMIENTO O CURTOSIS

NDICES DE PEARSON NDICES CUANTLICOS NDICE DE FISHER NDICE DE KELLEY NDICES CUANTLICOS

CURVAS DE LORENZ MEDIDAS DE CONCENTRAC IN NDICE DE GINI NDICES DE THEIL

1. Las medidas de tendencia central o promedios.

Por tendencia central se entiende la propensin o inclinacin de la distribucin a los valores medios, es decir a aquellos valores ms alejados de los extremos. Este concepto es a veces considerado sinnimo de promedio, es decir trmino medio o valor en que la distribucin se divide en dos partes iguales o casi iguales. Sin embargo en otras ocasiones al hablar de promedio se hace referencia a una funcin media que hace corresponder un valor cualquiera entre el menor y el mayor que toma la variable. Segn se adopte para los promedios un criterio u otro de los descritos podrn ser consideradas como tales todas las medidas de posicin o slo algunas de ellas: Aquellas que nos proporcionen valores prximos al central. Siguiendo un enfoque clsico, las medidas de tendencia central o promedios que vamos a considerar son las que figuran en el esquema anterior . MEDIA ARITMTICA Definicin:

La media aritmtica ( X ) de una variable X es el cociente entre la suma de todos los valores observados y el nmero total de observaciones. Sean x i = x1 , x 2 ,..., x n los valores observados de la variable X; Las principales frmulas para el clculo son: Estadsticas tipo I (E.T.I): Media aritmtica simple:

en trminos de n
n

en trminos de f

xi X=
i =1

=
i =1

xi

1 n

=
i =1

x ifi

(1)

donde: * n representa el nmero total de observaciones.

*
i =1

xi

= n X se denomina "total"

*
1 n

f i es la frecuencia relativa de x i , que en este caso toma un valor constante

, i.

Estadsticas tipo II y III (E.T. II y E.T. III). Media aritmtica ponderada.

en trminos de n

en trminos de f

x in i X=
i =1 k

xini =
i =1

ni
i =1

=
i =1

x ifi

(2)

siendo: * n i la frecuencia absoluta del valor x i * f i la frecuencia relativa del valor x i * x i los valores observados en estadsticas tipo II, o las marcas de clase si se trata de estadsticas tipo III. * k el nmero de valores distintos de la variable X en estadsticas tipo II, o el nmero de intervalos si se trata de estadsticas tipo III.
k

*
i =1

x i n i = n X , expresin denominada total.

Si por "ponderar" entendemos asignar a cada valor de la variable un factor que recoja la importancia relativa de dicho valor en la distribucin, en nuestro caso hemos ponderado por la frecuencia, dando as mayor "importancia" al valor que mas veces se repite. Una generalizacin a esto consiste en considerar unos "pesos" o ponderaciones w para los distintos valores de la variable siguiendo algn criterio preestablecido, en cuyo caso las frmulas para su clculo son:

E.T.I.

E.T.II. y III

xiw i Xp =
i =1 n

xiw * i

Xp =

i =1 k

wi
i =1
i =1

w* i

donde ya nos son conocidos todos los elementos integrantes, aunque quizs sea conveniente advertir que la frmula dada para E.T.II y E.T.III el w * i considerado abarca las frecuencias y las ponderaciones en sentido estricto: w * i = niwi

Obsrvese que para estadsticas tipo III (datos agrupados en intervalos), la media aritmtica es una mera aproximacin, ya que no podra calcularse en rigor al desconocerse los valores originales de la variable: estos quedan representados por la marca de clase del intervalo. As, todas y cada una de las observaciones pertenecientes a un determinado intervalo, se supone que son iguales a la marca de clase del mismo, lo que nos permite convertir a las estadsticas tipo III en estadsticas tipo II, sin olvidar que el valor de la aproximacin a la media aritmtica obtenido mediante la utilizacin de marcas de clase, diferir generalmente del valor calculado a partir de las observaciones individuales originales, as como del valor obtenido al trabajar con otros intervalos diferentes. En otras condiciones, en lugar de la marca de clase podramos tomar cualquier otro valor de los intervalos incluidos los extremos, segn las hiptesis que asumamos respecto a la distribucin de las observaciones dentro de los intervalos. La diferencia entre el valor aproximado y el verdadero valor de la media aritmtica, se denomina "error de agrupamiento ", error que estar en funcin del nmero de intervalos y de los lmites de los mismos, pudiendo reducirse mediante la definicin correcta de los intervalos adecuados. La media aritmtica posee las siguientes caractersticas principales: a) La media aritmtica es un valor no necesariamente observable de la variable, que vendr expresado en la misma unidad de medida que aquella.

b) La media aritmtica representa lo que generalmente se denomina el "centro de gravedad" de la distribucin de frecuencias, concepto extrado de las Ciencias Fsicas y que hace referencia en nuestro caso al "punto de equilibrio" de la distribucin, aspecto ste de especial importancia en distribuciones simtricas. c) La media aritmtica es, como tendremos ocasin de ver mas adelante, el momento de primer orden respecto al origen. d) El valor de la media aritmtica depende de todas y cada una de las

observaciones que integran la serie, hallndose muy afectado por las desviaciones extremas de dichas observaciones respecto al valor medio, pero no afectado por el orden en que se presenten las observaciones. e) Para un conjunto de observaciones dado, la media aritmtica es nica. f) La media aritmtica es un ndice "estable" de la tendencia central de una distribucin: ofrece escasa variabilidad en muestras procedentes de una misma poblacin. g) La media aritmtica es un promedio de fcil clculo y sencilla interpretacin, susceptible de operaciones algebraicas. Interpretacin grfica , a travs del diagrama acumulativo de frecuencias relativas: Sea una variable X que toma valores x i = ( x1 , x 2 ,..., x k ) con frecuencias relativas
f i = (f1 , f 2 ,..., f k ) :

xi

fi =

ni n

Fi

x1 x2

f1 f2

F1 = f1 F2 = f1 + f 2

...
xi

...
fi

...
Fi = f1 + ... + f i

...
xk

...
fk

...
Fk = f 1 + ... + f k

En el diagrama acumulativo de las frecuencias relativas, el producto ( x i f i ) es igual al rea rayada de la figura 1 cuando x i es positivo, y al valor opuesto cuando x i es negativo.

Como X =
i =1

x i f i , grficamente el valor de la media aritmtica podemos obtenerlo

por diferencia entre las reas positiva (+) y negativa (-) sombreadas en la grfica.

Propiedades 1) La suma de las desviaciones de los valores de una variable respecto a su media aritmtica, es nula.

Demostracin:

n n n

xi xi n
i =1

a) En E.T.I.:
i =1

(x i X) =
i =1

=
i =1

xi
i =1

xi = 0

b)En E.T.II. y E.T.III.


k k k k

xini xini
i =1

( x i X)n i =
i =1 i =1

x i n i Xn =
i =1

n=
i =1

xini
i =1

xini = 0

Observemos que esta propiedad implica que la suma de las desviaciones de signo positivo de las observaciones respecto al valor medio, es igual a la suma de las desviaciones consideradas de signo negativo, propiedad en la que tradicionalmente se han basado diversos autores para elaborar "reglas abreviadas de clculo" para la media aritmtica, reglas a las que si bien en la actualidad estn en desuso por la disponibilidad de avanzados medios informticos, resulta de inters pedaggico hacer una breve referencia a dos de ellos: A) Si se desea calcular la media aritmtica de un conjunto de observaciones
( x1 , x 2 ,..., x n ) ,

los pasos que se recomendaban seguir para mayor facilidad de clculo eran

estos: a) Adoptar un nmero arbitrario z.

b) Calcular la diferencia entre cada observacin y dicho valor arbitrario:


( x1 z; x 2 z;...; x n z)

c)

Sumar dichas diferencias, es decir, calcular B tal que:


n n

B=
i =1

( x i z) = (
i =1

x i ) nz

d)

Calcular A mediante la divisin de B por el nmero total de

trminos de la serie es decir, calcular la media de las desviaciones respecto al punto arbitrario:

( B A= = n
i =1

x i ) nz n =
i =1

xi n z=Xz

e) Sumar o restar A, segn el signo, del valor inicial arbitrariamente fijado: z+A= X y el resultado final obtenido es el verdadero valor de la media aritmtica X .

B) En caso de disponer de los datos ordenados en forma de una "estadstica tipo III", la forma de proceder ser la siguiente: a) Adoptar como valor arbitrario z de la media aritmtica la marca de clase x j correspondiente a un intervalo cualquiera
(L j1 L j ) ,

que generalmente suele ser el

intervalo que supongamos pueda estar ms prximo al centro de gravedad de la distribucin, o bien el intervalo central (o uno de los centrales en caso de nmero par de intervalos ), o simplemente el intervalo de mayor frecuencia. b) Calcular las distancias en unidades d i , (i = 1,2,..., k ) de cada intervalo al intervalo fijado, para el que
d j = 0 : d i = (..... 2,1,0,1,2,.....).

e) Multiplicar cada desviacin por su correspondiente frecuencia absoluta y sumar dichos productos:
k

nidi
i =1

d) Dividir el resultado anterior por el nmero total de observaciones n


k

nidi
i =1

=d

e) El resultado obtenido lo multiplicaremos por la amplitud c j = L j L j1 del intervalo fijado: c j d . f) Sumar el resultado del apartado anterior al valor de la media aritmtica arbitraria y obtendremos el "verdadero" valor de la media aritmtica: c j d + z = X , sin olvidar que al estar trabajando con datos agrupados en intervalos, este "verdadero valor" no es mas que una aproximacin. Esquemticamente:

Intervalos
(L i 1 L i )

Frecuencias absolutas Marcas de clase


(n i ) (x i )

Distancias
di n idi

L 0 L1 L1 L 2

n1 n2

x1 x2

d1 d2

n1d1 n 2d 2

...

...

...

...

...

You might also like