You are on page 1of 16

ESTADSTICA DESCRIPTIVA, FRECUENCIAS Y MEDIDAS DE POSICIN Y DISPERSIN Distribuciones de recuenci!

s Cuando los datos de una variable estn dispersos, la dispersin sigue un cierto patrn. Inicialmente los datos no nos dicen nada por s mismos, pero si los dividimos en clases o celdas ordenadamente, puede aclararse la forma de su dispersin, es decir, puede aclararse la forma de como estn distribuidos. Esta forma de la distribucin de los datos inherente a su variabilidad se denomina distribuci"n de recuenci!s . Normalmente es posible ver la forma general de una distribucin si se recogen cien o ms valores y se prepara convenientemente una t!b#! de recuenci!s con diez o veinte clases. ero la distribucin se puede ver aun con mayor claridad en forma de representacin grafica mediante un $isto%r!&! de recuenci!s . El histograma es una representacin visual de los datos en la !ue pueden observarse mas fcilmente tres propiedades esenciales de una distribucin como son" #orma, tendencia central o acumulacin y dispersin o variabilidad. $e esta forma, el histograma da una idea del proceso, lo !ue un simple e%amen de los datos tabulados no hace. &ay muchos m'todos para construir histogramas. Cuando los datos son numerosos, es muy (til reunirlos en clases y se recomienda utilizar entre ) y *+ clases ,o celdas-. . menudo conviene elegir un numero total de clases igual apro%imadamente a la raz cuadrada del tama/o de la muestra. 0as clases deben tener amplitud uniforme y se construye la primera de ellas comenzando con un limite inferior solo un poco menor !ue el valor mas pe!ue/o de los datos. 1e construye la ultima clase finalizando con un limite superior solo un poco mayor !ue el valor ms grande de los datos. ara realizar el histograma se marcan las clases sobre el e2e de abscisas, y sobre cada clase se levanta un rectngulo de altura proporcional al numero de observaciones de la variable ,frecuencia absoluta- !ue caen en la clase. El agrupamiento de los datos en clases condensa los datos originales, lo !ue da como resultado una perdida de algo de detalle. .s, cuando el numero de observaciones es relativamente pe!ue/o, o cuando las observaciones solo toman pocos valores, puede construirse el histograma a partir de la distribucin de frecuencias de los datos sin agrupar, dando lugar a los di!%r!&!s de b!rr!s. 0as distribuciones de frecuencias son la herramienta ms sencilla y ms utilizada y eficaz cuando estamos rodeados de montones de datos, !ue no nos dicen nada si no

hacemos mas !ue enumerarlos. .l e%presar estos datos en forma de una distribucin de frecuencias, ya nos proporcionan diversas ideas. uesto !ue las distribuciones de frecuencias se utilizan muy a menudo en el control de calidad, es necesario conocer la finalidad de las mismas y su interpretacin y uso. $ada la importancia de las distribuciones de frecuencias, derivada de !ue en todo proceso hay un momento en el !ue nos encontramos con un con2unto de datos sobre las variables a tratar, es de gran importancia formalizar el proceso de recogida, ordenacin y presentacin de los datos !ue, en la mayora de las ocasiones, aparecern dispuestos en tablas de frecuencias de simple o doble entrada !ue servirn para analizar las distribuciones de las variables. $ada una variable 3 con valores x5 , x * ,444444, x N aparecen una serie de conceptos generales !ue se mencionan a continuacin" Frecuencia absoluta ni: 1e denomina frecuencia absoluta del valor %i de la variable 3, el numero de veces ni !ue se repite ese valor. Frecuencia relativa fi " 1e denomina frecuencia relativa del valor %i de la variable 3 la relacin por cociente entre el n(mero de veces !ue aparece el valor %i y el n(mero total de valores de la variable ,N-. 6 sea, f i = ni 7 N. Frecuencia absoluta acumulada Ni" 1e denomina frecuencia absoluta acumulada del valor xi a la suma de las frecuencias absolutas de los valores de la variable 3 anteriores o iguales a xi . 1u valor es N i = ni con 2 8 5......i Frecuencia relativa acumulada Fi: Es la frecuencia absoluta acumulada dividida por el n(mero total de valores de la variable. 1u valor es Fi 8 N i 7 N. $e todas estas definiciones se e%traen las siguientes deducciones" 9 0a suma de las frecuencias absolutas sin acumular es igual al n(mero total de
ni ,8 Nelementos ,

9 9 9

0a (ltima frecuencia relativa acumulada es el total de elementos ,N-. 0a suma de todos las frecuencias relativas acumular es igual 0a (ltima frecuencia relativa acumulada es la unidad

.l con2unto de valores !ue ha tomado una variable, 2unto con sus frecuencias, se le denomina distribucin de frecuencias de la caracterstica o variable. ara !ue una distribucin de frecuencias !uede determinada es necesario conocer todos los valores de

la variable y uno cual!uiera de los conceptos de frecuencia !ue acabamos de definir, ya !ue el paso de uno a otro es inmediato. .dems, seg(n la forma en !ue se presenten los valores de la variable ser posible distinguir dos tipos de distribuciones de frecuencias" 9 0as !ue no estn agrupadas en intervalos, !ue surgen cuando la informacin se dispone asociando a cada valor o categora de la variable su frecuencia. 9 .!uellas cuyos valores observados generalmente aparecen agrupados en intervalos o clases :0 i , 0 i 5 ; debido al elevado n(mero de observaciones, y, por tanto, las frecuencias correspondientes a cada intervalo se obtienen sumando las de los respectivos valores de la variable !ue contiene. Cuando se traba2a con distribuciones agrupadas por intervalos o clases es necesario !ue las frecuencias observadas se asignen de alguna forma a los puntos del intervalo. 1e podr optar por suponer !ue los valores del intervalo se distribuyen uniformemente a lo largo de el o por considerar como representativo de todos los puntos del intervalo un (nico valor, por e2emplo, el punto medio del mismo, !ue denominaremos marca de clase (X;) y !ue, en consecuencia, se obtendr mediante 3 i 8 ,0 i 5 < 0 i -7*. .un!ue la agrupacin de valores tiene la venta2a de simplificar el mane2o de la informacin, presenta en cambio un importante inconveniente consistente en la perdida, en mayor o menor medida, de una parte de dicha informacin. 0a distribucin de frecuencias de una variable suele presentarse ordenadamente mediante la tabla de frecuencias siguiente"

Ii :0 + , 0 i ; :0 5 ,0 * ; :0 * , 0 = ; :0 k 5 , 0 >;

3i %5 %* %= %k

ni n, n* n= nk

fi f 5 8n 5 7N f * 8n * 7N f = 8n = 7N f>8n k 7N

Ni N 5 8n 5 N*8n 5 <n * N=8n 5 <n * <n = N k 8n 5 <...<n k 8N

#i # 5 8N 5 7N # * 8N*7N # = 8N=7N #>8N>7N85

8N

85

En cuanto al n(mero de intervalos k a considerar puede tenerse en cuenta la frmula de 1turges ,? 8 E:=7*< log ,N-7log,*-;-, o tambi'n tomar ? 8 .

Medid!s de 'osici"n dis'ersi"n ( or&! @na vez definidos los conceptos bsicos en el estudio de una distribucin de frecuencias de una variable, estudiaremos las distintas formas de resumir dichas distribuciones mediante &edid!s de 'osici"n ,o de centralizacin-, teniendo presente el error cometido en el resumen mediante las correspondientes &edid!s de dis'ersi"n. . su vez analizaremos la forma de la distribucin mediante #!s &edid!s de or&!. El histograma de frecuencias ya nos daba una representacin visual de las tres propiedades mas importantes de los datos muestrales relativos a variables" la forma de su distribucin, su tendencia central y su dispersin. .hora se trata de cuantificar estos conceptos.

Medid!s de 'osici"n 1e trata de encontrar unas medidas !ue sinteticen las distribuciones de frecuencias. En vez de mane2ar todos los datos sobre las variables, tarea !ue puede ser pesada, podemos caracterizar su distribucin de frecuencias mediante algunos valores num'ricos, eligiendo como resumen de los datos un valor central alrededor del cual se encuentran distribuidos los valores de la variable. El valor de la variable elegido para representar a una distribucin se llama promedio o medida de posicin y es un valor representativo de todos los valores !ue toma la variable. $ebe hallarse entre el mayor y el menor valor de la variable. ero estas medidas de posicin de una distribucin de frecuencias han de cumplir determinadas condiciones para !ue lean verdaderamente representativas de la variable a la !ue resumen. Aoda sntesis de una distribucin se considerara como operativa si intervienen en su determinacin todos y cada uno de los valores de la distribucin, siendo unica para cada distribucin de frecuencias y siendo siempre calculable y de fcil obtencin. . continuacin se relacionan las medidas de posicin ms comunes utilizadas en estadstica.

Media aritmtica : 1e define como la suma de todos los valores de la distribucin dividida por el numero total de datos. 0a e%presin matemtica !ue representa la media aritm'tica coincide con el momento de primer orden respecto al origen. ero esto solo es valido en el supuesto ms sencillo en !ue los datos de la variable est'n sin agrupar. En el caso de !ue tuvi'semos una distribucin con datos agrupados en intervalos, los valores individuales de la variable seran desconocidos y, por tanto, no podramos utilizar la formula anterior. En este supuesto los datos estarn agrupados en clases, y se postula la hiptesis de !ue el punto medio del intervalo de clase ,marca de clase- representa adecuadamente el valor medio de dicha clase, y aplicaramos la formula original de la media simple para dichos valores. En el caso de !ue la variable presente valores anormalmente e%tremos, 'stos pueden distorsionar la media aritm'tica, haci'ndola incluso poco representativa. . los estadsticos !ue no son afectados por los valores e%tremos de la muestra se les denomina estadsticos robustos. 0a media no es un estadstico robusto. Como veremos posteriormente, este inconveniente no lo posee la mediana. 1i la distribucin de frecuencias es ,% i ,n i -, siendo % i los valores de la variable o las marcas de clase, y siendo n i las frecuencias absolutas, la media aritm'tica, !ue representaremos por X , se define como sigue" X = 5 N

x n
i =5 i

Media aritmtica ponderada: Caso particular de la media aritm'tica, !ue aparece cuando se otorga a cada valor de la variable % i una ponderacin o peso B i , distinto de la frecuencia o repeticin n i . En este caso no todos los valores de la distribucin intervienen con el mismo peso en el calculo de la media. 0a cuanta de dichos pesos define la importancia de cada valor de la distribucin en el calculo de la media. 1i la distribucin de frecuencias es ,% i ,n i ,B i -, siendo % i 0os valores de la variable o las marcas de clase, siendo n i las frecuencias absolutas, y siendo B i los pesos o ponderaciones, la media aritm'tica ponderada. !ue denotaremos por C, se define como sigue"

C8

x n w
i =5 k i i

n w
i =5 i

Media geomtrica: 1ea una distribucin de frecuencias ,% i , n i -. 0a media geom'trica, !ue denotaremos por D. se define como la raz NE'sima del producto de los N valores de la distribucin. D8
N n5 n* nk x5 x* 44444x k

El empleo ms frecuente de la media geom'trica es el de promediar variables tales como porcenta2es, tasas, n(meros ndices. etc., es decir, en los casos en los !ue se supone !ue la variable presenta variaciones acumulativas. .dems, cuando la variable toma al menos un %
i

8 + entonces D se anula, y si la variable toma valores negativos se pueden presentar una

gama de casos particulares en los !ue tampoco !ueda determinada debido al problema de las races de ndice par de n(meros negativos. Media armonica: 1ea una distribucin de frecuencias ,% i ,n i -. 0a media armnica, !ue representaremos por &, se define como sigue"

N &8 5 7 n x i ni
i =5 k

6bs'rvese !ue la inversa de la media armnica es la media aritm'tica de los inversos de los valores de la variable. No es aconse2able en distribuciones de variables con valores pe!ue/os. 1e suele utilizar para promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc. Media cuadrtica : 1ea una distribucin de frecuencias ,% i ,n i -. 0a media cuadrtica, !ue representaremos por C. se define como sigue" C8
* * n5 x5* + n * x * +4444+n k x k N

0a media cuadrtica es la raz cuadrada de la media aritm'tica de los cuadrados de los valores de la variable.

Mediana: 1e define como mediana el valor de la distribucin, supuesta esta ordenada de menor a mayor, !ue de2a a su iz!uierda y a su derecha la misma frecuencia de

observaciones, es decir, el valor de la variable !ue ocupa el lugar central, supuesto un numero impar de datos. 1i el numero de datos fuese par puede decirse !ue hay dos valores medianos, y se toma como mediana la media aritm'tica entre ellos. Aambi'n se podra definir como a!uel valor de la distribucin cuya frecuencia absoluta acumulada es N7* ,N8

-. ara distribuciones agrupadas en intervalos. y suponiendo !ue todos los valores

comprendidos dentro del intervalo mediano :0 i 5 ,0 i ; se encuentran distribuidos uniformemente a lo largo de 'l, puede calcularse la mediana Fe mediante la e%presion" Fe 8 0 i 5 < :,N7* E ,N i 5 -- 7 n i ; c i donde N i 5 G N7* GN i siendo c i su amplitud. Como venta2a de la mediana tenemos !ue no influyen en ella los valores e%tremos ,estadstico robusto-. y :0 i 5 , 0 i ; es el intervalo siguiente al !ue contiene a N7*,

Moda : 0a moda es el valor de la variable !ue ms veces se repite, y en consecuencia, en una distribucin de frecuencias, es el valor de la variable !ue viene afectada por la m%ima frecuencia de la distribucin. En distribuciones no agrupadas en intervalos se observa la columna de las frecuencias absolutas, y el valor de la distribuciHn al !ue corresponde la mayor frecuencia ser la moda. . veces aparecen distribuciones de variables con ms de una moda ,bimodales, trimodales, etc-, e incluso una distribucin de frecuencias !ue presente una moda absoluta y una relativa. En distribuciones agrupadas en intervalos de la misma amplitud, realmente no tendremos un valor modal sino un intervalo modal ,el intervalo !ue presenta la mayor frecuencia :0
i 5

. 0 i ;-. odemos tomar como valor moda el e%tremo inferior del intervalo ,Fo 8 0 i 5

- o el e%tremo superior ,Fo 8 0 i -, o bien hacer !ue la moda sea igual a la marca de clase del intervalo modal ,Fo 8 % i -. En caso de !ue todos los valores del intervalo modal est'n distribuidos uniformemente dentro de 'l, la moda estar ms cerca de a!uel intervalo contiguo cuya frecuencia sea mayor, siendo las distancias de la moda Fo a los intervalos contiguos inversamente proporcionales a las frecuencias de dichos intervalos, la moda puede calcularse mediante la e%presin" Fo 8 0 i 5 < ,n i <l 7 ,n i E l < n i <l--c i

ara intervalos de distinta amplitud, realmente las densidades de frecuencias nos dan el numero de valores !ue hay en cada unidad de intervalo para cada intervalo. 0a mayor densidad de frecuencia, ahora s, nos determina el intervalo modal :0 i 5 , 0 i ;, calculndose la moda mediante la e%presin" Fo 8 0 i 5 < ,d i 5 7 ,d i 5 < d i+ 5 --c i con d i 8n i 7c i Cabe se/alar !ue la moda es la medida mas representativa en caso de distribuciones de variables en escala nominal. Esto es debido a !ue las distribuciones de este tipo presentan los datos no susceptibles de ordenaciHn, de tal forma !ue para estas distribuciones no es posible realizar operaciones elementales con sus observaciones. 0a moda se emplea sobre todo cuando los valores de la variable presentan una gran concentraciHn hacia un valor determinado. 1lo se utilizar en distribuciones de gran frecuencia total. Cuantiles" 1e definen los cuantiles de orden k como los valores de la distribucin, supuesta 'sta ordenada de menor a mayor, !ue la dividen en k partes con la misma frecuencia de observaciones. or lo tanto e%istirn r=k-1 cuantiles de orden k. El primer cuantil de orden k de2a a su iz!uierda la fraccin 1/k de frecuencia de observaciones. El segundo cuantil de orden k de2a a su iz!uierda la fraccin 2/k de frecuencia de observaciones. El rE'simo cuantil de orden k de2a a su iz!uierda la fraccin r7> ,5++ r7> por ciento- de frecuencia de observaciones, y a su derecha de2a la fraccin 5Er7> ,5++,>Er-7> por ciento- de frecuencia de observaciones. El rE'simo cuantil de orden k suele denominarse por Ir,>. ara el caso ms general, en !ue la distribucin este agrupada en intervalos, el rE'simo cuantil de orden > tomar el valor" Ir,> 8 0 i 5 < :,rN7> E ,N i 5 -- 7 n i - c i $onde N i 5 G rN 7> G N i y :0 i 5 , 0 i ; es el intervalo siguiente al !ue contiene a rN 7 >, siendo c i su amplitud. ara >8 ) y r 85,*,= tendremos los = cuartiles. ara > 85+ y r 8 5,*,...,J tendremos los J deciles, y para > 85++ y r 8 5,*,...,JJ tendremos los JJ percentiles. 0os cu!rti#es son, por tanto, los tres valores de la distribucin !ue la dividen en ) partes iguales, es decir, en ) intervalos dentro de cada cual est incluido el *KL de los valores de la distribucin. 0os deci#es son los J puntos !ue dividen la distribucin en 5+ partes, tales !ue dentro de cada una est incluido el 5+L de los valores de la distribucin. 0os 'ercenti#es son los JJ puntos !ue dividen la distribucin en 5++ partes, tales !ue dentro de cada una est incluido el 5 L de los valores de la distribucin. ara distribuciones sin agrupar en intervalos

el primer cuartil I 5,) es el valor de la distribucin !ue ocupa el lugar N7) el segundo cuartil I *,) es el valor de la distribucin !ue ocupa el lugar *N7), el tercer cuartil I =.) es el valor de la distribucin !ue ocupa el lugar =N7), el rE'simo decil Ir,5+ es el valor de la distribucin !ue ocupa el lugar rN75+ ,r 85,*,...,J-, el rE'simo percentil Ir,5++ es el valor de la distribucin !ue ocupa el lugar rN75++ ,r 85,*,...,JJ-. Momentos potenciales: Entre los valores !ue caracterizan una distribucin de frecuencias tenemos los momentos potenciales. $os distribuciones !ue tienen sus momentos iguales son iguales, y sern ms parecidas cuanto ms pr%imos sean sus momentos. 0os momentos suelen considerarse respecto del origen y respecto de la media. El momento de orden r respecto del origen se define como" ar = 5 N

x
i =5

r i

ni

El momento de orden r respecto de la media se define como" mr = 5 N

,x
i =5

x - * ni

1e observa !ue el momento de orden uno centrado en el origen coincide con la media aritm'tica de la distribucin, y el momento de orden * centrado en la media coincide con la varianza de la distribucin. Medid!s de dis'ersi"n 0as medidas de dispersin permiten calcularla representatividad de una medida de posicin, para lo cual ser preciso cuantificar la distancia de los diferentes valores de la distribucin respecto a dicha medida. . tal distancia es a lo !ue, en t'rminos estadsticos, denominaremos variabilidad o dispersiHn de la distribuciHn. 0as medidas de dispersiHn tienen como finalidad estudiar hasta !ue punto, para una determinada distribucin de frecuencias, las medidas de tendencia central o de posicin son representativas como sntesis de toda la informacin de la distribucin. Fedir la representatividad de una medida de posicin e!uivale a cuantificar la separacin de los valores de la distribucin respecto a dicha medida.

or e2emplo, si !ueremos estudiar en !ue grado una media aritm'tica nos marca una tendencia central generalizable del comportamiento de todos los elementos del con2unto estudiado, tendremos !ue fi2arnos en la separacin o desviacin de cada valor respecto a la media. 1i todos los valores estn cercanos al valor medio, este ser representativo de ellos. . la mayor o menor separacin de los valores de una distribucin respecto de otro, !ue se pretende !ue sea sus sntesis, se le llama dispersin o variabilidad. 1er, pues, tanto mas representativa la media aritm'tica de una variable cuanto ms agrupados en tomo a ella est'n los valores promediados y, por el contrario, ser tanto ms rechazable, por no ser representativa. cuanta mayor dispersin e%ista de los valores de la variable respecto a la media. Mesulta pues necesario para completar la informacin !ue pueda deducirse de una medida de posicin o centralizacin, acompa/arla de uno o varios coeficientes !ue nos midan el grado de dispersin de la distribucin de la variable respecto de esa medida de centralizacin. Estos coeficientes son los !ue llamamos medidas de dispersin. Inicialmente se distingue entre medidas de dispersin absolutas y relativas. entendi'ndose por relativas las !ue no dependen de las unidades de medida. osteriormente se clasifican las medidas absolutas y relativas seg(n sean medidas referentes a promedios o no lo sean. Entre las medidas de dispersin absolutas no referentes a promedios tenemos el recorrido o diferencia entre el mayor valor y el menor valor de una distribucin y el recorrido intercu!rt)#ico o diferencia e%istente entre el tercer cuartil y el primero. Entre las medidas de dispersin relativas no referentes a promedios tenemos el coe iciente de !'ertur! o cociente entre el mayor valor y el menor valor de una distribucin y el recorrido re#!ti*o o cociente entre el recorrido y la media, as como el recorrido se&intercu!rt)#ico o cociente entre el recorrido intercuartlico y la suma del primer y tercer cuartil. Entre las medidas de dispersin absolutas referentes a promedios tenemos las des*i!ciones &edi!s, #! *!ri!n+! ( #! des*i!ci"n t)'ic! . Estas medidas de dispersin involucran a los promedios y permiten medir el error !ue cometemos utilizando el promedio en cuestin como resumen de los datos. Como medida de dispersin mas simple relativa a la medida de posicin podramos considerar las desviaciones de cada valor al promedio y promediar estas desviaciones, es decir, considerar el valor $8

,%iE - ni 7 N,

i 85 ... >. ero esto, !ue sera lo primero !ue se nos ocurrira,

tiene como grave inconveniente las posibles compensaciones de las desviaciones positivas con las negativas al efectuar la suma, pudiendo obtenerse una medida pe!ue/a siendo la dispersin grande. ara solucionar este inconveniente se consideran los

valores absolutos de las desviaciones o se elevan estas al cuadrado. . continuacin se definen las medidas de dispersin mas interesantes, entre las !ue tenemos" esviaciones medias " ara medir la eficacia de la media se considera la des*i!ci"n &edi! res'ecto de #! &edi! !rit&,tic!, !ue se define como, la media aritm'tica de los valores absolutos de las diferencias entre los valores de la variable y la media aritm'tica, y cuya e%presin es la siguiente" 5 Dm = N

x
i =5

x ni

ara medir la eficacia de la mediana Me suele considerarse la des*i!ci"n &edi! res'ecto de #! &edi!n! , !ue se define como la media aritm'tica de los valores absolutos de las diferencias entre los valores de la variable y la mediana, y cuya e%presin es la siguiente" DMe = 5 N

x
i =5

Me

ni

!arian"a# cuasivarian"a# desviacin tipica $ error estndar: $e todas las medidas de dispersin absolutas respecto a la media aritm'tica, la varianza y su raz cuadrada ,la desviacin tpica-, son las mas importantes. 1i en vez de considerar los valores absolutos de las desviaciones respecto del promedio consideramos sus cuadrados, surge una nueva medida de dispersin denominada varianza y !ue definimos como, la media aritm'tica de los cuadrados de las desviaciones de los valores de la variable a la media aritm'tica, es decir, el momento de segundo orden respecto a la media aritm'tica. 1e define mediante la e%presin"

* =

5 N

,x
i =5

x - * ni

Como propiedades mas importantes de la varianza tenemos !ue nunca puede ser negativa, !ue es igual al momento de segundo orden respecto al origen menos el de primer orden elevado al cuadrado, !ue si en la distribucin de frecuencias sumamos a todos los valores de la variable una constante la varianza no vara ,un cambio de origen en la variable no afecta a la varianza- y !ue al multiplicar los valores de una distribucin de frecuencias por una constante % la varianza !ueda multiplicada por el cuadrado de la constante. .s como las desviaciones medias vienen e%presadas en las mismas unidades de medida !ue la distribucin, la varianza no, ya !ue vendr dada en las unidades correspondientes, pero elevadas al cuadrado. Esto dificulta su interpretacin y hace necesario definir la desviacin tpica o desviacin estndar. 0a desviacin tpica es la raz cuadrada, con signo positivo, de la varianza, con lo !ue su e%presin sera"

5 N

,x
i =5

x - * ni

.l ser la raz cuadrada de la varianza, vendr e%presada en las mismas unidades de medida !ue la distribucin, lo cual la hace mas apta como medida de dispersin. @n estadstico muy utilizado como medida de dispersin, sobre todo debido a sus propiedades muestrales, es la cuasivarianza, cuya e%presin es" S* = 5 k , x j x - * ni N 5 i =5

Aambien se considera la cuasidesviacion tipica, cuya e%presin es"


5 k , x j x - * ni N 5 i =5

S=

6tro estadstico muy utilizado como medida de dispersin tambi'n por sus propiedades muestrales, es el error estndar, cuyo valor es e 8 1 7 1iempre se cumple !ue $ Me G $ m G
n

Entre las medidas de dispersin absolutas referentes a promedios podramos haber definido tambi'n la desviacin media respecto a la moda y las desviaciones cuadrticas respecto a la mediana y a la moda, !ue vienen dadas en las mismas unidades de medida !ue la distribucin y !ue marcan la representatividad de los promedios con los !ue se relacionan. Entre las medidas de dispersin relativas ,valores adimensionales !ue no se ven afectados por las unidades de medida y !ue siempre se concretan en forma de cocienteutilizadas para comparar medidas de posicin o promedios, tenemos e# )ndice de dis'ersi"n res'ecto ! #! &edi!n! y el coe iciente de *!ri!ci"n de Pe!rson . Coeficiente de variacin de &earson: 1e usa para resolver el problema de comparacin de medias aritm'ticas de varias distribuciones !ue pueden venir, en general, en unidades diferentes. 1e define como la relacin por cociente entre la desviacin tpica y la media aritm'tica N8 7 x . Evidentemente a menor coeficiente de variatin N me2or es la media. 6bservamos !ue al efectuar el cociente eliminamos las unidades, y por tanto N es adimensional. or otra parte, N representa el n(mero de veces !ue contiene a x , y es claro !ue cuanto mayor sea N ms veces contendr a % , luego, relativamente, a mayor N menor representatividad de x . Este coeficiente tambi'n se suele e%presar en tantos por ciento como N 8 5++ , 7 x - .

Como tanto en el clculo de como en el clculo de x han intervenido todos los valores de la distribucin N presenta la garanta, frente a otros coeficientes, de !ue utiliza toda la informacin de la distribucin. 0a cota inferior de N es cero y el (nico caso problemtico se presenta cuando x 8 +, lo !ue hara !ue N tendiera a infinito. 'ndice de dispersin respecto a la mediana : 1e usa para resolver el problema de comparacin de medianas de varias distribuciones !ue pueden venir, en general, en unidades diferentes. 1e define como la relacin por cociente entre la desviacin media respecto de la mediana y la mediana aritm'tica N Me 8 $ Me 7Fe. Evidentemente a menor ndice de dispersin me2or es la mediana. Medid!s de or&! @na vez iniciado el anlisis estadstico de sinterizacin de la informacin, para lo cual hemos estudiado las medidas de posicin y dispersin de la distribucin de una variable, necesitamos conocer ms sobre el comportamiento de la misma. No podemos basar nuestras conclusiones (nicamente en e%presiones !ue vengan dadas en t'rminos de medidas de posicin y dispersin. 1i bien intentamos globalizar el comportamiento del colectivo !ue sea ob2eto de nuestro estudio, para lo cual las medidas de posicin son nuestro me2or instrumento, no debemos proceder a una intrepretacin !ue impli!ue un comportamiento de todos los elementos del colectivo uniformemente constante e igual a la medida de posicin en cuestin con un error dado por la correspondiente medida de dispersin. Este error o disparidad se hace ms ostensible al analizar la representacin grfica de la distribucin. ues bien, las medidas de forma de una distribucin se basan en su representacin grafica, sin llegar a realizar la misma. 0as medidas de forma se clasifican en &edid!s de !si&etr)! ( &edid!s de curtosis o !'unt!&iento0as medidas de asimetra tienen como finalidad el elaborar un indicador !ue permita establecer el grado de simetra ,o asimetra- !ue presenta una distribucin, sin necesidad de llevar a cabo su representacin grafica. 1upongamos !ue hemos representado grficamente una distribucin de frecuencias. 1i trazamos una perpendicular al e2e de abscisas por x y tomamos esta perpendicular como e2e de simetra, diremos !ue una distribucin es sim'trica si e%iste el mismo numero de valores a ambos lados de dicho e2e, e!uidistantes de x dos a dos y tales !ue cada par de valores e!uidistantes a x tengan la misma frecuencia. En caso contrario, las distribuciones sern asim'tricas. 0as medidas de curtosis estudian la distribucin de frecuencias en la zona central de la misma. 0a mayor o menor concentracin de frecuencias alrededor de la media y en la zona

central de la distribucin dar lugar a una distribucin ms o menos apuntada. or esta razn a las medidas de curtosis se les llama tambi'n de apuntamiento o concentracin central. 0as medidas de curtosis se aplican a distribuciones campaniformes, es decir, unimodales sim'tricas o con ligera asimetra ara estudiar la curtosis de una distribucin es necesario definir previamente una distribucin tipo, !ue vamos a tomar como modelo de referencia. Esta distribucin es la Nor&!#, !ue corresponde a fenmenos muy corrientes en la naturaleza, y cuya representacin grafica es una campana de Dauss. Aomando la normal como referencia, diremos !ue una distribucin puede ser mas apuntada !ue la normal ,es decir, le'tocurtic!- o menos apuntada ,es decir, '#!tic.rtic!-. . la distribucin normal, desde el punto de vista de la curtosis, se le llama &esoc.rtic!. Con la curtosis se estudia la deformacin, en sentido vertical, respecto a la normal, de una distribucin. . continuacin se definen las medidas de asimetra ms comunes, entre las !ue destacan las siguientes" Coeficiente de asimetr(a de Fis)er: .hora se intenta buscar una medida !ue reco2a la simetra o asimetra de una distribucin. 1i la distribucin es sim'trica, el e2e de simetra de su representacin grafica ser una recta paralela al e2e de ordenadas, !ue pasa por el punto cuya abscisa es la media aritm'tica. or ello, cuando la distribucin es asim'trica, referiremos los valores de la distribucin a este promedio. 1i una distribucin es sim'trica. e%iste el mismo numero de valores a la derecha !ue a la iz!uierda de x , y por tanto el mismo n(mero de desviaciones con signo positivo !ue con signo negativo, siendo la suma de desviaciones positivas igual a la suma de las negativas. odemos partir. pues, de las desviaciones ,%iE x - elevadas a una potencia impar para no perder los signos de las desviaciones. 0o ms sencillo sera tomar como medida de asimetra el promedio de estas desviaciones, elevadas a la potencia impar ms simple ,!ue es tres-, es decir, tomaramos como medida de asimetra el momento de orden tres centrado en la media. ero, de hacer esto, esta medida vendra e%presada en las mismas unidades !ue las de la variable. pero elevadas al cubo, por lo !ue no es invariante ante un cambio de escala. ara conseguir un indicador adimensional, debemos dividir la e%presin anterior por una cantidad !ue venga en sus mismas unidades de medida. Esta cantidad es el cubo de la desviacin tpica, obteni'ndose as el coeficiente de asimetra de M. .. #isher, cuya e%presin es"

g5 =

m= = =7 * = 5 k * N , x j x - ni i =5

5 k , x j x - = ni N i =5

1i g 5 8+ la distribucin es sim'trica, si g 5 O+ la distribucin es asim'trica positiva ,a derecha-, y si g 5 G + la distribucin es asim'trica negativa ,a iz!uierda-. 0a distribucin es asim'trica a derecha o positiva cuando la suma de las desviaciones positivas de sus valores respecto de la media es mayor !ue la suma de las desviaciones con signo negativo ,la grafica de la distribucin tiene mas densidad a la derecha de la media-. En caso contrario, la distribucin es asim'trica a la iz!uierda o negativa. Coeficiente de asimetr(a de Fis)er estandari"ado: ara N O5K+ el coeficiente de asimetra es asintticamente normal de media cero y varianza H7N. Este hecho nos lleva a considerar el coeficiente de asimetra estandarizado cuya e%presin es"
gs = g5 H N

Este coeficiente es asintticamente normal ,+,5-. Coeficiente de asimetr(a de &earson: ?arl earson propuso para distribuciones campaniformes, unimodales y moderadamente asim'tricas el coeficiente definido como .p 8 , x E Fo- 7 , donde Fo es la moda. Como en una distribucin campaniforme sim'trica. x 8 Fo 8 Fe, si la distribucin es asim'trica positiva o a derechas . x se desplaza a la derecha de la moda, y por tanto, x E Fo O +. En el caso de distribucin asim'trica negativa la media se sit(a por deba2o de Fo, por lo !ue el valor x E Fo G +. 0a desviacin tpica !ue aparece en el denominador no modifica el signo de la diferencia x E Fo y sirve para eliminar las unidades de medida de dicha diferencia. .s tendremos !ue si .p 8 + la distribucin es sim'trica, si .p O + la distribucin es asim'trica positiva y si .p G + la distribucin es asim'trica negativa. Aambi'n earson comprob empricamente para este tipo de distribuciones !ue se cumple =,% E Fe- .r E Fo ,la mediana siempre se situa entre la media y la moda en las distribuciones moderadamente asim'tricas-. razn,algunos autores utilizan como coeficiente de asimetra de earson el valor" .p =, x E Fe- or esta

Coeficiente de asimetr(a de *o+le$: Est basado en la posicin de los cuartiles y la mediana, y viene dado por la e%presin .b 8 ,C= < C 5 E *Fe- 7 ,C= < C5-. 1e cumple !ue si .b 8 + la distribucin es sim'trica, si .b O + la distribuciHn es asim'trica positiva y si .b G + la distribucin es asim'trica negativa. Cl y C= son el primer y tercer cuartil respectivamente. ,l coeficiente absoluto de asimetr(a: Est basado tambi'n en la posicin de los cuartiles y la mediana, y viene dado por la e%presin" . 8 :,C= EC*- E ,C* EC 5-; 7 1 8 ,C= < C 5 E *C*- 7 1 8 C= < C 5 E *Fe 71 1i .8+ la distribucin es sim'trica, si . O+ la distribucin es asim'trica positiva y si .G+ la distribucin es asim'trica negativa. C5, C* y C= son los cuartiles de la distribucin. @na vez presentadas las medidas de asimetra, a continuacin se definen las medidas de curtosis ms comunes, entre las !ue destacan las siguientes" Coeficiente de curtosis: En la distribucin normal se verifica !ue m ) 8 = ) siendo m
)

el momento de orden ) respecto a la media y

la desviacin tpica. 1i consideramos la

e%presiHn g * 8 m ) 7 ) E =, su valor ser cero para la distribucin normal. or ello, como coeficiente de apuntamiento o curtosis se utiliza la e%presin"

g* =

m) == = * ) 5 k * N , x j x - ni i =5

5 k , x j x - ) ni N i =5

@na distribucin es" &esoc.rtic! ,apuntamiento igual al de la normal- cuando g* 8 +, #e'toc.rtic! ,apuntamiento mayor !ue el de la normal- si g* O +, '#!tic.rtic! ,apuntamiento menor !ue el de la normal- si g* G +. ,l coeficiente de curtosis estandari"ado : ara N O 5K+ el coeficiente de curtosis es asintticamente normal de media cero y varianza *)7N. Este hecho nos lleva a considerar el coeficiente de curtosis estandarizado cuya e%presin es"
g ks = g* H N

Este coeficiente es asintticamente normal ,+,5-.

You might also like