You are on page 1of 7

CUARTILES

Los cuartales son los valores de la variable que dividen los datos en cuatro partes, por supuesto, una vez ordenados de menor a mayor. Los cuartales son: 1. Q1 primer cuart o cuartil inferior, hay un cuarto de los datos menores que l, dicho de otro modo el 25% de los datos son menores. Coincide con P25. 2. Q2 segundo cuartil o cuartil intermedio, el 50% de los datos son menores que l. Coincide con la mediana, D5 y P50. 3. Q3 tercer cuartil o cuartil superior, deja el 75% de los datos de debajo. Coincide con P75. En el caso de variables discretas para obtener Q1buscamos la primera observacin que supere el 25% de los datos, esta observacin ocupar el lugar donde n es el total de observaciones y E representa la parte entera. Q2 coincide con la Mediana por tanto al calcular la mediana lo estamos calculando y Q3 ocupar el lugar . En el caso en que tengamos una variable continua, como conocemos la relacin existente entre los percentiles y los cuartiles la frmula a usar ser una adaptacin: Clculo con datos no agrupados No hay uniformidad sobre su clculo. En la bibliografa se encuentran hasta cinco mtodos que dan resultados diferentes.2 Uno de los mtodos es el siguiente: dados n datos ordenados,

El primer cuartil: (n+3)/4 Para el tercer cuartil: (3n+1)/4

DESILES
En estadstica descriptiva, el concepto decil refiere a cada uno de los 9 valores que dividen un grupo de datos (clasificados con una relacin de orden) en diez partes iguales, y de manera que cada parte representa un dcimo de la poblacin. En resumen, los dciles son cada uno de los nueve valores que dividen un conjunto de datos en diez grupos con iguales efectivos. Los deciles se calculan como si fueran 10-cuantiles, o sea de manera que:

El primer decil separe el juego de datos entre el 10% de los valores inferiores, y el resto de los datos. Y el noveno decil separe los datos entre el 90% de los valores inferiores y el 10% de los valores superiores.

Obviamente, el trmino decil tambin se usa para designar la separacin de valores de una muestra, de manera tal de tener diez intervalos con el mismo nmero de valores. El decil nmero n, sera pues el situado entre el decil nmero (n-1) y el decil nmero (n+1), para n variando de 2 a 9.

PERCENTILES
El percentil es una medida usada en estadstica que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentajedado de observaciones en un grupo de observaciones. Por ejemplo, el percentil 20 es el valor debajo del cual se encuentran el 20 por ciento de las observaciones. Se representan con la letra P. Para el percentil i-simo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que l y el 100-i % restante son mayores. Aparecen citados en la literatura cientfica por primera vez por Francis Galton en 18851 P25 = Q1. P50 = Q2 = mediana. P75 = Q3. Clculo con datos no agrupados Un mtodo para establecer un percentil sera el siguiente: Calculamos... donde n es el nmero de elementos de la muestra e i, el percentil. El resultado de realizar esta operacin es un nmero real con parte entera E y parte decimal D. Teniendo en cuenta estos dos valores, aplicamos la siguiente funcin:

MEDIDA DE DISPERCION
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la media. Cunto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviacin media) y otra es tomando las desviaciones al cuadrado (varianza).

DESBIASION MEDIA
En estadstica la desviacin absoluta promedio o, sencillamente desviacin media o promedio de un conjunto de datos es la media de las desviaciones absolutas y es un resumen de la dispersin estadstica. Se expresa, de acuerdo a esta frmula:

La desviacin absoluta respecto a la media, , la desviacin absoluta respecto a la mediana, , y la desviacin tpica, , de un mismo conjunto de valores cumplen la desigualdad:

Siempre ocurre que

donde el Rango es igual a:

El valor:

Ocurre cuando los datos son exactamente iguales e iguales a la media aritmtica. Por otro lado:

VARIANZA
La varianza, , se define como la media de las diferencias cuadrticas de n puntuaciones con respecto a su media aritmtica, es

decir Para datos agrupados en tablas, usando las notaciones establcidas en los

captulos anteriores, la varianza se puede escibir como Una frmula equivalente para el clculo de la varianza est basada en lo siguiente:

Con lo cual se tiene

Si los datos estn agrupados en tablas, es evidente que

La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se miden en metros, la varianza lo hace en ). Si queremos que la medida de dispersin sea de la misma dimensionalidad que las observaciones bastar con tomar su raz cuadrada. Por ello se define la desviacin tpica, , como

Desviacin Estndar
La desviacin estndar (o desviacin tpica) es una medida de dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica descriptiva. Es una medida (cuadrtica) de lo que se apartan los datos de su media, y por tanto, se mide en las mismas unidades que la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que representan los datos en su distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones. Desviacin estndar o Tpica Esta medida nos permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar nos da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviacin estndar basta con hallar la raz cuadrada de la varianza, por lo tanto su ecuacin sera:

COEFICIENTE DE ASIMETRA
En teora de la probabilidad y estadstica, la medida de asimetra ms utilizada parte del uso del tercer momento estndar. La razn de esto es que nos interesa mantener el signo de las desviaciones con respecto a la media, para obtener si son mayores las que ocurren a la derecha de la media que las de la izquierda. Sin embargo, no es buena idea tomar el momento estndar con respecto a la media de orden 1. Debido a que una simple suma de todas las desviaciones siempre es cero. En efecto, si por ejemplo, los datos estn agrupados en clases, se tiene que:

en donde representa la marca de la clase -sima y denota la frecuencia relativa de dicha clase. Por ello, lo ms sencillo es tomar las desviaciones al cubo. El coeficiente de asimetra de Fisher, representado por , se define como:

donde es el tercer momento en torno a la media y estndar. Si Si

es la desviacin

, la distribucin es asimtrica positiva o a la derecha. , la distribucin es asimtrica negativa o a la izquierda. . El recproco entonces la

Si la distribucin es simtrica, entonces sabemos que no es cierto: es un error comn asegurar que si distribucin es simtrica (lo cual es falso).

COETICIENTE DE CURTOSIS
El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin.

Se definen 3 tipos de distribuciones segn su grado de curtosis: Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal). Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores centrales de la variable. Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.

El Coeficiente de Curtosis viene definido por la siguiente frmula:

Los resultados pueden ser los siguientes: g2 = 0 (distribucin mesocrtica). g2 > 0 (distribucin leptocrtica). g2 < 0 (distribucin platicrtica).

You might also like