You are on page 1of 30

VARIACIN

Coeficiente de
variacin
Definicin: Es una medida relativa
de variabilidad, o sea, mide la
variacin o dispersin de los datos
con respecto al promedio (media) en
trminos porcentuales. Es
independiente de las unidades de
medida, por lo tanto, permite
comparar la variabilidad de la
informacin de dos o ms muestras,
an en los casos en que la
informacin de estas muestras est
expresada en unidades diferentes.
Coeficiente de
Calculo:
variacin
Para calcular el
coeficiente de variacin, se utiliza
la siguiente formula tanto para
informacin no agrupada como para
informacin agrupada.
S = Desviacin Estndar
x = Media o promedio

s
CVx * 100
x
Coeficiente de
Si
Variacin
cambiamos la escala de medir en
la variable, el coeficiente de
variacin no cambia. No obstante, si la
media es igual a cero, el
coeficiente de variacin no
existe.

Ejemplo:
El peso de las mujeres es de 52.66 kg.
con una desviacin de 8.94 kg. y el de
los hombres de 56.91 kg. con una
desviacin de 11.91 kg. Para comparar la
dispersin entre las dos poblaciones
calculamos el coeficiente de variacin:
11.91
CVhombres 0.209
56.91

8.94
CVmujeres 0.170
52.66
En realidad el coeficiente de
variacin se usa para comparar la
variabilidad relativa de una
caracterstica, en poblaciones que
tienen distinta media.
No existen topes, que permitan valorar
un coeficiente de variacin como grande
o pequea.
Muchas veces su valor se multiplica por
100, para expresar el resultado en
porcentaje.
Ejemplo
Sea cuenta con datos del peso y la
estatura de un grupo de 20 nios entre
8 y 10 aos, y se desea saber cul de
las dos variables tiene mayor
variabilidad.
Ejemplo
En este caso no tiene sentido decir que
hay mayor dispersin en trminos
absolutos en la estatura, por el hecho
de que la desviacin estndar para
dicha variable es 10,5 mientras que
para el peso es 4,5, pues las unidades
en que estn expresadas ambas no son
comparables. Aqu cobran especial
importancia los coeficientes de
variacin, que quedan:
resulta que hay
mayor variabilidad
en el peso (10,7%)
que en la estatura
de los nios (6,8%).
Coeficiente de
asimetra
Una comparacin de la media, la mediana y
la moda puede revelar informacin acerca
de las caractersticas de sesgo
(asimetra).
Una distribucin de datos es asimtrica si
se extiende ms hacia un lado que hacia el
otro. (Una distribucin de datos es
simtrica si la mitad izquierda de su
histograma es aproximadamente una imagen
en espejo de su mitad derecha).
Coeficiente de
asimetra
Definicin. Se conoce tambin
como el coeficiente de pearson.
Para el anlisis de la asimetra
se utiliza el sesgo, el cul se
define como el grado de
deformacin que presenta una
distribucin.
Notacin
C.A1 = Coeficiente de Asimetra
con respecto a la mediana
C.A2 = Coeficiente de asimetra
con respecto a la moda
Calculo
Para calcular el coeficiente de
asimetra con respecto a la mediana se
utiliza la siguiente igualdad, tanto
para informacin no agrupada como para
informacin agrupada.
3( x Me )
C . A1
S
Me = mediana
S = desviacin estndar
x = media
Calculo
Para calcular el coeficiente de
asimetra con respecto a la moda se
utiliza la siguiente igualdad, tanto
para informacin no agrupada como para
( x Mo)
informacin agrupada.
C . A2
S
El resultado de esta igualdad se compara con
cero, de la siguiente forma:
Si C.A.= 0 La distribucin es Simtrica
o Normal.
Si C.A.> 0 La distribucin es Asimtrica
Positiva o deformacin a la derecha.
Si C.A.< 0 La distribucin es Asimtrica
Negativa. o deformacin a la izquierda.
Ejemplo
En una compaa se quiere realizar un
estudio para evaluar el nmero de
quejas diarias por el mal servicio
post-venta, esto con el fin de tomar
correctivos; para ello se cuenta con la
siguiente informacin:
5 9 10 12 13
Solucin
X= Nmero de quejas diarias por mal
servicio post-venta
N= 5 das
Informacin no agrupada
Antes de ello se debe calcular Media,
Me, desviacin estndar
n
Xi
49
x i 1 9,8
n 5
Me=10, por estar el valor en el centro

n
( Xi x ) 2
i 1 38,8
S 3,11
n 1 4
3(9,8 10 ) 0,6
C . A1 0,193
3,11 3,11

C.A1 = -0.193 . La distribucin del


nmero de quejas diarias por el mal
servicio post-venta, presenta una
asimetra negativa o con deformacin a
la izquierda.
Por ser la serie amodal no hay moda y
el coeficiente de asimetra con
respecto a la moda no existe.
Ejemplo
El tiempo en minutos utilizado por los
clientes de un supermercado para
realizar los pagos en caja
TIEMPO # DE
CLIENTES
0-3 6
3-6 7
6-9 4
9-12 3
20

Media = 5.1 minutos Me = 4.7 minutos


Mo = 4.2 minutos S = 3.9 minutos
s 3,9
CVx * 100 * 100 76 ,4%
x 5,1
3( x Me) 3(5,1 4,7)
C . A1 0,30
S 3,9
( x Mo ) 5,1 4, 2
C . A2 0, 23
S 3,9
CV = 76,4 %. El tiempo en atender a los
clientes vara con respecto al nmero
promedio en un 76,4%.
El tiempo en atender a los clientes
presenta una Asimetra con respecto a
la mediana y moda positiva.
Curtosis
Es una medida que indica o mide
lo plano o puntiaguda que es una
curva de distribucin. Es al
medida que nos da una idea acerca
del achatamiento o levantamiento
de la curva en relacin con la
normal.
Curtosis
La curtosis determina el grado de
concentracin que presentan los valores
en la regin central de la
distribucin. As puede ser:

Leptocrtica.- Existe una gran


concentracin.

Mesocrtica.- Existe una concentracin


normal.

Platicrtica.- Existe una baja


concentracin.
Medida basada en Cuartiles y Percentiles
K(letra griega minscula kappa) =
Coeficiente percentil de curtosis

Nota:
Si K < 0,263 la distribucin es
platicrtica
Si k = 0,263 la distribucin es normal o
mesocrtica
Si k > 0,263 la distribucin es
Diagrama de caja o
boxplot
El grafico de Tallo y hoja y el
histograma dan una impresin visual
general de un conjunto de datos,
mientras que las cantidades numricas
tales como la media y la desviacin
tpica brindan informacin sobre una
sola caracterstica de las
observaciones o datos.
El diagrama de caja es una
presentacin visual que describe al
mismo tiempo varias caractersticas
importantes de un conjunto de datos,
tales como la media, la dispersin,
la simetra y los valores extremos.
El centro de la caja es el Q2 o la Me,
los bordes son el cuartil 1 (Q1) y el
cuartil 3 (Q3). En los extremos del
diagrama se trazan dos rayas
horizontales que representan los
valores mximo y mnimo de la
distribucin. Para hallar los valores de
las rayas se multiplica la amplitud
inter cuartil (Q3-Q1) por 1,5 y el
resultado se suma a Q3 y se resta a Q1.
Por ltimo, por encima y por debajo de
las rayas se representan de forma
individual los valores extremos y
extraos de la distribucin.
Pasos para construir
un boxplot:
1)Construya una recta y marque en ella los
3 cuartiles Q1, Q2 y Q3.
2)Dibuje una caja sobre la recta con los
extremos localizados en Q1 y Q3.
3)Trace un segmento vertical por el punto
correspondiente a la mediana dentro de la
caja, as la lnea de la mediana divide
los datos en 2 partes iguales.
4)Se ubican los lmites mediante el rango
intercuartil (RI): los lmites estn a
1,5*RI menos de Q1 y a 1,5*RI ms de Q3.
Se considera que los datos fuera de estos
lmites son valores extraos.
Pasos para construir
un
5)Se
boxplot:
trazan dos lneas punteadas
(extensiones o bigotes de la caja): una que
va del centro de la primera vertical hasta
el valor mnimo dentro de los lmites, y la
otra que va del centro de la segunda
vertical hasta el valor mximo dentro de los
lmites.
6)Se marcan con un asterisco las
localizaciones de los valores extraos.
Grficamente:
Limi Limi
te Q1 Q2 o Me Q3 te
infe sup
* ** erio
rior
r
Q1-(1,5*RI) Q3+(1,5*RI)
El lugar ocupado por la mediana
dentro de la caja es un buen
indicador de la simetra, as,
mirando la caja, si la lnea
trazada por la mediana est en el
centro la distribucin de los
datos entonces tiende a ser
simtrica, si la lnea mediana se
acerca al lmite inferior, hay
indicios de asimetra positiva y si
est cerca del lmite superior hay
indicios de asimetra negativa.
Ejemplo:
En una prueba de rendimiento y consumo
de gasolina se probaron 13 vehculos,
durante 300 millas, en condiciones de
trnsito en ciudad y en el campo; de lo
anterior se obtuvieron los siguientes
datos en milla por galn:

Ciudad 16.2 16.7 15.9 14.4 13.2


15.3 16.8 16 16.1 15.3 15.2 15.3
16.2
Campo 19.4 20.6 18.3 18.6 19.2
17.4 17.2 18.6 19 21.1 19.4 18.5
18.7
De aqu se puede concluir lo
siguiente:
En el campo el consumo medio de
gasolina result mayor al de la
ciudad, lo que se aprecia en los
valores de las medianas
(Ciudad:15.9, Campo: 18.7).
La variabilidad de ambos grupos
es semejante, lo que se
observa en el ancho de las
cajas, que representa el rango
intercuantil.
En cuanto a la simetra se tiene
que para el grupo del campo la
distribucin es asimtrica
positiva mientras que para el
grupo de la ciudad se observa
asimetra negativa.
Por otra parte se observa un
dato atpico en el campo y otro
en la ciudad.

You might also like