Professional Documents
Culture Documents
x
i
f
i
N
.
Para su c alculo resulta muy util la disposici on de los datos en una tabla que incluira una columna para los distintos
datos x
i
, otra para las frecuencias absolutas f
i
y una nueva columna para x
i
f
i
, que seran los productos de los valores
correspondientes a la misma la de las columnas anteriores. La media corresponde a la suma de los valores de esta ultima
columna
x
i
f
i
, partido de N.
2. PAR AMETROS ESTADISTICOS. MEDIDAS DE DISPERSI ON
Existen variables estadsticas con comportamientos distintos que tienen la misma media, y lo mismo ocurre con las otras
medidas de centralizaci on. Por ello, resulta necesario calcular par ametros que muestren como se distribuyen los datos. As,
introduciremos algunos par ametros de dispersi on, que nos informan sobre como de dispersos se encuentran los datos
con respecto de la media. Esos ser an la desviaci on media, varianza, desviaci on tpica y el coeciente de variaci on.
Supongamos que nuestra variable estadstica X toma los distintos valores x
1
, x
2
, . . . , x
n
con frecuencias absolutas
f
1
, f
2
, . . . , f
n
respectivamente, y x es la media. Entonces se dene:
1. La desviaci on media es:
DM(X) =
|x
i
x|f
i
N
.
Dado que |x
i
x| es la distancia del dato x
i
a x, la desviaci on media es un promedio de las distancias de los
datos a la media, y por lo tanto, en cierto sentido, mide lo separados en promedio que est an los datos con respecto
de la media.
2. La varianza se dene como
Var(X) =
2
=
|x
i
x|
2
f
i
N
=
x
2
i
f
i
N
x
2
.
La primera de las expresiones indica que la varianza tambi en mide c omo de separados est an con respecto de la
media, la segunda es la que utilizaremos para calcular la varianza a partir de una tabla.
3. La desviaci on tpica es dt(X) = =
V ar(X).
4. El coeciente de variaci on se dene como CV(X) =
x
.
Para calcular todos estos par ametros, completaremos con nuevas columnas la tabla que hemos utilizado para calcular
la media. Para ello, incluiremos una nueva columna donde calcularemos para cada dato el valor de |x
i
x|, una columna
para |x
i
x|f
i
. La suma de los elementos de esta columna
|x
i
x|f
i
partido de N ser a el valor de la desviaci on media.
Ahora incluiremos una nueva columna con los valores de x
2
i
f
i
, y utilizaremos la suma de estos para incluirlos en la
expresi on de la varianza. De esta, calcularemos la desviaci on tpica y despu es la variaci on media.
3. CUARTILES, DECILES Y PERCENTILES
La mediana de una variable estadstica corresponde a un datoque deja la mitad de los datos por debajo de el.
Vamos a generalizar este concepto para denir los cuartiles, deciles y percentiles, para ello ahora dividiremos los datos
en 4 para los cuartiles, 10 para los deciles, y 100 para los percentiles.
Para los cuartiles, al dividir por 4, tendremos un datoque deja por debajo de el la primera cuarta parte de los datos,
un valor que deja la 2/4 parte de los datos, y otro para la 3/4 parte de los datos. Estos valores se denotan por Q
1
, Q
2
y Q
3
.
Esta sera la idea intuitiva, pero al igual que para la media, no siempre existe tal dato, y entonces denimos el cuartil, como
tambi en el decil o el percentil, como un promedio.
Con la idea de que Q
1
es aquel valor que deja la cuarta parte de los datos por debajo de el, y razonando como para la
media (de hecho, estoy haciendo un copia y pega), dividiremos el n umero de datos entre 4,
N
4
, y utilizando la tabla con
las frecuencias absolutas acumuladas se tiene dos posiblidades:
1. Si dicho valor no corresponde a ninguna frecuencia absoluta acumulada, el primer cuartil Q
1
coincide con el dato
x
i
cuya frecuencia absoluta acumulada supera por primera vez a
N
4
.
2. Si el valor es igual a la frecuencia absoluta acumulada F
i
de un dato x
i
, el primer cuartil Q
1
ser a el punto medio o
semisuma de este dato x
i
y el siguiente dato x
i+1
, esto es, Q
1
=
x
i
+x
i+1
2
.
De la misma forma calcularamos el segundo cuartil Q
2
con
2 N
4
=
N
2
, observa que este coincide con la mediana, y el
tercer cuartil Q
3
con
3 N
4
.
Con la misma idea calcularamos los deciles, al dividir los datos entre 10 obtendramos D
1
, D
2
, . . . , D
9
, donde D
k
se
calcula a partir del valor
k N
10
y la columna de las frecuencias absolutas acumuladas, y los percentiles P
1
, P
2
, . . . , P
99
, con
la misma idea y procedimiento usando el valor
k N
100
.