Professional Documents
Culture Documents
CENTRAL Y POSICIÓN
MEDIDAS DE TENDENCIA
CENTRAL
DATOS NO AGRUPADOS: Se utiliza para analizar
poblaciones o muestras pequeñas generalmente
cuando tienen 30 o menos elementos.
MEDIDAS DE TENDENCIA CENTRAL: Son medidas
que describen el centro de una distribución, que es
donde se localizan la mayor parte de los datos (caso
típico en la distribución normal)
MEDIA ARITMÉTICA: Es el valor equidistante entre
el grupo de mayor valor y el punto de menor valor de
una serie de datos.
n
xi
x i 1
n
MEDIDAS DE TENDENCIA CENTRAL
EJEMPLO:
◦ 2, 10, 4, 6, 9, 7, 5, 12
◦ Sumatoria 55
◦ Número de datos 8
55
x
8
◦ Media= 6.875
MEDIDAS DE TENDENCIA CENTRAL
LA MEDIANA: Es el valor que divide en
dos partes iguales a una serie de datos
finitos. Para encontrar la mediana es
necesario ordenar los datos, y pueden
ocurrir dos casos:
◦ Que el número de datos sea impar, la
mediana será valor central de la serie.
3,5,8,12,25 la mediana 8.
◦ Que el número de datos sea par, la mediana
será la media aritmética de los valores
centrales. 2,4,7,25,39,47. La mediana es 16
o sea la media de 7 y 25.
MEDIDAS DE TENDENCIA CENTRAL
(30 / 2 8)
Me 57.5 5
9
MEDIANA= 61.39
MEDIDAS DE TENDENCIA
CENTRAL
MODA: Para su calculo se utiliza la siguiente
formula: (d1)
Mo Li c
(d1 d 2)
Li= limite real inferior de la clase modal.
d1= frecuencia de la clase modal menos
frecuencia anterior.
d2= frecuencia de la clase modal menos
frecuencia posterior.
c= amplitud de clase.
La clase modal es la que tiene la más alta
frecuencia.
MEDIDAS DE TENDENCIA
CENTRAL
(1)
Mo 57.5 5
(1 3)
D1= 9-8=1
D2= 9-6=3
MEDIDAS DE POSICIÓN
CUANTILES: Son medidas de posición
que sitúan valores a diferentes puntos de
la distribución, los más utilizados son los
quartiles, los deciles y los percentiles.
QUARTILES: Dividen la distribución en
cuatro partes iguales Q1, Q2, Q,3.
(nj / 4 fa )
Qj Li c
f
MEDIDAS DE POSICIÓN
Qj;j=1,2,3
((30 *1) / 4) 0
Q1 52.5 5
8
Q1 57.1875
MEDIDAS DE POSICIÓN
DECILES: Dividen la distribución en diez
partes iguales D1, D2, D3…D9
(nj / 10 fa )
Dj Li c
f
((30 * 8) / 10) 23
D8 67.5 5
4
D8 68.75
Dj;j=1,2,3…9
MEDIDAS DE POSICIÓN
PERCENTILES: Dividen la distribución en
cien partes iguales P1, P2, P3…P99
(nj / 100 fa )
Pj Li c
f
((30 * 85) / 100) 23
P85 67.5 5
4
P85 70.625
Pj;j=1,2,3…99
MEDIDAS DE DISPERSIÓN
◦ INTRODUCCION
El conocimiento de la forma de
distribución y de las medidas de posición
puede servir para tener una idea bastante
clara de su conformación, pero no de la
homogeneidad de cada uno de los
valores con respecto a la medida de
tendencia central aplicada. Las medidas
de dispersión permiten apreciar el grado
de variabilidad ó propagación de los
datos.
INTRODUCCION
El conocimiento de la forma de
distribución y de las medidas de
posición puede servir para tener una
idea bastante clara de su
conformación, pero no de la
homogeneidad de cada uno de los
valores con respecto a la medida de
tendencia central aplicada.
INTRODUCCION
Las medidas de dispersión permiten
apreciar el grado de variabilidad ó
propagación de los datos y las de
forma pproporcionan un valor
numérico para saber hacia qué lado
de la distribución hay mayor
acumulación de frecuencias y si la
concentración central de frecuencias
es mayor que en los extremos o
viceversa sin tener que graficar los
datos.
EJEMPLO
Si la guía de turismo ecológico dice que el río
tiene en promedio 3 pies de profundidad,
¿querría usted cruzarlo a pie sin más
información? Quizá no.
Usted desearía saber algo sobre la variación
de la profundidad. ¿Mide 3.25 pies la máxima
profundidad y 2.75 la mínima? En dicho caso,
usted estaría de acuerdo en cruzar. ¿Qué hay
si la profundidad del río varia de 0.50 a 5.5
pies? Su decisión probablemente sería no
cruzar.
Antes de tomar una decisión, usted desea
información tanto de la profundidad típica como
de la dispersión de la profundidad del río…
CONSIDERACIONES
Por ejemplo:
Suponga que el nuevo monitor de computadora
Vision Quest LCD se arma en Baton Rouge y
también en Tucson. La producción media
aritmética por hora, en ambas plantas, es de 50.
Sobre la base de las dos medias, podría concluir
que las distribuciones de las producciones por
hora son idénticas
EJEMPLO
los registros de producción de 9 horas en las dos
plantas revelan que esta conclusión no es correcta.
( x
2
x ) xi
2
N
s2 i
N N
552
455
s2 8 9.6093
8
LA DESVIACION STANDARD
El cálculo de la varianza, se hace utilizando
datos cuadráticos con el objetivo de que las
desviaciones no se cancelen entre sí, por esta
razón, es necesario trabajar con valores
originales (no elevados al cuadrado) y esto se
logra con la desviación standard. El cálculo de
la desviación standard a partir de la varianza, es
simplemente obtener la raíz cuadrada de esta
última.
s 9.6093 3.10
2
Propiedades
El 68.27% de los datos de una distribución,
están a una desviación standard de la
media.
Varianza
Desviación Std
EL COEFICIENTE DE VARIACION
Es una medida de dispersión relativa que
se obtiene dividiendo la desviación estándar
de la serie de datos entre su media
aritmética y se multiplica por 100 para
expresarlo en porcentaje. Es un dato
adimensional puesto que los datos con se
calcula están expresadas en sus
dimensionales originales. Es útil cuando se
quiere comparar series de datos con dos
variables diferentes, ejemplo: altura y peso.
s
C.V . *100 C.V .
3.10
*100 45.09
x 6.875
SESGO
Es el grado de asimetría ó falta de simetría de
una distribución. Si la curva de frecuencia tiene
una “cola” más larga a la derecha del máximo
central que a la izquierda, se dice que la
distribución esta sesgada a la derecha ó que
tiene “sesgo positivo”, si es a la izquierda se
dice que tiene “sesgo negativo”.
PRIMER COEFICIENTE DE
PEARSON
En distribuciones sesgadas, la media tiende a
situarse con respecto a la moda al mismo
lado que la cola más larga. Así una medida de
la asimetría nos da por la diferencia (Media-
Moda) y se adimensiona dividiéndola por una
medida de dispersión.
x Mo 62.67 58.75
sesgo sesgo 0.5766
s 6.798
SEGUNDO COEFICIENTE DE PEARSON
Para evitar el empleo de la moda, se puede
usar
la fórmula empírica así:
3( x Me) 3(62.67 61.39)
sesgo sesgo 0.56487
s 6.798
COEFICIENTE DE SESGO USANDO
EL MOMENTO DE ORDEN TRES
CON RESPECTO A LA MEDIA
En este momento nos va a ser útil la hoja de
cálculo que venimos usando para datos
agrupados agregando lo siguiente:
Continuación tabla peso
estudiantes.........
(x-x)^3 f(x-x)^3 (x-x)^4 f(x-x)^4
-451.217663 -3609.7413 3460.83948 27686.7158
-19.034163 -171.307467 50.8212152 457.390937
12.649337 75.896022 29.4729552 176.837731
393.832837 1575.33135 2886.7947 11547.1788
1874.51634 3749.03267 23112.7864 46225.5729
5204.69984 5204.69984 90197.4482 90197.4482
7015.44652 6823.91111 119738.163 176291.144
6823.91
m
coeficient e sesgo a3 33 30 3 0.724
s 6.798
COEFICIENTE b1
b1 a 0.724 0.5242
2
3
2
P=0 NORMAL
DERECHA
P=0 NORMAL
IZQUIERDA
CURTOSIS
Es el grado de apuntamiento de una
distribución, normalmente se toma en
relación a una normal. Una distribución que
presenta un apuntamiento relativo alto, se le
llama: leptocúrtica, mientras que la curva
que es más achatada se llama platicúrtica.
La distribución normal se llama: mesocúrtica.