You are on page 1of 14

Actividad Unidad 2.

MEDIDAS ESTADISTICAS UNIVARIANTES

Integrantes:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS TECNOLOGA E INGENIERA (ECBTI)
CURSO DE ESTADSTICA DESCRIPTIVA
2016

INTRODUCCIN

La estadstica descriptiva y el anlisis de datos tienen como objetivo ordenar cierta


cantidad de datos con el fin de adquirir el mximo de informacin y orientar la
investigacin que se est realizando mediante numerosas herramientas, como lo
son las medidas de tendencia central, de posicin y de dispersin, las cuales son
de relevante importancia en el momento de realizar estudios estadsticos.
Las medidas de tendencia central y de posicin facilitan la interpretacin de la
informacin sobre un conjunto o serie de datos que se estn analizando sin antes
haber sido recopilados u organizados, ya sea en una investigacin documental o
de campo. Cada medida de tendencia central proporciona un valor numrico, el
cual es el ms representativo de los datos, es decir, el estudio de la tendencia
generalizada de que los datos se agrupen en su mayora alrededor de un valor
calculado; mientras que las medidas de posicin permiten dar una idea de cmo
estn organizados dichos datos.
Estas medidas estadsticas sirven para ubicar el centro u otra posicin de un
grupo de datos, pero no permiten retratar la distancia de los valores de la variable
a esta ubicacin; esta propiedad se denomina dispersin, si la dispersin es poca
es indicacin de una gran uniformidad entre los valores, una gran dispersin indica
poca uniformidad y una ausencia de dispersin es seal de uniformidad completa,
lo cual quiere decir que los datos tienen el mismo valor.
En el presente trabajo, se analizaron dos variables de los datos obtenidos de una
investigacin acerca de accidentes de trnsito, mediante el clculo de las medidas
de tendencia central, algunas de posicin y de dispersin; concluyendo en cada
uno de los tems presentados si todos los datos son representativos de dicha
situacin.

JUSTIFICACIN

Al realizar una investigacin donde se lleva a cabo una recoleccin de datos el


paso a seguir es ordenarlos por variables y analizar el comportamiento y relacin
entre cada una de stas, una vez realizado lo anterior el siguiente paso es analizar
si todos los datos encontrados son representativos de dicha investigacin, para lo
cual existen las medidas de tendencia central tales como la media, mediana y
moda las cuales tienen como objetivo determinar el valor que ms representa a los
datos; tambin se encuentran las medidas de posicin como los cuartiles, deciles
y percentiles que sirven para dar una idea del orden de los datos mediante la
posicin de los mismos; pero a veces estas medidas no representan a todos los
datos ya que en muchas ocasiones los datos se encuentran muy dispersos, para
esto se calculan las medidas de, como su nombre lo indica, dispersin tales como
rango, varianza, desviacin tpica o estndar y el coeficiente de variacin que
permiten dar una idea de la descentralizacin de estos datos. Lo explicado
anteriormente fue lo que se analiz tanto con la variable discreta (nmero de
muertos) como con la variable continua (velocidad) en una investigacin
relacionada con accidentes de trnsito.

OBJETIVOS

Objetivo General
Analizar en cada una de las variables (discreta y continua) si sus datos son
representativos de la situacin presentada.

Objetivos Especficos

Identificar una variable discreta y otra continua en los datos encontrados.


Organizar los datos de la variable discreta en una tabla de frecuencias para
datos no agrupados.
Organizar los datos de la variable continua en una tabla de frecuencias para
datos agrupados.
Calcular la media, moda, mediana para cada variable.
Calcular los cuartiles y algunos deciles y percentiles para cada variable.
Calcular el rango, varianza, desviacin tpica y coeficiente de variacin para
cada variable.
Concluir a partir de los valores calculados si todos los datos representan a la
variable en cuestin.

SOLUCIN ACTIVIDAD
A partir de la base de datos:
1. Identificar las variables discretas dentro del problema de estudio:
o Edad
o Nmero de heridos
o Nmero de muertos

Elegir una variable discreta que sea representativa y elaborar una tabla de
frecuencias para datos NO agrupados, calcular las medidas de tendencia
central: media, mediana, moda, los cuartiles, deciles 5, 7 y percentiles 30, 50 e
interpretar sus resultados.

Xi
0
1
2
3
4

f
47
48
21
3
1

Nmero de Muertos
fa
fr
47
0.39
95
0.40
116
0.17
119
0.03
120
0.01

fra
0.39
0.79
0.96
0.99
1.00

Media:
5

X if i

x = i=1 5

fi

047+148+221+33+41
=0.85 1
120

i=1

Mediana:
Es el valor ubicado en el medio del conjunto de datos ordenados en forma
ascendente, en este caso los datos nmero 60 y 61 se encuentran en la mitad, los
cuales segn la frecuencia acumulada ambos corresponden a 1; siendo la
mediana la siguiente:
1+1
~
x=
=1
2

Moda:
Es el dato de mayor frecuencia:

^x =1

Cuartiles:
Valores correspondientes a los datos que dividen al conjunto en cuatro partes
iguales: (120/4 = cada 30 datos)
Q1 = Valor nmero 30 y 31 = 0
Q2 = Mediana = 1
Q3 = Valor nmero 90 y 91 = 1
Deciles:
Valores correspondientes a los datos que dividen al conjunto en diez partes
iguales: (120/10 = cada 12 datos)
D5 = Mediana = 1
D7 = Valor nmero 84 y 85 = 1
Percentiles:
Valores correspondientes a los datos que dividen al conjunto en cien partes
iguales: (120/100 = cada 1,2 datos)
P30 = Valor nmero 36 y 37 = 0
P50 = Mediana = 1

INTERPRETACIN DE RESULTADOS
A partir de los anteriores resultados obtenidos, se puede deducir que el conjunto
de datos es simtrico ya que la media, mediana y moda es la misma, es decir 1,
adems de que este valor tambin se repite en la mayora de las dems medidas
de posicin siendo entonces el 1 el dato ms representativo.

Elegir una variable continua que sea representativa y siguiendo los


lineamientos, disear una tabla de frecuencia para datos agrupados, calcular
las medidas de tendencia central, los cuartiles , deciles 5, 7 y percentiles 50 y
75 (Interpretar sus resultados).

Variable continua: Velocidad


Nmero de intervalos de clase (K):
Rango:
Amplitud:

K=1+3.3log ( 120 )=7.86 8

R=Mayor datoMenor dato=15033=117


A=

R 117
=
=14.625
K
8

Mc (marca de clase): valor medio de cada intervalo de clase.


Velocidad
Intervalo de clase f fa
1. [33,47.625)
6
6
1
2. [47.625,62.25)
25
9
5
3. [62.25,76.875)
75
0
3 11
4. [76.875,91.5)
6
1
11
5. [91.5,106.125)
4
5
11
6. [106.125,120.75)
2
7
11
7. [120.75,135.375)
0
7
12
8. [135.375,150)
3
0
Media:

Mc
40.3125
54.9375
69.5625
84.1875
98.8125
113.4375
128.0625
142.6875

Mcif i

x = i=1

fi

8844.75
=73.7
120

i=1

Mediana:
Para datos agrupados la mediana se calcula mediante la siguiente ecuacin a
partir del intervalo de clase donde se encuentra el dato de la mitad es decir, el
intervalo nmero 3:
^
Li : Lmite inferior

~
x= L^i +

fi
i=1

fanteriores
i=1

A=62.25+

fi

14.625=72.7375
( 6025
50 )

Moda:
Para datos agrupados la moda se calcula mediante la siguiente ecuacin a partir
del intervalo de clase donde se encuentra la mayor frecuencia es decir, el intervalo
nmero 3:
da: Diferencia con la frecuencia anterior
dp: Diferencia con la frecuencia posterior

^x = ^
Li +

da
31
A=62.25+
14.625=72.325
d a +d p
31+14

Cuartiles:
Valores correspondientes a los datos que dividen al conjunto en cuatro partes
iguales:

Q1:

m=

N1 1201
=
=datonmero 30
4
4

(tercer intervalo)

mfa i1
3025
Q 1= ^
Li +
=62.25+
14.625=63.7125
f
50

Q2 = Mediana =

Q3:

m=

72.7375

N3 1203
=
=90
4
4

(cuarto intervalo)

mfa i1
9075
Q 3= ^
Li +
=76.875+
14.625=82.96875
f
36

Deciles:
Valores correspondientes a los datos que dividen al conjunto en diez partes
iguales:
D5 = Mediana =

D7:

m=

72.7375

N7 1207
=
=84
10
10

(cuarto intervalo)

mfa i1
8475
D7= L^i +
=76.875+
14.625=80.53125
f
36

Percentiles:
Valores correspondientes a los datos que dividen al conjunto en cien partes
iguales:
P = Mediana = 72.7375
50

P75:

m=

N75 12075
=
=90
100
100

(cuarto intervalo)

mfa i1
9075
P75= ^
Li +
=76.875+
14.625=82.96875
f
36

INTERPRETACIN DE RESULTADOS
A partir de los anteriores resultados obtenidos, se puede deducir que el conjunto
de datos es simtrico ya que la media, mediana y moda tienen valores muy

similares, con respecto a las medidas de posicin (cuartiles, deciles y percentiles)


estas tuvieron resultados cercanos por dos razones: primero, casi la mitad de los
datos se encontraban en un solo intervalo de clase, y segundo lo que son la
mediana, el segundo cuartil, el quinto cuartil y el percentil cincuenta tienen el
mismo valor ya que dividen el conjunto de datos en la mitad, por otro lado lo
mismo ocurre con el tercer cuartil y el percentil 75.

2. Calcular las medidas univariantes absolutas y relativas de dispersin para


variables cuantitativas ( Discretas y Continuas)

Con la variable discreta elegida calcular: rango, varianza, desviacin tpica y


coeficiente de variacin. Interpretar los resultados obtenidos y asociarlos con
el problema objeto de estudio.

Variable discreta: Nmero de muertos.

Xi
0
1
2
3
4

f
47
48
21
3
1

Nmero de Muertos
fa
fr
47
0.39
95
0.40
116
0.17
119
0.03
120
0.01

fra
0.39
0.79
0.96
0.99
1.00

Rango:
R=Dato mayor Dato menor=40=4
Varianza:
5

( X ix )2f i

S 2= i=1

89
=0.742
120

Desviacin tpica (S):


S= S2=0.86
Coeficiente de Variacin:
S 0.86
CV = =
=0.86
x
1
INTERPRETACIN DE RESULTADOS
Teniendo en cuenta la situacin que se est analizando, la cual es la mortalidad en
accidentes de trnsito, las medidas de dispersin muestran una baja diferencia
entre los datos obtenidos ya que la mayora de ellos se encuentran entre 0 y 1

adems de que el mximo nmero de vctimas mortales encontrado fue 4, por lo


tanto la tendencia de mortalidad en accidentes de trnsito ser entre 0 y 2.

Con la variable continua elegida calcular: rango, varianza, desviacin tpica y


coeficiente de variacin. Interpretar los resultados obtenidos y asociarlos con
el problema objeto de estudio.

Variable continua: Velocidad


Velocidad
Intervalo de clase f fa
1. [33,47.625)
6
6
1
2. [47.625,62.25)
25
9
5
3. [62.25,76.875)
75
0
3 11
4. [76.875,91.5)
6
1
11
5. [91.5,106.125)
4
5
11
6. [106.125,120.75)
2
7
11
7. [120.75,135.375)
0
7
12
8. [135.375,150)
3
0
Rango:
R=Dato mayorDato menor=15033=117
Varianza:
8

(Mci x )2f i

S 2= i=1

38150.9625
=317.9
120

Desviacin tpica (S):


S= S2=17.83
Coeficiente de Variacin:

Mc
40.3125
54.9375
69.5625
84.1875
98.8125
113.4375
128.0625
142.6875

S 17.83
CV = =
=0.15
x 120
INTERPRETACIN DE RESULTADOS
Teniendo en cuenta la situacin que se est analizando, la cual es la velocidad
que llevan los autos accidentes de trnsito, las medidas de dispersin muestran
una amplia desviacin entre los datos obtenidos ya que se presenta el caso de
varios datos muy alejados de otros aunque casi la mitad se encuentren en el
mismo intervalo de clase as que no se puede decir que hay algn dato de
velocidad que est relacionada con los accidentes de trnsito.
REFERENCIAS BIBLIOGRFICAS

Crdova Navarro, V. Corts Len, A. Probabilidad y Estadstica I. Mdulo de


Aprendizaje. Colegio De Bachilleres Del Estado De Sonora. Mxico. 3 Edicin.
2010.
Depool, R. Monasterio, D. Probabilidad Y Estadstica. Aplicaciones A La
Ingeniera Universidad Nacional Experimental Politcnica Antonio Jos de Sucre.
Venezuela. 2013.
Gonzales,
C.
Estadstica
General.
[en
lnea].
Disponible
en
http://tarwi.lamolina.edu.pe/~cgonzales/pdf/Estadistica%20General/unidad1.pdf
Ditutor.
Medidas
de
Posicin.
Pgina
web
http://www.ditutor.com/estadistica/medidas_posicion.html

disponible

en:

You might also like