You are on page 1of 19

FASE FINAL

ESTADISTICA DESCRIPTIVA

Presentado por:
FRANKLIN JAVIER SILVA OSORIO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


EVALUACION NACIONAL
DICIEMBRE 2016
Tabla de Contenido

1. Portada

2. Tabla de Contenido

3. Introducción

4. Justificación

5. Objetivos

6. Informe Estadístico

7. Propuesta Única

8. Conclusiones

9. Recomendaciones

10. Referencias Bibliográficas


INTRODUCCION

El siguiente trabajo se fundamenta en la temática propuesta dentro de todas las


unidades para el desarrollo de la actividad final fue necesario poner en práctica
conceptos tales como media aritmética, mediana rango, varianza, desviación,
mediana, también se busca la apropiación de conceptos y aplicación de la
estadística descriptiva al caso de estudio en un contexto verdadero
JUSTIFICACION
Resulta muy fundamental para llegar a conocer el comportamiento de varias
temáticas, por lo que se adquirido un papel clave en la investigación. Unas de las
utilidades e importancia de la estadística es que nos ayuda a la búsqueda y
organización de información para realizar diagnósticos e hipótesis para plantear y
tomar decisiones.
OBJETIVOS
 Analizar los resultados obtenidos dando conclusiones de los datos
arrojados de cada formula.
 Entender de manera práctica y teórica la aplicación de la variable continua y
discreta.
ANALISIS ESTADISTICO

Tabla de variable y tipo de variable


Variable Tipo de variable

Genero Cualitativas
Mes Cualitativas
Grado de alcohol Cuantitativas - Discreta

número de accidentes Cuantitativas - Discreta

Número de muertos Cuantitativas - Discreta

Involucra peatones Cualitativas

Otros factores Cualitativas


A partir de la base de datos:

1. Determinar la relación entre dos variables cuantitativas del problema de estudio:


- Identificar dos variables cuantitativas del problema que puedan estar relacionadas.
 Edad
 Muertos

Edad (x) Muertos (y)


17 4
18 7
19 2
21 8
22 4
23 3
24 1
29 5
30 1
31 2
32 2
33 5
34 2
35 7
36 1
38 5
42 3
43 1
44 2
45 6
46 10
48 0
50 2
52 4
53 0
54 7
55 6
56 3
60 0

- Realizar el diagrama de dispersión de dichas variables.


Dispersión

Accidentes de Tránsito Medellín


12
10
8
Muertos

6
4
2
0
10 20 30 40 50 60 70
Edad

- calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

Recta de regresión lineal

Accidentes de Tránsito Medellín


12
10
8
Muertos

6
Linear ()
4
f(x) = - 0.02x + 4.48
2 R² = 0.01
0
10 20 30 40 50 60 70
Edad
r=−0,119998773
r 2=0,014399706∗100=1,43
s=2,669179292
Estimaciónlineal=−0,024571098

Análisis:
El R² afirma que el modelo explica 1,4% de la información y el valor de r coeficiente indica
que no hay Correlación lineal porque el 0.014 está lejos al extremo 1 positivo que es la
correlación positiva porque el grado de relación es (11,9%) entre las variables.

Determinar la relación entre una variable dependiente y varias variables independientes;


si es el caso:

- Identificar una variable dependiente y varias variables independientes del estudio de


investigación.

Variable dependiente = # De Muertos


Variables Independientes = Edad y Grados de Alcohol
Edad (x1) Muertos
Muertos (y)(y)
17 4
18 7
19 2
21 8
22 4
23 3
24 1
29 5
30 1
31 2
32 2
33 5
34 2
35 7
36 1
38 5
42 3
43 1
44 2
45 6
46 10
48 0
50 2
52 4
53 0
54 7
55 6
56 3
60 0
Grados de
Alcohol (X2)
0,0 16
0,3 0
0,5 0
0,6 8
0,8 3
1,1 11
1,2 0
1,3 3
1,4 6
1,6 4
1,8 1
1,9 0
2,1 9
2,2 3
2,4 9
2,5 2
2,6 4
2,7 6
2,9 1
3,0 17

- Realizar el diagrama de dispersión de dichas variables. Calcular la recta de regresión


y el coeficiente de correlación para probar estadísticamente su relación.

Análisis de accidentes de tránsito en Medellín


12
10
8
Muertos

6
Linear ()
4
f(x) = - 0.02x + 4.48
2 R² = 0.01
0
10 20 30 40 50 60 70
Edad

r=−0,01199
r 2=0,0144∗100=1,44

El R² afirma que el modelo explica 1,4% de la información y el valor de r coeficiente indica


que no hay Correlación lineal porque el 0.014 está lejos al extremo 1 positivo que es la
correlación positiva porque el grado de relación es (11,9%) entre las variables y es
inversa.
Accidentes de tránsito en Medellín 2015
18
16
14
12
10
Muertos

8 Linear ()
6
4 f(x) = 0.19x + 4.84
2 R² = 0
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
Grados de Alcohol

r=0,033567586
r 2=0,0011∗100=0,1

El R² afirma que el modelo explica 0,1% de la información y el valor de r coeficiente indica


que no hay Correlación lineal porque el 0.0011 está lejos al extremo 1 positivo que es la
correlación positiva, y el grado de relación es (3,3%) entre las variables.

En base al estudio realizado a cada una de las variables dependientes e independientes


identificadas en la base de datos suministrada por la secretaría de tránsito de Medellín,
referente a la problemática planteada, se determina la especificación de la relación de la
información resultante donde el modelo no es confiable, ya que en ninguna de las
variables hay correlación lineal.
Calculamos la recta de regresión y el coeficiente de correlación para probar
estadísticamente su relación.

Recta de regresión lineal

Accidentes de Tránsito Medellín


12
10
8
Muertos

6
Linear ()
4
f(x) = - 0.02x + 4.48
2 R² = 0.01

0
10 20 30 40 50 60 70
Edad

r=−0,119998773
r 2=0,014399706∗100=1,43
s=2,669179292
¿−0,024571098
El R ² afirma que el modelo explica 1,43 de la información.
El valor de r coeficiente indica que no hay Correlación lineal porque el 0.0144.
Está lejos al extremo 1 positivo que es la correlación positiva el grado de relación
es (11,9 ) entre las variables.

Grafico obtenido
NUMERO DE FALLECIDOS

24
22

10 10
9
8
7
6
5
0 4
3
2
0 1 2 3 4 5 6 7 8 9 10 11 12

Interpretación de resultados
Es evidente lo que nos muestra el grafico, la moda muestra que en su mayoría de casos de
accidente hay por lo menos 2 muertos, mientras que la media discrepa, puesto que dice que
en promedio hay 5 muertos por accidente, esto nos hace pensar que no hay que hacer
mucho caso a la información obtenida en la media de la variable debido a que se encuentra
muy alejada de donde se encuentran la mayoría de los datos, además si lo comparamos con
la realidad muy rara vez se da el caso de 5 muertos en un accidente, luego la información
de la media no es de gran importancia para este análisis.
 Elegir una variable Continua que sea representativa y siguiendo los
lineamientos, diseñar una tabla de frecuencia para datos agrupados,
representarla gráficamente por medio de un histograma de frecuencias, un
polígono de frecuencias, calcular las medidas de tendencia central, determinar
el tipo de asimetría, los cuartiles , deciles 5 y 7 ; percentiles 25, 50 ( Interpretar
sus resultados).

VARIABLE CONTINUA: grados de alcohol del conductor.

Calculando el Rango se obtiene:


R=x max −x min =3,5−0=3,5 ≈ 4

Calculando el número de intervalos se obtiene:


k =1+ 3,32 log (n)=1+3,32 log (110 )=7,78 ≈ 8

Calculando el ancho se obtiene:


R 4
A= = =0,5
k 8

Media aritmética
n

∑ f i Xi 195
x́= i=1n = =1,77
110
∑ fi
i=1

Mediana
n 110
= =55
2 2

La clase de la mediana es (1,5 - 2), pues el número de frecuencias acumuladas es el valor


más cercano a 55.
Hay 48 observaciones por debajo del límite inferior de la clase de la mediana.
70−48=22
El valor de 22 se interpola en el ancho o amplitud de la clase de la mediana que es 0, 5

22∗0,5
X= =0,5
21
Sí pues, la mediana se encontrará 0,5 unidades más del límite inferior de la clase de la
mediana:
Me=1,5+0,5=2,0
Moda
f k−1
Mo= A +L
f k−1 + f k+1 k k
17
Mo= 0,5+1,5=1,72
17+ 21
Tipo de asimetría
x́=1,77
Me=2
Mo=1,72
POSIBLES ALTERNATIVAS DE SOLUCIÓN
Para el caso de la media, se ve que no es representativa (1,7), pues la mayoría de
datos no se encuentran muy cerca de esta, también no siempre es recomendable
usarla como un promedio, ya que es muy sensible a los valores extremos del
conjunto de datos. La mediana, para su cálculo es necesario que los datos estén
ordenados. Cuando la cantidad de datos es impar, fácilmente se identifica la
mediana; pero cuando el número de datos es par, la mediana se calcula hallando
el valor medio entre los dos valores centrales y no coincidirá con ninguno de los
valores del conjunto de datos. Como se vio en los resultados la moda se trata del
valor más frecuente en un conjunto de datos.
CONCLUSIONES
Se evidenció el logro de los objetivos propuestos para el desarrollo de la actividad,
consigo adquirir una serie de conocimientos como referencia un problema de
estudio donde se tuvo como enfoque el análisis e interpretación de los datos
expuestos de acuerdo a las temáticas determinadas para la unidad
REFERENCIAS BIBLIOGRAFICAS
Montero, J. M. (2007). Características de Una Distribución de Frecuencias.
Statistical Descriptive. Cengage Learning Paraninfo, S.A. Páginas 18-57.
Recuperado de:
(http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=
r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0)

You might also like