You are on page 1of 22

FASE FINAL

ESTADISTICA DESCRIPTIVA

RAFAEL JOSE TASCO


YONIS HERNAN HERNANDEZ
FRANKLIN JAVIER SILVA OSORIO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


EVALUACION NACIONAL
DICIEMBRE 2016
Tabla de Contenido

1. Portada………………………...…………………………………………………………...…1

2. Tabla de Contenido……….…….…………………………………………………………….2

3. Introducción……………………………………………………………………………….….3

4. Justificación…………………… ……………………………………………………………..4

5. Objetivos………………………………………………………………………..……………..5

6. Informe Estadístico ………………………………………….……………..…..……………..6

7. Propuesta Única ……………..………………………………………………..……………..18

8. Conclusiones………………………………………………………………...…………....... 19

9. Recomendaciones...…………………………………………………………………………20

10. Referencias Bibliográficas………………………………………………………………….21


INTRODUCCION

La estadística es una ciencia utilizada en el ámbito científico, de investigación y de análisis,


a través de ella es posible conocer y entender hechos específicos, de tal manera que facilite
la comprensión y la toma de decisiones.

A través del desarrollo de esta actividad se busca la apropiación de conceptos y aplicación


de la estadística descriptiva al caso de estudio en un contexto real. La aplicación de los
conocimientos durante el desarrollo de este trabajo permite llevar a la práctica estos
conceptos.

El presente trabajo ofrece la oportunidad de interactuar con los integrantes del grupo
colaborativo para la construcción del documento final, aportando desde su perfil como futuro
profesional análisis y propuestas de solución.
JUSTIFICACION

El caso de estudio propuesto para el desarrollo de la actividad brinda la oportunidad de tomar


como referencia una situación real para presentar propuestas como futuros profesionales en
los diferentes campos de acción, para el caso de estudio “Principales Causas que incrementan
e inciden en el número de accidentes de tránsito, ocurridos en el territorio nacional” permite
aplicar el conocimiento adquirido acerca del análisis estadístico, aplicando las diferentes
herramientas.
A través de los aportes de los integrantes del grupo se identifica la cauda predominante y las
posibles consecuencias del caso de estudio.
Este trabajo de investigación construido de forma colaborativa es una excelente oportunidad
para apropiar el conocimiento de los diferentes temas propuestos en el curso de Estadística
Descriptiva, de igual forma permite expresar el análisis de los resultados teniendo en cuenta
los conceptos básicos y procesos estadísticos aplicados.
Es necesario complementar los conceptos de Estadística Descriptiva a partir de la
profundización y análisis, de esta forma se apropian técnicos y recursos investigativos que
podrán ser aplicados en diferentes situaciones.

A partir del análisis estadístico realizado a accidentes de tránsito ocurridos en la ciudad de


Medellín se busca plantear alternativas de solución desde los diferentes puntos de vista de
los futuros profesionales integrantes del grupo. Así mismo se busca neutralizar y minimizar
las consecuencias y generar conciencia en la población para asumir conductas de prevención.
OBJETIVOS

Analizar las Principales Causas que incrementan e (inciden) en el número de accidentes de


tránsito, ocurridos en el territorio nacional” para presentar una propuesta de solución o
mitigación de las consecuencias.
ANALISIS ESTADISTICO

Según las actividades desarrolladas durante el curso y la retroalimentación por parte del Tutor
se realizó el consolidado para la presentación del informe descriptivo de la problemática
planteada.

Variable Tipo de variable


Tipo de vehículo Cualitativas
Genero Cualitativas
Involucra peatones Cualitativas
Mes Cualitativas
Día de la semana Cualitativas
Otros factores Cualitativas
Tipo de vía Cualitativas
Número de accidentes Cuantitativas - Discreta
Grado de alcohol Cuantitativas - Continua
Edad Cuantitativas - Discreta
Número de heridos Cuantitativas - Discreta
Número de muertos Cuantitativas - Discreta
Hora Cuantitativas - Continua
Costo estimado del siniestro Cuantitativas - Discreta
Velocidad Cuantitativas - Continua

Operacionalización de variables

A partir de esta información se pude identificar los siguientes análisis:


El porcentaje de accidentes de tránsito del hombre son mayor que al de la mujer superándolo
con un valor del 70.43%
El nivel de accidentes de tránsito ocasionados por la mujer donde involucran peatones es de
11.30%
El 43.47% de los accidentes de tránsito ocasionados en el municipio de Medellín
independientemente del genero han involucrado peatones.

Tablas de Frecuencias

DIA DE LA SEMANA
Clase Categoría f fr %
1 lunes 15 0,14 13,64
2 martes 8 0,07 7,27
3 miercoles 18 0,16 16,36
4 jueves 17 0,15 15,45
5 viernes 12 0,11 10,91
6 sabado 21 0,19 19,09
7 domingo 19 0,17 17,27
Total 110 1 100

MES
Clase Categoría f fr %
1 enero 6 0,05 5,45
2 febrero 6 0,05 5,45
3 marzo 7 0,06 6,36
4 abril 8 0,07 7,27
5 mayo 13 0,12 11,82
6 junio 10 0,09 9,09
7 julio 6 0,05 5,45
8 agosto 6 0,05 5,45
9 septiembre 8 0,07 7,27
10 octubre 10 0,09 9,09
11 noviembre 7 0,06 6,36
12 diciembre 23 0,21 20,91
Total 110 1,00 100,00

GENERO
Clase Categoría f fr %
1 mujer 34 0,31 30,91
2 hombre 76 0,69 69,09
Total 110 1 100

INVOLUCRA PEATONES
Clase Categoría f fr %
1 si 46 0,42 41,82
2 no 64 0,58 58,18
Total 110 1 100

TIPO DE VEHICULO
Clase Categoría f fr %
1 moto 44 0,4 40
2 carro 47 0,43 42,73
3 buseta 9 0,08 8,18
4 tractocamion 10 0,09 9,09
Total 110 1 100

Representación de la información

En los siguientes diagramas se representan los meses del año, se puede observar que el mes
en el cual se presentaron más accidentes fue diciembre con una representación del 23%.

ACCIDENTES POR MES


diciembre
noviembre
octubre
septiembre
agosto
julio
junio
mayo
abril
marzo
febrero
enero

0 5 10 15 20 25
Según la siguiente gráfica, el día de la semana en el que se presentaron en el mayor número
de accidentes de tránsito fue el día sábado.

DIA DE LA SEMANA
25

20

15

10

0
lunes martes miercoles jueves viernes sabado domingo

Genero

31%

mujer
69% hombre

En el diagrama anterior se ve representada la variable género (hombre y mujeres) en los


cuales se puede observar que los hombres representados por el color Naranja fueron los
mayores causantes de accidentes de tránsito en la ciudad con 69% del 100% de los accidentes.

Mediante el siguiente diagrama se puede observar que el mayor número de accidentes


ocurridos en la ciudad de Medellin no se involucraron peatones.
INVOLUCRA PEATONES

0 10 20 30 40 50 60 70

no si

TIPO DE VEHICULO

50
45
40
35
30
25
20
15
10
5
0
moto carro buseta tractocamion
Moda para cada una de las variables cualitativas y asociación con la situación objeto
de estudio.
Para dar solución a este interrogante se debe tener en cuenta que la moda siempre es el dato
con mayor frecuencia, por ello:
MES
La variable con mayor frecuencia es diciembre con un 20,91% de los datos.
DIA DE LA SEMANA
La variable con mayor frecuencia es el día sábado con un 19,09% de los datos.

TIPO DE VEHICULO
La variable con mayor frecuencia es accidente en carro con un 43%
GENERO
La variable con mayor frecuencia son los accidentes del genero hombre en un 69% de los
casos.
INVOLUCRA PEATONES
La variable con mayor frecuencia son los accidentes que no involucra peatones en 58,18%
de los datos.
Tabla de contingencias o de doble entrada, con dos variables cualitativas
Total
Etiquetas de fila hombre mujer general
lunes 10,91% 2,73% 13,64%
martes 5,45% 1,82% 7,27%
miercoles 8,18% 8,18% 16,36%
jueves 10,91% 4,55% 15,45%
viernes 7,27% 3,64% 10,91%
sabado 12,73% 6,36% 19,09%
domingo 13,64% 3,64% 17,27%
Total general 69,09% 30,91% 100,00%
MEDIDAS UNIVARIANTES DE DISPERSION.

VARIABLE DISCRETA: número de muertos


Frecuencia
NUMERO Frecuencia relativa
Frecuencia
DE Frecuencia acumulada acumulada x^2 fx^2
relativa (%)
MUERTOS ascendente ascendente
(%)
0 0 0,00 0 0,00 0 0
1 7 6,36 7 6,36 1 7
2 24 21,82 31 28,18 4 96
3 22 20,00 53 48,18 9 198
4 10 9,09 63 57,27 16 160
5 9 8,18 72 65,45 25 225
6 4 3,64 76 69,09 36 144
7 10 9,09 86 78,18 49 490
8 8 7,27 94 85,45 64 512
9 6 5,45 100 90,91 81 486
10 2 1,82 102 92,73 100 200
11 3 2,73 105 95,45 121 363
12 5 4,55 110 100,00 144 720
TOTAL 110 100 3601

𝑅𝑎𝑛𝑔𝑜 = 𝑅 = 12 − 1 = 11
VARIANZA
∑ 𝑓 ∗ 𝑥2 3601
𝑠2 = − 𝑥̅ 2 = − 4,82 = 9,69
𝑛 110
DESVIACIÓN TÍPICA

∑ 𝑓 ∗ 𝑥2
𝑠=√ − 𝑥̅ 2
𝑛

𝑠 = 3,11
COEFICIENTE DE VARIACIÓN
𝑠
𝐶𝑉 = × 100%
𝑥̅
3,11
𝐶𝑉 = × 100% = 64,79%
4,8
Interpretación de los resultados obtenidos y asociación con el problema objeto de
estudio.
Conforme al coeficiente de variación se puede concluir que la media no es representativa
para el análisis de esta variable, puesto que cuando el coeficiente de variación es muy alto se
dice que la media aritmética no es lo suficientemente representativa en la distribución.

 Con la variable Continua elegida calcular: rango, varianza, desviación típica y


coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el
problema objeto de estudio.

Calculando el Rango se obtiene:


𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 3,5 − 0 = 3,5 ≈ 4
Calculando el número de intervalos se obtiene:
𝑘 = 1 + 3,32 log(𝑛) = 1 + 3,32 log(110) = 7,78 ≈ 8
Calculando el ancho se obtiene:
𝑅 4
𝐴= = = 0,5
𝑘 8

Variable continua: grados de alcohol del conductor

Categori Lsuperio frascendent


Linferior f X fr f% f*x f*x^2
a r e

0 0,5 9 0,25 0,08 8,18 10 2,25


1 0,5625
17,2 14,2
0,5 1 19 0,75 0,17 32
2 7 5 10,6875
15,4 21,2
1 1,5 17 1,25 0,15 48
3 5 5 26,5625
19,0 36,7
1,5 2 21 1,75 0,19 70
4 9 5 64,3125
19,0 47,2 106,312
2 2,5 21 2,25 0,19 89
5 9 5 5
13,7
2,5 3 5 2,75 0,05 4,55 96
6 5 37,8125
14,5
3 3,5 16 3,25 0,15 110 52
7 5 169
3,5 4 2 3,75 0,02 1,82 110 7,5
8 28,125
TOTALE
110 1 100 195 443,375
S

RANGO
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 3,5 − 0 = 3,5 ≈ 4
MEDIA

∑ 𝑓 ∙ 𝑥 195
𝑥̅ = = = 1,77
∑𝑓 110

VARIANZA

2
∑ 𝑓 ∗ 𝑥2 443,375
𝑠 = − 𝑥̅ 2 = − 1,772 = 2,26
𝑛 110
DESVIACIÓN TÍPICA

∑ 𝑓 ∗ 𝑥2
𝑠= √ − 𝑥̅ 2
𝑛

𝑠 = 1,5
COEFICIENTE DE VARIACIÓN
𝑠
𝐶𝑉 = × 100%
𝑥̅
1,5
𝐶𝑉 = × 100% = 84,74%
1,77

Interpretación los resultados obtenidos y asociación con el problema objeto de estudio.


Como se puede observar en los resultados dados, el coeficiente de variación es muy alto
(84,74%), por tanto la media aritmética no es lo suficientemente representativa en la
distribución.
Análisis de correlación lineal simple de las dos variables cuantitativas seleccionadas.

Número de heridos vs Velocidad

Diagrama de dispersión y tipo de asociación entre las variables.

Número de heridos = variable dependiente eje Y

Velocidad = variable independiente eje X

Velocidad vs Numero de heridos


9
8
7
Numero de heridos

6
5
Numero de
4
heridos vs Edad
3
y = 0,0586x - 0,6267
2 R² = 0,4693
Lineal (Numero
1
de heridos vs
0 Edad)
0 50 100 150 200
Velocidad

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,68509008
Coeficiente de determinación R^2 0,46934842
R^2 ajustado 0,46443498
Error típico 1,13580198
Observaciones 110

La regresión obtenida entre el número de muertos y la velocidad es de 46,93% se ajusta a


una tendencia lineal positiva y su tipo de asociación es directa.
Modelo matemático que permite predecir el efecto de una variable sobre la otra.

𝑹𝟐 Coeficiente de determinación = 0,4693* 100 = 46,93%

Esta ecuación matemática es confiable un 46,93%% presenta estimación de confiabilidad


mínima de acuerdo al resultado obtenido.

R= coeficiente de correlación = √0,4693 de coeficiente de determinación

r= 0,6850

Porcentaje de explicación del modelo y el grado de relación de las dos variables.

r = 0, 6850

Interpretación Valores de r (+) Valores de r (-)


Correlación perfecta =1 =-1
Correlación 0.90<r<1 -1<r<-0.90
excelente
Correlación 0.80<r<0.90 -0.90<r<-0.80
aceptable
Correlación regular 0.60<r<0.80 -0.80<r<-0.60
Correlación mínima 0.30<r<0.60 -0.60<r<-0.30
No hay correlación 0<r<0.30 -0.30<r0

Relación de la información obtenida con el problema.

Después de hacer el análisis de regresión y correlación lineal simple para las dos variables
número de heridos y velocidad, variables que se presentan en los accidentes de tránsito
reportados de la ciudad de Medellín en el año 2015, se determina una tendencia lineal
positiva, esto da una asociación directa, es decir que el número de heridos aumenta a medida
que aumenta la velocidad. Se determinar que la ecuación matemática es confiable a través
del coeficiente de determinación en un 46,93%. A partir de este coeficiente de correlación se
infiere que la correlación entre número de heridos y velocidad es mínima para el caso de
estudio según lo reportado por la base de datos de la secretaria de transito de la ciudad de
Medellín.

Velocidad = variable dependiente eje Y

Número de muertos = variable independiente eje X

REEGRESION SIMPLE NUMERO DE


MUERTOS VS VELOCIDAD
160
140
y = 5,2288x + 47,968
120 R² = 0,7907
Velocidad

100
80
60
40
20
0
0 2 4 6 8 10 12 14
Numero de muertos

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,889222659
Coeficiente de determinación R^2 0,790716938
R^2 ajustado 0,788779132
Error típico 8,338396365
Observaciones 110
La regresión obtenida entre el número de muertos y la velocidad es de 79% se ajusta a una
tendencia lineal positiva y su tipo de asociación es directa.

Modelo matemático que permite predecir el efecto de una variable sobre la otra.

𝑹𝟐 Coeficiente de determinación = 0,7907* 100 = 79%

Esta ecuación matemática es confiable un 79% presenta buena estimación de confiabilidad

R= coeficiente de correlación = √0,7887 de coeficiente de determinación

r= 0,8892
Porcentaje de explicación del modelo y el grado de relación de las dos variables.

R= 0, 8892

Interpretación Valores de r (+) Valores de r (-)


Correlación perfecta =1 =-1
Correlación 0.90<r<1 -1<r<-0.90
excelente
Correlación 0.80<r<0.90 -0.90<r<-0.80
aceptable
Correlación regular 0.60<r<0.80 -0.80<r<-0.60
Correlación mínima 0.30<r<0.60 -0.60<r<-0.30
No hay correlación 0<r<0.30 -0.30<r0
Tabla tomada de “estadística básica aplicada”; Ciro Martínez Bernardino

Relación de la información obtenida con el problema.

Después de hacer el análisis de regresión y correlación lineal simple para las dos variables
número de muertos y velocidad, variables que se presentan en los accidentes de tránsito
reportados de la ciudad de Medellín en el año 2015, se determina una tendencia lineal
positiva, esto da una asociación directa, es decir que el número de muertos aumenta a medida
que aumenta la velocidad. Se determinar que la ecuación matemática es confiable a través
del coeficiente de determinación en un 79%. A partir de este coeficiente de correlación se
infiere que la correlación entre número de muertos y velocidad es aceptable para el caso de
estudio según lo reportado por la base de datos de la secretaria de transito de la ciudad de
Medellín.
POSIBLES ALTERNATIVAS DE SOLUCIÓN

El objeto de estudio de la situación problema inicia por los accidentes ocurridos en las
principales vías de accedo de la ciudad de Medellín.
Como resultado del análisis estadístico se puede concluir que los accidentes de mayor
frecuencia ocurren en automóviles conducidos por hombres (70%) en los cuales los causantes
fueron peatones en su gran mayoría (57%), asi mismo el principal factor es la imprudencia
de los conductores, representada en un 26%.
A través del diagrama de dispersión puede establecerse que la edad y el alcohol fueron
factores bastante influyentes en la ocurrencia de los accidentes, presentando un alto índice
de mortalidad, lo cual se convierte en un problema social que requiere mayor atención.
El análisis de las variables y el resultado del coeficiente de determinación muestran que el
grado de alcohol y edad muestra una alta relación y dependencia entre ellas.

Los datos analizados arrojan que el 90% de los accidentes ocurren por fallas humanas debido
al exceso de velocidad, consumo de alcohol, omisión de señales, mal estado de la via,
consumo de drogas (alucinógenos o medicamentos) distracción, entro otros.
Corresponde a la administración pública el planteamiento de alternativas de solución frente
a temas de seguridad vial en aras de controlar y reducir el índice de accidentalidad.
Una posible solución a corto plazo es la generación de conciencia ciudadana en la comunidad
a través de campañas de sensibilización, talleres y charlas.
Desde la ingeniería industrial puede intervenirse en esta alternativa de solución, ya que a
través de ella se pueden evaluar factores del medio ambiente y técnicos que ocasionan
accidentes de tránsito.
Teniendo en cuenta los factores de la edad y el consumo de alcohol a través del modelo de
correlacion lineal, se determina que son la mayor causa de accidentalidad.

Otra de las intervenciones es la sensibilización para que el conductor evite comportamientos


inseguros tales como hablar por celular, comer, hablar con los demás pasajeros, entre otros.
Conclusiones

La importancia de la estadística descriptiva en situaciones cotidianas es de suma importancia


en el ejercicio de la ingeniería industrial ya que a través de ella se puede llegar a la
recolección, análisis e interpretación de datos. Esta es una herramienta fundamental para que
la toma de decisiones sea asertiva y útil.
Recomendaciones
Para el caso de la media, se ve que no es representativa (1,7), pues la mayoría de
datos no se encuentran muy cerca de esta, también no siempre es recomendable
usarla como un promedio, ya que es muy sensible a los valores extremos del
conjunto de datos. La mediana, para su cálculo es necesario que los datos estén
ordenados. Cuando la cantidad de datos es impar, fácilmente se identifica la
mediana; pero cuando el número de datos es par, la mediana se calcula hallando el
valor medio entre los dos valores centrales y no coincidirá con ninguno de los
valores del conjunto de datos. Como se vio en los resultados la moda se trata del
valor más frecuente en un conjunto de datos.
Referencias Bibliográficas

Matus, R., Hernández, Martha, and García, E.Estadística. México, D.F., MX: Instituto
Politécnico Nacional, 2010. ProQuest ebrary. Web. 1 July 2016. Recuperado de:
http://site.ebrary.com/lib/unadsp/reader.action?ppg=12&docID=10365616&tm=147198155
6569

•Montero, J. M. (2007).Conceptos Generales Estadística descriptiva. Madrid: Paraninfo.


Página 3 - 16 Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100007&v=2.1&u=unad&it=r&p=
GVRL&sw=w&asid=0a7332df0d4700de0bd272caa41e1718

You might also like