You are on page 1of 17

ESTADISTICA DESCRIPTIVA

Unidad 2: Paso 4– Descripción de la información

Presentado a:

Ramiro Hernán Polanco


Tutor

Entregado por:

Federico Sánchez Amado


Código: 1082885733

Anyi Paola Ambuila Palomino


Código 1.121.954.104

Grupo: 100105_155

Universidad Nacional Abierta y a Distancia – UNAD


Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente - ECAPMA
Noviembre de 2018
Bogotá D.C
INTRODUCCIÓN

La relación entre la variable dependiente(Explicada) e independiente(Explicativa) se


representa por medio de funciones dependiendo del comportamiento que presenten los
datos y la relación que presente entre las dos variables, según esto los datos pueden
presentar diferentes comportamientos y se pueden representar por medio de
ecuaciones lineales, hipérboles o no lineales.

Por medio de regresiones lineales se determinará la relación de las variables


dependientes (Endógenas) con las variables independientes (Exógenas) y será posible
representarlo en un modelo matemático el cual permitirá la predicción de la variable
dependiente del sistema al solucionar la función que representa la relación de la variable
explicada con la variable explicativa.
Las medidas estadísticas y bivariantes ofrecen herramientas para el análisis de la
correlación que presentan dos variables cuantitativas en un análisis estadístico,
permitiendo el análisis de casos cotidianos describiendo la relación que estas
representan por medio de gráficas, tablas, porcentajes o modelos matemáticos. Las
teorías que explican el comportamiento de dos variables son: la teoría de regresión que
explica la forma o estructura del comportamiento de la relación entre las variables y la
teoría de la correlación que explica intensidad en la cual las dos variables se relacionan.

El coeficiente de determinación permite determinar la variabilidad presenta en la relación


entre las dos variables, este corresponde al cuadrado del coeficiente de correlación.
Con el coeficiente de determinación se pretende encontrar la confiabilidad de la
correlación de las dos variables y con el coeficiente de correlación el índice de relación
que presentan los datos.
JUSTIFICACIÓN.

El presente trabajo busca apropiarse de los conocimientos sobre el análisis de sistemas


bivariantes con conceptos estadísticos, logrando su aplicación a situaciones problema
cotidianos, determinando la relación o dependencia estadística que presentan las
variables tomadas de la base de datos de la secretaria de movilidad del Quindío y así
encontrar cuales variables presentan una relación que puedan influir en los accidentes
reportados.
OBJETIVOS

Objetivo General

Determinar para el caso práctico elegido del curso si existe dependencia estadística
entre diferentes variables y realizar un análisis estadístico de los resultados.

Objetivos específicos

• Graficar por medio de una nube de puntos o diagrama de dispersión la relación


presente entre dos variables

• Identificar entre las variables elegidas cual cumple el papel de variable explicada
y el de variable explicativa.

• Establecer el modelo matemático de un sistema bivariante para el análisis


estadístico.

• Determinar el coeficiente de correlación

• Determinar el coeficiente de Determinación.

• Analizar los resultados y establecer si existe dependencia estadística entre las


variables elegidas.
Análisis de correlación lineal simple de las dos variables cuantitativas
seleccionadas

Estudiante: Federico Sánchez amado

Regresión y Correlación lineal Simple

-Identificar dos variables cuantitativas de la situación estudiada que puedan


estar relacionadas.
Variables cuantitativas seleccionadas:

- Peso
- Estatura

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


asociación entre las variables.
Diagrama de Dispersión.

URGENCIAS HOSPT.FEDERICO LLERAS


DE IBAGUE
100.00
y = 63.656x - 40.308
80.00 R² = 0.8645

60.00
PESO

40.00

20.00

0.00
0 0.5 1 1.5 2
-20.00
ESTATURA

Analizando el diagrama de dispersión se puede establecer que el tipo de asociación es


directamente proporcional ya que a mayor estatura es mayor el peso de los pacientes
atendidos en la sala de urgencias del hospital Federico Lleras de la ciudad de Ibagué.
Encontrar el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

𝑦 = 63.656 ∗ x − 40.3075
𝑅 2 = 0.8645

El coeficiente de determinación es de 86,45% confiable.


Determinar el porcentaje de explicación del modelo y el grado de relación de las dos
variables.

𝑅 2 = 0.8645 ∗ 100 = 86,45%

𝑟 = √0,8645

= 0,9278

El coeficiente de relación obtenido es de 0,9278 lo que nos indica que el grado de


correlación entre el peso y la estatura de los pacientes de la sala de urgencias del
Hospital Federico Lleras es excelente
Conclusiones

 El coeficiente de correlación mide el grado de variación presente en el conjunto


de dos variables.

 El coeficiente de determinación determina la capacidad predictiva del sistema.

 Para el caso de la base de datos proporcionada por la secretaria de movilidad


del Quindío, las variables edad y velocidad no presentan relación. Lo cual indica
que la edad no determina la velocidad elegida por cada individuo al conducir.

 El diagrama de dispersión puede ser representado con funciones y de acuerdo


a la relación que tengan estas pueden ser lineales, hipérbole o no
Referencias bibliográficas

- Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto


Politécnico Nacional. Recuperado
dehttp://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&
docID=10436604&tm=1489456194304

- Matus, R., Hernández, Martha, and García, E (2010). Estadística. México,


D.F., MX: Instituto Politécnico Nacional, (2010). ProQuest
ebrary. Recuperado de
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=1&do
cID=10365616&tm=1489456296586

- Economipedia. (2018). Coeficiente de correlación lineal - Definición, qué es


y concepto | Economipedia. [en linea] Disponible en :
https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html
[Acceso 26 Nov. 2018].
Anexo
Laboratorio Regresión y Correlación Lineal.

Estudiante: Federico Sánchez

1.1. Sal-Tensión. Se quiere estudiar la asociación entre consumo de sal y tensión


arterial. A una serie de voluntarios se les administra distintas dosis de sal en su
dieta y se mide su tensión arterial un tiempo después.
X (sal) Y (Tensión)

1,6 98

2,3 102

3,3 109

4,2 113

4,6 115

5,0 120

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables

TENSION vs CONSUMO DE SAL


X (sal) Y (tensión)
independiente Dependiente 140
120
1.6 98 100 y = 6.1062x + 88.128
TENSION

80 R² = 0.987
2.3 102
60
3.3 109 40
20
4.2 113 0
4.6 115 0 1 2 3 4 5 6
CONSUMO DE SAL
5 120

El tipo de asociación de las variables es directa, ya que cuando hay un mayor consumo
de sal se puede determinar que aumenta la tensión respectivamente

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?
r 2= coeficiente de determinación . El modelo es confiable en un 98.7%, es muy
confiable.

c. Determine el grado de relación de las dos variables.


COEFICIENTE DE CORELACION:
El coeficiente de correlación es de 0,99, lo cual nos dice que la correlación entre el
consumo de sal y la tensión es Excelente.

d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión


arterial esperada?

y = 6.1062(5.6) + 88.128 = 122.314

LA tensión esperada debe ser de 122

1.4 X-Y. En un nuevo proceso artesanal de fabricación de cierto artículo que


está implantado, se ha considerado que era importante ir anotando
periódicamente el tiempo medio (medido en minutos) que se utiliza para
realizar una pieza y el número de días desde que empezó dicho proceso
de fabricación. Con ello, se pretende analizar como los operarios van
adaptándose al nuevo proceso mejorando paulatinamente su proceso de
producción.

a. Identifique la variable dependiente (y) y la variable independiente


(x),realice el diagrama de dispersión y determine el tipo de asociación
entre las variables
y (NUMERO
x(MINUTOS)
DE DIAS) MINUTOS VS NUMERO DE DIAS
Independiente
Dependiente
50
12 45
NUMERO DE DIAS

23 30 40
y = -0.3566x + 42.569
35 27 30
R² = 0.7963
42 25 20
53 23 10
65 21
0
70 20 0 20 40 60 80
MNUTOS

El tipo de asociación de las variables es inversa, ya que cuando hay un mayor número
de días, menor es la cantidad de minutos empleados en el proceso de fabricación.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?
r 2= coeficiente de determinación. El modelo es confiable en un 79,6%.

c. Determine el grado de correlación de las dos variables.

𝑅 2 = 0.7963 ∗ 100 = 79,6%

𝑟 = √0,7963

= 88,9

El grado de correlación de las dos variables es aceptable .

d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 90 días?

y = -0.3566(90) + 42.569
=74.66
El tiempo que debe tardarse el empleado cunado lleve 90 días es de 74,66 minutos

1.9 Sobrepeso-R. Los investigadores están estudiando la correlación entre


la obesidad y la respuesta individual al dolor. La obesidad se mide como
porcentaje sobre el peso ideal (x). La respuesta al dolor se mide
utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una
medida de sensación de punzada. Obsérvese que ambas, X e Y, son
variables aleatorias.
Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.

X (% SOBREPESO) Y (UMBRAL DE
INDEPENDIENTE REFLEJO) Correlacion de la obseidad y el dolor
DEPENDIENTE individual
99 2
20
90 3

UMBRAL DE REFLEJO
20 4 15
75 9.5 10
30 11.5
5 y = -0.0451x + 11.615
62 9 R² = 0.0573
75 9 0
90 12.5 0 20 40 60 80 100 120
45 8 SOBREPESO
50 19

El tipo de asociación es inversa teniendo en cuanta que el umbral de reflejo no depende


del sobrepeso.

Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. ¿Es confiable?

r2: coeficiente determinación: es confiable 79,6%

Determine el porcentaje de explicación del modelo y el grado de relación de las


dos variables.

𝑅 2 = 0,0573 ∗ 100 = 57,3%

𝑟 = √0,0573

= 5.73

El grado de correlación de las dos variables es mínima

¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de


sobrepeso, de 34?

y = -0.0451(34) + 11.615

=13.14

El umbral de reflejo cuando hay un porcentaje de sobrepeso de 34 es 13.14


Estudiante: Anyi Ambuila

1.2. CH-Pureza. El rendimiento del producto de un proceso químico está relacionado


con la temperatura de operación del proceso. Se desea establecer la relación
que existe entre la pureza (y) del oxígeno producido y el porcentaje de
hidrocarburo (x) que está presente en el condensador principal en un proceso de
destilación, de acuerdo con los siguientes datos:

X
Y
(% de Hidro
(Pureza)
carburos)

0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
102

100

98 y = 14.947x + 74.283
R² = 0.8774
96
Pureza
94 Pureza

92 Lineal
(Pureza)
90

88

86
0 0.5 1 1.5 2
% de hidrocarburos

como la pendiente de la ecuación de regresión lineal es positiva el tipo de asociación


entre las Variables % de hidrocarburo y pureza del oxígeno es
directamente proporcional! eso indica que cuando la variable de %
hidrocarburo aumenta la variable pureza del oxígeno también aumenta.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?
como el Valor del coeficiente de determinación es
R² = 0,8774
es un valor cercano a 1 podemos concluir que el modelo matemático anteriormente
referenciado es confiable un 87,74

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.
Coeficiente de Determinación R² = 0,8774
Confiabilidad del modelo CD= R² X 100 = 87,74 %. Es confiable en un 87,74 %
R= Coeficiente de correlación Se obtiene tomando el valor del Coeficiente de
Determinación y a este valor sacarle la Raíz cuadrada, el paramento debe ser entre
1 y -1.

R= √0,8774 = 0,9366 Con estos datos obtenidos podemos concluir que hay una
correlación excelente entre la variable de % de hidrocarburos y la pureza.
d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a
91,3?
𝑦 = 14,947𝑥 + 74,283
𝑌 = 91.3
Reemplazo en la ecuacion para encontrar el % de hidrocarburos

91,3 = 14,947𝑥 + 74,283


91,3 − 74,283 = 14,947𝑥
−17,017 = 14,947𝑥
𝑥 = −17,071/14,947
𝑋 = −32,018

El porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3 es de:


= −32,018 %

1.3. X-Y. En un nuevo proceso artesanal de fabricación de cierto artículo que está
implantado, se ha considerado que era importante ir anotando periódicamente el
tiempo medio (medido en minutos) que se utiliza para realizar una pieza y el
número de días desde que empezó dicho proceso de fabricación. Con ello, se
pretende analizar como los operarios van adaptándose al nuevo proceso
mejorando paulatinamente su proceso de producción.

Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

a. Identifique la variable dependiente (y) y la variable independiente (x),realice


el diagrama de dispersión y determine el tipo de asociación entre las
variables
50
45
40
35
30
25
y

20 y = -0.3566x + 42.569
15 R² = 0.7963
10
5
0
0 20 40 60 80
x

b. Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

El modelo matemático hallado (y = -0,3566x + 42,569) nos permite predecir el


efecto que tiene una variable respecto a la otra. Al verificar el coeficiente de
determinación, observamos que la confiabilidad es de 0,7963que expresado en
porcentaje nos da una confiabilidad del 79,6% correlación excelente.

c. Determine el grado de correlación de las dos variables.


El coeficiente de correlación obtenido es de 0,99 lo que indica que esta es una
correlación excelente.

Coeficiente de Determinación R² = 0,7963

Confiabilidad del modelo CD= R² X 100 = 79,63 % Es confiable en un 79,9 %

R= Coeficiente de correlación Se obtiene tomando el valor del Coeficiente de


Determinación y a este valor sacarle la Raíz cuadrada, el paramento debe ser entre
1 y -1.

R= √0,7963 = 7,9 Con estos datos obtenidos podemos concluir que hay una
correlación excelente entre la variable de % de consumo de vapor y temperatura

d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 90 días?

1.4. PIB-Ventas. Una compañía multinacional del servicio de telecomunicaciones en


Colombia, como medio de planeación estratégica para la toma de decisiones, solicita
a su departamento financiero, hacer predicciones económicas del valor anual de sus
ventas totales, versus el PIB nacional de las últimas dos décadas, para la toma de
decisiones para la apertura de nuevos mercados. Realice el diagrama de dispersión
y determine el tipo de asociación entre las variables.

Año PIB Nación Ventas de la compañía


2001 1,70 339,43
2002 2,50 363,02
2003 3,90 359,75
2004 5,30 336,90
2005 4,70 339,38
2006 6,70 348,40
2007 6,90 372,00
2008 3,50 358,79
2009 1,70 337,94
2010 4,00 357,32
2011 6,60 342,14
2012 4,00 327,84
2013 4,90 362,06
2014 4,40 348,80
2015 3,10 353,52
2016 2,00 355,40
2017 1,80 342,00
400
350 y = -0.1049x + 560.48
R² = 0.002
300
250
200
150
100
50 y = -0.0475x + 99.508
R² = 0.0191
0
2000 2002 2004 2006 2008 2010 2012 2014 2016 2018

PIB Nación Ventas de la compañía


Lineal (PIB Nación) Lineal (Ventas de la compañía )

a. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. ¿Es confiable?
b. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
¿Cuál podría ser la proyección de ventas para el año 2018 si se espera que el PIB
nacional sea del 3,1?

You might also like