You are on page 1of 19

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

ESTADISTICA DESCRIPTIVA

MEDIDAS DE DISPERSIÓN Y ESTADÍSTICAS BIVARIANTES

FANNY OMERIS HERNANDEZ Código: 32.896.685

JAVIER EDUARDO AREVALO Código: 79.778.015

JONNATHAN ALEXANDER CELY AMAYA Código: 1.057.587.286

SANDRA PATRICIA BOHORQUEZ Código: 35.422.126

WILSON GAVIRIA BERNAL Código: 11.259.139

Grupo: 204040-8

Tutor (a): ALBERTO GARCIA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

2015
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

TABLA DE CONTENIDO

INTRODUCCIÓN .......................................................................................................... 3

JUSTIFICACION ........................................................................................................... 4

OBJETIVOS ................................................................................................................... 5

OBJETIVO GENERAL. .............................................................................................. 5


OBJETIVOS ESPECIFICOS. ...................................................................................... 5
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

INTRODUCCIÓN

Una vez que se ha localizado el “centro” con las medidas de tendencia central, la

investigación en busca de información a partir de conjunto de datos se dirige ahora a las

medidas de dispersión. Las medidas de dispersión incluyen el rango, la varianza y la

desviación estándar. Estos valore numéricos describen la cantidad de dispersión, o

variabilidad, que se encuentra entre los datos: datos bastante agrupados poseen valores

relativamente pequeños, y datos más dispersos tienen valores más grandes. El

agrupamiento más estrecho ocurre cuando los datos carecen de dispersión (todos los datos

tienen el mismo valor), para los cuales la medida de dispersión es cero. No hay límite

respecto a cuán dispersos pueden ser los datos; en consecuencia, las medidas de dispersión

pueden ser muy grandes.

En el campo de la estadística hay muchos problemas que requieren un análisis de

una o dos variables. En administración, en educación, en psicología y en muchas otras

materias, a menudo es necesario contestar preguntas como las siguientes: “¿Están

relacionadas estas dos variables? En caso afirmativo, ¿de qué manera? ¿Existe una

correlación entre las variables?”. Las relaciones bajo análisis son de tipo matemático que

permiten predecir el comportamiento de una variable con base en el conocimiento que se

tiene sobre otra.

En este documento encontrara los ejercicios desarrollados por los integrantes del

grupo 204040_8, sobre medidas de dispersión y regresión, y correlación lineal con base a

los datos del Hospital Federico Lleras Acosta, de la ciudad de Ibagué; que gracias al trabajo

en equipo se logró desarrollar lo propuesto en la guía de actividades del trabajo

colaborativo dos (2).


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

JUSTIFICACION
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

OBJETIVOS

OBJETIVO GENERAL.

OBJETIVOS ESPECIFICOS.

 Calcular e interpretar adecuadamente las medidas estadísticas univariantes y asociar

sus resultados con posibles alternativas de solución al problema.

 Determinar la relación entre dos o más variables inscritas en una situación específica a

partir del análisis de regresión lineal simple


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

Cálculo e interpretación de las medidas univariantes de dispersión para la variable


discreta

Población: Edad
Muestra: 120
Variable: Cuantitativa
Tipo de variable: Discreta

0 0 0 0 0 1 1 1 2 2 3 3 3 4 4 5 5
5 5 7 8 13 16 16 17 17 17 17 18 19 19 19 19 19
20 20 20 21 21 21 22 22 23 23 23 23 23 23 23 24 24
24 24 24 25 25 25 26 26 26 26 31 31 33 33 34 34 35
36 37 37 39 39 39 40 40 42 43 44 44 45 47 48 48 49
50 51 51 52 52 53 54 54 54 54 55 55 55 56 57 58 59
59 60 61 62 64 65 68 68 71 73 73 75 75 81 82 85 87
94

Representación de tallo y hojas


0 0 0 0 0 1 1 1 2 2 3
0
3 3 4 4 5 5 5 5 7 8
3 6 6 7 7 7 7 8 9 9 9
1
9 9
0 0 0 1 1 1 2 2 3 3 3
2 3 3 3 3 4 4 4 4 4 5 5
5 6 6 6 6
1 1 3 3 4 4 5 6 7 7 9
3
9 9
4 0 0 2 3 4 4 5 7 8 8 9
0 1 1 2 2 3 4 4 4 4 5
5
5 5 6 7 8 9 9
6 0 1 2 4 5 8 8
7 1 3 3 5 5
8 1 2 5 7
9 4
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

Paso 1 Rango Xmáximo 94 Xmínimo 0 Rango=Xmáximo - Xmínimo 94


Paso 2 Intervalo de clase 120 8
94
Paso 3 Ancho de amplitud 12
8
Paso 4 Nuevo Rango 12 8 96
Paso 5 Exceso 96 94 2
Paso 6 Nuevo valor menor Xmínimo 0 1 = -1
Paso 7 Nuevo valor mayor Xmáximo 94 1 95
Paso 8 Primer término del intervalo Nuevo valor menor = -1
Paso 9 Segundo término del intervalo 11
Frecuencia relativa (%) 144000

TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS

Intervalos Intervalos
1 -1 11 21 5 105 525 [-1 a 11) 21
2 11 23 21 17 357 6069 [11 a 23) 21
3 23 35 25 29 725 21025 [23 a 35) 25
4 35 47 14 41 574 23534 [35 a 47) 14
5 47 59 20 53 1060 56180 [47 a 59) 20
6 59 71 9 65 585 38025 [59 a 71) 9
7 71 83 7 77 539 41503 [71 a 83) 7
8 83 95 3 89 267 23763 [83 a 95) 3

120 4212 210624


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

𝑅 94 0
Rango: 𝑅 𝑥𝑚𝑎𝑥 𝑥𝑚𝑖𝑛 𝑅 94

∑ 𝑥𝑓 4.212
Media: 𝑥̅ 𝟓
∑𝑓 120

2
4.212
∑ 𝑥𝑓 2 210.624 120
∑ 𝑥 2𝑓
Varianza: ∑𝑓 120 1
𝑠2
∑𝑓 1 𝟓 𝟕 𝟓𝟗

Desviación estándar: 𝑠 √𝑠 2 √527 59 𝟗𝟕

22 97
× 100%
Coeficiente de 𝑠 35 10
𝐶𝑉 × 100%
variación: 𝑥̅
65,44%

Las medidas de dispersión representan una alta variabilidad de los datos con respecto a la media
obtenida, representado en un 22,97 la desviación estándar de los datos de la variable de la edad
con respecto a la media de 35,10 años. Igualmente el coeficiente de variación para esta variable
es de un 65,44% lo cual es una variación alta de los datos reales con respecto al promedio
identificado.

Población: Número de visitas del último trimestre


Muestra: 120
Variable: Cuantitativa
Tipo de variable: Discreta

1 86 86 86
2 26 52 104
3 8 24 72

𝟔 𝟔
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

𝑅 3 1
Rango: 𝑅 𝑥𝑚𝑎𝑥 𝑥𝑚𝑖𝑛 𝑅 2

∑ 𝑥𝑓 162
Media: 𝑥̅ 𝟓
∑𝑓 120

162 2
∑ 𝑥𝑓 2 262 120
∑ 𝑥 2𝑓
Varianza: ∑𝑓 120 1
𝑠2
∑𝑓 1 𝟔 𝟗

Desviación estándar: 𝑠 √𝑠 2 √0 369 𝟔

0 61
× 100%
Coeficiente de 𝑠 1 35
𝐶𝑉 × 100%
variación: 𝑥̅
45,19%
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

Cálculo e interpretación de las medidas univariantes de dispersión para la variable


continua

Población: Peso
Muestra: 120
Variable: Cuantitativa
Tipo de variable: Continua

2,6 3,1 3,1 3,4 3,9 5,2 8,9 9,4 9,7 11,9 12,5 14,2 15,3 15,9 16,5 16,7 16,9
18,3 19,7 23,0 24,5 30,5 45,0 45,2 45,8 45,8 45,9 50,2 52,6 52,7 52,9 53,8 54,0 54,9
55,0 55,2 55,9 56,0 56,8 56,9 57,3 57,6 57,8 57,9 58,0 58,2 58,2 58,3 58,6 58,8 58,9
60,0 60,0 60,0 60,2 60,3 60,5 60,5 60,6 60,8 60,8 60,8 61,6 62,3 62,7 62,9 62,9 63,2
63,8 64,3 64,3 65,0 65,2 65,2 65,4 65,6 65,7 65,7 65,8 65,9 67,2 67,2 67,2 67,2 67,5
67,9 67,9 68,9 70,0 70,0 70,0 70,2 70,8 72,0 72,5 72,9 72,9 72,9 73,8 75,3 78,0 78,1
78,4 78,5 78,5 78,5 78,6 78,6 78,6 78,9 79,5 80,9 85,0 85,0 85,0 85,8 85,8 85,9 87,2
87,5

Representación de tallo y hojas


0 2,6 3,1 3,1 3,4 3,9 5,2 8,9 9,4 9,7
1 1,9 2,5 4,2 5,3 5,9 6,5 6,7 6,9 8,3 9,7
2 3,0 4,5
3 0,5
4 5,0 5,2 5,8 5,8 5,9
0,2 2,6 2,7 2,9 3,8 4,0 4,9 5,0 5,2 5,9 6,0
5 6,8 6,9 7,3 7,6 7,8 7,9 8,0 8,2 8,2 8,3 8,6
8,8 8,9
0,0 0,0 0,0 0,2 0,3 0,5 0,5 0,6 0,8 0,8 0,8
1,6 2,3 2,7 2,9 2,9 3,2 3,8 4,3 4,3 5,0 5,2
6
5,2 5,4 5,6 5,7 5,7 5,8 5,9 7,2 7,2 7,2 7,2
7,5 7,9 7,9 8,9
0,0 0,0 0,0 0,2 0,8 2,0 2,5 2,9 2,9 2,9 3,8
7 5,3 8,0 8,1 8,4 8,5 8,5 8,5 8,6 8,6 8,6 8,9
9,5
8 0,9 5,0 5,0 5,0 5,8 5,8 5,9 7,2 7,5
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

Paso 1 Rango Xmáximo 87,5 Xmínimo 2,6 Rango=Xmáximo - Xmínimo 84,9


Paso 2 Intervalo de clase 120 8
84,9
Paso 3 Ancho de amplitud 11
8
Paso 4 Nuevo Rango 11 8 88
Paso 5 Exceso 88 85 3
Paso 6 Nuevo valor menor Xmínimo 2,6 1,6 = 1
Paso 7 Nuevo valor mayor Xmáximo 87,5 1,6 89
Paso 8 Primer término del intervalo Nuevo valor menor = 1
Paso 9 Segundo término del intervalo 12
Frecuencia relativa (%) 132000

TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS

Intervalos Intervalos
1 1,1 12,1 10 6,6 65,5 429,0 1,1 12,1 10
2 12,1 23,1 10 17,6 175,5 3080,0 12,1 23,1 10
3 23,1 34,1 2 28,6 57,1 1630,2 23,1 34,1 2
4 34,1 45,1 1 39,6 39,6 1564,2 34,1 45,1 1
5 45,1 56,1 15 50,6 758,3 38329,5 45,1 56,1 15
6 56,1 67,1 42 61,6 2585,1 159112,9 56,1 67,1 42
7 67,1 78,1 21 72,6 1523,6 110533,6 67,1 78,1 21
8 78,1 89,1 19 83,6 1587,5 132631,4 78,1 89,1 19

120 6792,0 447310,9


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

𝑅 87 5 26
Rango: 𝑅 𝑥𝑚𝑎𝑥 𝑥𝑚𝑖𝑛 𝑅 84 9

∑ 𝑥𝑓 6.792 0
Media: 𝑥̅ 𝟓𝟔 𝟔
∑𝑓 120

2
6.792 0
∑ 𝑥𝑓 2 447.311 120
∑ 𝑥 2𝑓
Varianza: ∑𝑓 120 1
𝑠2
∑𝑓 1 𝟓 𝟖𝟒

Desviación estándar: 𝑠 √𝑠 2 √528 43 𝟗𝟗

22 99
× 100%
Coeficiente de 𝑠 56 60
𝐶𝑉 × 100%
variación: 𝑥̅
40,62%

Población: Estatura
Muestra: 120
Variable: Cuantitativa
Tipo de variable: Discreta

0,45 0,47 0,53 0,57 0,57 0,65 0,73 0,76 0,82 0,85 0,86 0,96 0,96 0,98 1,00 1,03 1,03
1,06 1,10 1,16 1,18 1,40 1,50 1,51 1,51 1,52 1,52 1,53 1,53 1,55 1,55 1,56 1,56 1,56
1,56 1,57 1,58 1,58 1,58 1,58 1,58 1,58 1,59 1,59 1,59 1,59 1,59 1,60 1,60 1,61 1,61
1,61 1,62 1,62 1,62 1,62 1,62 1,62 1,63 1,63 1,63 1,63 1,63 1,63 1,64 1,64 1,64 1,65
1,65 1,65 1,65 1,65 1,65 1,65 1,65 1,66 1,66 1,67 1,67 1,67 1,67 1,67 1,67 1,68 1,68
1,68 1,68 1,68 1,68 1,69 1,70 1,70 1,70 1,71 1,71 1,72 1,72 1,72 1,72 1,72 1,72 1,73
1,74 1,75 1,75 1,75 1,75 1,76 1,76 1,78 1,78 1,78 1,79 1,79 1,80 1,80 1,80 1,81 1,86
1,86
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

Paso 1 Rango Xmáximo 1,86 Xmínimo 0,45 Rango=Xmáximo - Xmínimo 1,41


Paso 2 Intervalo de clase 120 8
1,4
Paso 3 Ancho de amplitud 0,18
8
Paso 4 Nuevo Rango 0,18 8 1,41
Paso 5 Exceso 1,41 1,41 0
Paso 6 Nuevo valor menor Xmínimo 0,5 0,00 = 0
Paso 7 Nuevo valor mayor Xmáximo 1,9 0,00 2
Paso 8 Primer término del intervalo Nuevo valor menor = 0
Paso 9 Segundo término del intervalo 1
Frecuencia relativa (%) 2115

TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS

Intervalos
1 0,45 0,63 5 0,54 2,7 1,4
2 0,63 0,80 3 0,71 2,1 1,5
3 0,80 0,98 5 0,89 4,5 4,0
4 0,98 1,16 6 1,07 6,4 6,8
5 1,16 1,33 2 1,24 2,5 3,1
6 1,33 1,51 2 1,42 2,8 4,0
7 1,51 1,68 60 1,60 95,7 152,8
8 1,68 1,86 37 1,77 65,6 116,2

120 182,3 289,8


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

𝑅 1 86 0 45
Rango: 𝑅 𝑥𝑚𝑎𝑥 𝑥𝑚𝑖𝑛 𝑅 1 41

∑ 𝑥𝑓 182 31
Media: 𝑥̅ 𝟓
∑𝑓 120

2
182 31
∑ 𝑥𝑓 2 289 82 120
∑ 𝑥 2𝑓
Varianza: ∑𝑓 120 1
𝑠2
∑𝑓 1 𝟕𝟗

Desviación estándar: 𝑠 √𝑠 2 √0 1079 𝟖𝟓

0 3285
× 100%
Coeficiente de 𝑠 1 52
𝐶𝑉 × 100%
variación: 𝑥̅
21,62%

Los resultados utilizando Excel son


Varianza 0,11064
Desviación estándar: 0,33263

Solución del laboratorio de regresión y correlación lineal.

1. Se requiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de
voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un
tiempo después. Los resultados son los siguientes:

𝒚 .
1,8 100
2,2 98
3,5 105
4,0 110
4,3 112
5,0 120
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

Diagrama de Dispersión
130

120

110

100

90
Y (TENSIÓN ARTERIAL))

y = 6,3137x + 85,612
80 R² = 0,9165
70

60

50

40

30

20

10

0
1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
X (SAL)

La ecuación del diagrama de dispersión presenta una pendiente positiva por lo tanto
podemos decir que a mayor consumo de sal, mayor aumento en la tensión arterial, eso nos indica
que las dos variables tienen una relación directamente proporcional.

El modelo matemático para las variables sal y tensión arterial está dada por la ecuación:

𝒚 𝟔 𝟕 𝟖𝟓 𝟔
donde x (sal) es la variable independiente y y (tensión arterial) la variable dependiente.

Con los resultados obtenidos se puede asegurar que la ecuación de la recta es una muy
buena estimación de la relación entre las dos variables sal vs presión. El R2 afirma además que el
modelo explica el 91,65% de la información y el valor de r (coeficiente de correlación lineal)
confirma además el grado de relación (95,73%) entre las variables: sal y presión.

Al administrar una dosis de 6,5 de sal; la tensión arterial del paciente debe ser aproximadamente
de 126,6745
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

2. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantando, se ha


considerado que era importante ir anotando periódicamente el tiempo medio (medido en
minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho
proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al
nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos
representan dicha situación.

𝒚
10 35
20 28
30 23
40 20
50 18
60 15
70 13

DIAGRAMA DE DISPERSIÓN
40
y = -0,3464x + 35,571
35 R² = 0,9454
30

25
Y (MINUTOS)

20

15

10

0
0 10 20 30 40 50 60 70
X (DÍAS)

La ecuación del diagrama de dispersión presenta una pendiente negativa por lo tanto podemos
decir que a mayor cantidad de días del proceso de fabricación, los operarios gastan menor
cantidad de minutos en la elaboración del artículo, eso nos indica que las dos variables tienen una
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

relación inversamente proporcional.

El modelo matemático para las variables x (días) y y (minutos) está dada por la ecuación:

donde x (días) es la variable independiente y y (minutos) la variable dependiente.

Con los resultados obtenidos se puede asegurar que los operarios a medida que avanzan los días
van mejorando su proceso de producción, es decir a mayor días menos minutos en la fabricación
del artículo. El R2 afirma además que el modelo explica el 94,54% de la información y el valor de
r (coeficiente de correlación lineal) confirma además el grado de relación (97,23%) entre las
variables: días y minutos.

Un operario en el día 100 debe tardar aproximadamente en la elaboración de un artículo 0,931


minutos

3. Una nutricionista de un hogar infantil desea encontrar un modelo matemático que permita
determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10
niños y realiza las mediciones respectivas. A continuación se presentan los resultados.

𝑬 𝑷 𝒌
103 15
108 19
109 18
110 20
111 19
114 20
115 21
118 24
121 25
123 22
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

DIAGRAMA DE DISPERSIÓN
27

24

21

18

15
Peso (kg)

12

6
y = 0,4212x - 27,377
R² = 0,8102
3

0
100 102 104 106 108 110 112 114 116 118 120 122 124
Estatura (cm)

La ecuación del diagrama de dispersión presenta una pendiente positiva por lo tanto podemos
decir que a mayor estatura, mayor peso, lo otro que nos indica es que por cada centímetro la
relación de cambio es de 0,4212. Las dos variables tienen una relación directamente
proporcional.

El modelo matemático para las variables x (cm) y y (kg) está dada por la ecuación:

donde x (cm) es la variable independiente y y (kg) la variable dependiente.

Con los resultados obtenidos se puede asegurar que a medida que los niños aumentan su estatura,
también su peso aumentara. El R2 afirma además que el modelo explica el 81,02% de la
información y el valor de r (coeficiente de correlación lineal) confirma además el grado de
relación (90,01%) entre las variables: centímetros y kilogramos.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD

Un estudiante que mida 130 cm debe tener un peso aproximado de 27,379 kg

You might also like