You are on page 1of 34

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

Escuela de Ciencias Bsicas, Tecnologa e Ingeniera


211622 Estadstica y Probabilidad

SITUACIN PROBLEMA

PRESENTADO POR:

SANDRA GISETH HERRERA PRIETO.


Cd: 1016039815. Correo: Sgherrera5@misena.edu.co
JAIRO LUGO
Cd: 80108715. Correo: jasang73@gmail.com
JUAN CARLOS URQUIZA
Cd: Correo:
LIDA ALEXI GONZALEZ
Cd: 1012320926. Correo:

INGENIERA DE ALIMENTOS - CEAD: JAG

PRESENTADO A:

HECTOR ABELARDO CHAPARRO

ESTADISTICA Y PROBABILIDAD 211622-3

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

COLOMBIA

2016
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

INTRODUCCION

A continuacin se presenta el recopilado de las temticas relacionadas con estadstica


descriptiva, en el cual se realiz un estudio de un caso Una fbrica de lcteos
denominada Santa Helena, el cual nos da las pautas a tener en cuenta con la base de datos
de los empleados de la compaa, en este caso se plantearon 5 problemas los cuales
determinan ciertos estudios estadsticos con los datos que han sido generados en la base de
datos de los empleados.
En primer lugar en el primer problema este nos plantea que debemos determinar poblacin,
muestra y variables del caso y la base de datos que estamos revisando. Para el segundo
problema se tena que determinar las tablas de frecuencia de las variables con sus
respectivas grficas y anlisis desarrollados a partir de los resultados obtenidos. Para el
tercer problema se deban identificar las medidas de tendencia central y elegir las variables
cuantitativas discretas y las variables cuantitativas continuas. Para el cuarto problema, se
deban usar medidas de dispersin, usar asimetra y curtosis y realizar el diagrama de cajas
y bigotes y finalmente para el caso del quinto problema tenemos que, se deba hallar el
coeficiente de correlacin de Pearson, el coeficiente de determinacin, realizar el diagrama
de dispersin y encontrar la recta de regresin.
Cada uno de los problemas se desarroll con la ayuda de los participantes del grupo
colaborativo, afianzando las habilidades y desarrollo del rea profesional.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

DESARROLLO DEL TRABAJO


Solucin de los problemas planteados:
Situacin Problema
La fbrica de lcteos Santa Helena en funcionamiento desde hace ao y medio requiere
de un proceso de certificacin mediante las normas ISO, para as estandarizar su proceso y
poder competir ms adelante en el mercado nacional. Un consultor de calidad aconseja a la
direccin analizar las variables, investigacin que genero la base de datos suministrada en
primera instancia de los empleados para caracterizar quines estn trabajando con ellos. As
el gerente de la empresa le solicito a usted realizar un anlisis de la informacin que
recolecto el mes pasado. Para ello se le solicita lo siguiente:
1. Problema 1:

Enunciar cul es la poblacin y muestra a estudiar.

Poblacin: Para este caso tenemos que la poblacin a estudiar en esta situacion problema
son los trabajadores de la fbrica.
Muestra: La muestra que tenemos definida son un grupo de 40 trabajadores de la fbrica, la
cual es el objeto de estudio.
Identificar las variables obtenidas en la base de datos y diligenciar el siguiente
cuadro:
Variable Cuantitativa Cualitativ Unidades
a
Edad X Aos
Estatura X Cm
Sexo X Hombre/Mujer
No. Artculos producidos X Cantidad Decenas
semanalmente
Cuidad de Residencia X Bogot/Cali/Medelln/Cartagena
No. Hermanos X Cantidad - Unidades
Horas de trabajo X Horas
semanalmente
Estado civil X Casado/Separado/Soltero/Unin
libre/Viudo/Otros
Salario semanal X Miles de pesos
No. De hijos X Cantidad - Unidad
Nivel de estudio X Bachillerato/Tcnico/Tecnolgico/
Universitario
Tiempo de antigedad en X Aos
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

la fabrica
Cargo X Auxiliar/Operativo/Asistente

De su propuesta de estudio estadstico, qu otras variables podra tener en cuenta?


Inclyalas en el cuadro anterior y subryelas de rojo.
Para este tipo de estudios, se podran llegar a considerar variables como: No. De hijos,
Nivel de estudios, Tiempo de antigedad en la fbrica, cargo.

2. Problema 2:

Realice las tablas de frecuencia correspondiente por cada una de las variables, tenga en
cuenta el tipo de variable para su construccin.

Variable cuantitativa Discretas

N = 50 Tostin y Trillado; C = Categora; ni = Frecuencia Absoluta; Ni = Frecuencia


absoluta acumulada; fi = frecuencia relativa; Fi = frecuencia relativa acumulada.

Tostin y Trillado
Rango =Xmax Xmin
K = Nmero de intervalos
C = amplitud
Rango = 135.5 143
Rango = 7.5
Como el nmero de observaciones es pequeo entonces,
K = 50 = 7.07 = 7 Tomaremos a 7 como el nmero de intervalos.
C = R/K
C = 7.5/7
C=1
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Categora (Edad) ni Ni fi Fi Pi

135.5 136.5 4 4 0.080 0.080 8.0%

136.6 137.6 5 9 0.100 0.180 10.0%

137.7 138.7 9 18 0.180 0.360 18.0%

138.8 139.8 5 23 0.100 0.460 10.0%

139.9 140.9 14 37 0.280 0.740 28.0%

141.0 142.0 11 48 0.220 0.960 22.0%

142.1 143.0 2 50 0.04 1 4.0%

Es una variable cuantitativa contina

Interpretaciones
Frecuencia Absoluta
Hazlo de acuerdo a las variables cualitativas
Frecuencias Absolutas Acumuladas
14 de las temperaturas de Tostin de cacao se han realizado con temperaturas entre
19.9 y 140.9 C.

Frecuencia Relativa
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

5 de cada 50 temperaturas de tostin se han realizado entre los 138.8 y 19.8 C

Frecuencia Relativa acumulada


El 18 % de las temperaturas de tostin se han realizado entre los 137.7 y 138.7 C

Nota: En esta tabla de frecuencias se agrupan los datos mas no es una variable cuantitativa
continua.

Estatura en cm
Rango =Xmax Xmin
K = Nmero de intervalos
C = amplitud
Rango = 188 157
Rango = 31
Como el nmero de observaciones es pequeo entonces,
K = 40 = 6.32 Tomaremos a 6 como el nmero de intervalos.
C = R/K
C = 31/6
C = 5.17

Categora (Estatura en cm) ni Ni fi Fi Pi

157 162.1 6 6 0.150 0.150 15%

162.3 167.5 6 12 0.150 0.300 15%

167.6 172.8 5 17 0.125 0.425 12.5%

172.9 178.1 10 27 0.250 0.675 25%

178.2 183.4 10 37 0.250 0.925 25%

183.5 188.7 3 40 0.075 1 7.5%


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Nota: En esta tabla de frecuencias se agrupan los datos mas no es una variable cuantitativa
continua.
No. De artculos producidos semanalmente

Rango =Xmax Xmin


K = Nmero de intervalos
C = amplitud
Rango = 90 48
Rango = 42
Como el nmero de observaciones es pequeo entonces,
K = 40 = 6.32 Tomaremos a 6 como el nmero de intervalos.
C = R/K
C = 42/6
C=7

Categora (No. Artculos producidos ni Ni fi Fi Pi


semanalmente)
48 55 11 11 0.275 0.275 27.5%

56 63 3 14 0.075 0.350 7.5%

64 71 8 22 0.200 0.550 20%

72 79 13 35 0.325 0.875 32.5%

80 87 4 39 0.100 0.975 10%

88 95 1 40 0.025 1 2.5%

Nota: En esta tabla de frecuencias se agrupan los datos mas no es una variable cuantitativa
continua.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

No. De Hermanos

Categora (No. Hermanos) ni Ni fi Fi Pi

0 11 11 0.275 0.275 27.5%


1 14 25 0.350 0.625 35%
2 8 33 0.200 0.825 20%
3 1 34 0.025 0.850 2.5%
4 2 36 0.050 0.90 5%
6 1 37 0.025 0.925 2.5%
8 1 38 0.025 0.950 2.5%
10 2 40 0.050 1 5%

Salario semanal en miles de pesos

Rango =Xmax Xmin


K = Nmero de intervalos
C = amplitud
Rango = 776 599
Rango = 177
Como el nmero de observaciones es pequeo entonces,
K = 40 = 6.32 Tomaremos a 6 como el nmero de intervalos.
C = R/K
C = 177/6
C = 29.5
Categora (Salario semanal en miles ni Ni fi Fi Pi
de pesos)
599 628.5 1 1 0.025 0.250 2.5%

628.6 658.1 6 7 0.150 0.175 15%

658.2 687.7 12 19 0.30 0.475 30%


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

687.8 717.3 12 31 0.30 0.775 30%

717.4 746.9 3 34 0.075 0.850 7.5%

747 776.5 6 40 0.150 1 15%

Tabla para variable cualitativa

En el caso de variable cualitativa no se pueden calcular las frecuencias acumuladas pues no


es posible establecer un orden en las clases dentro de la modalidad. Colocamos en la tabla
aquellos valores que son independientes del lugar en que se pongan las modalidades.

Sexo

Categora (Sexo) ni fi Pi

Femenino 20 0.5 50%


masculino 20 0.5 50%
40 1 100%

Ciudad donde viven


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Categora (Ciudad donde vive) ni fi Pi

Bogot 14 0.350 35%


Cali 9 0.225 22.5%
Cartagena 7 0.175 17.5%
Medelln 10 0.250 25%
40 1 100%

Estado civil

Categora (Estado Civil) ni fi Pi

Casado 5 0.125 12.5%


Soltero 11 0.275 27.5%
Separado 4 0.100 10%
Viudo 6 0.150 15%
Unin libre 10 0.250 25%
otros 4 0.100 10%
40 1 100%
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Variable cuantitativa Continua


Una variable cuantitativa continua puede tomar todos los valores reales comprendidos entre
un valor inicial y un final. El intervalo que hemos tomado es semicerrado por la derecha,
normalmente los intervalos suelen ser semicerrados para tomar todos los valores posibles y
evitar que un mismo valor pueda entrar en dos intervalos distintos.

1. Si n es pequeo tomaremos como nmero de intervalos


2. Si en cambio n es grande tomaremos

(Horas de trabajo Semanales)

Rango =Xmax Xmin


K = Nmero de intervalos
C = amplitud
Rango = 63 19
Rango = 44
Como el nmero de observaciones es pequeo entonces,
K = 40 = 6.32 Tomaremos a 6 como el nmero de intervalos.
C = R/K
C = 44/6
C = 7.33
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Modalidad Marca de ni fi Pi Ni Fi
Clase
1 19 26.3 X1 12 0.300 30% 12 0.300
2 26.4 33.7 X2 14 0.350 35% 26 0.650
3 33.8 41.1 X3 4 0.100 10% 30 0.750
4 41.2 48.5 X4 4 0.100 10% 34 0.850
5 48.6 55.9 X5 3 0.075 7.5% 37 0.925
6 56 63.3 X6 3 0.075 7.5% 40 1
Realice las grficas adecuadas para cada una de las variables, tenga en cuenta el tipo de
variable para su construccin.

TIPO DE VARIABLE DIAGRAMA


V. CAULITATIVA Barras, Sectores, Pictogramas
Diferencial (Barras)
V. DISCRETA
Integral (en escalera)

Diferencial (histograma, polgono de frecuencias)


V. CUANTITATIVA
Integral (diagrama de Acumulados)

Variables Cualitativas

Grfico de barras
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Sexo
0.6

0.5

0.4

0.3
Frecuencia Relativa
0.2

0.1

0
Femenino Masculino

Modalidad
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Grfico de Sectores

Estado Civil
4 5
Casado
Soltero
10 Separado
11 Viudo
Unin libre
otros

6 4

El arco de cada porcin se calcula usando la siguiente regla de tres

Variables Cuantitativas Discretas


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Edad
45
40
35
30
25
20
15
Frecuencia Absoluta Acumulada 10
5
0

)
.5

.7

.9
22

29

36

4
[1

6.

3.
[2

[3
Modalidad

Grfico
Escalera
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

No. Articulos Producidos Semanalmente


45
39 40
40
35
35
30
25 22
20
Frecuencia Absoluta Aculada 14
15 11
10
5
0

)
)

)
55

63

79

87

95
71

8
4

0
[4

[5

[6

[7

[8

[8
Modalidad
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

$ Salario Semanal en Miles de Pesos


45
40
35
30
25
20
15
Fraceuencia Absoluta Acumulada 10
5
0

5)

7)

9)
8.

7.

6.
62

74
68


99

.4
.2
58

17
[5

[6

[7
Modalidad

Grfico Diferencial (Barras)


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Diagrama Diferencial (histograma, polgono de frecuencias)


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Escriba 4 interpretaciones relevantes de los datos obtenidos en las dos indicaciones


anteriores usando cada tipo de frecuencia (absoluta, relativa, absoluta acumulada y relativa
acumulada.

Interpretaciones
Frecuencia Absoluta
En La fbrica de lcteos Santa Helena Trabajan 20 hombres

14 de los trabajadores tienen 1 hermano

Solo 5 de los empleados de La fbrica de lcteos Santa Helena estn casados

10 de los trabajadores viven en Medelln

Frecuencias Absolutas Acumuladas


25 de los trabajadores tienen entre cero y un hermano

27 de los trabajadores miden entre 157 y 178 cm

34 de los trabajadores trabajan de 19 a 48 horas en la semana


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

39 de los trabajadores fabrican de 48 a 87 artculos semanalmente

Frecuencia Relativa
6 de cada 40 trabajadores tienen edades entre los 22 y 26 aos

12 de cada 40 trabajadores devengan sueldos entre 658 mil y 687 mil pesos

30 de cada 40 trabajadores trabajan entre 33 y 41 horas a la semana

11 de cada 40 empleados tienen entre 37 y 40 aos

Frecuencia Relativa acumulada


El 30 % de los trabajadores laboran de 19 a 26 horas a la semana

El 17,5 % de los empleados ganan entre 599 mil y 658 mil pesos

El 67,5 % de los empleados miden entre 157 y 178 cm

El 82,5 % de los empleados tienen de cero a dos hermanos

Conclusiones
1. En las variables cualitativas no se deben tener en cuenta las frecuencias acumuladas.

2. Los histogramas de frecuencias pueden construirse no slo con las frecuencias


absolutas, sino tambin con las frecuencias acumuladas y las frecuencias relativas.

3. Problema 3:

Qu medida(s) de tendencia central se puede(n) sacar a cada una de las variables


propuestas en la base de datos?

Media, mediana y moda.

Encuentre las medidas de tendencia central identificadas en el tem anterior y d


conclusiones con ellas.

Medida de Eda Estatur No de artculos N HORAS Salario


tendencia d a (cm) producidos Hermano de semanal (en
central semanalmente s trabajo miles de pesos)
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

semanales

Media 29,4 172,75 67,15 1,875 33,875 27720


Mediana 29 174,5 68,5 1 30 690
Moda 20 182 52 1 28 697

Conclusin: Las medidas de tendencia central estn divididas en tres, las cuales la media sirve para
mostrar en qu lugar se ubica las personas promedio o tpicas del grupo (poblacin), donde es
aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la
frecuencia total. Lo que quiere decir que, corresponde a la suma de un conjunto de datos dividida
por el nmero total de dichos datos y se puede decir que es el promedio en este caso de la edad,
estatura, nmero de productos producidos, nmero de hermanos, horas de trabajo semanal y salario
semanal. Para reconocer la mediana es necesario tener ordenados los valores sea de mayor a menor
o lo contrario. Se divide el total de casos (N) entre dos, y el valor resultante corresponde al nmero
del caso que representa la mediana de la distribucin. Es el valor central de un conjunto de
valores ordenados en forma creciente o decreciente. O sea, la Mediana corresponde al valor que
deja igual nmero de valores antes y despus de l en un conjunto de datos agrupados. La moda es
la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se
repite ms de los anteriormente nombrados.

Variable cuantitativa contina


Elija una variable cuantitativa discreta y una variable cuantitativa continua y escriba dos
conclusiones usando medidas de posicin por cada una de ellas.

Variable cuantitativa discreta (Numero de hermanos)

Variable cuantitativa discreta


Numero Frecuencia Frecuencia Frecuencia
de Frecuencia absoluta relativa (h) %n relativa %H
hermanos absoluta acumulada (F) acumulada
(f) (H)
0 11 11 0,275 27,5 0,275 27,5
1 14 25 0,35 35 0,625 62,5
2 8 33 0,2 20 0,825 82,5
3 1 34 0,025 2,5 0,85 85
4 2 36 0,05 5 0,9 90
5 0 36 0 0 0,9 90
6 1 37 0,025 2,5 0,925 92,5
7 0 37 0 0 0,925 92,5
8 1 38 0,025 2,5 0,95 95
9 0 38 0 0 0,95 95
10 2 40 0,05 5 1 100
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Total 40 1 100 9,125 912,5

Estatura (cm)
Numero Lmite Lmite Marca de Frecuencia F h H
de inferior superior clase (Y) absoluta (f)
intervalo
1 157 161,905964 159,452982 6 6 0,15 0,15
2 161,905964 166,811929 164,358947 5 11 0,125 0,275
3 166,811929 171,717893 169,264911 6 17 0,15 0,425
4 171,717893 176,623858 174,170875 5 22 0,125 0,55
5 176,623858 181,529822 179,07684 10 32 0,25 0,8
6 181,529822 186,435786 183,982804 6 38 0,15 0,95
7 186,435786 191,341751 188,888769 2 40 0,05 1
Total 40
Variable cuantitativa continua (Estatura (cm))

n 40
Max 188
Min 157
Rango "R" 31
Intervalos 6 Aprox 7
Ancho clase 4,9059644

Conclusin: En la variable cuantitativa continua se tuvieron en cuenta el nmero de estaturas (cm)


ya que puede tomar cualquier valor real (infinito) dentro de un intervalo y variable cuantitativa
discreta se tomaron los valores de numero de hermanos porque solo podemos tomar nmeros finito
de valores enteros.

4. Problema 4:

Qu tan confiables son los datos obtenidos? Use medidas de dispersin.

1. Edad

Rango
R=V mxV mn

Dnde:

V mx =Valor mximo
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

V mn =Valor mnimo

R=4019=21

Varianza

n
S 2= (Cix )2
i=1
n
=frecuencia absoluta
Ci=marca de clase
x =media aritmtica
n=tamao de lamuestra

S 2=9 ( 20,529,6 )2+ 6 (23,529,6 )2 +3 ( 26,529,6 )2+ 4 ( 29,529,6 )2 +3 ( 32,529,6 )2+ 4 ( 35,529,6 )
40

745,29+223,26+28,83+0,04 +25,23+139,24+ 871,31


S 2=
40

2033,2
S 2= =50,83
40

Desviacin estndar

S= S2

S= 50,83
S=7,13

Coeficiente de variabilidad porcentual

S
CV = 100
x
7,13
CV = 100
29,6
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

CV =24,08 24,1

Como el coeficiente es menor de 33%, se comprueba que la media aritmtica es un buen


estadstico.

2. Estatura

Rango

R=188157=31

Varianza

S 2=6 ( 158,5173,2 )2 +1 (162,5173,2 )2+ 6 ( 166,5173,2 )2 +4 ( 170,5173,2 )2+5 ( 174,5173,2 )2


2 2 2
+ 8 ( 178,5173,2 ) + 8 (182,5173,2 ) + 2 ( 186,5173,2 )
40

1296,54+114,49+ 269,34+29,16+ 8,45+ 224,72+ 691,92+53,2


S 2=
40

2687,82
S 2= =67,19 67,2
40

Desviacin estndar

S= 67,2
S=8,2

Coeficiente de variabilidad porcentual

S
CV = 100
x
8,2
CV = 100
173,2

CV =4,73 5

Como el coeficiente es menor de 33%, se comprueba que la media aritmtica es un buen


estadstico.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

3. N de artculos

Rango

R=9048=42

Varianza

2 2 2 2 2 2
S =10 (50,567 ) +1 ( 56,567 ) + 6 ( 62,567 ) +8 ( 6967 ) +8 ( 75,567 )
2 2
+5 ( 81,567 ) +2 ( 87,567 )
40

2 2722,5+110,25+121,5+32+578+1051,25+ 840,5
S=
40

2 5456
S= =136,4
40

Desviacin estndar

S= 136,4
S=11,67 12

Coeficiente de variabilidad porcentual

12
CV = 100
67

CV =17,9 18

Como el coeficiente es menor de 33%, se comprueba que la media aritmtica es un buen


estadstico.

4. N de hermanos

Rango
R=110=11

Varianza
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad
2 2 2 2 2 2
25 ( 0,52 ) +9 ( 2,52 ) + 2 ( 4,52 ) +1 ( 6,52 ) +1 ( 8,52 ) +2 ( 10,52 )
S 2=
40

2 56,25+2,25+12,5+20,25+ 42,25+144,5
S=
40

278
S 2= =6,95 7
40

Desviacin estndar

S= 7
S=2,6 3

Coeficiente de variabilidad porcentual

3
CV = 100
2

CV =150

Como el coeficiente es mayor de 33%, se comprueba que la media aritmtica no es un buen


estadstico.

5. Horas trabajadas

Rango
R=63,518,5=45

Varianza

7 ( 2134 )2+10 ( 2634 )2+ 9 ( 3134 )2 +2 ( 3634 )2 +4 ( 4134 )2+ 2 ( 4634 )2 +3 (5134 )2
2 2
2 1 (5634 ) + 2 ( 6134 )
S=
40

1183+640+ 81+ 8+196+288+ 867+484 +1458


S 2=
40
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

5205
S 2= =130,12
40

Desviacin estndar

S= 130,12
S=11,41

Coeficiente de variabilidad porcentual

11,41
CV = 100
34

CV =33,5

Como el coeficiente es mayor de 33%, se comprueba que la media aritmtica no es un buen


estadstico.

6. Salario semanal

Rango
R=780599=181

Varianza

1 ( 611,5693,4 )2+ 4 ( 637,5693,4 )2 +11 ( 663,5693,4 )2 +1 1 ( 689,5693,4 )2 + 4 ( 715,5693,4 )2+ 3 ( 741,5


S 2=
40

6707,61+ 12499,24+9834,11+ 167,31+1953,64 +6940,83+32944,86


S 2=
40

71047,6
S 2= =1776,19
40

Desviacin estndar

S= 1776,19
S=42,14
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Coeficiente de variabilidad porcentual

42,14
CV = 100
693,4

CV =6,1

Como el coeficiente es menor de 33%, se comprueba que la media aritmtica si es un buen


estadstico.

D conclusiones usando asimetra y curtosis. Realice el diagrama de cajas y bigotes.

5. Problema 5:

Hay algn tipo de relacin entre horas de trabajo vs artculos producidos, para ello
encuentre el coeficiente de correlacin de Pearson, el coeficiente de determinacin, realice
el diagrama de dispersin y encuentre la recta de regresin.
En primer lugar es importante tener en cuenta los datos a los cuales se les debe realizar los
siguientes clculos No de artculos producidos semanalmente vs Horas de trabajo semanales

No de artculos Horas de trabajo X1*Y X1 2 Y1 2


producidos semanalmente semanales Y 1
X
52 28 1456 2704 784
51 36 1836 2601 1296
83 25 2075 6889 625
90 28 2520 8100 784
73 19 1387 5329 361
78 32 2496 6084 1024
76 29 2204 5776 841
85 48 4080 7225 2304
63 53 3339 3969 2809
74 26 1924 5476 676
49 32 1568 2401 1024
65 19 1235 4225 361
83 19 1577 6889 361
48 28 1344 2304 784
75 31 2325 5625 961
52 48 2496 2704 2304
66 62 4092 4356 3844
51 58 2958 2601 3364
79 43 3397 6241 1849
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

60 29 1740 3600 841


71 19 1349 5041 361
52 28 1456 2704 784
79 63 4977 6241 3969
65 26 1690 4225 676
84 26 2184 7056 676
77 37 2849 5929 1369
72 41 2952 5184 1681
53 52 2756 2809 2704
77 49 3773 5929 2401
66 28 1848 4356 784
78 23,5 1833 6084 552,25
50 30 1500 2500 900
49 30 1470 2401 900
66 23 1518 4356 529
65 40 2600 4225 1600
54 42,5 2295 2916 1806,2
5
72 21 1512 5184 441
71 30 2130 5041 900
72 32 2304 5184 1024
60 21 1260 3600 441
2686 1355 90305 18606 51695,
4 5

Coeficiente de correlacin de Pearson

Variable 1 Variable 2 n Pearson p-valor


No de artculos producidos No de artculos producidos 40 1,00 <0,0001
No de artculos producidos Horas de trabajo 40 -0,12 0,4650

Horas de trabajo No de artculos producidos 40 -0,12 0,4650


Horas de trabajo Columna2 40 1,00 <0,0001

Coeficientes de correlacin. (Correlacin de Pearson: Coeficientes\probabilidades)

No de artculos producidos Horas de trabajo


No de artculos 1,00 0,46
producidos
Horas de trabajo -0,12 1,00
Coeficiente de determinacin
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Qxy
Formula de Coeficiente de Correlacin :r =
Q xQ y

r >0 Positiva

r <0 Negativa

INFORMACIN FORMULA RESULTADO


Nmero de Muestras N= 40
Media de =
= N x /N 2686
= 40 =67,15

186.064 2
Varianza x = x = 67,15
X 2 2
2
i .fi 40
x =2 2
N x =4651,64509,12
2

x =142,48
2

Desviacin Tpica x = 142,48


x = x = x 2

x =11,94

Media de =
= N y/ N =
1355
=33,87
40
y = Y 2i . f i 51695,5 2
y=
2

y =
2 2 11,94
2
N 40
y =1292,39142,56
2

y =1149,83
2

Desviacin Tpica y =1149,83


y = y = y 2

y =33,91

Covarianza xy =
xy =
x . y . f . xy =
90305
2274,37
40
N
xy =16,75
Coeficiente de Correlacin Qxy 16,75 16,75
R= R= R= =
Q xQ y 11,9433,91 404,89
R= -0,041
Coeficiente de R2= R2=0,0412
Determinacin
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

R2= 0,0017

Ecuacin de la Recta de Qxy 16,75


y = ( x ) y33,87= ( x 67,15 )
Regresin x2 142,48
y33,87=0,12 x +8,06
y=0,12 x+ 8,06+33,87
y=0,12 x+ 8,06+33,87
y=0,12 x+ 41,93

La relacin entre horas de trabajo vs artculos producidos, es negativa es decir que las dos variables no
estn relacionadas entre s, cuando una aumenta la otra disminuye. Por otro lado se puede determinar que
la dependencia es muy leve ya que se aproxima ms a cero que a uno.

Diagrama de dispersin

HORAS DE TRABAJO VS PRODUCCIN


70
60
50
40
Horas de Trabajo Semanales f(x) = - 0.12x + 41.93
30
20
10
0
45 50 55 60 65 70 75 80 85 90 95

Nmero de Artculos Producidos Semanalmente

En la grfica se evidencia una dispersin muy grande. No hay una relacin y una tendencia directa
entre las horas de trabajo y el nmero de artculos producidos.

Con los datos arrojados en el tem anterior d 4 conclusiones.

Entre qu variables (de las dadas en la base de datos) podemos establecer una relacin
lineal? Justifique.

6. Discusin final:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

Segn los resultados obtenidos previamente, Cmo caracteriza los empleados de la empresa Santa
Helena?

7. Cuadro de Roles:

Tareas o funciones Funciones que faltan


Nombre de Rol realizadas del rol reforzar para
integrante seleccionado Funciones del rol (listarlas) (Describir las fortalecer el trabajo
del equipo actividades que colaborativo
realiz)
Sandra Relator 1. Relatora de todos los
Giseth procesos en forma escrita.
Herrera
2. Responsable de recopilar y
sistematizar la informacin.

3. Organizar el documento y
entregarlo al lder
comunicador.
Jairo Lugo Viga del 1. Controla el cronograma de
Tiempo tiempo establecido.

2. Es responsable porque el
equipo desarrolle las
diferentes actividades dentro
del tiempo pactado.

3. Debe conocer la agenda


del curso.
Lida Alexy Utilero 1. Responsable de conseguir
Gonzlez el material y/o las
herramientas de acuerdo a las
necesidades del equipo para
el desarrollo de las
actividades y/o procesos que
se requieran.

2. Pasar a pdf, editar


imgenes, normas APA,
Netiqueta.
Juan Carlos Lder 1. Responsable de la
Urquiza comunicacin entre el tutor y
el equipo, como tambin de
presentar a su equipo la
informacin que recoge de la
observacin - al desarrollo de
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

las actividades - hecha a los


otros equipos de grupo (lo
compartido en el foro
general. Verifica el
cumplimiento de los roles
por parte de cada integrante.

2. Conoce muy bien la gua y


aclara qu es lo que en ella se
solicita.

3. Recuerda a sus
compaeros sobre el uso de
la rbrica de evaluacin y
verifica que se tengan en
cuenta sus criterios.

4. Hace la entrega al final


como lo indica la gua.
Dinamizador 1. Dinamizador del proceso,
del Proceso quien se preocupa por
verificar al interior del
equipo que se estn
asumiendo las
responsabilidades
individuales y de grupo.

2. Propicia que se mantenga


el inters por la actividad.

3. Cuestiona de forma
permanente al grupo para
generar puentes entre lo que
ya se aprendi y lo que se
est aprendiendo.

4. Hace comentarios a los


aportes y hace preguntas
orientadoras.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
Escuela de Ciencias Bsicas, Tecnologa e Ingeniera
211622 Estadstica y Probabilidad

CONCLUSIONES

Para cualquier tipo de estudio estadstico es importante determinar la poblacin, la muestra y las
variables a contemplar ya que esta ser la base para los futuros anlisis que deseemos hacer al
problema que se nos ha planteado. Si definimos esto bien desde el comienzo el desarrollo ser ms
sencillo ya que tendremos los datos concisos a la hora de trabajar.

REFERENCIAS BIBLIOGRFICAS

Ditutor. (2015). Tipos de variables. [En linea]. Recuperado el 28 de febrero de 2016.


Tomado de: http://www.ditutor.com/estadistica/variables_tipos.html

Vitutor. (2014). Recta de regresin. [En linea]. Recuperado el 12 de marzo de 2016.


Tomado de: http://www.vitutor.com/estadistica/bi/recta_regresion.html

Pea, D. Fundamentos de estadstica


Disponible en
http://campus06.unad.edu.co/ecbti05/mod/lesson/view.php?id=9173&pageid=2264

Montero Lorenzo, J, M (2007). Estadstica Descriptiva. Conceptos generales.


Disponible en
http://campus06.unad.edu.co/ecbti05/mod/lesson/view.php?id=9173&pageid=2262

You might also like