You are on page 1of 12

Análisis de datos en STATA

1. Tabla de Frecuencia para sueldo

Tabla de Frecuencia para sueldo

SUELDO Freq. Percent Cum.

1750 1 2.22 2.22


2400 4 8.89 11.11
2800 4 8.89 20.00
2950 1 2.22 22.22
3050 1 2.22 24.44
3250 1 2.22 26.67
3500 1 2.22 28.89
3550 1 2.22 31.11
3568 1 2.22 33.33
3580 1 2.22 35.56
3640 1 2.22 37.78
3752 1 2.22 40.00
3800 2 4.44 44.44
3890 1 2.22 46.67
3980 1 2.22 48.89
4005 1 2.22 51.11
4050 1 2.22 53.33
4150 2 4.44 57.78
4158 1 2.22 60.00
4200 1 2.22 62.22
4300 1 2.22 64.44
4500 1 2.22 66.67
4520 1 2.22 68.89
4550 1 2.22 71.11
4800 2 4.44 75.56
4850 1 2.22 77.78
4890 1 2.22 80.00
5240 1 2.22 82.22
5480 1 2.22 84.44
5850 1 2.22 86.67
5940 1 2.22 88.89
6200 1 2.22 91.11
6250 1 2.22 93.33
6850 1 2.22 95.56
7050 1 2.22 97.78
7150 1 2.22 100.00

Total 45 100.00

Tabla n° 1. Muestra la frecuencia absoluta, relativa y acumulada.

Interpretación Tabla 1:
Como podemos apreciar en la tabla n°1, nos encontramos con una muestra de 45 sueldos de diferentes
individuos, de los cuales los sueldos de 2400 y 2800 son los más comunes, obteniendo cada uno una
frecuencia relativa de 8.89%. Los sueldos de 3800, 4150 y 4800 son los siguientes en mayor frecuencia
alcanzando, cada uno, una frecuencia relativa de 4.44%. Los demás sueldos poseen un porcentaje de
2.22%, cada uno. Se podría decir que en la distribución de sueldos hay una predilección por los sueldos
mas bajos.
2. Tablas e Histogramas de frecuencia para sueldos por sexo

Tabla de frecuencia para SUELDOS por SEXO (M)

SUELDO Freq. Percent Cum.

1750 1 3.85 3.85


2400 3 11.54 15.38
2800 3 11.54 26.92
3050 1 3.85 30.77
3500 1 3.85 34.62
3568 1 3.85 38.46
3580 1 3.85 42.31
3800 1 3.85 46.15
4005 1 3.85 50.00
4050 1 3.85 53.85
4150 2 7.69 61.54
4158 1 3.85 65.38
4300 1 3.85 69.23
4550 1 3.85 73.08
4800 1 3.85 76.92
4850 1 3.85 80.77
5240 1 3.85 84.62
5480 1 3.85 88.46
6200 1 3.85 92.31
6250 1 3.85 96.15
7150 1 3.85 100.00

Total 26 100.00

Tabla n° 2. Muestra la frecuencia absoluta, relativa y acumulada.

Interpretación Tabla 2:
En esta tabla podemos observar los sueldos que son asignados a los individuos perteneciente al sexo
masculino (M). Por medio del mismo, podemos apreciar que los sueldos de 2400 y 2800 son los más
frecuentes teniendo cada uno una frecuencia relativa en la muestra de 11.54%, apareciendo solo 3 veces,
cada uno, en la muestra. El único q sigue en mayor frecuencia es el sueldo de 4150, apareciendo dos
veces y presentando una frecuencia relativa de 7.69%. Los demás montos de sueldo solo aparecen una
sola vez, representando, cada uno, una frecuencia relativa de 3.85%.
HISTOGRAMA DE FRECUENCIA PARA SUELDO POR SEXO (M)
Elaborado por Roy Mendoza

10
9

8
7
FRECUENCIA

5
4

2
2
0

2000 3000 4000 5000 6000 7000


SUELDO (en soles)
INEI

Gráfico n° 1. Muestra la frecuencia absoluta del sueldo para el sexo M

Interpretación Gráfico 1:
A través del gráfico n°1, podemos ver que los sueldos q están repartidos en mayor parte hacia los más
pequeños siendo los sueldos menores de 4000 los que poseen mayor frecuencia (12 datos) mientras que
aquello q son mayores a 5000 presentan menos frecuencia (solo habiendo 5 datos). En este caso hay un
mayor número de sueldos en el rango de 4000 a 5000, obteniendo estos una frecuencia de 9.

Tabla de frecuencia para SUELDOS por SEXO (F)


SUELDO Freq. Percent Cum.

2400 1 5.26 5.26


2800 1 5.26 10.53
2950 1 5.26 15.79
3250 1 5.26 21.05
3550 1 5.26 26.32
3640 1 5.26 31.58
3752 1 5.26 36.84
3800 1 5.26 42.11
3890 1 5.26 47.37
3980 1 5.26 52.63
4200 1 5.26 57.89
4500 1 5.26 63.16
4520 1 5.26 68.42
4800 1 5.26 73.68
4890 1 5.26 78.95
5850 1 5.26 84.21
5940 1 5.26 89.47
6850 1 5.26 94.74
7050 1 5.26 100.00

Total 19 100.00

Tabla n° 3. Muestra la frecuencia absoluta, relativa y acumulada.


Interpretación Tabla 3:
A través de la tabla n°3, podemos ver que todos los sueldos poseen la misma frecuencia, tanto absoluta
como relativa de 1 y 5.26 respectivamente. No hay sueldo en el sexo femenino (F) que posea una
frecuencia mayor en la muestra estudiada. En conclusión, todas las mujeres reciben sueldos distintos. En
este estudio el sueldo es diferenciado.

HISTOGRAMA DE FRECUENCIA PARA SUELDO POR SEXO (F)


Elaborado8por Roy Mendoza
8
6
FRECUENCIA

5
4

3 3
2
0

2000 3000 4000 5000 6000 7000


SUELDO (en soles)
INEI

Gráfico n° 2. Muestra la frecuencia absoluta del sueldo para el sexo F

Interpretación Gráfico 2:
Con el gráfico n°2 nos damos cuenta q, al igual q en el sueldo a los del sexo masculino, hay una mayor
predilección por los pagos de sueldos menores. Siendo es este caso los pagos menores a 5000 los q
poseen en suma 13 datos, mientras que los mayores a 5000 solo poseen una frecuencia de 6. En el sueldo
del sexo femenino, encontramos una asimetría mucho más notoria que en el caso del sexo masculino.
3. Gráficos de las variables

GRÁFICA DE PASTEL DE LA VARIABLE CARGO


Elaborado por Roy Mendoza

26.67% 28.89%

22.22%
22.22%

Coordinador Empleado
Gerente Jefe
INEI

Gráfico n° 3. Muestra la frecuencia relativa de la variable Cargo

Interpretación Gráfica 3:
Este gráfico muestra la distribución porcentual de los cargos en la muestra estudiada. Si bien no hay un
cargo notoriamente preponderante, podemos decir que en la muestra de estudios existen mucho más
individuo que son Coordinadores, representando un 28.89% de toda la muestra. Existe igual número de
Gerentes y Empleados, teniendo cada uno un 22% de la muestra. El número de jefes es el segundo cargo
más frecuente, teniendo una frecuencia relativa de 26.67%.

HISTOGRAMA DE FRECUENCIA DE LA VARIABLE EDAD


Elaborado por Roy Mendoza
11
10

9 9
FRECUENCIA

6 6
5

4
0

20 30 40 50 60 70

INEI
EDAD (en años)

Gráfico n° 4. Muestra la frecuencia absoluta de la variable Edad


Interpretación Gráfica 4:
En el gráfico vemos que la gráfica, y si evaluamos la línea de la normal, se podría decir que no es
asimétrica. Las edades que cuentan con una mayor frecuencia en la muestra son la que se encuentran en
el intervalo de 40 a 50 años. Evaluando las edades, podemos encontrar que la población de adultos
mayores es mucho may0r a la de jóvenes y adultos. Se puede decir que la tasa de natalidad es muy baja,
ya que predominan los ancianos.

HISTOGRAMA DE FRECUENCIA DE LA VARIABLE ESTATURA


Elaborado por Roy Mendoza
15

12
11
10
FRECUENCIA

10

6
5

2
0

1.5 1.6 1.7 1.8 1.9 2

INEI ESTATURA (en m)

Gráfico n° 5. Muestra la frecuencia absoluta de la variable Estatura

Interpretación Gráfica 5:
En el gráfico se puede notar que, en lo que respecta a la estatura, en la muestra predomina la gente de
baja estatura, es decir, que la muestra posee una asimetría positiva. En la muestra en estudio las
personas con una estatura alta son muy pocos, teniendo más del 60% entre baja y mediana estatura, y
solo 6 personas de las 45 en estudio tienen una altura igual o mayor que 1.8m.

Solo se puede decir que 2 personas de las 45, menos del 5% son las más altas llegando cerca de los 2m. a
curva de la normal nos ayudo a diferencial la asimetría que tiene la muestra.
GRÁFICO DE PASTEL DE LA VARIABLE SEXO
Elaborado por Roy Mendoza

19

26

F M
INEI

Gráfico n° 6. Muestra la frecuencia absoluta de la variable Sexo

Interpretación Gráfica 6:
Este gráfico de pastel de la variable sexo vemos que hay un mayor número individuos de sexo masculino,
obteniendo aproximadamente el 58% de la frecuencia relativa.

HISTOGRAMA DE FRECUENCIA DE LA VARIABLE SUELDO


Elaborado por Roy Mendoza
16
15
FRECUENCIA

10

8 8

5
5

4 4
0

2000 3000 4000 5000 6000 7000

INEI
SUELDO (en soles)

Gráfico n° 7. Muestra la frecuencia absoluta de la variable Sueldo


Interpretación Gráfica 7:
En este gráfico podemos notar que, según la línea de la normal, la distribución no es muy asimétrica,
pero, igual encontramos algo de predilección por los sueldos más bajos, aunque no es realmente
marcada esta predilección. los sueldos de mayor frecuencia son los que se encuentran entre 3000 y 5000
soles, pero en especial, aquellos que tienden a 4000.

HISTOGRAMA DE FRECUENCIA DE LA VARIABLE TIEMPO DE SERVICIO


Elaborado por Roy Mendoza
15

12
11
10
FRECUENCIA

6
5

4
3
0

0 10 20 30

INEI
TIEMPO DE SERVICIO (en años)

Gráfico n° 8. Muestra la frecuencia absoluta de la variable Tiempo de servicio

Interpretación Gráfica 8:
En este gráfico, y siguiendo la tendencia de la línea normal, vemos que la distribución es asimétrica,
teniendo como en todos los casos anteriores, predilección por aquellos datos menores. Es decir, que en
la muestra hay muchas más personas que tienen menos años de servicio. Se podría llegar a afirmar que
son muy pocas aquellas personas que tienen un tiempo de servicio mayor a los 20 años, no son ni el 30%.

En conclusión, en este estudio hay un mayor número de individuos con menor tiempo de servicio,
originando una simetría positiva.
HISTOGRAMA DE FRECUENCIA DE LA VARIABLE NIVEL
Elaborado por Roy Mendoza 22
20
15
FRECUENCIA

11
10

6
5

2
0

1 2 3 4 5
NIVEL
INEI

Gráfico n° 9. Muestra la frecuencia absoluta de la variable Nivel

Interpretación Gráfica 9:
En el gráfico de nivel vemos que la tendencia de las gráficas pasadas se revierte, en esta encontramos
que ahora son los datos de mayor nivel los que poseen mayor frecuencia en la muestra. La mayor
frecuencia la tiene el nivel 4, con 22 individuos con este nivel, el cual representa casi el 50% de toda la
muestra. Solo2, menos de 5% de la muestra, se encuentran en el nivel 5. Siguiendo la tendencia de la
línea normal se puede decir que nos encontramos frente a una asimetría negativa en donde priman los
datos mayores sobre los menores.
4. Medidas de tendencia central y dispersión

Para la variable EDAD

variable mean p50 sd variance

x2 48.02222 47 13.29301 176.704

Tabla n° 4. Muestra la media, mediana, desviación estándar y varianza


de la variable Edad.

Interpretación Tabla 4:
Según la tabla, la variable Edad posee una media de 48, es decir que la edad promedio de la muestra es
de 48 años. También tiene una mediana, que quiere decir que el dato central de la muestra,
correspondiente a los años es el 47. En lo que a la moda respecta la hallaremos con la ayuda de los
gráficos anteriores, obteniéndose una moda de 43 años. En lo que respecta al valor de la desviación
estándar y la varianza, vemos que hay una desviación del 13,29 que nos indica que los datos están muy
dispersos de la media.

Para la variable ESTATURA

variable mean p50 sd variance

x3 1.656222 1.64 .1171303 .0137195

Tabla n° 5. Muestra la media, mediana, desviación estándar y varianza


de la variable Estatura.

Interpretación Tabla 5:
Según la tabla, la variable Edad posee una media de 1.66, es decir que la estatura promedio de la
muestra es de 1.66m. También tiene una mediana, que quiere decir que el dato central de la muestra,
correspondiente a la estatura es el 1.64m. En lo que a la moda respecta la hallaremos con la ayuda de los
gráficos anteriores, obteniéndose una moda de 1.69m. En lo que respecta al valor de la desviación
estándar y la varianza, vemos que hay una desviación del 0.118 que nos indica que los datos no están
muy dispersos de la media.

Para la variable SUELDO

variable mean p50 sd variance

x5 4150.956 4005 1311.555 1720177

Tabla n° 6. Muestra la media, mediana, desviación estándar y varianza


de la variable Sueldo.
Interpretación Tabla 6:
Podemos observar que la variable Sueldo posee una media de 4150.956, es decir que el sueldo que
reciben en promedio es de 4150.956 soles. También tiene una mediana, que quiere decir que el dato
central de la muestra, correspondiente al sueldo de 4005. En lo que a la moda respecta la hallaremos con
la ayuda de los gráficos anteriores, obteniéndose una moda de 2400. En lo que respecta al valor de la
desviación estándar y la varianza, vemos que hay una desviación del 1311.55 que nos indica que los
datos están muy dispersos de la media.

Para la variable TIEMPO DE SERVICIO

variable mean p50 sd variance

x6 13.28889 12 7.542673 56.89192

Tabla n° 7. Muestra la media, mediana, desviación estándar y


varianza de la variable Tiempo de servicia.

Interpretación Tabla 7:
En la tabla vemos que la variable Tiempo de servicio posee una media de 13.29, es decir que el tiempo
de servicio que tienen en promedio es de 13.29 años. También tiene una mediana, que quiere decir que
el dato central de la muestra, correspondiente a los años es el 12. En lo que a la moda respecta la
hallaremos con la ayuda de los gráficos anteriores, obteniéndose una moda de 12 años. En lo que
respecta al valor de la desviación estándar y la varianza, vemos que hay una desviación del 7.54 que nos
indica que los datos no están muy dispersos de la media

Para la variable NIVEL

variable mean p50 sd variance

x7 3.222222 4 1.125912 1.267677

Tabla n° 8. Muestra la media, mediana, desviación estándar y


varianza de la variable Tiempo de servicio.

Interpretación Tabla 8:
En esta última tabla de variables, veremos a la variable Nivel, que, según la muestra, posee un promedio
de 3.22 de nivel. También posee un dato central de la muestra que es el 4. Debemos adjuntar también la
moda que es el nivel 4, el que goza de mayor frecuencia en la muestra. En lo que respecta a los
estadísticos de dispersión, nos encontramos con una desviación estándar de 1.1259 lo cual nos dice que
los datos no se encuentran muy dispersos de la media.
5. Coeficientes de variación

Coeficiente de variación para SEXO/SUELDO

Interpretación Tabla 9:
-> x4 = F
En la tabla vemos que el coeficiente de variación
variable cv de sueldo de los varones es mayor al coeficiente
de variación del sueldo de las mujeres en la
x5 .2989572
muestra. Esto nos indica que los datos, de los
sueldos de los varones, están mucho más
dispersos que en el de las mujeres.
-> x4 = M

variable cv

x5 .3310759

Tabla n° 9. Muestra el coeficiente de dispersión


de Sexo/Sueldo

Coeficiente de variación para CARGO/SUELDO

Interpretación Tabla 10:


-> x1 = Coordinador
En la tabla vemos que el coeficiente de
variable cv variación de sueldo por cargo de los Jefes es
mayor al coeficiente de variación del sueldo de
x5 .1037639
los demás. Esto nos indica que los datos, de los
sueldos de los Jefes, están mucho más
dispersos que en el de los otros. En lo que
-> x1 = Empleado
respecta al sueldo de los Coordinadores, los
variable cv datos están mucho mas cerca a la media.

x5 .1395697

-> x1 = Gerente

variable cv

x5 .1387948

-> x1 = Jefe

variable cv

x5 .1499764

Tabla n° 10. Muestra el coeficiente de


dispersión de Cargo/Sueldo

You might also like