You are on page 1of 20

Estadística Descriptiva

Preparación de datos para su procesamiento

Antes de procesar los datos se han recopilado en una investigación, es necesario crear un archivo
que permita acceder a la información de manera simple, y con la seguridad de que está trabajando
con los datos deseados.

Estadística en comics (1993)

1 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
Para organizar los datos es necesario tener presente que en el archivo se deben tener muy bien
definidos los conceptos “campo de datos” y registro”.

Un campo de datos viene a ser el espacio donde se guardan los datos de una misma variable,
mientras que en un registro es el espacio reservado para guardar los datos de una misma unidad
elemental (persona, artículo, empresa, etc.) Tomando como base la estructura de una hoja Excel,
se puede considerar que las columnas pueden ser asociadas a los campos de datos; es decir cada
columna debe contener datos de una sola variable; del mismo modo, las filas pueden ser asociadas
a los registros de datos; es decir cada fila deben figurar solamente los datos de una unidad
elemental (persona, empresa, articulo, etc.) tal como se muestra en la siguiente imagen.

Registro de datos

Campo de datos

a) Creación de un archivo de datos con Excel

Hay varias formas de ingresar los datos a una computadora. La forma más simple y una de las
más usadas para ingresar una cantidad pequeña de datos es mediante el uso de programa
Excel. Como se menciono anteriormente, en una hoja de Excel las columnas (campo de datos)
definen el tipo de información almacenada (variables) y las filas (registros de datos) definen la
unidad elemental a la que pertenecen los datos registrados.

Para crear un archivo de datos, se procede de la siguiente manera.

2 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
1.- Abrir una hoja Excel en blanco y poner en la primera fila las etiquetas o nombres simplificados
de las columnas. Cada columna, llamada “campo de datos”, debe ser asociada a una variable que
se ha incluido en la encuesta o cuestionario.

2.- Activar el desplazamiento del cursor hacia la derecha. Para ello, debe elegir primero la opción
“Mas comandos”.

3 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
3.- En la pantalla que aparece a continuación debe elegir “opciones” avanzadas” (1), luego habilitar
las opciones de desplazamiento del cursor (2) y, finalmente elegir la opción “derecha”

1 2

Cuando digite los datos y presione la tecla “Enter” el cursor se desplazará hacia la derecha
facilitando con el ingreso de los datos de una encuesta. Recuerde que posteriormente debe
realizar los pasos anteriores para retomar al modo usual del desplazamiento del cursor.

4.- Ingresar los datos utilizando el formulario de datos creado con Excel.

Colocar el cursor en la primera celda disponible (columna A, fila 2), luego comenzar a digitar los
datos correspondientes a la primera encuesta. Cuando termine de digitar un dato, presiones
“Enter”para que el cursor se desplace a la celda de la derecha, para digitar el siguiente dato.

4 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
Al terminar de ingresar los datos recopilados en todas las encuestas aplicadas, se tendrá una hoja
Excel en las que las columnas definen el tipo de información almacenada (variables), y las filas
definen la unidad elemental a la cual pertenecen los datos ingresados.

Variable (campo de de datos)

Registro de datos (recopilados den una encuesta)

El proceso de digitación de datos en una hoja Excel es lento y tedioso; no obstante, es totalmente
válido cuando la cantidad de datos por ingresar no es elevada.

En aquellos casos en los que se requiere ingresar los datos de un elevado número de encuestas, es
preferible utilizar otros programas y/o medios.

5 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva

Organización y presentación de los datos

La organización de los datos constituye la primera etapa de su tratamiento, pues,


facilita los cálculos posteriores y evita posibles confusiones. Realmente, la
organización de la información tiene una raíz histórica y aunque actualmente con el
desarrollo de los medios informáticos deja de tener importancia desde un punto de
vista aplicado, desde la perspectiva de la enseñanza de la Estadística tiene un gran
valor conceptual.
La organización va a depender del número de observaciones distintas que se
tengan y de las veces que se repitan cada una de ellas. La descripción consiste en
facilitar el entendimiento de tendencias, similitudes y diferencias de los datos
recolectados. También son importantes las mediciones de resumen, variabilidad y
de frecuencia.

6 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva

2.2.1.- Tablas de distribución de frecuencias


En el trabajo estadístico, lo que se tiene disponible en un primer momento es un
material numérico o cualitativo, producto de la recopilación de datos, que son
categorizados ordenados, procesados y presentados en cuadros o gráficos.

A. Distribución de frecuencias datos cualitativos


Una distribución de frecuencias es una tabla que resume los datos mostrando la
frecuencia o número de elementos que dentro de cada una de las clases, que
deben ser mutuamente excluyentes y colectivamente exhaustivas. El objetivo es
proveer información acerca del conjunto de datos que no podría obtenerse
rápidamente por simple observación de los datos originales. La mejor manera de
examinar los datos categóricos o cualitativos, implica organizar y presentar un
conjunto de datos en forma tabular y gráfica. No obstante, con frecuencia esos
datos son categóricos, no numéricos.

Un punto que es necesario resaltar es la elección del título apropiado para cada
cuadro, tabla o grafico. Debe evitarse incluir palabras o frases que distorsionan el
mensaje que proporcionan y que de alguna manera, inducen a establecer una
relación con una situación específica.

Ejemplo 01:

Tabla Nº 01
Actividades que realizan las mujeres. Chiclayo Diciembre 2012.
Frecuencia Frecuencia
Número de
relativa relativa
Actividad que realiza mujeres
simple simple %
ni hi hi%
Estudiante 79 0.56 56.43
Trabaja 23 0.16 16.43
Estudia y trabaja 31 0.22 22.14
Ama de casa 7
0.05 5.00
TOTAL 140 1.00 100.00

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre


la preferencia de consumo de productos cosméticos. Dic. 2012.

1. Frecuencia absoluta simple (ni): Resulta del conteo de cada una de las
categorías de la variable.

Interpretación de las frecuencias absolutas observadas n i:

7 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
n1= 79 mujeres manifestaron que la actividad que realizan es ser ama de
casa.
n2= 23 mujeres manifestaron que la actividad que realizan es trabajar.

2. La frecuencia relativa simple (hi): Permite mostrar la porción o fracción del número
total de observaciones en cada clase. Para convertir una distribución de frecuencia
a una distribución de frecuencias relativas, cada una de las frecuencias de clase se
divide entre el número total de frecuencias
n
hi  i
n
n1 79 n 23
h1    0.56 h2  2   0.16
n 140 n 140

h1= 0.56, se interpreta como la proporción de mujeres que manifestaron ser


amas de casa.
h4 = 0.16, se interpreta como la proporción de mujeres que manifestaron
que trabajan.

3. La frecuencia relativa porcentual: hi% , hi (100) ó % : resulta de multiplicar la


frecuencia relativa h; por 100 así:

h 1 %= 0.56*100=56.43 h 2 %=0.16*100=16.43

h 1 %=56.43%, porcentaje de mujeres que manifestaron ser amas de casa.


h 2 %=16.43% porcentaje de mujeres que manifestaron que trabajan.

8 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
Ejemplo 02:

Tabla N° 02

Tipo de contrato de las enfermeras del HAAA. Chiclayo 2011.

Número de Frecuencia relativa Frecuencia relativa


Tipo de contrato enfermeras simple simple%
ni hi hi%
Contratado 28 0.61 60.87
Nombrado 18 0.39 39.13
Total 46 1.00 100

Fuente: encuesta aplicada a las enfermeras de HNAAA. Chiclayo 2010.

Gráficos

Los gráficos de dos variables, se construye en el plano rectangular o de coordenadas


cartesianas, donde hay dos ejes, X e Y. En el eje Y (ordenada) se colocan los valores de la
variable dependiente y en X (abcisa) la variable independiente, siendo y =f(x).

2.- Principales partes de un gráfico

1.- Titulo: Expresa el contenido del grafico y por lo general, es igual o parecido al
título del cuadro estadístico que sirvió de referencia, debe indicar claramente la
naturaleza del fenómeno representado.

2.- Escalas: Para graficar se utiliza el sistema cartesiano, compuesto por dos ejes:
uno horizontal llamado abscisa; y el otro vertical llamado ordenada. Ambos ejes
se cortan en un punto llamado origen.
Las escalas vienen a ser la graduación de ambos ejes, según la naturaleza de las
variables y frecuencias correspondientes.

3.- Cuerpo: Es el grafico en sí, y constituye la representación en dibujo de los datos.

4.- Fuente: Indica el origen de los datos estadísticos que se está representando en
el gráfico.

9 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
Gráfico de barras

Son gráficos de barras rectangulares cuya altura es proporcional al porcentaje que de


casos en cada categoría o nivel de la variable. Si la variable tiene muchas categorías, una
alternativa es hacer el gráfico con barras horizontales en vez de verticales.

Gráfico de barras simples


Para su elaboración se debe contar con una tabla de entrada simple.

Gráfico N° 01

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre la preferencia de


consumo de productos cosméticos. Dic. 2012.

Gráfico N° 02

Fuente: encuesta aplicada a las enfermeras de HNAAA. Chiclayo 2010.

10 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
Gráfico de Sectores

También llamado Gráfico Sectorial o Torta, es un círculo dividido en porciones


proporcionales al porcentaje de cada nivel respecto al total de datos. Cada porción se
obtiene multiplicando las frecuencias relativas por 360°, obteniéndose los grados para
cada porción de la torta.

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre


la preferencia de consumo de productos cosméticos. Dic. 2012.

Fuente: encuesta aplicada a las enfermeras de HNAAA. Chiclayo 2010.

Nota: También se pueden utilizar efectos tridimensionales para lograr una mejor
presentación.

11 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
Ejemplo 3: En relación con el ejemplo anterior del estudio de las preferencias de los
productos cosméticos también se analizo la actividad que realizan según el uso habitual de
los productos.

Tabla N° 03
Actividad que realiza según el uso de cosméticos en las mujeres de la
ciudad de Chiclayo. Dic. 2012.

Usas cosméticos habitualmente


Si No
Actividad que Frecuencia Frecuencia Frecuencia Frecuencia
Número de Número de
realiza relativa relativa relativa relativa
mujeres mujeres
simple simple % simple simple %
ni hi hi% ni hi hi%
Estudiante 66 0.57 56.90 13 0.54 54.17
Trabajo 18 0.16 15.52 5 0.21 20.83
Estudia y trabaja 26 0.22 22.41 5 0.21 20.83
Ama de casa 6 1
0.05 5.17 0.04 4.17
Total 116 1.00 100.00 24 1.00 100

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre la preferencia de consumo de productos
cosméticos. Dic. 2012.

Las frecuencias de este cuadro se obtienen de manera similar a lo explicado


anteriormente, con la diferencia de que las frecuencias relativas y porcentuales referidas a
las categorías Si y No se obtienen considerando a 116 mujeres para el primer caso y 24
mujeres para el segundo.

Gráfico N° 03

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre la preferencia de consumo de productos
cosméticos. Dic. 2012.

12 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva

En este caso se puede apreciar, es conveniente adicionar una leyenda para indicar el color
que representa a cierta información. Por otro lado, también puede observarse que existe
una separación entre cada grupo de barras verticales equivalente a la mitad del ancho de
cada grupo se debe tener en cuenta que si los nombres o etiquetas de las categorías son
grandes es preferible utilizar el gráfico de barras horizontales, cuya construcción es similar
a lo indicado anteriormente. Del mismo modo se pueden presentar gráficos en tres
dimensiones.

Gráfico N° 04 : Actividad que realiza según el uso de cosméticos en las mujeres de la


ciudad de Chiclayo. Dic. 2012.

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre


la preferencia de consumo de productos cosméticos. Dic. 2012.

13 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
B. Distribución de frecuencias variables cuantitativos discretos

Cuando se tiene datos cuantitativos discretos cuyo número de resultados no es grande


(no mayor de 12 datos), la información puede ser clasificada y presentada
directamente, es decir cada valor de la variable constituye una clase o una categoría.

En primer lugar se ordena los valores de la variable discreta de menor a mayor, a


continuación se obtienen las frecuencias absolutas, ósea el número de veces que se
repite un valor de la variable. Las otras frecuencias que se hallan son las siguientes:

Frecuencia absoluta: frecuencia absoluta del valor Y i al número de veces que


aparece este valor en el conjunto de observaciones y se representa por ni donde
i =1,2,3,……m.

Frecuencia relativa: indica la proporción con que se repite un valor. Se obtiene


dividiendo la frecuencia absoluta ante el tamaño de la muestra. Para una mejor
interpretación es más conveniente multiplicarla por 100 para trabajar con una
frecuencia relativa porcentual.

Frecuencia absoluta acumulada: indica el número de valores que son menores o


iguales que el valor dado.

Frecuencia relativa porcentual acumulada: Indica el porcentaje de datos que son


menores o iguales que el valor dado.

Ejemplo de tabla de frecuencia de datos cuantitativos discretos

Suponga que en un estudio socioeconómico se observó, entre otras variables, el


número de de trabajadores eventuales que tienen las empresas comerciales en la
región de la ciudad de Chiclayo. Mediante una muestra de 40 empresas, se encontraron
los siguientes resultados

Número de trabajadores
4 5 7 7 7 8 8 7 7 7
10 10 8 9 5 6 7 5 8 8
5 6 6 6 9 7 8 9 5 6
8 10 9 8 7 10 9 4 8 9
a) Construya una tabla de distribución de frecuencias absolutas para estos datos.
b) Interprete cada frecuencia absoluta.

14 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
Solución:

1.- En primer lugar se observa que el conjunto de observaciones es de tamaño 40, luego

n = 40.

2.- En segundo lugar, identificamos el numero de categorías observaciones m= 5

Y1 = 4 , Y2= 5, Y3 = 6, Y4= 7, Y5= 8, Y6= 9, Y7= 10

3.- Elaboración de la tabla con sus frecuencias absolutas.

Frecuencia absoluta
Número de trabajadores simple
eventuales
ni
4 2
5 5
6 5
7 9
8 9
9 6
10 4
Total 40

Interpretación de las frecuencias absolutas observadas n i:


n1 = en 2 empresas se observó que el número de trabajadores eventuales fue igual
a 4.
n2= en 5 empresas se observó que el número de trabajadores eventuales fue igual a
5.

La tabla de distribución de frecuencias, se puede construir no solo con respecto a


las frecuencias absolutas, sino también con respecto a otro tipo de frecuencias,
tales como: las relativas, las absolutas acumuladas, las relativas acumuladas, etc.
Las cuales se definen como sigue:

2.- La frecuencia acumulada : Ni se obtiene sumando iterativamente las frecuencias


absolutas.
N 1 = 2, N 2 =n 1 + n 2 = 2 + 5 = 7

La ultima frecuencia acumulada es igual al tamaño de la muestra, las frecuencias


acumuladas se usan para construir la ojiva o polígono acumulativo.
N2 =7, significa que en 7 empresas se observó que el número de trabajadores
eventuales fue de 5 o menos trabajadores.

15 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
3.- La frecuencia relativa simple: hi , se obtiene por división de ni/n así:
n 2
h1  1   0.050
n 40

h1= 0.050, se interpreta como la proporción de empresas que tienen 4


trabajadores eventuales.
n 5
h2  2   0.125
n de40
h2 = 0.125, se interpreta como la proporción empresas que tienen 5
trabajadores eventuales.

4.- La frecuencia relativa acumulada: Hi , se obtiene sumando iterativamente las


frecuencias relativas simple.

H1 = h1 = 0.050 H2 = h1 + h2 = 0.050 + 0.125 = 0.175

H2 = 0.175, es la proporción de empresas que tienen 5 o menos trabajadores


eventuales.

5.- La frecuencia relativa porcentual: hi% , hi (100) ó % : resulta de multi plicar la


frecuencia relati va h; por 100 así:

h 1 %= 0.050 *100 = 5.00 h 2 %=0.125*100=12.5

h 1 %=5%, de empresas se observó que el número de trabajadores


eventuales fue igual a 4.

h 2 %=12.5% de empresas se observó que el número de trabajadores


eventuales fue igual a 5.

6.- La frecuencia relativa porcentual acumulada: Hi%, se obtiene sumando iterativamente


las frecuencias relativas porcentual.

H1% =h1% = 5 H2%= h1% + h2% =17.5

H2%= 17.5 %, de empresas de empresas se observó que el número de


trabajadores eventuales fue de 5 o menos trabajadores.

16 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
Tabla N° 04

Distribución del número de trabajadores eventuales en Empresas Comerciales.


Chiclayo 2013.

Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


Número de Frecuencia
absoluta absoluta relativa relativa relativa
trabajadores relativa simple
simple acumulada acumulada simple% acumulada%
eventuales
ni Ni Hi Hi hi% Hi%
4 2 2 0.050 0.050 5.000 5.000
5 5 7 0.125 0.175 12.500 17.500
6 5 12 0.125 0.300 12.500 30.000
7 9 21 0.225 0.525 22.500 52.500
8 9 30 0.225 0.750 22.500 75.000
9 6 36 0.150 0.900 15.000 90.000
10 4 40 0.100 1.000 10.000 100.000
Total 40 1.000 100.000

Fuente: Encuesta aplicada a las empresas comerciales. Chiclayo Enero 2013.

Gráficos para Variables Cuantitativas Discretas

Diagrama de Barras

Es un gráfico utilizado para representar la distribución de frecuencias de una variable


cualitativa y cuantitativa discreta. Puede graficarse en forma horizontal o vertical.

Fuente: Encuesta aplicada a las empresas comerciales. Chiclayo Enero 2013.

Diagrama de bastones (ESPECTRO).- Es un gráfico utilizado para representar una


distribución de frecuencias o frecuencias relativas de una variable numérica (en general
discreta) sin agrupar.
17 Est. Sandra Cecilia Loaiza Chumacero.
Estadística Descriptiva

Diagrama en escalera.- Es un gráfico utilizado para representar la distribución de


frecuencias acumuladas de una variable discreta numérica.

BIBLIOGRAFÍA

 Apuntes de clase: Sandra Loaiza Chumacero “Estadística Descriptiva ” (USAT. 2017).

18 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
 Apuntes de clase: Sandra Loaiza Chumacero “Estadística Inferencial ” (USAT. 2017).

 Johnson Robert, Kuby Patricia (2008). Estadística elemental: Lo esencial. Cengage


Learning Editores, S.A.

 Prieto Luis, Herranz Inmaculada (2010). Biosestadística: sin dificultades matemáticas.


En busca de tesoros escondidos. Ediciones Díaz de Santos.

 Martinez Ciro. (2012). Estadística y muestreo. (13va. Ed.) Bogotá: Ecoe Ediciones.

 Alvarado Pintado, Agurto Hugo (2009). Estadística para Administración y Economía


con aplicaciones en Excel. (1ra Ed. ) Lima : Editorial San Marcos E.I.R.L.

 Daniel, Wayne W.(2006). Bioestadística: base para el análisis de las ciencias de la salud
/ Wayne W. Daniel. México, D.F. : Limusa Wiley.

 Pagano, Marcelo (2001). Fundamentos de bioestadística. México, D.F. : Thomson.

 Mendenhall, William Robert J. Beaver, Barbara M. Beaver(2010). Introducción a la


probabilidad y estadística / William Mendenhall, México, D.F. : Cengage Learning,

 Daza Jorge (2006). Estadística Aplicada con Microsoft Excel (2006). (1ra Ed. ) Lima :
Editorial Megabyte.

 Rodríguez Jesús, Pierdant Alberto, Rodríguez Cristina (2008). Estadística para


Administración (1ra Ed. ) México: Grupo Editorial Patria. S.A.

 Barreno, Emma; Chue, Jorge; Millones, Rosa; Vásquez, Félix; Castillo, Carlos (2010).
Estadística Aplicada (1ra Ed., 1ra reimp.), Lima: Universidad de Lima, Fondo Editorial.

 Fernández, Antonio; Fernández, Inés M. (2009). Cuadernos de Estadística Crítica y


Alternativas a la significación Estadística en el contraste de hipótesis (1ra Ed. ) Madrid
: La Muralla, S.A.

 Quevedo, Hector; Pérez, Blanca (2008). Estadística para Ingeniería y Ciencias (1ra Ed. )
México: Grupo Editorial Patria. S.A.

 Quezada, Nel (2010). Estadística para Ingenieros. (1ra Ed. ) Lima : Empresa Editora
Macro E. I. R. L.

 Toma, Jorge; Rubio, Jorge (2012) Estadística Aplicada Primera Parte (2da Ed.) Lima:
Centro de Investigación de la Universidad del Pacífico (Apuntes de Estudio; 64).

 Toma, Jorge; Rubio, Jorge (2012) Estadística Aplicada Segunda Parte (1ra Ed. ) Lima:
Centro de Investigación de la Universidad del Pacífico (Apuntes de Estudio; 69).

19 Est. Sandra Cecilia Loaiza Chumacero.


Estadística Descriptiva
 Cordova, Manuel (2008) Estadística Aplicada (1ra Ed.) Lima: Editorial Librería Moshera
S.R.L.

20 Est. Sandra Cecilia Loaiza Chumacero.

You might also like