You are on page 1of 15

Distribución de frecuencias

ORGANIZACIÓN DE DATOS: CLASIFICACIÓN DE EVENTOS Y


CARACTERISTICAS

1. Criterios de clasificación de los datos

Los datos se clasifican de acuerdo con el tipo de la característica a que pertenecen y con este
propósito se han definido las series estadísticas que se clasifican en:

a) Series cualitativas

La característica está referida a una cualidad o estado de la unidad de estudio, no proporciona un


valor numérico. Ejemplo: sexo, ocupación laboral, lugar o el país de residencia, carrera
estudiada, rama de actividad de la empresa, idioma, causa de la enfermedad, tipo de tratamiento.

b) Series cuantitativas

La característica es medible o numérica. Estas características se clasifican en: discretas o


continuas.

Características cuantitativas discretas

Se obtienen de un número finito de posibles valores, generalmente enteros, que pueden contarse,
esto es: 0,1, 2, 3,4, ... Por ejemplo: número de hijos, número de trabajadores, número de mujeres,
número de libros, número de asegurados, número de préstamo, número de pacientes atendidos,
número de medicamentos, número de días de incapacidad, días de estancia.

Características cuantitativas continuas

Son las mediciones que se obtienen de un número infinito de posibles valores dentro de un
intervalo. Por ejemplo: peso, edad, estatura, salario, área de terreno, tiempo de recuperación,
nivel de colesterol en la sangre.

c) Series cronológicas

Los datos están referidos a un período de tiempo, que puede ser: años, meses, días, semanas,
horas, minutos, segundos, etc.

d) Series geográficas

Los datos se clasifican de acuerdo con su distribución espacial, como por ejemplo: países,
provincias, cantones, distritos, regiones.

María Marjorie Mora Valverde 1


Distribución de frecuencias

1.2 Requisitos de estas clasificaciones

a) Se definen adecuadamente las características y las categorías que la componen.


b) Las categorías deben ser mutuamente excluyentes: los datos se ubican en una y solo una de
las categorías.
c) Las categorías deben ser exhaustivas: todos los datos quedan incluidos en las categorías
definidas.

2. DISTRIBUCIÓN DE FRECUENCIAS

Se llama distribución de frecuencias al agrupamiento y clasificación de los datos, de una


población o de una muestra, de acuerdo con una o dos características, o variables, que se han
obtenido de las unidades de estudio. Este agrupamiento muestra las relaciones entre los datos de
un conjunto y facilita el análisis.

Antes de generar las distribuciones de frecuencias del conjunto de datos, que generalmente se
encuentran almacenados en una base de datos, es necesario revisar y tabular los datos.

2.1 Procesamiento de los datos

Finalizado el trabajo de campo, se realiza el procesamiento de los datos, que consiste en convertir
la información en datos que sean susceptibles de ser analizados estadísticamente. Este trabajo
comprende las siguientes tareas que se le harán al cuestionario:

a) Revisión y crítica

El entrevistador al concluir su labor diaria debe revisar los cuestionarios, lo mismo hace el
supervisor del grupo, más tarde cuando los cuestionarios se llevan a la oficina se realiza una
nueva revisión de inconsistencias, omisión de respuestas, anotaciones ilegibles, etc.

b) Codificación

Se listan las respuestas a las preguntas abiertas, se clasifican en varias categorías, según
corresponda, y luego se les asigna códigos numéricos.

c) Digitación

En una base de datos que se tiene preparada para este propósito se digitan los datos de los
cuestionarios.
d) Tabulación

Finalmente se procede a la tabulación de los datos, construyendo cuadros con distribuciones de


frecuencias para una o más variables de la encuesta. Con las tabulaciones de los datos se procede
a analizar la consistencia de las respuestas obtenidas, se elaboran cuadros y gráficos, se calculan
las medidas de interés y se aplican las técnicas indicadas en los objetivos de la investigación.

María Marjorie Mora Valverde 2


Distribución de frecuencias

2.2 Distribución de frecuencias para características cualitativas


Distribución de frecuencias según sexo: con valores absolutos y con relativos con respecto al
total de columna simple con la proporciones con respecto al total de columna

Gráfico N°1
ESTUDIANTES DE UN CURSO DE ESTADÍSTICA
SEXO Total Proporción DE LA UNIVERSIDAD DE COSTA RICA
Sexo II semestre 2007
Hombres 17 0,45
Mujeres 21 0,55
Total 38 1,00 Mujeres

Hombres

0 5 10 15 20 25
Número de estudiantes
Fuente: Escuela de Estadística de la Universidad de Costa Rica, 2007.

Distribución de frecuencias según carrera: con valores absolutos y con relativos respecto al total
de columna de doble entrada proporciones con respecto al total por columnas

Total por columnas

Carrera Total Hombres Mujeres PROPORCIONES


Total Hombres Mujeres
Microbiología 10 3 7 0,26 0,18 0,33
Farmacia 7 4 3 0,18 0,24 0,14
Medicina 7 5 2 0,18 0,29 0,10
Zootecnia 6 3 3 0,16 0,18 0,14
Nutrición 5 1 4 0,13 0,06 0,19
Biología 2 1 1 0,05 0,06 0,05
Odontología 1 0 1 0,03 0,00 0,05
Total 38 17 21 1,00 1,00 1,00

María Marjorie Mora Valverde 3


Distribución de frecuencias

Gráfico N°2
ESTUDIANTES DE UN CURSO DE ESTADÍSTICA DE LA UNIVERSIDAD DE COSTA RICA,
SEGÚN CARRERA
II semestre 2007
Número de estudiantes
Carrera 0 2 4 6 8

Microbiología

Farmacia

Medicina

Mujeres
Zootecnia
Hombres
Nutrición

Biología

Odontología

Fuente: Escuela de Estadística de la Universidad de Costa Rica, 2007.

Gráfico N°3
ESTUDIANTES DE UN CURSO DE ESTADÍSTICA DE LA UNIVERSIDAD DE COSTA RICA,
SEGÚN CARRERA
II semestre 2007
Número de estudiantes
Carrera 0 2 4 6 8 10 12

Microbiología

Farmacia

Medicina

Mujeres
Zootecnia
Hombres
Nutrición

Biología

Odontología

Fuente: Escuela de Estadística de la Universidad de Costa Rica, 2007.

María Marjorie Mora Valverde 4


Distribución de frecuencias

Distribución de frecuencias por según carrera: con valores absolutos y con relativos respecto al
total de filas de doble entrada proporciones con respecto al total por

Total por filas

Carrera Total Hombres Mujeres PROPORCIONES


Total Hombres Mujeres
Microbiología 10 3 7 1,00 0,30 0,70
Farmacia 7 4 3 1,00 0,57 0,43
Medicina 7 5 2 1,00 0,71 0,29
Zootecnica 6 3 3 1,00 0,50 0,50
Nutrición 5 1 4 1,00 0,20 0,80
Biología 2 1 1 1,00 0,50 0,50
Odontología 1 0 1 1,00 0,00 1,00
Total 38 17 21 1,00 0,45 0,55

2.3 DISTRIBUCIÓN DE FRECUENCIAS PARA CARACTERÍSTICAS


CUANTITATIVAS
Actualmente, el objetivo de las distribuciones de frecuencias es resumir grandes conjuntos de
datos, pero para propósitos didácticos utilizaremos conjuntos pequeños. Una distribución de
frecuencias según grupos o intervalos de una característica continua o discreta es una tabla de la
siguiente forma:

Frecuencia Frecuencia Frecuencia


Límites de Frecuencia relativa
absoluta Porcentaje acumulada acumulada más
clase (fr) o proporción
(f) menos de (F) de (F↑)
Li - Ls f1 f1/n f1/n * 100 F1 F1

Li - Ls f2 f2/n f2/n* 100 F2 F2

Li - Ls f3 f3/n f3/n* 100 F3 F3

... ... ... ... ... ...

fn fn/n fn/n* 100 Fn Fn

Total 1,00 100,00

Simbología:

Li: límite inferior de la clase


Ls: límite superior de la clase

María Marjorie Mora Valverde 5


Distribución de frecuencias

f: número de observaciones de la clase


F: número de observaciones acumuladas de la clase
fr: número de observaciones de la clase con respecto al total de datos del conjunto

2.3.1 Para características cuantitativas discretas

A continuación se describen los pasos para elaborar una distribución de frecuencias para una
variable cuantitativa discreta, con el número de créditos de 45 estudiantes de un curso de
estadística:

13 15 18 13 19 23 20 20 24 21 18 19 19 17 17
14 16 18 19 22 20 20 23 19 19 18 14 16 18 17
22 23 22 21 20 19 20 22 18 20 21 22 19 17 16
Pasos para construir una distribución de frecuencias:

1. Se ordenan los datos por magnitud, del menor al mayor valor:

13 13 14 14 15 16 16 16 17 17 17 17 18 18 18

18 18 18 19 19 19 19 19 19 19 19 20 20 20 20

20 20 20 21 21 21 22 22 22 22 22 23 23 23 24

2. Se construye un arreglo ordenado

Créditos Frecuencia
13 2
14 2
15 1
16 3
17 4
18 6
19 8
20 7
21 3
22 5
23 3
24 1
Total 45

María Marjorie Mora Valverde 6


Distribución de frecuencias

3. Se determina el número de clases o agrupaciones de los datos

Corresponde a los grupos o intervalos en los cuales se ubican, una única vez, las observaciones o
datos.

Es un requisito que las clases sean mutuamente excluyentes y exhaustivas.

Clases mutuamente excluyentes

Las observaciones se ubican en una y solo una de las clases.

Clases exhaustivas

Todas las observaciones del conjunto de datos quedan incluidas en alguna de las clases definidas.

¿Cómo se determina el número de clases o de intervalos?

Se debe tener en cuenta que el objetivo de la distribución de frecuencias es resumir el conjunto de


datos para interpretarlo mejor, por esta razón no es conveniente definir muchas clases; tampoco
se debe escoger muy pocas porque se pierde información. Esta es una decisión que debe tomar el
estudiante o el investigador después de conocer muy bien el tipo y cantidad de datos que desea
ordenar.

En algunos libros de estadística se recomienda utilizar entre 6 y 15 intervalos o clases; menos de


6 podría indicar que se han resumido los datos más de la cuenta y más de 15 que no se han
resumido adecuadamente. No se debe olvidar que esta es una recomendación y que la cantidad de
clases depende mucho de la cantidad de datos y del interés del investigador.

El número de clases se puede aproximar por medio de la fórmula de Sturges, que dice:

K = 1+3,322 (log10 n) (1) donde

K: número de clases o intervalos

n: total de datos del conjunto

Este resultado debe ser adaptado de acuerdo con los intereses del investigador y el tipo de datos.

En el ejemplo si usamos esta fórmula tenemos que:

K = 1+3,322 (log10 45), 1+3,322 (1,6532) = 6,49

Se podría usar seis o siete clases, usaremos seis.

María Marjorie Mora Valverde 7


Distribución de frecuencias

3. Amplitud o tamaño del intervalo de la clase

Se determina dividiendo R/K, tal que:

R: es el rango o recorrido de los datos. El valor del rango es la diferencia entre el mayor y el
menor valor del conjunto.

K: número de clases

Amplitud o tamaño del intervalo = rango / número de clases (2)

La amplitud que se obtenga con esta fórmula podría ser un número un poco incómodo de
manejar, por tanto se recomienda que se utilice un número fácil de explicar y de comprender la
información que se desea comunicar. Se prefieren intervalos de tamaño 5 o 10 o múltiplos de
10.

Para determinar el tamaño de los intervalos del ejemplo se procede de la siguiente manera:

Se calcula el rango, tal que: R = 24 - 13 = 11

Tamaño del intervalo = 11 / 6 = 1,83 ≈ 2

Se utilizará un tamaño de intervalo de tamaño 2, porque es más cómodo, que la fracción de 1,83.
También se podría trabajar con seis clases o con ocho clases.

Si uno de los dos términos está definido, ya sea el número de clases o el tamaño del intervalo,
con solo utilizar la fórmula anterior (2) queda determinado el término que falta.

4. Con el número de clases y el tamaño de los intervalos determinados (6 clases de tamaño 2), se
procede a elaborar las clases de la distribución de frecuencias con los límites dados, como la
variable es discreta estos serán los límites definitivos.

Límites dados de la clase

13 - 14
15 - 16
17 - 18
19 - 20
21 - 22
23 - 24

María Marjorie Mora Valverde 8


Distribución de frecuencias

Para el ejemplo tenemos que, después de calcular los límites se asignan a cada intervalo las
observaciones que el corresponden, que llamamos frecuencia absoluta y que se indican a la par
del arreglo ordenado de la página 5. Luego se acumulan las frecuencias absolutas para obtener las
frecuencias acumuladas que aparecen en la tercera columna ( 2; 2+3; 5+10; 15+8; 23+6; 29+1).
Con la fórmula que aparece en la tabla de la página 4 se calculan las frecuencias relativas
simples y por último se multiplican por 100 las frecuencias relativas para tener los porcentajes.
Se ha incluido también, en esta distribución de frecuencias, las frecuencias acumuladas “más de”,
que acumulan las frecuencias absolutas en orden inverso, es decir del último límite al primero (4;
4+8; 12+15; 27+10; 37+4; 41+4). Así ser logra completar la tabla siguiente:

Frecuencia
Frecuencia Frecuencia
Número de Frecuencia relativa acumulada
absoluta acumulada Porcentaje
créditos (fr) o proporción menos de
(f) menos de (F)
(F↑)
13 - 14 4 4 0,089 8,9 45

15 - 16 4 8 0,089 8,9 41

17 - 18 10 18 0,222 22,2 37

19 - 20 15 33 0,333 33,3 27

21 - 22 8 41 0,178 17,8 12

23 - 24 4 45 0,089 8,9 4

Total 45 1,000 100

2.3.2 Para características cuantitativas continuas


Ejemplo:

Los siguientes datos corresponden a las estaturas (en cm, redondeados a la unidad más próxima)
de los 54 estudiantes de un curso de estadística impartido en el I semestre del año 2007:

153 153 156 156 157 157 158 158 158 160 160 160 160
161 161 161 161 162 162 162 162 164 164 164 164 165
167 167 167 167 168 168 168 168 169 169 172 172 173
173 173 174 175 175 175 177 177 177 179 179 183 183
185 187

Para construir una distribución de frecuencias se seguirá los mismos pasos indicados para la
distribución de frecuencias de una variable discreta.
Pasos para construir una distribución de frecuencias:

María Marjorie Mora Valverde 9


Distribución de frecuencias

1. Se ordenan los datos, por magnitud, en un arreglo ordenado

Estatura Frecuencia
153 2
156 2
157 2
158 3
160 4
161 4
162 4
164 4
165 1
167 4
168 4
169 2
172 2
173 3
174 1
175 3
177 3
179 2
183 2
185 1
187 1
Total 54

2. Determinar el número de clases


Si no se tiene definido el número de clases, se puede utilizar la fórmula de Sturges, para
determinar el número de clases más adecuado de la distribución.

K = 1+3,322 (log10 n) (1) donde

K: número de clases o intervalos

n: total de datos del conjunto

En el ejemplo si usamos esta fórmula tenemos que:

Usando la fórmula de Sturges: K = 1+3,322 (log10 54), 1+3,322 (1,73239376) = 6,7550 ≈ 7

María Marjorie Mora Valverde 10


Distribución de frecuencias

3. Amplitud o tamaño del intervalo de la clase

Se determina dividiendo R/K, tal que

Amplitud o tamaño del intervalo = rango / número de clases (2)

Para determinar el tamaño de los intervalos del ejemplo se procede de la siguiente manera:

se calcula el rango, tal que

R = 187 – 153 = 34

Amplitud = 34 / 7 = 4,85≈5

4. Límites dados

Con el número de clases y el tamaño de los intervalos se procede a elaborar las clases de la
distribución de frecuencias con los límites dados, es decir como si la variable fuera discreta, hasta
que se llenan todos los componentes de la tabla. Se construyen los límites para 7 clases de
tamaño 5

Límites dados de la clase


153 - 157
158 - 162
163 - 167
168 - 172
173 - 177
178 - 182
183 - 187

5. Límites reales

Si la variable es continua, sucede que para este nivel de medición hay muchos valores
intermedios entre el límite superior de una clase y el límite inferior de la siguiente, y se deben
construir los límites reales de acuerdo con el tipo de redondeo de los datos cuando se recogieron.
Los datos pueden haberse redondeado, de acuerdo con los siguientes criterios:

Redondeo a la unidad más próxima


Se resta 0,5 al límite inferior y se suma 0,5 al límite superior.
Redondeo al décimo más próximo
Se resta 0,05 al límite inferior y se suma 0,05 al límite superior.

María Marjorie Mora Valverde 11


Distribución de frecuencias

Redondeo al centésimo más próximo


Se resta 0,005 al límite inferior y se suma 0,005 al límite superior.

Así sucesivamente.

En el ejemplo, la estatura que es una variable continua, por tanto, es necesario calcular los límites
reales y como los datos se redondearon a la unidad más próxima, se resta 0,5 al límite inferior y
se suma 0,5 al límite superior, de la siguiente forma:

Límites reales de clase

152,5 - 157,5
157,5 - 162,5
162,5 - 167,5
167,5 - 172,5
172,5 - 177,5
177,5 - 182,5
182,5 - 187,5

Después de que se calculan estos límites, se procede a completar la tabla de la distribución de


frecuencias que se presenta a continuación:

Frecuencia Frecuencia
Límites reales Frecuencia relativa (fr)
absoluta acumulada menos Porcentaje
de clase o proporción
(f) de (F)
152,5 - 157,5 6 6 0,111 11,1

157,5 - 162,5 15 21 0,278 27,8

162,5 - 167,5 9 30 0,167 16,7

167,5 - 172,5 8 38 0,148 14,8

172,5 - 177,5 10 48 0,185 18,5

177,5 - 182,5 2 50 0,037 3,7

182,5 - 187,5 4 54 0,074 7,4

Total 54 1,000 100,0

María Marjorie Mora Valverde 12


Distribución de frecuencias

Ejemplo:

A continuación se describen los pasos para elaborar una distribución de frecuencias, con los datos
del peso de 30 niños atendidos en la consulta externa de una clínica, en marzo del 2008. (Los
pesos se redondearon al décimo más próximo)

24,1 25,0 24,8 24,3 25,3 24,2 23,6 24,5 24,4 24,2 24,5 23,0 24,0 23,8 23,8
25,3 24,5 24,0 25,2 24,6 25,2 24,4 24,7 24,1 24,6 24,9 24,1 25,8 25,2 23,3

Pasos para construir una distribución de frecuencias:

1. Se ordenan los datos en un arreglo ordenado, por magnitud

Pesos Frecuencia
23 1
23,3 1
23,6 1
23,8 2
24 2
24,1 3
24,2 2
24,3 1
24,4 2
24,5 3
24,6 2
24,7 1
24,8 1
24,9 1
25,0 1
25,2 3
25,3 2
25,8 1
Total 30

2. Escoger el número de clases

Si no se tiene definido el número de clases, se puede utilizar la fórmula de Sturges

María Marjorie Mora Valverde 13


Distribución de frecuencias

K = 1+3,322 (log10 n) (1) donde

K: número de clases o intervalos

n: total de datos del conjunto

En el ejemplo si usamos esta fórmula tenemos que:

K = 1+3,322 (log10 30), 1+3,322 (1,47712125) = 5,91 ≈ 6

3. Amplitud o tamaño del intervalo de la clase

Se determina dividiendo R/K, tal que

Amplitud o tamaño del intervalo = rango / número de clases (2)

Para determinar el tamaño de los intervalos del ejemplo se procede de la siguiente manera.

Se calcula el rango, tal que

R = 25,8 - 23 = 2,8

Tamaño del intervalo = 2,8 / 6 = 1 / 2 = 0,4666 ≈ 0,5

4. Con el número de clases y el tamaño de los intervalos se procede a elaborar las clases de la
distribución de frecuencias con los límites dados, es decir como si la variable fuera discreta.

Límites dados de la clase

23,0 - 23,4
23,5 - 23,9
24,0 - 24,4
24,5 - 24,9
25,0 - 25,4
25,5 - 25,9

5. Como la variable es continua hay muchos valores intermedios entre el límite superior de una
clase y el límite inferior de la siguiente, y se deben construir los límites reales de acuerdo con el
redondeo de los datos cuando se recogieron, como se explicó en el ejemplo anterior.

Como en nuestro ejemplo la variable, el peso de los niños, es continua se calculan los límites
reales:

María Marjorie Mora Valverde 14


Distribución de frecuencias

Límites reales de clase

22,95 - 23,45
23,45 - 23,95
23,95 - 24,45
24,45 - 24,95
24,95 - 25,45
25,45 - 25,95

Para el ejemplo tenemos que, después de calcular los límites reales se asignan a cada intervalo de
peso el número de niños y se completa la siguiente tabla:

Frecuencia Frecuencia
Frecuencia acumulada
Límites reales absoluta relativa (fr) o Porcentaje
menos de (F)
(f) proporción
22,95 - 23,45 2 2 0,067 6,7

23,45 - 23,95 3 5 0,100 10,0

23,95 - 24,45 10 15 0,333 33,3

24,45 - 24,95 8 23 0,267 26,7

24,95 - 25,45 6 29 0,200 20,0

25,45 - 25,95 1 30 0,033 3,3

Total 1,000 100

Estas tabulaciones de los datos permiten elaborar los cuadros y los gráficos, para presentar y
analizar los datos. También con la base de datos revisada y sin errores se calculan las medidas de
interés y se aplican las técnicas indicadas en los objetivos de la investigación.

María Marjorie Mora Valverde 15

You might also like