You are on page 1of 14

TEMA II DISTRIBUCIONES DE FRECUENCIAS

CONTENIDO
Introducción
Distribuciones de la frecuencia
Clases de una distribución de frecuencia
Características
Construcción de la distribución de frecuencia
Frecuencias relativas
Propiedades de las frecuencias absolutas y relativas
2.4. Frecuencias acumuladas
2.4.1 Frecuencia Acumulada menor que
2.4.2 Frecuencia Acumulada mayor que
2.5 Distribución Continua
2.5.1 Frecuencia de Clase
2.5.2 Intervalo de Clase
2.5.3 Amplitud de un intervalo de clase
2.5.4 Marca de clase
2.5.5 Fronteras de clase o límites reales
2.5 Representación grafica
Grafica de barras
Grafica de sectores
Grafica de polígonos o líneas
2.4 Paquetes estadísticos

DESARROLLO

2.1 Introducción
En el tema anterior se pudo observar que la estadística descriptiva utiliza técnicas
para organizar y presentar datos.
La organización y la presentación deben responder a un patrón para llegar a
conclusiones lógicas. En este capitulo nos introducimos a las técnicas de
organización de datos y de graficación.

2.2 Distribuciones de la frecuencia


Una distribución de frecuencia es un agrupamiento de datos en categorías que
muestren el número de observaciones de cada categoría.
También se dice que una distribución de frecuencias es una tabla de resumen en la
que los datos se agrupan o arreglan en clases o categorías ordenadas en forma
numérica, establecidas de modo conveniente.

2.2.1 Clases de una distribución de frecuencia


Las distribuciones de frecuencias pueden ser simples o agrupadas; de datos
cuantitativos o cualitativos; de variables discretas o continuas.
1. Simples o agrupadas
a) Simple, una distribución de frecuencia simple significa que los valores
de la variable X no se combinan para formar grupos, sino que cada X es
un grupo en si, ejemplo el uno aparece 6 veces en la muestra.
Tabla de distribución de frecuencias de las edades de los estudiantes de la
materia de Estadística

X= Edad F=Frecuencia
17 4
18 8
19 10
20 5
21 1
28 1
31 1
∑ 30

En la primera columna se anotan las edades, en la segunda se anotan las


veces que se reitera cada dato, a estos valores se les llama frecuencia
absoluta.
La frecuencia total es la sumatoria de las frecuencias absolutas
b) Agrupada

Tabla de distribución de frecuencias de las edades de los estudiantes de la


Materia de Estadística (Fila 1)

X=Edad F=Frecuencia
17-19 22
20-22 6
23-25 0
26-28 1
29-31 1
∑ 30

1. Cuantitativas o cualitativas.- Que a su vez pueden ser


a) Cuantitativas que pueden ser simples o agrupadas( Se vio anteriormente)
b) Cualitativas
 De una sola entrada o simple.- Una distribución es cualitativa cuando
los datos se agrupan en categorías no numéricas:

Tabla de distribución de frecuencias de los estudiantes de la materia de


Estadística (Fila 1) por sexo

X=Sexo F=Frecuencia
V 10
M 20
∑ 30
 Distribución matricial
Se llama también cuadros compuestos y tienen mas de una entrada,
ejemplo:

Tabla de Distribución de edades según el sexo de los estudiantes de la


materia de Estadística (Fila 1)

X=Edad\Y=Sexo F M TOTAL
17 4 0 4
18 7 1 8
19 6 4 10
20 3 2 5
21 0 1 1
28 0 1 1
31 0 1 1
∑ 20 10 30

2.2.2 Características
1. Expresa la frecuencia con que los valores e encuentran en cada clase
2. El numero total de datos considerados
3. Se puede expresar la frecuencia de cada valor como una fracción o porcentaje
del número total de observaciones.
4. Las clases son mutuamente excluyentes por tanto, cada dato debe pertenecer
exclusivamente a una clase.

2.2.3 Construcción de la distribución de frecuencia

Para construir una distribución de frecuencias se sugiere seguir los siguientes pasos:
1. Identifique el valor máximo y mínimo y obtenga la amplitud o rango de la
distribución
2. Seleccione un numero de clases y un ancho de clases de manera que el producto
sea un poco mayor que la amplitud o rango.
3. El valor inicial, este valor debe ser un poco más pequeño que el puntaje mínimo.

2.3. Frecuencias relativas


Se llama frecuencia relativa al valor h de la división entre una Frecuencia absoluta y la
Frecuencia total(n)
f
h
n
f=Frecuencia
X= Edad absoluta h=Frecuencia relativa p=Frecuencia porcentual
17 4 0,13 13%
18 8 0,27 27%
19 10 0,33 33%
20 5 0,17 17%
21 1 0,03 3%
28 1 0,03 3%
31 1 0,03 3%
∑ 30 1 100%

Para obtener la frecuencia relativa se divide la frecuencia absoluta entre la frecuencia


total
Para obtener las frecuencias porcentuales se multiplican las frecuencias relativas por
100.

2.3.1. Propiedades de las frecuencias absolutas y relativas


 Las frecuencias absolutas o relativas son siempre números enteros positivos
o cero, es decir f  0 ; h  0
 La suma de todas la frecuencias absolutas es igual a la frecuencia total
 La suma de todas la frecuencias relativas es igual a 1
 La suma de todas las frecuencias porcentuales es igual a 100

Actividad
De los asistentes a clases se recopila la información de las siguientes variables:
Variable edad
Variable peso (distribución continua)
Variable estatura (distribución continua)
Variable cantidad de hermanos
a) Construya una distribución de frecuencias
b) Cuales son los limites reales
c) Calcule los puntos medios o marca de clase
d) Encuentre todas las frecuencias acumuladas y porcentuales
e) Realice al análisis correspondiente

2.4. Frecuencias acumuladas


En un conjunto de datos agrupados encontramos: Frecuencias absoluta acumulada
menor que y frecuencia absoluta acumulada mayor que
2.4.1. Frecuencia acumulada menor que
Es la suma de todas las frecuencias correspondientes a los datos menores o iguales
al que se considera.
Directamente se la puede llamar Frecuencia acumulada, representándola por F.
En forma simbólica se tiene F i =  j  f j , es decir la Frecuencia acumulada f j es
i

la suma de las Frecuencias simples hasta f j .Así por ejemplo:


F=Frecuencia
acumulada
X= Edad f=Frecuencia absoluta menor que
17 4 4
18 8 12
19 10 22
20 5 27
21 1 28
28 1 29
31 1 30
∑ 30

Se llama Ojiva a la representación grafica como un Diagrama de líneas suavizado de


la Frecuencia acumulada.

2.4.2 Frecuencia acumulada mayor que


Es un conjunto de datos agrupados, se llama Frecuencia acumulada absoluta mayor
que: a la suma de todas las frecuencias correspondientes a los datos mayores o
iguales al que se considera.
Directamente se la puede llamar Frecuencia acumulada mayor que, representándola
por F*.
En forma simbólica se tiene F* L =  j  L f j , es decir la Frecuencia absoluta
k

acumulada mayor que F *L es la suma de las Frecuencias simples hasta fj .Así por
ejemplo

F=Frecuencia
acumulada mayor
X= Edad f=Frecuencia absoluta que
17 4 4+8+10+5+1+1+1=30
18 8 8+10+5+1+1+1=26
19 10 10+5+1+1+1=18
20 5 5+1+1+1=8
21 1 1+1+1=3
28 1 1+1=2
31 1 1
∑ 30

Se llama también Ojiva a la representación grafica como un Diagrama de líneas


suavizado de la Frecuencia acumulada absoluta mayor que.
2.5 Distribución Contínua

Si los datos de la variable cuantitativa contínua (que pueden tomar cualquier valor
dentro de ciertos intervalos). La distribución de frecuencias se muestra en una tabla
llamada de clasificación de datos, donde s indica el número de datos que se encuentran
dentro de un intervalo.
También se emplean estas tablas si el número de datos de variable discreta es grande.
Una clasificación de datos es un resumen de todos los datos, distribuidos en Clases o
Categorías, determinando claramente el número de elementos que pertenecen a cada
Clase.
Posteriormente se indicará el modo establecer una Clasificación de datos, previamente
se indican las definiciones y ejemplos de una Clasificación ya existente.

Se disponen los siguientes datos sobre las estaturas medidas en cm de un grupo de 32


personas.

157,158,159,160,161,162,163,164.165,166,166,167,167,168,168,168,169,168,170,170,
171,172,172,173,173,174,174,175,176,177,178,179

Ordenando los datos en una tabla, se obtiene que el total de datos es n=32, la cantidad
de datos diferentes es de 23
Datos f
157 1
158 1
159 1
160 1
161 1
162 1
163 1
164 1
165 1
166 2
167 2
168 3
169 2
170 2
171 1
172 2
173 2
174 2
175 1
176 1
177 1
175 1
179 1
 32

Esta distribución es un claro ejemplo de que no es adecuada debido a que hay una
excesiva cantidad de datos diferentes con respecto a n.
La distribución que se logra no es adecuada, ya que hay una excesiva cantidad de datos
diferentes con respecto al total “n”.
Una tabla de esta forma no brinda información y no es manejable para análisis o
comparaciones que se desee efectuar.
La gran cantidad de datos, sugiere que se realice otra manera de presentación de los
mismos.
Precisamente en estos casos es adecuada la Clasificación de datos que consiste en
agrupar los datos dentro de cierto número de Clases. Cada Clase estará expresada como
un Intervalo.

2.5.1 Frecuencia de Clase

Se llama Frecuencia absoluta de Clase a la frecuencia correspondiente a una Clase. En


la práctica directamente se llamará Frecuencia de clase
Los mismos datos del ejemplo anterior se muestran como una Clasificación de datos.

157,158,159,160,161,162,163,164.165,166,166,167,167,168,168,168,169,168,170,170,
171,172,172,173,173,174,174,175,176,177,178,179

El número total de datos o Frecuencia total es de n=32 se clasifican por la tabla


Intervalos f Frecuencia
de clase de Clase
Linf Lsup
156,160 3
160,164 4
164,168
168,172 6
172,176 8
176,180 7
4

En la primera columna se anotan los intervalos de datos, en la segunda se anota el


número de datos que caen dentro del correspondiente intervalo.
Los intervalos son semicerrados, incluyen al Límite inferior (Linf) pero no al superior
(Lsup)
Por ejemplo el primer intervalo esta comprendido entre 156,160, si un dato es 156 o esta
dentro del intervalo se lo considera dentro del mismo, pero si un dato es de valor 160 no
se lo cuenta en el intervalo primero sino corresponderá al segundo.
Cada intervalo representa una clase por lo tanto los datos han sido clasificados en seis
clases.

2.5.2 Intervalo de Clase


Se llama intervalo de clase al simbolismo que define una clase
Los intervalos de clase pueden ser semicerrados y cerrados. En el ejemplo anterior el
intervalo es semicerrado.

2.5.3 Amplitud de un intervalo de clase


Los intervalos de clase al estar comprendidos entre dos extremos poseen una cierta
amplitud o tamaño o ancho que se define del siguiente modo:
Se llama amplitud de intervalo de clase o directamente Amplitud de clase a la diferencia
entre los Límites de clase (Superior menos inferior)
A la amplitud de clase se la llama también Ancho de Intervalo o Tamaño de Intervalo.
Si en una distribución de frecuencias todos los intervalos poseen la misma Amplitud,
esta se designa por c. En la práctica para el cálculo de la Amplitud de clase se emplea la
fórmula c= Lsup-Linf

2.5.4 Marca de clase


Para representar numéricamente a una Clase dentro de una Distribución de frecuencias
se emplea la Marca de clase que se define como:
Se llama Marca de Clase al punto medio del intervalo de clase, que se obtiene
promediando los Límites inferior y superior de clase, es decir:
L inf  L sup
2
A la marca de clase se lo llama también Punto medio de la clase.
Por ejemplo para el intervalo de clase
156,160 la marca de clase es L inf  L sup = 156  160 =158
2 2
La marca de clase representa a todos los datos de la Clase. Por tanto, para fines de
análisis se puede considerar que todos los datos de la clase 156,160 poseen un valor
de 158 cm.
Es decir que a todas la personas que pertenecen al intervalo 156,160 se les asigna la
estatura de 158 cm.

Los datos de las estaturas se clasifican como:

Intervalos Marca de c Amplitud f Frecuencia


de clase clase de intervalo de clase
Linf Lsup
156,160 158 4 3
160,164 162 4 4
164,168
168,172 166 4 6
172,176 170 4 8
176,180 174 4 7
178 4 4

En la columna 1 se anotan los Intervalos de clase, indicando sus límites de clase.


La Marca de clase es el promedio de los Límites de clase

156 158 160 162 164 166 168

Marca de clase Marca de clase Marca de clase


Limites de clase Limites de clase Limites de clase

2.5.5 Fronteras de clase o límites reales


Una medición o un dato generalmente carecen de precisión absoluta, ya que dependerán
de las técnicas e instrumentos con que se obtiene tal medida.
Por ejemplo al indicar que una persona tiene una estatura de 156 cm, si la medida se ha
realizado con una precisión de un decimal, significa que la estatura exacta estará entre
155.5 y 156.5 cm.
Esto significa que si se hace una Clasificación de datos, deben especificarse otros
límites para cada clase, especificando su precisión. A estos nuevos límites se los llama
Fronteras de Clase o Límites reales de clase.

Si se conoce la precisión con que se miden los datos, o en caso de que se considere
como más conveniente se efectúa una Clasificación de datos con Intervalos cerrados, tal
como en la tabla adjunta.
En los Intervalos cerrados se incluyen a ambos extremos como parte del Intervalo.
Al indicar que una Clase está comprendida entre 156,159 y que la siguiente clase esta
entre 160.163, significa que para la primera Clase se incluyen a todos los valores entre
155.5 y 159.5 Por tanto las Fronteras de clase superior e inferior de la primera clase son
155.5 y 159.5 respectivamente.

2.6 Representaciones gráficas

Cuando las distribuciones de la frecuencia se estructuran principalmente para condensar


conjuntos numerosos de datos y representarlos en una forma “fácil de asimilar” por lo
general es mejor representarlos gráficamente.”Una fotografía dice mas que mil
palabras”

Las gráficas nos sirven para representar diferentes datos correspondientes a variables de
una determinada investigación.

El investigador debe seleccionar el método de presentación que considera resalta con


mas claridad los aspectos pertinentes de un conjunto de datos.

Existen 4 tipos básicos de gráficos: Barras, circulares, histogramas y polígonos, que por
supuesto no son los únicos, ya que existe una variedad de gráficos, con la ayuda de
software como Excel, Minitab y otros.
Según Berenson y Levine1 los gráficos se adecuan mas para los siguientes tipos de
datos:

DATOS -GRAFICA DE BARRAS


-GRAFICA CIRCULARES
DATOS

DATOS -GRAFICA DE HISTOGRAMAS


-GRAFICA DE POLIGONOS

2.6.1Ejemplos de gráficos:

Berenson y Levine; ESTADISITICA PARA ADMINISTRACION Y ECONOMIA: Conceptos y


aplicaciones, MacGraw-Hill/Interamericana S.A., México, 1992, Pag.31
2.7. Ejemplo de construcción de tablas de frecuencias simples y agrupadas
Tabla de Distribución de Frecuencias de las edades de los estudiantes de Estadística

Frecuencias Simples "MENOR QUE" "MAYOR QUE"


p h p h p
f (FRECUENCIA h (FRECUENCIA (FRECUENCIA F.ACUMULADA (FRECUENCIA (FRECUENCIA F.ACUMULADA (FRECUENCIA (FRECUENCIA
(X) EDAD ABSOLUTA) RELATIVA) PORCENTUAL) ABSOLUTA RELATIVA) PORCENTUAL) ABSOLUTA RELATIVA) PORCENTUAL)
17 3 0,10 10% 3 0,10 9,7% 31 1,00 100%
18 15 0,48 48% 18 0,58 58,1% 30 0,97 97%
19 7 0,23 23% 25 0,81 80,6% 25 0,81 81%
20 5 0,16 16% 30 0,97 96,8% 18 0,58 58%
21 1 0,03 3% 31 1,00 100,0% 3 0,10 10%
31 1,00 100%

Tabla de Distribución de Frecuencias de las pesos de los estudiantes de Estadística

Frecuencias c=Lsup-
Simples "MENOR QUE" "MAYOR QUE" Linf (Linf+Lsup)/2
p h p h p Marca de
f (FRECUENCIA h (FRECUENCIA (FRECUENCIA F.ACUMULADA (FRECUENCIA (FRECUENCIA F.ACUMULADA (FRECUENCIA (FRECUENCIA Amplitud clase
(Y) PESO DE CLASE RELATIVA) PORCENTUAL) ABSOLUTA RELATIVA) PORCENTUAL) ABSOLUTA RELATIVA) PORCENTUAL) de Clase
41-45 1 0,03 3% 1 0,03 3% 31 1,00 100% 4 43
46-50 4 0,13 13% 5 0,16 16% 29 0,94 94% 4 48
51-55 8 0,26 26% 13 0,42 42% 25 0,81 81% 4 53
56-60 10 0,32 32% 23 0,74 74% 23 0,74 74% 4 58
61-65 2 0,06 6% 25 0,81 81% 13 0,42 42% 4 63
66-70 4 0,13 13% 29 0,94 94% 5 0,16 16% 4 68
71-75 2 0,06 6% 31 1,00 100% 1 0,03 3% 4 73
31 1,00 100%

Tabla de Distribución de Frecuencias de las estaturas de los estudiantes de Estadística


c=Lsup-
Frecuencias Simples "MENOR QUE" "MAYOR QUE" Linf Fronteras de clase
h p h p h p
f (FRECUENCIA (FRECUENCIA (FRECUENCIA F.ACUMULADA (FRECUENCIA (FRECUENCIA F.ACUMULADA (FRECUENCIA (FRECUENCIA Amplitud o límites reales
(Z) ESTATURA ABSOLUTA) DE CLASE PORCENTUAL) ABSOLUTA RELATIVA) PORCENTUAL) ABSOLUTA RELATIVA) PORCENTUAL) de Clase
141-150 1 0,03 3% 1 0,03 3% 31 1,00 100% 9 140.5 150,5
151-160 11 0,35 35% 12 0,39 39% 30 0,97 97% 9 151,5 160,5
161-170 14 0,45 45% 26 0,84 84% 26 0,84 84% 9 161,5 170,5
171-180 4 0,13 13% 30 0,97 97% 12 0,39 39% 9 171,5 180,5
181-190 1 0,03 3% 31 1,00 100% 1 0,03 3% 9 181,5 190,5
31 1,00 100%

Tabla de Distribución de Frecuencias de la cantidad de hermanos de los estudiantes de Estadística


c=Lsup-
Frecuencias Simples "MENOR QUE" "MAYOR QUE" Linf
h p h p h p
f (FRECUENCIA (FRECUENCIA (FRECUENCIA F.ACUMULADA (FRECUENCIA (FRECUENCIA F.ACUMULADA (FRECUENCIA (FRECUENCIA Amplitud
(W) HERMANOS ABSOLUTA) DE CLASE PORCENTUAL) ABSOLUTA RELATIVA) PORCENTUAL) ABSOLUTA RELATIVA) PORCENTUAL) de Clase
1a3 22 0,71 71% 22 0,71 71,0% 31 1,00 100% 2
4a6 8 0,26 26% 30 0,97 96,8% 30 0,97 97% 2
7a9 1 0,03 3% 31 1,00 100,0% 22 0,71 71% 2

You might also like