You are on page 1of 24

Organización y presentación de los datos cuantitativos

OBJETIVOS

• Definir los tipos de variables cuantitativas.


• Explicar los procedimientos para organizar las variables cuantitativas, por
ejemplo, las tablas de distribución de frecuencias por puntos e intervalos.
• Graficar los resultados a través del histograma y polígono de frecuencias.
• Aprender a interpretar los resultados mostrados en las tablas o gráficos.
Competencias

El estudiante deberá ser capaz de:

 Identificar correctamente los diferentes tipos de variables cuantitativas.


 Identificar correctamente el procedimiento para organizar los datos
cuantitativos en las tablas de distribución de frecuencias.
 Elaborar las gráficas, histograma y polígono de frecuencias, para ilustrar
los datos cuantitativos.
 Interpretar los resultados ilustrados a través de las tablas y gráficos en
referencia.
ESTADÍSTICA DESCRIPTIVA

ORGANIZACIÓN Y PRESENTACIÓN DE LOS DATOS

DATOS CUANTITATIVOS

Si los resultados de la investigación son inherentemente numéricos, sean estos valores


discretos o continuos, obtendrán un tratamiento especial para agruparlos y presentarlos
conocido como distribución de frecuencias.

PROCEDIMIENTOS PARA DATOS AGRUPADOS

Los datos pueden ser agrupados de las siguientes formas:

 Distribución de frecuencias por puntos.


 Distribución de frecuencias por intervalos.
CONCEPTOS BÁSICOS

Distribución de frecuencias

Esta es una tabla resumen en la cual los datos se agrupan o arreglan en categorías
denominadas clases, las cuales deben ser ordenadas en forma numérica y de modo
conveniente.

Lo anterior, se hace cuando los datos a tratar son numerosos, por lo tanto, es útil el
distribuirlos en clases o categorías.

Frecuencia de clase

Se refiere al número de observaciones que pertenecen a cada clase o categoría.


DISTRIBUCIÓN DE FRECUENCIAS POR PUNTOS

Si la amplitud de la variación de los datos es pequeña, se puede elaborar una


distribución de frecuencias por puntos, en donde se presentan los datos, en
forma tal, que se disponen los valores por orden de magnitud.

Como características que tipifican este tipo de arreglo, se tienen:

 Las diferencias entre los valores no son significativas.


 Por lo anterior, los valores se repiten entre si, con gran frecuencia.

A continuación, presentamos un ejemplo.


Ejemplo #1

Un inspector de control de calidad, quiere estimar el peso promedio de llenado para las cajas de cereal
empacadas en una fábrica. El cereal está en paquetes que contienen 12 cajas cada uno. Para su
inspección, el inspector selecciona en forma aleatoria 5 paquetes y mide el peso de llenado de cada una
de las cajas. Obteniendo los resultados en onzas, elabore una tabla de distribución de frecuencias.

PAQUETE ONZAS DE LLENADO

1 16.1 15.9 16.1 16.2 15.9 15.8 16.1 16.2 16.0 15.9 15.8 16.0

2 15.9 16.2 15.8 16.0 16.3 16.1 15.8 15.9 16.0 16.1 16.1 15.9

3 16.2 16.0 15.7 16.3 15.8 16.0 15.9 16.0 16.1 16.0 15.9 16.1

4 15.9 16.1 16.2 16.1 16.1 16.3 15.9 16.1 15.9 15.9 16.0 16.0

5 16.0 15.8 16.3 15.7 16.1 15.9 16.0 16.1 15.8 16.0 16.1 15.9
PASOS PARA CREAR
UNA DISTRIBUCIÓN DE FRECUENCIAS POR PUNTOS

 Definir la variable aleatoria.

 Determinar el valor del Rango o Amplitud.

 Ordenar los datos en forma ascendente.

 Contar los datos de acuerdo a su categoría.

 Calcular la frecuencia simple, relativa y porcentual en cada categoría.

 Graficar los datos.


DISTRIBUCIÓN DE LOS PESOS EN ONZAS
PARA LAS CAJAS DE CEREAL

PESO FRECUENCIA
EN CONTEO
ONZAS SIMPLE RELATIVA PORCENTAJE

15.7 // 2 0.033 3.3


15.8 /////// 7 0.117 11.7
15.9 ////////////// 14 0.233 23.3
16.0 ///////////// 13 0.217 21.7
16.1 /////////////// 15 0.250 25.0
16.2 ///// 5 0.083 8.3
16.3 //// 4 0.067 6.7

TOTALES 60 1.000 100.0


DISTRIBUCIÓN DEL NÚMERO DE CAJAS DE CEREAL
SEGÚN SUS PESOS EN ONZAS

NÚMERO DE CAJAS
20 20

15
15 14 15
13

10 10

5
5 4 5

0 0
15.6 15.7 15.8 15.9 16.0 16.1 16.2 16.3 16.4

PESOS EN ONSAS
DIAGRAMA DE FRECUENCIAS POR INTERVALOS

Si al recolectar los datos, la amplitud de la variación de los mismos es


significativamente grande, entonces se procede a agruparlos en intervalos de
clases con la finalidad de buscarles un significado visual más eficaz ya que el
diagrama de frecuencias por puntos para estos casos es ineficiente.

La clave es obtener un número de categorías o clases para organizar los


datos, para lo cual existen varios criterios para determinarlo. Sin embargo
ninguno de ellos es exacto. Algunos autores sugieren de cinco a quince
clases, dependiendo de cómo estén distribuidos los datos y cuántos sean.
Un criterio utilizado frecuentemente es que el número de clases debe ser
aproximadamente igual a la raíz cuadrada del número de datos, otros más
formales, recomiendan la aplicación de algunas de las siguientes reglas para
elegir la cantidad de intervalos, basadas todas ellas en el tamaño de la
muestra.

 W. J. Dixon y R. A. Kronmal 10 log10 (n)

 P. E. Velleman 2 n1/2

 Herbert Sturges 1 + 3.3 log (n)


Otras propuestas para establecer el número de intervalos que aconsejan
algunos autores para trabajar en la confección de los intervalos son:

 David Freedman y Persi Diaconis h = 2Rn-1/3 donde R representa el


rango intercuartil de los datos.

 D. W. Scott h = 3.5 Sx n-1/3 donde Sx es la desviación estándar de los


datos.

 David P. Doane h = 1 + log (n) + log [1 + kurtosis (data) n1/2/6]

Veamos el procedimiento a través del siguiente ejemplo.


Ejemplo #1

Un analista de Estudios de Tiempos y Movimientos ha concentrado su atención en una operación que


realiza un operario en la línea de montaje. Elabore una distribución de frecuencias para los siguientes
datos que representan el tiempo de dicha operación en segundos.

TIEMPO DE LA OPERACIÓN EN SEGUNDOS

1000 1110 1010 1070 1030 1000

1150 990 1090 1080 1150 1200

1050 1030 1120 1050 1030 1150

1230 1170 1180 1110 1160 1100

1100 1060 1130 1105 935 1210


RECOMENDACIONES
DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS

 Recuerde que este tipo de distribución, tiene como propósito el buscar que se
aprecien con una mejor perspectiva o dimensión el conjunto de datos.

 Al determinar el valor de “K” se aplicará la regla de redondeo. Sin embargo, al


estimar el valor de “T” éste será redondeado, según sea el caso, a la cifra entera o
decimal superior.

 Para establecer el límite inferior del primer intervalo, se podrá escoger un número
igual al mínimo valor dentro del conjunto de todos los datos. Podrá ser inferior a
éste, pero en no más del 1% de su magnitud.

 Se utilizará una diagonal como símbolo o notación para identificar a los datos en
sus diferentes categorías al momento de realizar el conteo.
PASOS PARA CREAR
UNA DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS

 Definir la variable aleatoria.

 Determinar el valor del Rango o Amplitud.

 Estimar el número de intervalos para agrupar los datos a través de la regla


empírica de Sturges.

 Obtener el tamaño de los intervalos, dividiendo el rango entre el número de


intervalos estimado.

 Se procede a crear la tabla de distribución de frecuencias para agrupar los datos.

 Contar los datos de acuerdo a su categoría.

 Calcular la frecuencia simple, relativa y porcentual en cada categoría.

 Graficar los datos.


Paso #1 Definir la variable estudiada.

X i : Tiempo en segundos para ejecutar la operación.

La variable es cuantitativa porque es numérica. Pertenece a las


continuas debido a que se mide el tiempo a través de un
instrumento de precisión.
Paso #2 Calcular el rango.

Rango = X máx. – X mín.


Rango = 1230 – 935
Rango = 295 segundos

Como el rango es significativamente grande, los valores no se


repiten consistentemente. Es por ello, que se procede a
agruparlos a través de una distribución de frecuencias por
intervalos para darle una mayor eficiencia a la organización.

Cabe señalar, que si se diera puntualmente la distribución,


muchos de los valores que puede adquirir la variable, en su
recorrido de 296 casos diferentes, quedarían sin asignación
alguna, perdiendo apariencia o aspecto la clasificación.
Paso #3 Estimar el número de intervalos necesarios a través de
la regla empírica de Sturges.

K = 1 + 3.3 log (n)

En donde
n: número de datos o tamaño de la muestra.
K: número aproximado de intervalos.

Para nuestro ejemplo, reemplazamos

K = 1 + 3.3 log (30)

K  6 intervalos
Paso #4 Se obtiene el tamaño (T) de los intervalos de clase.

Rango
T = -------------
K

en donde
295
T = ----------
6

T  50 segundos
Paso #5 Se construye la tabla de distribución de frecuencias.

Se asume un valor para crear el primer límite inferior, tomando como


referencia el mínimo valor existente entre los datos. Este valor podrá
ser igual al mínimo o inferior a éste, para que pueda ser incluido
dentro del intervalo. En el segundo de los casos, se deben tener
presente las sugerencias al aplicar este tipo de distribución.
Finalmente, consideramos que 930 es el valor apropiado para
empezar la organización.

Para mantener una continuidad a lo largo de la distribución, el valor


del límite superior en cada uno de los intervalos debe coincidir con los
inferiores de su próxima categoría.
Paso #5 Continuación …

Luego, con el objeto de evitar conflictos o ambigüedades al interpretar


los intervalos de clase, se debe establecer previamente un criterio para
asignar la variable o dato en cada una de las categorías.

Se pueden utilizar así, cualquiera de las siguientes normas:

 Mayor que el límite inferior y menor o igual que el límite superior


de la categoría.

 Mayor o igual que el límite inferior y menor que el límite superior


de la categoría.

El criterio que será utilizado para asignar los datos, será el primero.
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

TIEMPO PARA EJECUTAR LAS OPERACIONES DE ENSAMBLADO

TIEMPO CONTEO NÚMERO


PUNTO FRECUENCIA
EN DE DE PORCENTAJE
MEDIO RELATIVA
SEGUNDOS DATOS OPERACIONES

930 – 980 955 / 1 0.033 3.3


980 – 1030 1005 /////// 7 0.233 23.3

1030 – 1080 1055 ///// 5 0.167 16.7


1080 – 1130 1105 //////// 8 0.267 26.7

1130 – 1180 1155 ////// 6 0.200 20.0


1180 – 1230 1205 /// 3 0.100 10.0

TOTAL 30 1.000 100.0


DISTRIBUCIÓN DEL NÚMERO DE OPERACIONES EVALUADAS
SEGÚN EL TIEMPO PARA EJECUTARLA

10 10

9 9
8
8 8
NÚMERO DE OPERACIONES

7
7 7
6
6 6
5
5 5

4 4
3
3 3

2 2
1
1 1

0 0

98
0
03
0
08
0 30 80 23
0
0- 1 1 11 11 1
93 0- 0- 0 - 0 - 0-
98 10
3
10
8
11
3
11
8

TIEMPO EN SEGUNDOS
DISTRIBUCIÓN DEL NÚMERO DE OPERACIONES EVALUADAS
SEGÚN EL TIEMPO PARA EJECUTARLA

10 10

9 9
8
8 8
NÚMERO DE OPERACIONES

7
7 7
6
6 6
5
5 5

4 4
3
3 3

2 2
1
1 1

0 0

98
5 35 08
5 35 85 35
5- - 10 1 - 11 - 11 - 12
93 5 5- 5 5 5
98 10
3
10
8
11
3
11
8

TIEMPO EN SEGUNDOS

You might also like