Professional Documents
Culture Documents
45
1
Crditos
00 11 0 010 1 01 0 110 1 00 01 01 00 1 011
45
2
Generalmente, no es fcil obtener informacin desde un conjunto de datos con una simple ojeada. Es necesario disponerlos en alguna estructuracin tabular que contenga agrupaciones de estados de la variable y, a la vez, permita extraer alguna informacin en forma rpida y sencilla. Estas estructuras tabulares son llamadas tablas de frecuencias, que, segn los propsitos del anlisis, pueden ser unidimensionales o multidimensionales.
J. Duarte V. Probabilidades y Estadstica CM 432
45
3
1 1 2 2 2 2 3 3 3Valor de 3 Frecuencia 3 3 4 4 5 5 6 6 6 6 6 6 6 6 Variable 1 2 Dato Frecuencia 2 Presentacin 3 4 tabular de 24 4 6 datos5 2 discretos: 6 2 8 Total Total : 24 datos J. Duarte V. Probabilidades
y Estadstica CM 432
45
6 2 2 8 24
4
Una frecuencia, llamada tambin frecuencia absoluta, es el nmero de datos contenidos en una agrupacin. 00 11 0 010 1 01 0 110 1 00 01 01 00 tabular unidimensional Una estructuracin 1 011 consta de un ttulo y algunas columnas. El ttulo de una tabla de distribucin de frecuencias debe ser auto explicativo, considerando entre otros aspectos de importancia, los elementos seleccionados en la muestra, la caracterstica observada en ellos, el lugar y perodo en que se efectu el registro. La estructura tabular depende de la naturaleza cualitativa o cuantitativa de los datos.
J. Duarte V. Probabilidades y Estadstica CM 432
45
5
45
6
Caracterstica en estudio
Elementos en estudio
Perodo
Frecuencia Absoluta
Distribucin de funcionarios, segn especialidad. Empresa Mayor S.A. 1996 i Especialidad ni fi 1 5 0.125 Ing. Civil 10 2
3
Frecuencia Relativa
Lugar
5 15 n = 40
Total
45
7
ni fi ! n
Los datos de esta caracterstica de inters se pueden resumir en los estados observados , denominados clases o categoras. La estructura tabular se puede representar de la siguiente manera:
45
8
Caracterstica en estudio
Elementos en estudio
Perodo
Distribucin de trabajadores, segn salario. Empresa ELECTROMOTRIZ. Ao 2000. i Rentas 1 Bajas 2 Medias 3 Altas Total ni 25 40 15 n = 80 fi 0.3125 0.5000 0.1875 1
J. Duarte V. Probabilidades y Estadstica CM 432
Ni 25 65 80
Fi 0.3125 0.8125 1
45
Frecuencia Relativa Acumulada
Ni ! n j
j !1
Lugar
2
9
Ni Fi ! n
x1 ! 3, x2 ! 2, x3 ! 1, x4 ! 0, x5 ! 3, x6 ! 2 x7 ! 1, x8 ! 1,
x9 ! 3, x10 ! 3, x11 ! 2, x12 ! 4, x13 ! 2, x14 ! 2,
La estructura tabular de este tipo de variable es anloga al caso anterior, teniendo en Nmero de cuenta realizar una interpretacin de orden del sujeto en el que se ha resultados variable adecuada. Representa a la efectuado la lectura de
X: Nmero de focos quemados en una caja producida por la empresa LUMINOSA S.A.
xi
45
la variable X.
10
Existen distintas formas de tabular este tipo de datos. Para construir una tabla de frecuencias, de datos continuos, se sugiere utilizar preferentemente el siguiente procedimiento, recomendado por la mayora de los autores:
J. Duarte V. Probabilidades y Estadstica CM 432
45
11
xmn
Rango ! xmx xmn ! R
Determinar el rango o recorrido de la variable R, donde xmx es el dato mayor y xmn es el menor.
J. Duarte V. Probabilidades y Estadstica CM 432
45
12
xmn
Rango ! xmx xmn ! R
Dividir el rango R en un nmero m de intervalos de igual longitud, determinando la amplitud de cada intervalo con
Rango Ai ! ! A, i ! 1,2, - , m m
J. Duarte V. Probabilidades y Estadstica CM 432
45
13
Rango ! xmx
2
x1
2 4
x2 xm 1
M
1
45
F1 4 F2 8 F3 n 1
14
1
Fi
Puesto que A es un valor arbitrario, distintos A producen tabulaciones diferentes, pero en general la forma distribucional no tendr variaciones 00 11 0 010 1 01 0 110 1 00 01 01 00 1 011 significativas. Los autores clsicos recomiendan utilizar entre 5 y 20 intervalos. (Los avances en materias computacionales podrn hacer cambiar este criterio?) Para condicionar el nmero de intervalos a se determinar la amplitud por
R R 5 20 ! R ! A , i ! 1,2,- ,8 A! i 2 8
J. Duarte V. Probabilidades y Estadstica CM 432
45
15
Un valor importante
00 11 0 010 1 01 0 110 1 00 01 01 00 1 011
Para efectos de clculo de estadsticas, se debe obtener el punto medio de cada intervalo. Este valor ser llamado marca de clase y se denotar por
ci , i ! 1, 2,K , m
J. Duarte V. Probabilidades y Estadstica CM 432
45
16
Un valor importante
00 11 0 010 1 01 0 110 1 00 01 01 00 1 011
xi 1 xi ci ! , i ! 1, 2,3,..., m 17 2
45
1
Marcas de clase
Existen otros criterios para 00 11 0 010 1 01 0 110 1 00 01 01 00 1 011 determinar el nmero de intervalos (al parecer, menos arbitrarios) que quedan en funcin del nmero total de datos. A fin de cuentas el criterio que se utilizar depender de la calidad de la informacin que se obtenga de la tabla construida.
45
18
n si n no
45
19
Tarea
010 siguientes datos ordenados 00 11 0 Los 1 01 0 110 1 00 01 01 00 1 011 corresponden a 100 mediciones de dimetros (en pulgadas) de tubos de ensayo obtenidos en el laboratorio REX. Haz la correspondiente tabla de frecuencias para estos datos: 3.63 3.69 3.70 3.71 3.71 3.73 3.76 3.76 3.77 3.79 3.80 3.81 3.81 3.82 3.82 3.83 3.83 3.83 3.84 3.86 3.86 3.87 3.88 3.89 3.90 3.90 3.91 3.91 3.92 3.93 3.93 3.94 3.94 3.94 3.95 3.95 3.95 3.95 3.96 3.96 3.96 3.96 3.97 3.97 3.97 3.97 3.97 3.98 3.98 3.99 3.99 4.00 4.00 4.01 4.02 4.02 4.02 4.03 4.03 4.04 4.04 4.04 4.05 4.05 4.05 4.06 4.06 4.07 4.07 4.07 4.07 4.08 4.08 4.08 4.09 4.09 4.10 4.11 4.11 4.12 4.12 4.13 4.14 4.14 4.15 4.15 4.16 4.16 4.16 4.16 4.17 4.18 4.20 4.22 4.23 4.24 4.26 4.28 4.29 4.35
45
20