Professional Documents
Culture Documents
Objetivos a identificar Frecuencias absolutas Frecuencias relativas Frecuencia acumulada. Tablas. Medidas de Tendencia Central. Histogramas y polgonos. Grficos Ejercicios y Aplicaciones.
Objetivos a identificar:
Conocer la definicin de frecuencias y sus tipos. Aplicacin de las frecuencias Conocer la distribucin de frecuencias Aprender a ubicar los intervalos de clase y su utilidad. Medidas de tendencia central en datos agrupados. Conocer los percentiles y cuartiles. Aplicaciones.
Tanto las variables cualitativas como las cuantitativas, originan observaciones, las cuales se conocen como: series cualitativas o series cuantitativas. Mientras que los datos que originan estas series, (vectores o conjuntos de datos) son pocos, basta solo ordenarlos para saber el valor mayor y menor, la existencia de concentraciones alrededor de algunos valores
Tipos de Distribucin
Por ejemplo una distribucin simple sera: Provincias de nacimiento de 10 ticos: (atendiendo al cdigo de la provincia) 1,2,3,4,5,6,7,7,7,7 Esta es una forma ordenada de expresar esa distribucin
La Distribucin de Frecuencias es un conjunto de elementos ordenados, resumidos o distribuidos en las diferentes categoras de una serie de datos determinada. El nmero que aparece resumiendo cada categora es conocido como la frecuencia y cada categora tiene una frecuencia, denominada absoluta. La suma de estas frecuencias absolutas, nos da el nmero de unidades observadas en todas las categoras
Las Clases o Intervalos o Categoras seleccionadas tienen que ser exhaustivas y mutuamente excluyentes. Eso significa que ningn elemento del conjunto a la hora de clasificar, puede encontrar ambigedad en la definicin del intervalo. Ejemplo: Un intervalo de la variable No. de hijos, pudiera ser: 1-4 hijos: Se entiende que en ese intervalo clasifican todos los encuestados que tienen 1,2,3, y hasta 4 hijos. Los que no tienen hijos, no estn aqu, al igual si el nmero de hijos es mayor a 4.
Estudiamos el nmero de embarazos anteriores de 20 parturientas (discreta) en el Hospital de la Mujer Adolfo Carit en abril de 2012. El vector obtenido de la revisin realizada de estos 20 elementos es como sigue en la tabla preparada para el efecto
E.A
4 6 9
No.
6 7 8
E.A
8 4 11
No
11 12 13
E.A
5 3 4
No
16 17 18
E.A
3 3 14
4
5
4
9
9
10
7
8
14
15
7
1
19
20
3
3
Serie Ordenada: 1, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 11, 14 Ahora se debe seleccionar el nmero de intervalos de clases que vamos a tener . Nunca deben ser menores de 4 y no mayores de 10, pues no tiene razn el resumen hecho. Para ello tambin calculamos la amplitud de la serie (14-1) y la dividimos entre el nmero de clases que deseamos (4) 14-1 / 4 = 3.25 ~ 4
Para ello tomamos la frecuencia de la clase y la dividimos entre el total de elementos observados. El resultado es un %. Ejemplo: Para el intervalo de 1-4 embarazos, donde la frecuencia absoluta es =10, la Frecuencia relativa es: (10 / 20) x 100 = 50 % As tendremos en todo el cuadro anterior:
1-4 embarazos
5-8 embarazos 9-12 embarazos 13- 16 embarazos
10
6 3 1
50
30 15 5
TOTAL
20
100
A medida que vamos analizando cada intervalo de clase, con su frecuencia absoluta, esta se va sumando a la frecuencia anterior. Ayuda a conocer en donde estn concentrados los valores en los intervalos. Vemoslo, en este ejemplo
IC
1-4 embarazos 5-8 embarazos 9-12 embarazos
fa
10 6 3
Fr (%)
50 30 15
faa 10 16 19
fra 50 80 95
13- 16 embarazos
20
100
TOTAL
20
100
Principal funcin
El propsito de estas medidas es el de tratar de resumir en un solo nmero, la posicin o localizacin de la distribucin.
La Media o Promedio
La media o el promedio, es el resultado de sumar todos los valores que toma la variable en el conjunto y dividir el nmero de elementos de ese propio conjunto entre esa cantidad sumada anteriormente.
Ejemplo de la media
Siendo el conjunto de estudio la frecuencia cardiaca (pulsaciones por minuto) de 6 estudiantes de la clase: 55,64,53,79,64,68 Aplicando la frmula: 55+64+53+79+64+68 = = 63.8~ 64 pul/min 6
La Moda
Esta medida se asocia con el valor mas comn, ms tpico que ocurre mas frecuentemente en un conjuntos de datos. Es el valor de mayor frecuencia. Ejemplo:
1, 3, 3, 3, 4, 4, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 11, 14
En este caso, la Moda (Mo)= 4 Puede suceder que no est definida la Moda en un conjunto o que existan varias Modas (igual nmero de frecuencias ), para lo que la utilidad de la Moda es reducida. La Moda tambin es til con las variables cualitativas (el diagnstico mas frecuente en emergencias en el da de hoy fue la EDA)
La Mediana
Es el valor central de una serie de datos ordenados y su ubicacin equidista de los limites mayor y menor del conjunto. Ej.: 55,63,53,79,64,68,78 ( N=7) Ordenando el conjunto: 53, 55, 63, 64, 68, 78, 79
Me = N +1/2 = 7 + 1/ 2 = 8/2 =4 (lo que quiere expresar que en este caso, el 4to. Elemento de la serie ordenada, que en este caso es 64
La Mediana... cont
En el caso de que la serie sea par: 55,63,53,79,64,68 donde N = 6 Se ordena tambin: 53, 55, 63,64,68,79
Se calcula promediando los dos valores centrales: Me = 63+64/ 2 = 63.5 lo que significa que el 50% de los elementos estudiados tienen una frecuencia cardiaca menor o igual a 63.5
La Media depende del valor exacto de cada observacin y estos valores se pierden cuando los datos se agrupan, por lo que hay que estimarla. La Mediana no tiene en cuenta la magnitud exacta de la mayora de las observaciones y por ello es que es menos eficaz que la Media porque implica una prdida de informacin La Mediana es mucho menos manejable que la Media para el tratamiento matemtico y se utiliza poco en las tcnicas estadsticas complejas. La Mediana resulta til para el trabajo descriptivo. La Moda no se toma muy en cuenta, por la variabilidad de sus observaciones.
Obtenido el Punto medio (pm), se multiplica la frecuencia (f) de cada intervalo por su Pm y posteriormente, se realiza una sumatoria de todos los productos obtenidos por Intervalo de Clase (IC) y esa suma se divide entre la sumatoria de las f obtenidas y esa ser la Media ( ) de estos datos. Vemoslo en un ejemplo:
Pm
2.5 6.5 10.5 14.5
fa
10 6 3 1
Pm x fa 25 39 31.5 14.5
TOTAL
20
110
Ejemplo... final
= 110 / 20 = 5.5 ~ 6
Lo que significa que el promedio de embarazos anteriores de ese grupo de 20 parturientas fue de 6
Aqu se supone que los valores estn distribuidos uniformemente a travs del intervalo. Pasos a seguir para el clculo: 1.- n / 2, o sea, se divide la sumatoria de las frecuencias absolutas entre 2. Este paso ubica el valor de la mediana en el intervalo de clase (IC) correspondiente 2.- Se procede a la sustraccin del Ls-Li del IC. 3.- Se aplica entonces la siguiente frmula:
Donde: n = es la sumatoria de las frecuencias absolutas Me = Mediana Li = Lmite inferior real de la clase donde esta la Me Fi = Frecuencia absoluta de la clase donde est la Me Fa = Frecuencia acumulada de la clase anterior a la clase donde est la Me C = la diferencia del Ls Li del IC donde est la Me
Utilicemos el de las 20 parturientas, anteriormente citado. N = 20 ; n/2 = 10, lo que quiere decir que la Me est en el intervalo 1-4 embarazos Aplicando la frmula: 1 + [(10 0) / 10] * 3 = 1+ (1) (3) = 4 Me = 4
Esto nos recuerda que menos del 50% de las parturientas tuvieron 4 embarazos anteriores y mas del 50% tuvieron mas de esa cifra.
Aspecto importante a tener en cuenta con el uso de variables continuas en datos agrupados
Recordar que en el caso de las V.C, los intervalos de clase tienen valores reales y valores indicados. Hay que definir antes de efectuar los clculos, con cual de estos valores vamos a trabajar. Esto es aplicable para cualquier medida de posicin que se quiera calcular.
La Moda (Mo), pierde su definicin, al ser aplicada a datos agrupados, donde se aplica entonces el concepto de Clase Modal, o sea, aquella clase donde se concentra la mayor densidad de frecuencias por unidad de intervalo y es por eso que se dice que en estos casos la Mo se estima.
Frmula de clculo de la Mo
Mo = Li + [ d1 / ( d1+ d2)] * C, siendo Mo = Moda Li = Lmite inferior de la clase modal (C.M) d1= diferencia entre la f de la C.M y la f de la clase anterior. d2= diferencia entre la f de la C.M y la f de la clase posterior C = Ls Li del intervalo de la C.M
29.5- 34.5 34.5- 39.5 39.5- 44.5 44.5- 49.5 49.5- 54.5 54.5- 59.5 59.5- 64.5 64.5- 69.5 69.5- 74.5 TOTAL
1 3 8 9 7 4 3 3 2 40
Cuartiles y Percentiles
Los cuartiles son valores que dividen el conjunto de una variable en cuatro partes: Q1= toma en cuenta el primer cuarto Q2= es la mediana Q3= toma en cuenta las partes Q4= toma todo el conjunto. Ese mismo conjunto puede dividirse en deciles, quintiles y percentiles ( 5, 10 y 100 unidades, respectivamente)
Los percentiles se utilizan como parmetros de ubicacin y solo se calculan para grandes conjuntos de datos. Ejemplo: los grandes estudios de crecimiento y desarrollo, donde se buscan construir parmetros para una poblacin de sujetos determinada, ubican a travs de la edad, sexo, peso y talla, los percentiles adecuados en los que debe crecer y desarrollarse saludablemente una persona. (Ver tablas de crecimiento y desarrollo del pas).
lo que significa que el septuagsimo segundo percentil est ubicado en la medida # 28,8. Analizando las fac de los intervalos de clases del conjunto agrupado, ubicamos de inmediato donde esta ubicada esta cifra (28,8)
Sustituyendo en la frmula
P72= 54.5 + ( 28.8-28) * 5 4 P72 = 54.5 + 1.0 = 55.5 Lo que significa que un 72 % de las mujeres positivas al Papanicolau tienen edades inferiores a los 55.5 aos y un 28% son positivas por encima de esa edad.