You are on page 1of 14

DISTRIBUCIONES DE FRECUENCIA, MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIN

La estadstica es una disciplina muy til que se origin a partir de las matemticas. La estadstica descriptiva
es empleada para realizar estudios sistemticos de informacin a travs de la recopilacin, organizacin y
anlisis de datos para una investigacin o una encuesta. Es muy til en el pronstico y prediccin de varios
resultados.
Los datos estadsticos sern datos relacionados con una investigacin. Los datos (cualitativos o cuantitativos),
pueden presentarse una sola vez, repetirse dos veces o ms de dos veces. La repeticin de los valores de la
variable es lo que se denomina como la frecuencia. Las frecuencias de los valores de las variables pueden ser
organizadas en una tabla. Esta tabla se denomina tabla de distribucin de frecuencias. En esta seccin se
incluye el estudio de la distribucin de frecuencias con varios ejemplos. La Distribucin de frecuencia se puede
definir como la tabulacin de los valores de las variables consideradas. Una distribucin de frecuencias se
define como una disposicin ordenada de datos clasificados de acuerdo a la magnitud de las observaciones.
A travs de los ejemplos observa como son organizados los datos en tablas de distribucin de frecuencias, los
grficos asociados y las medidas de tendencia central.
Para variables cualitativas:
Las variables categricas de naturaleza cualitativa son aquellas cuya caracterstica permite clasificar a los
individuos en categoras, por ejemplo, nacionalidad, sexo, color preferido, etc. Los sistemas de representacin
grfica asociados a este tipo de variables son el diagrama de barras y el diagrama circular o grfico de sectores,
en los cuales las barras o los sectores representan las categoras de la variable estadstica.
Ejemplo: En un estudio realizado por una red de cinemas de la ciudad, se encuesta a 8400 personas mayores
de 18 aos, las dos primeras preguntas fueron:
Cul es su estado civil?
Cul es su da favorito de la semana para asistir a cine?
Tablas de distribucin de frecuencias:
Nmero de
personas
(Frecuencia
Absoluta)

Frecuencia
Absoluta
Acumulada

Lunes

500

500

6%

6%

Martes

1200

1700

14,3%

20,3%

Mircoles

1500

3200

17,8%

38,1%

75%

Jueves

1000

4200

11,9%

50%

18%

93%

Viernes

1200

5400

14,3%

64,3%

7%

100%

Sbado

1000

6400

11,9%

76,2%

Domingo

2000

8400

23,8%

100%

ESTADO
CIVIL

Nmero
de
personas
(Frecuenc
ia
Absoluta)

Frecuencia
Absoluta
Acumulada

Porcentaje
(Frecuenc
ia
Relativa)

Frecuencia
Relativa
Acumulada

Soltero

2100

2100

25%

25%

Casado

1680

3780

20%

45%

Unin
Libre

2520

6300

30%

1512

7812

588

8400

Divorciado
Viudo

DA
FAVORITO A
LA SEMANA
PARA
ASISTIR A
CINE

Porcentaje
(Frecuencia
Relativa)

Frecuencia
Relativa
Acumulada

Grficos apropiados

Cantidad de personas

Grfico 1. Diagrama de barras

Grfico 2. Diagrama circular o grfico de sectores

DA PREFERIDO PARA IR A CINE

2500

ESTADO CIVIL

7%

2000

SOLTERO

1500

18%

1000

25%

500

30%

20%

CASADO
UNION LIBRE
DIVORCIADO
VIUDO

Dia de la semana

Medidas de tendencia central


Para las variables estadsticas cualitativas slo es posible hallar la Moda. Con base en los ejemplos
anteriores sera:
El estado civil de la mayora de los encuestados es Unin libre.
El da de la semana que la mayora de las personas encuestadas prefieren para ir a cine es el
domingo.
Para variables cuantitativas:
Las variables numricas de naturaleza cuantitativa involucran la nocin de cantidad, es decir, los valores que
puede asumir la variable son los resultados de medidas numricas, por ejemplo: peso, estatura, edad, etc.
Estas pueden ser discretas o continuas, las discretas son aquellas que slo pueden tomar valores dentro de
un subconjunto finito o numerable de reales (Ortiz, 2009, pg. 9); las continuas pueden tomar cualquier valor
dentro de un intervalo en la recta real. Los sistemas de representacin grfica de estas variables dependen
de los valores que toma la variable estn o no agrupados; as, para los no agrupados se usan los diagramas de
barras y el polgono de frecuencias y para datos agrupados en intervalos se usan histogramas y polgonos de
frecuencias.
Datos No agrupados:
Ejemplo: Se aplica a un curso de 30 alumnos una prueba cuya nota mnima es 0 y la mxima es 9, las notas
son las siguientes:
Nota

Nmero
de
Alumnos
(Frecuencia
Absoluta)

Frecuencia
Absoluta
Acumulada

Porcentaje
(Frecuencia
Relativa)

Frecuencia
Relativa
Acumulada

0
1
2
3
4
5
6
7
8
9

2
3
1
1
1
3
2
5
7
5

2
5
6
7
8
11
13
18
25
30

6,6%
10%
3,3%
3,3%
3,3%
10%
6,6%
16,6%
23,3%
16,6%

6,6%
16,6%
19,9%
23,2%
26,5%
36,5%
43,1%
59,7%
83,3%
100%
Tomado de: http://www.vadenumeros.es/sociales/frecuencia-absoluta-relativa.htm

Medidas de tendencia central datos no agrupados


Media: Medida de tendencia central usualmente llamada promedio, se define como la divisin de la suma de
todos los valores entre el nmero de datos.
La nota promedio alcanzada por los alumnos es de 5,7:
() + () + () + () + () + () + () + () + () + ()
=
= ,

Mediana: Del conjunto de datos obtenidos es el valor que al organizar los datos en orden ascendente o
descendente se encuentra a la mitad o centro de los mismos. Divide al conjunto de datos en dos.
Notas de los alumnos organizadas en este caso de mayor a menor:

0,0,1,1,1,2,3,4,5,5,5,6,6,7,7,7,7,7,8,8,8,8,8,8,8,9,9,9,9,9
El 50% de los alumnos obtuvieron notas por encima de 7
El 50% de los alumnos obtuvieron notas por debajo de 7

Moda: Es el dato que ocurre con mayor frecuencia en un conjunto de elementos estudiados.
La nota ms obtenida por los alumnos fue 8.

Datos agrupados:
Ejemplo: Se encuesta a un grupo de 65 personas de mayores de 60 aos sobre cul es su peso en kilogramos,
los resultados son los siguientes:
Peso Menor: 50 Kg, Peso Mayor: 120 kg
Rango: Xmax-Xmin = 120 50 = 70

Amplitud de cada intervalo: . =

Intervalos de clase

Lk , Lk 1
[50 - 60)
[60 - 70)
[70 - 80)
[80 - 90)
[90 - 100)
[100 - 110)
[110 - 120]

10, Los intervalos estn construidos de 10 en 10.

TABLA DE DISTRIBUCION DE FRECUENCIAS


Frecuencia
Frecuencia Absoluta
Porcentaje
Marcas de Absoluta Acumulada (Frecuencia Relativa)
clase Ck
nk
Nk
55
65
75
85
95
105
115

8
10
16
14
10
5
2

8
18
34
48
58
63
65

12,31 %
15,38 %
24,62 %
21,54 %
15,38 %
7,69 %
3,08 %

Frecuencia Relativa
Acumulada

12,31 %
27,69 %
52,31 %
73,85 %
89,23 %
96,92 %
100 %

Histograma:

Nmero de personas

PESO DE PERSONAS MAYORES DE 60 AOS

Peso en kg
Tomado de http://estadisticaeducativaunefm.blogspot.com/2010/05/poligonos-de-frecuencia.html

Medidas de tendencia central para datos agrupados:


m

Media para un conjunto de datos agrupados: X

(C
k 1

nk )

: Sumatoria
Ck : Marcas de clase de los intervalos en los que se han agrupado los datos.
nk : Frecuencia absolutas de los intervalos de clase.
N : Frecuencia total de los datos considerados.

X =

() + () + () + () + () + () + ()

= ,

El peso promedio de los 65 encuestados, es de 79,7 Kg

Mediana para un conjunto de datos agrupados: X med

N k 1
2
*A
Lk
nk

Para calcularla, es necesario ubicar primero en la distribucin de frecuencias el intervalo en donde se encuentra
la mediana la forma de calcularlo es a travs de encontrar la posicin N / 2, el intervalo donde se encuentra la
mediana se conoce como intervalo mediano.

Son 65 datos, el intervalo mediano se encuentra en 65/2, el intervalo mediano es donde se encuentra el dato 33. El
intervalo mediano se encuentra sealado en la tabla con verde, se observa con base en la frecuencia absoluta
acumulada.

Lk : Limite inferior o frontera inferior del intervalo mediano.


N : Frecuencia total de los datos considerados.
Nk-1 : Frecuencia acumulada anterior al intervalo mediano.
nk : Frecuencia absoluta del intervalo mediano.
A : Amplitud del intervalo en el que se encuentra la mediana .

Intervalos de clase

Lk , Lk 1

TABLA DE DISTRIBUCION DE FRECUENCIAS


Frecuencia
Frecuencia Absoluta
Porcentaje
Marcas de Absoluta Acumulada (Frecuencia Relativa)
clase Ck
nk
Nk

Frecuencia Relativa
Acumulada

[50 - 60)
[60 - 70)

55
65

8
10

8
18

12,31 %
15,38 %

12,31 %
27,69 %

[70 - 80)
[80 - 90)
[90 - 100)
[100 - 110)
[110 - 120]

75
85
95
105
115

16
14
10
5
2

34

24,62 %
21,54 %
15,38 %
7,69 %
3,08 %

52,31 %
73,85 %
89,23 %
96,92 %
100 %

48
58
63
65

Reemplazndolo en la frmula se tiene:

X med

65

18

N k 1
2
2
*10 --------- * A ----------------- X
Lk
med 70
16
nk

X med 79,06

El 50% de las personas encuestadas tiene pesos por encima de 79 kg.

El 50% de las personas encuestadas tiene pesos por debajo de 79 kg.

Moda para un conjunto de datos agrupados:

d1

X mod Lk A

d
2
1

d1 nk nk 1

d 2 nk nk 1
Primero se localiza el intervalo modal, que es aquel en el que hay la mayor densidad de frecuencia por unidad de
intervalo y luego se aplica la formula
El intervalo modal se encuentra sealado en la tabla con morado, se observa el intervalo que tiene mayor frecuencia
absoluta acumulada.

L k :Lmite inferior del intervalo modal.


A : Amplitud del intervalo en el que se encuentra la mediana .
d1 : Diferencia entre la frecuencia del intervalo modal y la frecuencia del intervalo anterior.
d2 : Diferencia entre la frecuencia del intervalo modal y la frecuencia del intervalo posterior.

Intervalos de clase

Lk , Lk 1
[50 - 60)
[60 - 70)
[70 - 80)
[80 - 90)
[90 - 100)
[100 - 110)
[110 - 120]

TABLA DE DISTRIBUCION DE FRECUENCIAS


Frecuencia
Frecuencia Absoluta
Porcentaje
Marcas de Absoluta Acumulada (Frecuencia Relativa)
clase Ck
nk
Nk
55
8
8
12,31 %
65
10
18
15,38 %
75
85
95
105
115

16
14
10
5
2

34
48
58
63
65

24,62 %
21,54 %
15,38 %
7,69 %
3,08 %

Reemplazndolo en la frmula se tiene:

d1

X mod Lk A
d

d
2
1

6
X mod 70 10
77,5
6

El peso que mayor concentracin de personas tiene es de 77,5 kg.

Frecuencia Relativa
Acumulada

12,31 %
27,69 %
52,31 %
73,85 %
89,23 %
96,92 %
100 %

ACTIVIDAD PARTE 1.
LEA EL SIGUIENTE TEXTO Y RESUELVA LAS PREGUNTAS PLANTEADAS:
La intensidad de la utilizacin del "mundo online"
En la ltima dcada, la utilizacin de las llamadas "redes sociales", como el Facebook, el Twitter y el MySpace,
ha tenido un incremento exponencial, siendo particularmente popular entre los ms jvenes. Se estima que
en 2011, el Facebook tena ms de 500 millones de usuarios activos. Datos recientes indican que ms de la
mitad de los adolescentes accede a su red social preferida ms de una vez por da y que el 22% lo hace ms de
10 veces por da. Se puede decir que una gran parte del desarrollo social y emocional de esta generacin, tiene
lugar frente a la pantalla de la computadora y del celular.
Para verificar la existencia de asociacin entre la utilizacin de redes sociales del Internet y algunos sntomas
depresivos en adolescentes, se realiza un estudio inicial en donde se define como poblacin los adolescentes
bogotanos, recurrindose a una muestra de conveniencia constituida por 522 alumnos que frecuentan el 8
ao de escolaridad, inscritos en Colegios Privados del Distrito Capital.
Algunos resultados iniciales de la informacin recolectada se muestran a continuacin:
DISTRIBUCION DE LOS ADOLESCENTES ENCUESTADOS SEGN SEXO
No. de Adolescentes
Porcentaje
SEXO
FEMENINO
MASCULINO

(Frecuencia Absoluta)

(Frecuencia relativa)

nk
298
224

fk
57,1%
42,9%

EDAD A LA CUAL INGRESARON POR PRIMERA VEZ A


LAS REDES SOCIALES
No. de
Porcentaje
Frecuencia
Adolescentes
(Frecuencia
(Frecuencia
Relativa
EDAD
relativa)
Absoluta)
Acumulada

nk

6
7
8
9
10
11
12
13
14
15

51
68
61
75
70
90
43
37
17
10

fk

10%
13%
12%
14%
13%
17%
8%
7%
3%
2%

10%
23%
25%
49%
62%
79%
87%
94%
97%
100%

Con base en la anterior informacin responde a las siguientes preguntas:


1. Escoge cules de las medidas de tendencia central (MTC) es posible calcular de acuerdo a la informacin
presentada. Justifica tu respuesta
INFORMACIN

ES POSIBLE HALLAR
(seale con una x)

Media:

Si ___ No ____

Moda:
Media:

Si ___ No ____
Si ___ No ____

EDAD A LA CUAL
INGRESARON POR
Mediana: Si ___ No ____
PRIMERA VEZ A LAS
REDES SOCIALES

SEXO DE LOS
ADOLESCENTES
ENCUESTADOS

Mediana: Si ___ No ____


Moda:

Si ___ No ____

LOS ADOLESCENTES Media:


Si ___ No ____
EN REDES SOCIALES
PIENSAN QUE LOS
Mediana: Si ___ No ____
COMPAEROS O
CONTACTOS EN SU
Moda:
Si ___ No ____
MAYORA SON
TIEMPO QUE SE
DEDICA
DIARIAMENTE
A LAS REDES
SOCIALES

Media:

Si ___ No ____

Mediana: Si ___ No ____


Moda:

Si ___ No ____

JUSTIFICACIN

2. Completa la tabla de distribucin de frecuencias para datos agrupados teniendo en cuenta el histograma
presentado para el tiempo que dedican los adolescentes diariamente a las redes sociales:
TABLA DE DISTRIBUCION DE FRECUENCIAS

TIEMPO QUE SE DEDICA DIARIAMENTE A LAS REDES SOCIALES


No. de Adolescentes
Tiempo en Minutos
(intervalos)

Lk , Lk 1

Marcas de clase

Ck

(Frecuencia
Absoluta)

nk

Frecuencia
Absoluta
Acumulada

Porcentaje
(Frecuencia relativa)

fk

Nk

[0 - 60)
[60 - 120)
[120 - 180)
[180 - 240)
[240 - 300)
[300 - 360)
[360 - 420)
[420 - 480]

N= 522

3, 4 y 5: Teniendo en cuenta la distribucin de frecuencias realizada en el numeral anterior, calcula las tres
medidas de tendencia central y a partir de estos valores redacta dos conclusiones realizando un anlisis del
tiempo que dedican los adolescentes diariamente a las redes sociales:
CLCULOS

CONCLUSIN

CLCULOS

CONCLUSIN

ACTIVIDAD PARTE 2.
MEDIDAS DE DISPERSIN PARA DATOS NO AGRUPADOS:
6. Las siguientes son las calificaciones de dos estudiantes a primer corte en la asignatura de geometra y
estadstica:
Juan Jos:

4,7

8,9

6,8

4,5

0,4

Ana Mara:

6,5

6,8

Cul estudiante presenta ms variabilidad en sus notas?: ______________________________________


Cmo observaste esto?: _________________________________________________________________

7. Halla la media o promedio ( X ) de las calificaciones de cada uno:


Promedio de Juan Jos: __________________

Promedio de Ana Mara: ______________________

8.RANGO
Qu es el Rango?

RANGO

De qu otra forma se le puede llamar?

Ejemplo 1:
Rango de las calificaciones de Juan Jos:

Ejemplo 2:
Rango de las calificaciones de Ana Mara:

9, 10, 11 y 12. DESVIACIN MEDIA, VARIANZA Y DESVIACIN TPICA


Qu es desviacin respecto a la media?
Cul es su expresin general?
Ejemplo 1: Desviacin respecto a la media de
las calificaciones de Juan Jos:
9. Desviacin
respecto a la
media

Calificaciones
Xi
4,7
8,9
6,8
4,5
0,4
8

Desvi. Respecto a la media


Xi - X

Ejemplo 2: Desviacin respecto a la media de


las calificaciones de Ana Mara:
Calificaciones
Xi

Desvi. Respecto a la media


Xi - X

6,5
6,8
5

Qu es la desviacin media?
Se toma la sumatoria del valor absoluto de la desviacin media de los datos y se divide entre el
nmero de datos.
Cul es su expresin general?

Ejemplo 1: Desviacin respecto a la media de


las calificaciones de Juan Jos:
10.
DESVIACIN
MEDIA

Calificaciones
Xi
4,7
8,9
6,8
4,5
0,4
8

fi

|Xi - X |* fi

Ejemplo 2: Desviacin respecto a la media de las


calificaciones de Ana Mara:
Calificaciones
Xi

|Xi - X |* fi

6,5
6,8
5
N=

N=
D X = _______ =

D X = _______ =

fi

Qu es la varianza?

Cul es su expresin general?

Ejemplo 1: Varianza de las calificaciones de


Juan Jos:
11.
VARIANZA

Calificaciones
Xi
4,7
8,9
6,8
4,5
0,4
8

fi

( Xi - X ) 2* fi

Ejemplo 2: Varianza de las calificaciones de Ana


Mara:
Calificaciones
Xi

fi

( Xi - X ) 2* fi

6,5
6,8
5
N=

S 2 = _______ =

N=

S 2 = _______ =

Qu es la desviacin tpica?

Cul es su expresin general?


12.
DESVIACIN
TPICA
Ejemplo 1: Desviacin tpica de las
calificaciones de Juan Jos:

Ejemplo 1: Desviacin tpica de las calificaciones


de Juan Jos:

S 2 S =

S 2 S =

S =

S =

Cierta empresa colombiana lleva un registro del kilometraje de sus 52 vehculos. A continuacin se presentan
los registros del kilometraje semanal en una tabla de distribucin de frecuencias que refleja 7 agrupaciones de
acuerdo al nivel de kilometraje:
Intervalos
(Kilometraje)

[109
[234
[359
[484
[609
[734
[859

Marcas de
clase Ck

Vehculos
fi

234)
359)
484)
609)
734)
859)
984]

Ck * fi

| Ck - X |* fi

1
1
8
14
8
14
6
N=

Calcula la media, el rango, la desviacin media, la varianza, y la desviacin tpica:


13.
Rango:

14.
Media: X = -----------------

X =

15.
Desviacin media: D X = _______ =

16.
Varianza: S 2 = _______ =

17.

Desviacin tpica: S 2 S =

( Ck - X ) 2* fi

S =

You might also like