You are on page 1of 160

ESTADISTICA

Objetivo:
- Leer e interpretar información de tablas y gráficos
- Recopilar y comunicar información utilizando los procedimientos
más adecuados a la característica de lo que se va a informar.
90
80
70
60
50 Este
40 Oeste
30 Norte
20
10
0
1er trim. 2do trim. 3er trim. 4to trim.
¿Qué es Estadística?
Es la ciencia encargada de recoger, clasificar, describir y analizar
datos numéricos que sirvan para deducir conclusiones y tomar
decisiones a partir de estos análisis.

La Estadística se divide en dos grandes grupos:

 Estadística descriptiva o deductiva:


Se ocupa de la recolección, organización y representación de
datos en forma coherente.
 Estadística inductiva o inferencial:
Se ocupa de interpretar los datos recogidos y obtener
conclusiones a partir de ellas.
¿ Qué es una población?
Población o Universo: Es el conjunto de todos los individuos u
objetos que poseen alguna característica común observable.
Una población puede ser finita o infinita.
Ejemplo:
- La población consistente en la fabricación de brocas, en
una empresa determinada, en un día determinado, es finita.
- La población formada por todos los posibles sucesos (caras o
sellos en tiradas sucesivas de una moneda es infinita.
- La población formada por los Números Naturales es infinito
- La población formada por el número de alumnos de un Universidad
determinada, en un año determinado es finito.
¿Qué es una muestra?

Muestra es un subconjunto de la población. Es una parte de ella.

Se dice que una muestra es representativa de la población, cuando


corresponde más o menos al 20% de ella. Y se pueden deducir
importantes conclusiones acerca de ésta, a partir del análisis de
la misma.
Ejemplo:
Población: Campos petroleros en Colombia.
Muestra: Campos que tiene Ecopetrol.
¿Qué es una variable?

Una variable es la característica o atributo a observar.


El conjunto de valores asignados a la variable se llama dato o
dominio de la variable.
Las variables pueden ser continuas o discretas.
Variable continua es aquella que puede tomar cualquier valor
entre dos valores dados, es decir, en un rango determinado.
Ejemplo:
La estatura de los alumnos de un cuarto básico es continua,
porque pueden medir 1,70 m 1,72 m 1,708 m etc
Variables discreta son aquellas que toman un valor entero

Ejemplo:
El número de hijos de una familia es discreta, porque puede
haber 1, 2, 3, ....etc. hijos

Ejercicios

 Decir de las variables siguientes cuáles representan datos


discretos o datos continuos.
 Número de acciones vendidas cada día en un mercado de
valores.
Respt: Discreta
 Temperaturas registradas cada media hora en un observatorio.
Respt: Continua

 Período de duración de taladros producidos por una


empresa determinada
Respt: Continua
 Censos de Ingenieros egresados.
Respt: Discreta

 Número de billetes de $10000 circulando en Colombia


Respt: Discreta
 Pulgadas de precipitación en una ciudad durante varios meses
del año.
Respt: Continua
 Alumnos matriculados en la UIS, en
los últimos cinco años.
Respt: Discreta

 Dar el dominio de cada una de las siguientes variables y decir


si son continuas o discretas.
 Número de litros de agua en una máquina de lavar.
Dominio : cualquier valor de cero litros a la capacidad de la
máquina ( 12,3 12,005 12,0047 etc)
Variable : Continua

 Número de libros en un estante de librería.


Dominio : 0, 1, 2, 3, ........ Hasta el mayor número de libros
que puedan entrar en el estante.
Variable : Discreta
 Suma de puntos obtenidos en el lanzamiento de un par de
dados

Dominio : 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12


Variable : Discreta
 Tiempo de vuelo de un proyectil
Dominio : De cero en adelante ( 5 5,3 5.045 etc)
Variable : Continua
 Estado civil de un individuo
Dominio : Casado, soltero, viudo
Variable : Discreta
 Velocidad de un automóvil en kilómetros por hora.
Dominio : De 0 en adelante ( 120 120,8 120,04 etc)
Variable : Continua
Distribuciones de frecuencias
Toma de datos: Es la obtención de una colección de los mismos
que no han sido ordenados numéricamente.
Ejemplo: Conjunto de alturas de 100 estudiantes, sacados de una
lista alfabética de una Universidad.

Ordenación: Es una colocación de los datos numéricos tomados,


en orden creciente o decreciente de magnitud.
Ejemplo:
32 , 45, 100, 120 , 145, 186, 198, 200 ( ordenación creciente )
200, 198, 186, 145, 120, 100, 45, 32 ( ordenación decreciente)
Al recoger información se obtiene un gran número de datos,
que conviene presentar en forma resumida en una tabla llamada
distribución de frecuencias.

Frecuencia absoluta: es el número de veces que se repite un valor


de la variable.
Ejemplo:
Los siguientes datos son las calificaciones obtenidas, en la
asignatura de Matemática, por un grupo de 30 alumnos:
7–3–5–4–3–4–5–6–5–7–3–2–6–5–4–6–
3 - 4 – 5 – 2 - 7 – 4 – 5 – 7 – 6 – 5 – 4 – 2 –3 - 1
Variable Estadística Frecuencia absoluta
Calificación Nº de alumnos
1 1
2 3
3 5
4 6
5 7
6 4
7 4
Frecuencia acumulada hasta un valor determinado: es el número
de observaciones menor o igual al valor considerado.
Se obtiene sumando sucesivamente las frecuencias absolutas.

Ejemplo:
Variable estadística Frecuencia absoluta Frecuencia acumulada
Calificación Nº de alumnos -------------
1 1 1

2 3 4
3 5 9
4 6 15
5 7 22
6 4 26
7 4 30
Frecuencia relativa: es el cuociente entre la frecuencia absoluta
y el número total de individuos de la muestra

Variable estadística Frecuencia absoluta Frecuencia relativa


Calificación Nº de alumnos -----------
1 1 1 / 30
2 3 3 / 30
3 5 5 / 30
4 6 6 / 30
5 7 7 / 30
6 4 4 / 30
7 4 4 / 30

NOTA: La suma de las frecuencias relativas es igual a 1


Ej. 1 / 30 + 3 / 30 + 5 / 30 + 6 / 30 + 7 / 30 + 4 / 30 + 4 / 30 = 30 / 30
= 1
Frecuencia relativa porcentual: Es la frecuencia relativa
expresada en porcentajes.

Variable estadística Frecuencia absoluta Frecuencia relativa porcentual


Calificación Nº de alumnos -----------
1 1 ( 1 / 30 ) • 100
2 3 ( 3 / 30 ) • 100
3 5 ( 5 / 30 ) • 100
4 6 ( 6 / 30 ) • 100
5 7 ( 7 / 30 ) • 100
6 4 ( 4 / 30 ) • 100
7 4 ( 4 / 30 ) • 100

NOTA: La suma de las frecuencias relativas porcentuales es el


100%
Ejercicios
 Los siguientes datos son las calificaciones de un grupo de 27
alumnos en la asignatura de matemática:
5 6 5 7 4 2 3 5 4 6 7 5 4 6 5 4 5 6
4 3 4 6 7 5 4 5 6
a) Construya una tabla de distribución de frecuencias
b) ¿Cuántos alumnos tienen nota inferior a 5?
c) ¿Qué porcentaje de alumnos tiene nota 4?
d) ¿Cuántos alumnos tiene nota 6?
e) ¿Qué porcentaje de alumnos tiene nota superior o igual a 4?
Respuesta
Calificación frecuencia Frecuencia Frecuencia Frec. relat.
acumulada relativa porcentual
2 1 1 1 / 27 = 0,037 3,7
3 2 3 2 / 27 = 0,074 7,4
4 7 10 7 / 27 = 0,259 25,9
5 8 18 8 / 27 = 0,296 29,6
6 6 24 6 / 27 = 0,222 22,2
7 3 27 3 / 27 = 0,111 11,1

b) 10 alumnos tienen nota inferior a 5,0


c) El 25,9% de los alumnos tiene nota 4,0
d) 6 alumnos tienen nota 6,0
e) El 88,8% de los alumnos tiene nota igual o superior a 4,0
 Una encuesta realizada a alumnos de Bachillerato acerca
de su futura profesión, indica lo siguiente:

Variable F. absoluta a) Completar la tabla con frecuencia


profesión Nº de alumnos acumulada, relativa y relativa
Ingeniería 10 porcentual.
Medicina 6
b) ¿Cuántos alumnos fueron encuestados?
Economía 12
c) ¿Cuál es la profesión que tiene mayor
Periodismo 8
preferencia?
Derecho 5
9
d) ¿Qué porcentaje de alumnos prefiere
Arquitectura
Otras 10
arquitectura?
e) ¿Qué porcentaje de alumnos prefiere
medicina?
Respuesta
Profesión Frecuencia F. acumulada F. relativa F. relat. %
Ingeniería 10 10 10 / 60 = 0,166 16,6
Medicina 6 16 6 / 60 = 0,100 10,0
Economía 12 28 12 / 60 = 0,200 20,0
Periodismo 8 36 8 / 60 = 0,133 13,3
Derecho 5 41 5 / 60 = 0,083 8.3
Arquitectura 9 50 9 / 60 = 0,150 15,0
Otros 10 60 10 / 60 = 0,166 16,6

b) 60 alumnos fueron encuestados


c) Economía es la profesión con mayor frecuencia
d) El 15% de los alumnos prefiere Arquitectura
e) El 10% de los alumnos prefiere Medicina
 En una muestra de 40 familias, el número de hijos se
distribuye según la tabla:
a) Completa la tabla con frecuencia
acumulada, relativa y relativa
Variable F. absoluta porcentual.
Nº de hijos Nº de familias b) ¿Cuántas familias tienen menos de
4 hijos?
1 2
c) ¿Cuántas familias tienen 5 hijos?
2 8
d) ¿Cuál es la frecuencia relativa de las
3 12 familias que tienen 2 hijos?
4 14 e) ¿Qué porcentaje de familias tiene 6
5 3
hijos?
f) ¿Qué fracción representan las familias
6 1
con 2 hijos?
g) ¿Qué fracción representan las familias
con 4 hijos?
Respuesta
Nº hijos Frecuencia F. acumulada F, relativa Frec. Relat. %
1 2 2 2 / 40 = 0,05 5
2 8 10 8 / 40 = 0,20 20
3 12 22 12 / 40 = 0,30 30
4 14 36 14 / 40 = 0,35 35
5 3 39 3 / 40 = 0,075 7,5
6 1 40 1 / 40 = 0,025 2,5

b) 22 familias tienen menos de 4 hijos


c) 3 familias tienen 5 hijos
d) La frecuencia relativa de familias con 2 hijos es de 0,20
e) El 2,5% de las familias tiene 6 hijos
f) 1 / 5 de las familias tienen 2 hijos
g) 7 / 20 de las familias tienen 4 hijos
Medidas de tendencia central en
valores no agrupados.
Son valores representativos de la totalidad de los datos.
Su cálculo permite analizar los datos en torno a un valor central.

Los valores centrales más usados son:


 Media aritmética.
 Mediana
Moda.
Media aritmética ( X )

 Media aritmética: corresponde al promedio de los valores.


Se simboliza por X

La media aritmética se obtiene sumando los valores de la variable


dividido por el número total de valores.

En forma General :
X = x1 + x2 + x3 +....xn
n
Ejemplo:
Determinar el promedio de notas de un alumno, en la asignatura
de Lenguaje y comunicación.

Las notas son: 3- 5 - 7 - 6 - 4 - 5 - 3 - 5 - 4 - 5 - 3 - 4

X = 3 + 5 + 7 + 6 + 4 +5 + 3 +5 + 4 + 5 + 3 + 4 = 54 = 4,5
12 12

Luego, el promedio de notas del alumno es 4,5


La media aritmética ponderada es otra forma de calcular el
promedio, utilizando la tabla de distribución de frecuencias.

Ejemplo: Se debe multiplicar cada valor con su


Notas Frecuencias
frecuencia.
3 3
3 • 3 = 9 4 • 3 = 12 5 • 4 = 20
4 3
6•1=6 7•1=7
5 4 Se suman los productos:
6 1 9 + 12 + 20 + 6 + 7 = 54
7 1
La suma del producto se divide por el
total de datos:
54 : 12 = 4,5
Luego,
X = 4,5
Mediana ( Me )
Es el valor de la variable que deja igual número de valores antes y
después de él en una distribución de frecuencias
Según el número de valores de la variable se distinguen dos casos:
 Si el número de valores es impar, la mediana coincide con el
valor central.
Ejemplo: 5 – 8 – 9 – 11 – 12 – 13 – 15
Luego, la mediana es el 11

NOTA: los valores deben estar ordenados. Puede ser en forma


creciente o decreciente
 Si el número de valores es par, la mediana es el promedio
aritmético de los dos valores centrales.
Ejemplo:
2 – 3 – 5 – 6 – 8 – 9 – 11 – 12

El calculo sería: ( 6 + 8 ) : 2 = 14 : 2 = 7

Luego, la mediana es 7
Moda ( Mo )
Es el valor de la variable que tiene mayor frecuencia

Ejemplo:

Variable F. absoluta La moda es 4 hijos, porque tiene


Nº de hijos Nº de familias mayor frecuencia, que es del 14
1 2 familias.
2 8
3 12
4 14
5 3
6 1
Ejercicios
 Las calificaciones de un estudiante de la UIS, en seis pruebas,
fueron 84, 91, 72, 68, 87 y 78. Hallar el promedio de sus notas.
Respuesta:
X = 84 + 91 + 72 + 68 + 87 + 78 = 480 = 80
6 6

Luego, el estudiante tiene promedio 80

 Diez medidas de diámetro de un cilindro fueron registradas como:


3,88 4,09 3,92 3,97 4,02 3,95 4,03 3,92 3,98 y 4,06
Respuesta:

X = 3,88 + 4,09 + 3,92 + 3,97 + 4,02 + 3,95 + 4,03 + 3,92 +3,98 +4 ,06
10
= 39,82 = 3,98 Luego, la media aritmética es 3,98
10

Calcular el salario medio semanal de 65 empleados


Salario Frecuencia
$ 55.000 8
$ 65.000 10
$ 75.000 16
$ 85.000 14
$ 95.000 10
$ 105.000 7
Respuesta

Salario ( x) Frecuencia F•X


$ 55.000 8 $ 440.000
$ 65.000 10 $ 650.000
$ 75.000 16 $ 1.200.000
$ 85.000 14 $ 1.190.000
$ 95.000 10 $ 950.000
$ 105.000 7 $ 735.000

X = 440.000 + 650.000+ 1.200.000 + 1.190.000 + 950.000 + 735.000


65
Luego, el sueldo promedio es
= 5.165.000 = 79.461,538 $ 79.461,5
65
 Las calificaciones de un estudiante de la UIS, en seis
pruebas, fueron 84, 91, 72, 68, 87 y 78. Hallar la mediana de
sus calificaciones

Respuesta:
Se deben ordenar las calificaciones: 68 72 78 84 87 91
Luego, la mediana es 78 + 84 = 162 = 81
2 2

 Hallar la moda de los siguientes números: 3, 5, 2, 6, 5, 9, 5,


2, 8.
Respuesta:
La moda es el número 5, ya que su frecuencia es mayor
Representación gráfica de la
información
 Gráfico lineal o de segmentos:
Se utiliza especialmente para representar datos numéricos de
situaciones que ocurren en períodos sucesivos.
35
30
25
Temperatura

20
15
10
5
0
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
 gráfico de Barra : Permite hacer comparaciones mediante
barras paralelas colocadas en forma vertical u horizontal
entre dos ejes perpendiculares.

90
80
70
60
50
40 Matematica
30 Lenguaje
20
10
0
1er 2do 3er 4to
trim. trim. trim. trim.
 Gráfico circular: Consiste en un círculo dividido en sectores
que representan las frecuencias relativas porcentuales de una
distribución
Los 360 grados del círculo se dividen proporcionalmente al
porcentaje correspondiente de cada frecuencia.

4to trim. 1er trim.


13% 13%

2do trim.
17%

3er trim.
57%
Gráfica de Datos
Existen dos tipos de gráficas mas usuales:
 Polígono de Frecuencias

 Histograma

Otros gráficos:
 Gráfica de barras

 Pictograma

 Gráfico Circular o de pastel.


Polígono de Frecuencias
Es la representación mediante un gráfico de
línea. En él se muestra la distribución de
frecuencias y está formado por segmentos de
línea que unen los puntos correspondientes a
la frecuencia de cada una de las clases.

El eje “x” representa el dato “xi”


y el eje “y” las frecuencias.
Ejemplo
9 Polígono de Frecuencias
8
7
6
5
f 4
Intervalo de Punto medio f 3
clase “xi” 2
38 – 42 40 2 1
0
43 – 47 45 4
35 40 45 50 55 60 65 70
48 – 52 50 8 xi
53 – 57 55 5

58 – 62 60 3

63 - 68 65 3

Total 25
El eje “y” puede ser sustituido por las
frecuencias relativas o porcentuales.
Polígono de Frecuencia Relativa
0.35

0.3

0.25
fr 0.2

0.15

0.1

0.05

0
35 40 45 50 55 60 65 70
xi
Polígono de Frecuencia Porcentual

35

30

25

% f 20

15

10

0
35 40 45 50 55 60 65
xi
Histograma
14

Es la representación gráfica de 12

10

los datos mediante una sucesión 6

de rectángulos. 0
0,95 2,95 4,95

Está formado por rectángulos cuya anchura


representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.
En el eje “x” estarán los límites verdaderos,
los puntos medios y en el eje “y” las
frecuencias.
Intervalo de Punto medio f
clase “xi”

Ejemplo 38 – 42 40 2

43 – 47 45 4

48 – 52 50 8

53 – 57 55 5

58 – 62 60 3
Histograma
63 - 68 65 3
9
Total 25
8
7
6
5
f
4
3
2
1
0
35 40 45 50 55 60 65
xi
También podemos usar la frecuencia relativa y
la frecuencia porcentual.
Histograma con frecuencias relativas
0.35
0.3
0.25
fr
0.2
0.15
0.1
0.05
0
35 40 45 50 55 60 65
xi
Histograma con frecuencias porcentuales
35

30

25

20
%f
15

10

0
35 40 45 50 55 60 65
xi
Pirámide Poblacional
Una variante en el histograma es colocar en el
eje “x” de tal manera que las columnas
quedarán en forma horizontal, es muy común
en datos poblacionales.
Ojiva
Es la representación gráfica de las frecuencias
acumuladas mediante un gráfico de línea. Se
muestra la distribución de frecuencias
acumuladas de los datos.

En el eje “x” estarán los puntos medios y en el


eje “y” las frecuencias acumuladas.
Ejemplo

Intervalo Punto f fr fa
de clase medio “xi”
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63 - 68 65 3 0.12 25
Total 25 1
Ojiva
30

25 25

22
20 19

fa 15 14

10
6
5
2
0 0
35 40 45 50 55 60 65
xi
Usando la frecuencia acumulada y la
frecuencia porcentual.
Intervalo Punto medio f fr f% fa fra f%a
de clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63 - 68 65 3 0.12 12 25 1 100
Total 25 1 100
Ojiva con frecuencia relativa acumulada
1
0.9 0.88

0.8 0.76
0.7
0.6 0.56
fra 0.5
0.4
0.3
0.24
0.2
0.1 0.08

0 0

35 40 45 50 55 60
xi
Ojiva con frecuencia porcentual acumulada
100
90 88

80 76
70
60 56
f%a 50
40
30
24
20
10 8

0 0

35 40 45 50 55 60
xi
Gráfico Circular
También es llamado gráfico de pastel.

Sólo se representan datos de frecuencias


relativas o frecuencias porcentuales.

Se debe dividir el área del círculo de manera


proporcional a las frecuencias. 13% 13%
17%
PERRO
PAJARO
HAMSTER
GATO
57%
Agregaremos una columna a nuestra tabla de
frecuencias “Frecuencia relativa al círculo”,
multiplicando (fr)(360°), para mostrar la parte
proporcional de círculo medida en grados que
corresponde a cada intervalo.
Ejemplo 1
0.08 x
360°
Intervalo Punto medio f fr (fr ) (360°)
de clase “xi” 0.16 x
38 – 42 40 2 0.08 28.8° 360°

43 – 47 45 4 0.16 57.6°
48 – 52 50 8 0.32 115.2°
53 – 57 55 5 0.20 72°
58 – 62 60 3 0.12 43.2°
63 - 68 65 3 0.12 43.2°
Total 25 1 360°
Gráfico Circular 40
8%
60
12% 65
12% 45
16%

55
20% 50
32%
Ejemplo 2
Color Frecuencia Conteo Color de Playera
Azul IIII 4 Azul Blanco Café Gris
Negro Rosa Verde
Blanco IIII I 7 4%
Café II I I 3 16%
16%
Gris 4 8%
IIII
28%
Negro II 2 16%
Rosa IIII 4 12%
Verde I 1
Otros Gráficos
La gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan
separadas unas de otras.
La escala en el eje “x” es para mostrar
categorías o intervalos de números NO
consecutivos. Frecuencia absoluta
60

50

40

30

20

10

0
PERRO PAJARO HAMSTER GATO
Carrera Alumnos
Elección de Carrera
Medicina 8
Mecánica 11 11 11
Civil 8 8 8
6
Agronomía 3 3 3
Físico - Matemáticas 3
Leyes 6
Contaduría 11
Pictograma
Similar al de barras, sólo que se sustituyen por
figuras, generalmente relacionadas con la
variable estudiada.
Distribución de frecuencias con
datos agrupados
 Rango: Es la diferencia entre el mayor valor y el menor de ellos.
Ejemplo:
Si la estatura del alumno más alto de un curso es 1,92 m
y la del menor es 1,68 m, entonces el rango de estos datos es:
1,92 m – 1,68 m = 0,24 m = 24 cm.

 Clases o intervalos : En la ordenación de datos muy numerosos,


es usual presentarlos agrupados y ordenados en clases o categorías.
Ejemplo:
En un grupo de 50 alumnos se registraron los siguientes
puntajes en una prueba:

61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
62 83 75 67 72 83 83 84 84 67 71 87 80
77 64 77 82 83 85 79 72 83 83 87
Para ordenarlos y agruparlos, se establecen los intervalos
que se usarán, determinando el rango de los datos.
Dato mayor: 88 Dato menor: 61 Rango: 88 – 61 = 27
De acuerdo con el rango y teniendo en cuenta la cantidad de
datos, se forman los intervalos.
Si quisiéramos formar 6 intervalos, se tiene que dividir el rango
con la cantidad deseada.
27 : 6 = 4, 5 se aproxima a 5 ( amplitud aparente del intervalo)

Intervalo de puntajes Frecuencias


60 – 64 5 El intervalo 60 – 64 es un
65 – 69 5 símbolo para representar
70 – 74 8 a la clase respectiva
75 – 79 12 Los valores 60 y 64 son
80 – 84 16 los límites aparentes de
85 – 89 4 la clase.
Los límites reales de una clase se obtienen calculando el
promedio entre el límite aparente superior de una clase y el
límite aparente inferior de la clase siguiente.

Ejemplo: Calcular los límites reales de la clase 70 – 74

Lri = 69  70 =
139 = 69,5 Límite real inferior
2 2
Lrs = 74  75 =
149 = 75,5 Límite real superior
2 2
 Tamaño o amplitud de una clase: Corresponde a la diferencia
entre su límite real superior y el límite real inferior.
Ejemplo:
75,5 – 69,5 = 5 Su amplitud es igual a 5
NOTA: Todas las clases tienen igual tamaño.
 Marca de clase: Es el punto medio de un intervalo de
clase.

Ejemplo.
Intervalo Marca de clase
60 – 64 62
65 – 69 67
70 – 74 72

 Frecuencia total: Es la suma de las frecuencias absolutas de


todas las clases.
Ejemplo: Frecuencia total
Intervalo Frecuencia
12 + 11 + 10 = 33
1–5 12
6 – 10 11
11 -15 10
Ejercicios
 Dado los siguientes puntajes, determinar:
61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
62 83 75 67 72 83 83 84 84 67 71 87 80
77 64 77 82 83 85 79 72 83 83 87

a) Determinar seis intervalos


b) Determinar el límite real superior e inferior de cada clase
c) Determinar la marca de clase de cada intervalo
d) Determinar la frecuencia absoluta
Respuesta
Se debe determinar el rango: Pje mayor – Pje menor:
88 – 61 = 27
Luego, 27 : 6 = 4,5 se aproxima a 5 la amplitud del intervalo

Intervalo Lri - Lrs Marca de clase Frecuencia


60 – 64 59,5 – 64,5 62 5
65 – 69 64,5 – 69,5 67 5
70 – 74 69,5 – 74,5 72 8
75 – 79 74,5 – 79,5 77 12
80 – 84 79,5 – 84,5 82 16
85 – 89 84,5 – 89,5 87 4
 Ordena los siguientes datos de menor a mayor y calcula
su rango: 3,22 2,92 3,01 4,48 5,06 4,31 2,98 3,07

Respuesta:
Ordenado: 2,92 2,98 3,01 3,07 3,22 4,31 4,48 5,06
Rango: 5,06 – 2,92 = 2,14

 La siguiente distribución de frecuencias corresponde a los


salarios de los empleados de una fábrica:
Salarios ( $ ) Frecuencia
50.000 – 54.999 7

55.000 – 59.999 18
60.000 – 64.999 32
65.000 – 69.999 45
70.000 – 74.999 52
75.000 – 79.999 28
80.000 – 84.999 16
85.000 – 89.999 8
a) Calcula los límites reales del tercer intervalo

Respuesta:
Lri = 59.999 + 60.000 = 59.999,5
2
Lrs = 64.999 + 65.000 = 64.999,5
2
b) Calcula el tamaño de los intervalos
Respuesta: Lrs – Lri = amplitud
64.999,5 - 59.999,5 = 5000
c) Determina el límite aparente inferior del séptimo intervalo
Respuesta:
[80.000 – 84.999] Límite aparente inferior: 80.000
d) Determina el límite real superior del segundo intervalo

Respuesta:
[55.000 – 59.999] Lrs = 59.999 + 60.000 = 59.999,5
2
e) Escribe en orden la marca de clase
Respuesta:
Salarios ( $ ) Marca de clase
50.000 – 54.999 52.499,5

55.000 – 59.999 57.499,5


60.000 – 64.999 62.499,5
65.000 – 69.999 67.499,5
70.000 – 74.999 72.499,5
75.000 – 79.999 77.499,5
80.000 – 84.999 82.499,5
85.000 – 89.999 87.499,5
f) Determina la frecuencia acumulada.

Respuesta:
Salarios ( $ ) Frecuencia acum
50.000 – 54.999 7
55.000 – 59.999 25
60.000 – 64.999 57
65.000 – 69.999 102
70.000 – 74.999 154
75.000 – 79.999 182
80.000 – 84.999 198
85.000 – 89.999 206
g) Determinar la frecuencia relativa

Respuesta:
Salarios ( $ ) Frecuencia relativa
50.000 – 54.999 7 / 206 = 0,033
55.000 – 59.999 18 / 206 = 0,087
60.000 – 64.999 32 / 206 = 0,155
65.000 – 69.999 45 / 206 = 0,218
70.000 – 74.999 52 / 206 = 0,252
75.000 – 79.999 28 / 206 = 0,135
80.000 – 84.999 16 / 206 = 0,077
85.000 – 89.999 8 / 206 = 0,038
h) Determinar la frecuencia relativa porcentual

Respuesta:
Salarios ( $ ) Frecuencia relativa %
50.000 – 54.999 3,3
55.000 – 59.999 8.7
60.000 – 64.999 15,5
65.000 – 69.999 21,8
70.000 – 74.999 25,2
75.000 – 79.999 13,5
80.000 – 84.999 7,7
85.000 – 89.999 3,8
Ejercicio
Después de medir las alturas de 40 alumnos de un curso,
resultaron los siguientes valores de la variable:
154 178 150 166 182 175 163 175 150 162
152 155 161 165 160 159 160 168 165 162
163 155 157 161 162 155 167 164 162 158
158 163 166 167 156 164 170 176 172 160

a) Determina el rango
Respuesta:
182 - 150 = 32
b) Determina 7 intervalos:

Respuesta: El rango es 32. Luego, 32 : 7= 4,5 (5 amplitud )

Intervalo c) Determinar la frecuencia


150 – 154
155 – 159
Respuesta:
160 – 164 Intervalo Frecuencia
165 – 169 150 – 154 4
170 – 174 155 – 159 8
175 – 179 160 – 164 14
180 – 184 165 – 169 7
170 – 174 2
175 – 179 4
180 – 184 1
d) Determinar la marca de clase de los intervalos

Respuesta:
Intervalo M de C
e) Determinar el límite
150 – 154 152 real inferior del tercer
155 – 159 157
160 – 164 162
intervalo
165 – 169 167
Respuesta:
170 – 174 172
175 – 179 177 Lri = 159 + 160 = 159,5
180 – 184 182 2

f) Determinar el límite real superior del quinto intervalo


Respuesta:
Lrs = 174 + 175 = 174,5
2
g) Determinar la frecuencia acumulada

Respuesta:
h) Determinar la frecuencia
Intervalo F. acum
150 – 154 4 relativa porcentual
155 – 159 12 Respuesta:
160 – 164 26
165 – 169 33 Intervalo F. Relat %
170 – 174 35
150 – 154 10
175 – 179 39
155 – 159 20
180 – 184 40
160 – 164 35
165 – 169 17,5
170 – 174 5
175 – 179 10
180 – 184 2,5
i) ¿Cuántos alumnos miden menos de 160 ?

Respuesta: 12 alumnos miden menos de 160


j) ¿Qué porcentaje de alumnos mide entre 170 y 174 ?
Respuesta: El 5% de los alumnos miden entre 170 y 174
k) ¿Qué porcentaje de alumnos mide entre 160 y 174 ?

Respuesta: El 57,5 % de los alumnos mide entre 160 y 174

l) ¿Cuál es la frecuencia total ?


Respuesta: n = 40
m) ¿Cuál es la amplitud del intervalo ?
Respuesta: c = Lrs – Lri = 159,5 - 154,5 = 5
Medidas de tendencia central en
datos agrupados
 Media aritmética: Se suma el producto de la marca de clase con
la frecuencia y se divide por la frecuencia total.
En forma general : X =  f • x
 f

Ejemplo:
Intervalo Frecuencia Marca de clase f • x X = 3805
60 – 64 5 62 310
50
65 – 69 5 67 335
70 – 74 8 72 576
75 – 79 12 77 924 X = 76,1
80 – 84 16 82 1312
85 – 89 4 87 348
Mediana: Es calcular un valor que separa al conjunto en dos
grupos de igual cantidad.

Para calcular la mediana se ocupa la siguiente formula:

Me = L i m + (n/2 – f( acum. ant ) ) • c


fm

L i m = límite real inferior del intervalo mediano ( primer intervalo


cuya frecuencia acumulada es igual o mayor que n/2 )
n / 2 = mitad de la frecuencia total
f( acum. ant ) = frecuencia acumulada del intervalo anterior al
intervalo mediano
c = amplitud del intervalo
f m = frecuencia absoluta del intervalo mediano
Ejemplo
Hallar la mediana de los pesos de 40 estudiantes, dado en la
siguiente tabla de distribución
Intervalo Frecuencia F acum
118 – 126 3 3
n / 2 = 40 / 2 = 20
127 – 135 5 8
L i m = 144 + 145 = 144,5
136 – 144 9 17
145 – 153 12 29
2
154 – 162 5 34 f ( acum. ant ) = 17
163 – 171 4 38
172 – 180 2 40
c = 144,5 + 153,5 = 9
n = 40 f m = 12

M e = 144,5 + ( 20 – 17 ) • 9 = 144,5 + 3 • 9 = 144,5 + 27 = 146,75


12 12 12
Ejemplo 2
Las edades de los obreros que trabajan en una empresa constructora,
se distribuyen como sigue:
n / 2 = 180 / 2 = 90 c=5
Edad Frecuencia F acum
18 – 22 15 15 L i m = 32 + 33 = 32,5
23 – 27 26 41 2
28 – 32 30 71 f( acum ant) = 71 f m = 38
33 – 37 38 109
38 – 42 32 141
Me = L i m + (n/2 - f(acum ant)) • c
43 – 47 20 161
48 – 52 12 173
fm
53 – 57 7 180
= 32,5 + ( 90 - 71) • 5
38
n = 180 = 32,5 + 19 • 5 = 32,5 + 2,5
38
Me = 35
Moda
Cuando los datos están agrupados en intervalos, la moda
corresponde a la marca de clase del intervalo de mayor
frecuencia
Ejemplo: La tabla de distribución muestra el número de horas
que un grupo de jóvenes dedica a ver televisión diariamente.
Horas frecuencia
0–2 25 El intervalo modal es [3 - 5]
3–5 35 Luego, se dice que la moda es su marca
6–8 25 de clase.
9 – 11 10
M de C = 3 + 5 = 4 Mo = 4 horas
12 - 14 5
2
Representación gráfica en datos
agrupados
Histograma: Es un gráfico de barras verticales que sirve para
representar los datos de una distribución de frecuencias
en la cual los valores de la variable están agrupados en
intervalos.

El histograma tiene la siguiente característica:


Las bases de las barras o rectángulos están sobre el eje horizontal y
su ancho ( longitud sobre el eje) es igual al tamaño de los intervalos
de clase.
Ejemplo:
Esta tabla de distribución de frecuencias indica las edades de los
alumnos que asisten a clases de Inglés.

Edad frecuencia f
5–7 8
8 – 10 10
10
11 – 13 7 8
14 – 16 5 6
17 – 19 4 4
2
Eje x = intervalos I
Eje y = frecuencia 5- 7 8-10 11-13 14-16 17-19
Polígono de frecuencia
Es la modalidad de un gráfico de datos que se origina al unir
los puntos medios de los lados superiores de las barras de un
histograma. f

El punto medio 10 •
de cada intervalo 8 •
es la marca de •
6
clase •
4 •
2
x
6 9 12 15 18
¡ Puff……!

Ejercicio
Dada la tabla de distribución de edades de un grupo de padres
cuyos hijos están en primer año de universidad.
Hallar: a) media aritmética b) Mediana c) Moda
Edad frecuencia a) Media aritmética
45 – 48 2 Edad f x f•x
49 – 52 5 45 – 48 2 46,5 93
53 – 56 12 49 – 52 5 50,5 252,5
57 – 60 8 53 – 56 12 54,5 654
61 – 64 5 57 – 60 8 58,5 468
61 – 64 5 62,5 312,5

X =  f • x = 1780 = 55,625
n 32
b) Mediana

Edad f F acum n / 2 = 32 / 2 = 16
45 – 48 2 2
49 – 52 5 7
L i m = 52 + 53 = 52,5
53 – 56 12 19 2
57 – 60 8 27
f (acum ant) = 7
61 – 64 5 32
n = 32 c = 56,5 - 52,5 = 4
f m = 12
Me = 52,5 + ( 16 – 7 ) • 4 = 52,5 + 9 • 4 = 55,5
12 12
c)
: Moda:
El intervalo modal es [53 - 56] . Luego. La moda es su marca
de clase: 53 + 56 = 54,5
2
* Construye una tabla de distribución de frecuencias de datos
agrupados en intervalos de clase. Considera como limite
inferior del primer intervalo = 10 y c = 10
El puntaje obtenido por 130 alumnos en una prueba de biología
es el siguiente:

12 45 53 85 23 91 34 56 65 70 72 74 86
95 32 45 56 58 33 49 55 70 66 62 64 55
83 26 34 72 60 64 72 80 58 98 50 20 35
76 68 90 99 56 48 56 68 82 40 92 38 56
84 66 78 74 25 15 48 50 66 49 53 83 91
42 64 72 54 89 92 28 34 40 56 64 68 63
35 56 66 38 82 78 74 90 85 66 70 72 58
66 80 80 95 96 99 94 40 42 58 65 67 81
90 50 48 52 62 70 80 93 45 36 49 81 73
56 38 51 23 90 84 96 75 38 28 36 83 29
Respuesta:

Intervalo M. de Clase frecuencia F. acum. F. Relat F. Relat.%


10 – 19 14,5 2 2 0,015 1,5
20 – 29 24,5 8 10 0,061 6,1
30 – 39 34,5 13 23 0,100 10,0
40 – 49 44,5 14 37 0,107 10,7
50 – 59 54,5 22 59 0,169 16,9
60 – 69 64,5 20 79 0,153 15,3
70 – 79 74,5 17 96 0,130 13,0
80 – 89 84,5 17 113 0,130 13,0
90 - 99 94,5 17 130 0,130 13,0
De acuerdo con la tabla anterior, responder las siguientes
preguntas:

a) ¿Cuántos alumnos obtuvieron entre 30 y 49 puntos?

Respuesta: Hay 27 alumnos

b) ¿Cuántos alumnos obtuvieron entre 60 y 89 puntos?


Respuesta: Hay 54 alumnos

c) ¿Cuántos alumnos obtuvieron entre 40 y 99 puntos?


Respuesta: Hay 107 alumnos
d) ¿Qué porcentaje de alumnos obtuvieron entre 30 y 49 puntos?

Respuesta: El 20,7 % de los alumnos

e) ¿Qué porcentaje de alumnos obtuvo entre 50 y 59 puntos?

Respuesta: el 16,9 % de alumnos

f) ¿Cuántos alumnos obtuvieron menos de 60 puntos?

Respuesta: 59 alumnos
g) ¿Cuántos alumnos obtuvieron menos de 30 puntos?

Respuesta: 10 alumnos

h) ¿Cuántos alumnos obtuvieron 50 o más puntos?

Respuesta: 93 alumnos

i) ¿Cuántos alumnos obtuvieron 70 o más puntos?


Respuesta: 51 alumnos

j) ¿Qué porcentaje de alumnos obtuvo menos de 20 puntos?

Respuesta: 1,5 % de los alumnos


k) ¿Cuál es la marca de clase que representa al intervalo de
mayor frecuencia?

Respuesta: la marca de clase de mayor frecuencia es 54,5

l) ¿Cuál es el límite aparente superior del tercer intervalo?

Respuesta: 39
m) ¿Cuál es el límite real inferior del quinto intervalo?

Respuesta: 49,5

n) ¿Cuál es la amplitud del intervalo?

Respuesta: c = 10
n) Calcula la media aritmética:

Respuesta:
Intervalo M. de Clase frecuencia f • x
10 – 19 14,5 2 29 X = f•x
20 – 29 24,5 8 196 n
30 – 39 34,5 13 448,5
40 – 49 44,5 14 623
50 – 59 54,5 22 1199
X = 8095
60 – 69 64,5 20 1290 130
70 – 79 74,5 17 1266,5
80 – 89 84,5 17 1436,5
90 - 99 94,5 17 1606,5
X = 62,26
n = 130
ñ) Calcula la mediana:

Respuesta:
n / 2 = 130 / 2 = 65
Intervalo frecuencia F. acum.
10 – 19 2 2 L i m = 59,5 c = 10
20 – 29 8 10
30 – 39 13 23
f(acum. ant) = 59
40 – 49 14 37 f m = 20
50 – 59 22 59
60 – 69 20 79
Me = 59,5 + ( 65 – 59 ) • 10
70 – 79 17 96
80 – 89 17 113
20
90 - 99 17 130
Me = 59,5 + 6 • 10
n = 130 20
Me = 59,5 + 3 = 62,5
o) Calcular el intervalo modal y la moda :

Respuesta:

El intervalo modal es [50 - 59] porque tiene la mayor


frecuencia , que es 22.

La moda corresponde a la marca de clase de ese intervalo.

Luego, Mo = 50 + 59 = 54,5
2
a+b=c

Ejercicios
 Calcular el rango entre. 3,22 2,93 3.01 4,48 5,06 4.31
2,98 3,07
Repuesta: 5,06 - 2,98 = 2,08

 El siguiente cuadro muestra el consumo anual en Colombia de


kilogramos de carne de bovino per cápita.
Año 1984 1985 1986 1987 1988 1989 1990 1991 1992 1996

Consumo 17,0 15,0 14,7 14,0 15,6 17,3 18,5 18,1 17,6 20,0

a) Calcular el consumo promedio desde 1986 hasta 1992


Respuesta: X = 115,8 = 16,54
7
b) Calcular el consumo promedio de los 10 años?

Respuesta: X = 1678 = 16,78


10

 La siguiente tabla representa las medidas de una pieza de


motores

Intervalo Frecuencia
Dibuja en un mismo gráfico el
100 – 109 4 histograma y el polígono de
110 – 119 17 frecuencias.
120 – 129 29
130 – 139 18
140 – 149 10
150 – 159 5
160 – 169 2
Respuesta:
f

29 •

18
• •
10 •

4 • •
104,5 114,5 124,5 134,5 144,5 154,5 164,5 Marca de clase
 Dado las siguientes frecuencias, calcular la mediana,
la moda y la media aritmética
6 - 7 - 7 - 3 - 4 - 1 - 7 - 5
Respuesta:

Me : Para calcular la mediana se deben ordenar las frecuencias:


1 - 3 - 4 - 5 - 6 - 7 - 7 - 7
Luego, 5 + 6 = 11 = 5,5 Me = 5,5
2
Mo = La moda es 7 , porque es la frecuencia que más se repite

X = 6 + 7 + 7 + 3 + 4 + 1 + 7 + 5 = 40 = 5
8 8
 Las notas obtenidas por 45 alumnos en una prueba de
Estadística son:

Determinar : Mo, Me y X
Notas Frecuencia
1 1 Respuesta:
2 4 Me = Como n / 2 = 45 / 2 = 22,5
3 5 Luego. la mediana es 5 , pues es el primer
4 6 valor de la variable cuya f(acum.) es igual o
5 9 mayor que 22,5
6 12
7 8

X = 1•1 + 2 • 4 + 3 • 5 + 4 • 6 + 5 • 9 + 6 • 12 + 7 • 8 = 221 = 4,9


45 45
Mo = La moda es 6 pues es el valor que tiene mayor frecuencia
absoluta
Percentiles, Deciles y Cuartiles

La mediana de un conjunto de datos ordenados, es el valor que


los separa en dos partes iguales.

Existen otros valores típicos que dividen a un conjunto de datos


numéricos en una cierta cantidad de partes iguales; éstos son:
Percentiles, Deciles y Cuartiles.

P50 = 52 % = Me
Percentiles
Los percentiles de una distribución de datos numéricos son
los 99 valores que la dividen en 100 partes iguales.

Los percentiles se designan por: P1 , P2 , P3 , .............P99


Se lee: P1 = percentil 1 P2 = percentil 2 ............etc.

0 P1 P2 P3 ........................................................P99.
Ejemplo:
•En la distribución de notas de un grupo de alumnos, el
P45 es una nota de referencia que permite afirmar que el
45 % de esos alumnos obtuvo esa nota o una menor.
El cálculo de percentiles se hace de la misma forma como se
obtiene la mediana, en una distribución.

Ejemplo: Considerar la distribución de frecuencias de los


212 puntajes para calcular P45 .
Puntaje frecuencia Frec. Acum. Respuesta:
350 – 399 4 4 Se calcula el 45% de 212:
400 – 449 6 10
212 = 100% x = 212 • 45
450 – 499 9 19
500 – 549 20 39
x 45 % 100
550 – 599 31 70 x = 95,4
600 – 649 80 150
650 – 699 42 192 La frecuencia acumulada 95,4 se
700 – 749 10 202 encuentra en la clase 600 - 649
750 – 799 8 210
800 – 849 2 212
L r i p = 599 + 600 = 599,5 f (acum. ant) = 70
2 c = 50 f p = 80

P45 = L r i p + [ % - f (acum. ant)] • c


fp
P45 = 599,5 + ( 95,4 – 70 ) • 50
80
= 599,5 + 15,875
= 615,375

Este valor significa que el 45 % de los alumnos obtuvo


puntajes menores o iguales a 615,3.
 Considerar la misma distribución anterior para calcular
P8.

Respuesta:

Calcular el 8 % de 212: 212 = 100 % x = 212 • 8 = 16,96


x 8% 100

Este valor de la frecuencia acumulada se encuentra en la clase


450 – 499
L r i p = 449 + 450 = 449,5 F(acum. ant) = 10 c = 50 f p = 9
2
P8 = 449,5 + ( 16,96 – 10) • 50
9
= 449,5 + 38,66
= 488,16
Ejercicio de percentil
Dada la tabla de distribución, determinar qué porcentaje de los
alumnos obtuvieron entre 400 y 600 puntos.
Puntaje frecuencia Frec. Acum.
350 – 399 4 4
Respuesta:
400 – 449 6 10
450 – 499 9 19
400 puntos corresponde a un
500 – 549 20 39 percentil que se desconoce, por
550 – 599 31 70 lo que se simboliza por Px .
600 – 649 80 150
650 – 699 42 192 Además se sabe que corresponde
700 – 749 10 202
al segundo intervalo, y que su
750 – 799 8 210
800 – 849 2 212
L r i p = 399,5
El % buscado es: x • 212 F(acum. ant) = 4
100
fp= 6 c = 50
212
x. 4
Px = 399,5 + 100 • 50
6
400 = 399,5 + 2,12 x  4 .50
6
2,12 x  4
400 – 399,5 = .50
6
0,5 • 6 = 2,12 x – 4
50
0,06 + 4 = 2,12 x
4,06 1,9 % = x
=x
2,12
600 puntos corresponde a un percentil desconocido, por lo
que se simboliza por Py

Además se sabe que está ubicado en el sexto intervalo, y que


su L r i p = 599,5 f(acum. ant) = 70 f p = 80 c = 50
El % buscado es x • 212
100
212 La diferencia entre
y.  70
Entonces: Py = 599,5 + 100 .50 ambos porcentajes
80
212 corresponde al
y.  70
600 – 599,5 = 100 .50 porcentaje pedido.
80
0,5 • 80 = 2,12 y - 70 33,3 – 1,9 = 31,4 %
50
0,8 + 70 = y y = 33,3 %
2,12
Calcular qué porcentaje de los 212 alumnos tuvieron
resultados entre 620 y 680 puntos.

Respuesta:
620 puntos corresponde a un percentil que se desconoce y se designa
por Px. 212
x.  70
Entonces, Px = 599,5 + 100 • 50
80

2,12 x  70
620 – 599,5 = .50
80

20,5 • 80 = 2,12x – 70 x = 48,4 %


50
680 puntos corresponde a un percentil que se desconoce y se
designa por Py.

( 680 – 649,5 ) • 42
= 2,12y - 150 x = 82,8 %
50

Así, la diferencia entre ambos porcentajes corresponde al porcentaje


de alumnos que tienen entre 620 y 680 puntos.
82,8 % - 48,4 % = 34,4 = 34,4 % de los alumnos
Deciles
Los deciles de una distribución de datos numéricos son los 9
valores que la dividen en 10 partes iguales.

Los deciles se designan por D1 , D2 , D3 , ...........D9

Se leen: Decil 1 , decil 2 .......decil 9

0 D1 D2 D3 D4 D5 D6 D7 D8 D9
Para calcular deciles, se hace de la misma forma que los
percentiles.
Ejemplo: Considerar la siguiente tabla de distribución para
calcular D3
Puntaje frecuencia Frec. Acum.
350 – 399 4 4
400 – 449 6 10
450 – 499 9 19 Para calcular el tercer decil (D3)
500 – 549 20 39 se tiene que tener en cuenta que
550 – 599 31 70 corresponde al 30 % inferior
600 – 649 80 150
de los datos de la distribución.
650 – 699 42 192
700 – 749 10 202
750 – 799 8 210
800 – 849 2 212
Se calcula el 30% de 212 212 = 100%
x 30% x = 63,6

Esta cantidad de datos corresponde a la clase 550 – 599

L r i = 549 + 550 = 549,5 f(acum. ante) = 39 c = 50


2 f d = 31

D3 = 549,5 + ( 63,6 – 39 ) • 50
31
= 549.5 + 39,6
= 589,1

El 30 % de los 212 alumnos tiene un puntaje igual o menor que


589,1 puntos.
 Calcular el D7
Respuesta:

El 70% de 212 = 148,4 f(acum. ant) = 70 f d = 80 c = 50


El límite real inferior de la clase 600 – 649 es 599,5
148,4  70
D7 = 599,5 + .50
80
D7 = 599,5 + 49

D7 = 648,5 puntos

NOTA: Se ha calculado D3 y D7 , entonces se puede concluir que


el 40% de los 212 alumnos obtuvo entre 589,2 y 648,5
puntos.
Cuartiles
Los Cuartiles de una distribución de datos numéricos son los
tres valores que la dividen en 4 partes iguales
Los cuartiles se designan por: Q1 , Q2 y Q3

Q1 Q2 Q3

Q1 es el primer cuartil y corresponde al 25% inferior


Q2 es el segundo cuartil y corresponde al 50% inferior
Q3 es el tercer cuartil y corresponde al 75% inferior
Los cuartiles se calculan de la misma forma que los percentiles
y los deciles.
 Calcular el tercer cuartil, de la siguiente distribución

Respuesta:
Puntaje frecuencia Frec. Acum. El 75% de 212 = 159
350 – 399 4 4
400 – 449 6 10
L r i q = 649,5 c = 50
450 – 499 9 19 f(acum. ant) = 150 f q = 42
500 – 549 20 39
550 – 599 31 70 159  150
Q3 = 649,5 + .50
600 – 649 80 150 42
650 – 699 42 192
700 – 749 10 202 Q3 = 649,5 + 10,7
750 – 799 8 210
Q3 = 660,2
800 – 849 2 212

El 75% de los alumnos tiene un puntaje igual o inferior a 660,2 puntos,


lo que significa que el 25% de ellos tiene un puntaje igual o superior
a 660,2
 Un curso rindió una prueba de Matemática, ¿Qué se puede
decir del resultado, si se sabe que en la distribución de las
notas se obtuvo: Q2 = 5,8 y Q3 = 6,5 ?

Respuesta:
Es conveniente ver la situación en forma gráfica:

5,8 6,5
25%
50%

Se puede afirmar que:


* El 50% del curso obtuvo una calificación superior a 5,8
* El 25% mejor preparado logró notas superiores al 6,5
Medidas de dispersión

Al grado en que los datos numéricos tienden a extenderse


alrededor de un valor medio se le llama variación o dispersión

Las medidas de dispersión más utilizadas son:

* Rango

* Desviación media

* Desviación típica o estándar.


Rango
El rango de un conjunto de datos numéricos es la diferencia
entre el mayor y el menor de ellos.
Ejemplo:
Un alumno obtuvo las siguientes notas parciales en Matemática:
2 - 3,9 - 5 - 5,9 - 6,2
El rango es 4,2 ya que es la diferencia entre 6,2 y 2

¿Qué significado tiene el rango de notas 4,2 respecto de las


notas de otro alumno cuyo rango es 2,1?
En el primer caso las notas están más dispersas que en el
segundo. No se sabe en que caso son mejores; para
determinarlo es necesario más información.
Desviación Media
La desviación de un puntaje x con respecto a la media
aritmética x está dada por la diferencia d = x - x
Ejemplo:
Un alumno obtuvo las siguientes notas en la asignatura de
Biología: 3,9 - 2 - 5 - 6,2 - 5,9 Calcular la desviación
de ellas.
Respuesta:
Primero se debe calcular el promedio.
x = 3,9 + 2 + 5 + 6,2 +5,9 = 23 = 4,6
5 5
Ahora se calcula la diferencia de cada nota con el promedio

d = 3,9 – 4,6 = - 0,7 d = 2 – 4,6 = - 2,6


d = 5 – 4,6 = 0,4 d = 6,2 – 4,6 = 1,6
d = 5,9 – 4,6 = 1,3

NOTA: La suma de las desviaciones de todos los datos con


respecto a la media aritmética es igual a cero.

Ejemplo:
-0,7 + 0,4 + 1,3 + -2,6 + 1,6 = 0
La desviación media de n datos numéricos x1, x2, ......xn
es la media aritmética de los valores absolutos de las
desviaciones de todos los datos con respecto a su promedio.

Se designa por DM n = frecuencia total

DM = |x1 – x | + |x2 – x | +.........|xn – x |


n

Ejemplo:

DM = |-2,6 | + |-0,7 | + |0,4 | + |1,3 | + |1,6 | = 6,6 = 1,3


5 5

El valor 1,3 es la desviación media de todas las notas dadas.


 Un alumno obtuvo las siguientes calificaciones en la
asignatura de Inglés: 3,2 - 6 - 6,8 - 4,3 - 2,9 - 5,7
Calcular la desviación media de las notas.

Respuesta:

x = 3,2 + 6 + 6,8 + 4,3 + 2,9 + 5,7 = 28,5 = 4,8


6 6
| 3,2 – 4,8 | = 1,6 | 6 – 4,8 | = 1,2 | 6,8 – 4,8 | = 2
| 4,3 – 4,8 | = 0,5 | 2,9 – 4,8 | = 1,9 | 5,7 – 4,8 | = 0,9

Luego, DM = 1,6 + 1,2 + 2 + 0,5 + 1,9 + 0,9 = 8,1 = 1,3


6 6
El valor 1,3 es la desviación media de todas las notas dadas.
Desviación media en datos
agrupados
La siguiente tabla muestra los puntajes obtenidos en Icfes
con un promedio de 614 puntos. Calcular la desviación media.
Puntajes Frecuencia x |x–x| f • |x – x | •Primero se debe sacar
350 – 399 4 374,5 239.5 958 la marca de clase.
400 – 449 6 424,5 189.5 1137
450 – 499 9 474,5 139.5 1255.5 •Se debe obtener la
500 – 549 20 524.5 89.5 1790 desviación |x – x |
550 – 599 31 574.5 39.5 1224.5

600 – 649 80 624.5 10.5 840 •Se realiza el producto de la


650 – 699 42 674.5 60.5 2541 frecuencia con la desviación
700 – 749 724.5 1105
•Se obtiene la sumatoria
10 110.5
750 – 799 8 774.5 160.5 1284

800 – 849 2 824.5 210.5 421 del producto


212 *Considerar la frecuencia
12556
total.
Con todos los datos se aplica la fórmula de la desviación media

DM =  f • | x – x | DM = 12556 = 59,2 puntos


n 212

Se puede decir que los puntajes se desvían, en promedio, 59,2


puntos con respecto a la media.
Hay que considerar que algunos puntajes son inferiores a ella
y otros superiores.

Si los puntajes estuvieran más agrupados en torno al promedio,


es decir, menos dispersos, el valor de DM sería menor.
Calcular la DM de la siguiente distribución que representa
las horas diarias dedicadas al estudio de 20 alumnos

f • |x – x |
d) Frecuencia total
Horas Frecuencia x f•x |x–x|
e) x = 95 = 4,7
0–2 5 1 5 3,7 18,5
20
3–5 7 4 28 0,7 4,9 * Determinar | x – x |
6–8 6 7 42 2,3 13,8 * Determinar f • |x – x |
9 - 11 2 10 20 5,3 10,6 * Obtener  f • | x – x |
20 95 47,8
Respuesta: * Finalmente se determina la DM
* Determinar el promedio
DM = 47,8 = 2,3
a) Obtener la marca de clase 20
b) Multiplicar f • x Las horas diarias se desvían en 2,3
c) Obtener  f • x puntos con respecto a la media.
 Calcula la desviación media de las medidas de una pieza
de motores, dada por la siguiente tabla:

Intervalo frecuencia x x•f |x–x | f•|x–x| * Sumatoria del producto


100 – 109 4 104,5 418 24,2 96,8
110 – 119 17 114,5 14,2 241,4
1946,5 DM = 923 = 10,8
120 – 129 29 124,5 3610,5 4,2 121,8
85
130 – 139 18 134,5 2421 5,8 104,4
140 – 149 10 144,5 1445 15,8 158
150 – 159 5 154,5 772,5 25,8 129 Las medidas se desvían
160 – 169 2 164,5 329 35,8 71,6 en promedio de 10,8
85 10942.5 923 puntos con respecto a
Respuesta: la media.
* Marca de clase (x) *Se calcula | x – x |
* x = 10942,5 = 128,7 * Se calcula f • | x – x |
85
Desviación típica o estándar
La desviación típica se simboliza por la letra S
La desviación típica o estándar expresa el grado de dispersión
de los datos con respecto al promedio y corresponde a la raíz
cuadrada de la media del cuadrado de las desviaciones de dichos
datos con respecto a su media aritmética.
En forma general:
Ejercicios
 Calcular la desviación típica de las siguientes notas de
Matemática: 2,0 - 3,9 - 5,0 - 5,9 - 6,2

Respuesta:
* Primero se debe obtener el promedio
x = 2,0 + 3,9 + 5,0 + 5,9 + 6,2 = 4,6
5
* Se calcula la desviación típica

S= ( 2  4,6) 2
 (3,9  4,6) 2
 (5  4,6) 2
 (5,9  4,6) 2
 ( 6, 2  4,6) 2

5
6,7  0,4  0,1  1,6  2,5 11,3
S= =
5 5

= 2,2 = 1,4
Luego, la desviación típica de las notas es 1,4 con respecto
al promedio
Si de estas notas descartáramos el 2, la nota más alejada del
promedio, entonces la desviación típica sería S = 1,04 ; este
valor es menor que 1,4.
Las notas consideradas, sin la nota 2, tendrían una dispersión
menor, es decir, estarían más centradas.
 Calcular la desviación típica de las siguientes notas:
5,2 - 4,9 - 5 - 5,1 - 5,2 - 5,3 - 4,9 - 5,2

Respuesta:
* Se obtiene el promedio x = 5,1

*S= 0,1  0,2  0,1  0  0,1  0,2  0,2  0,1


2 2 2 2 2 2 2 2

S=
0,02 = 0,1
Este valor es considerablemente menor que el ejercicio anterior. Se
debe a que los datos son más homogéneos que en la otra distribución,
presentan escasa dispersión con respecto al promedio.
Desviación típica en datos
agrupados
Calcular la S de la siguiente distribución que representa
las horas diarias dedicadas al estudio de 20 alumnos, con un
promedio de 4,7
* f •| x – x | 2

Horas Frecuencia x |x–x| |x–x|


2 f •| x – x |
2

0–2 5 1 3,7 13,69 68,45 * Se calcula S


3–5 7 4 0,7 0,49 3,43
159,8
6–8 6 7 2,3 5,29 31,74 S=
9 - 11 2 10 5,3 28,09 56,18
20
159,8 S= 7,9
•Primero se debe sacar la marca de clase.
* Determinar las desviaciones S= 2,8
* Obtener la desviación al cuadrado
* Producto de la frecuencia con la desviación al cuadrado.
La siguiente tabla muestra los puntajes obtenidos en Icfes.
con un promedio de 614 puntos. Calcular la desviación típica

Puntajes Frecuencia x |x–x| | x – x |2 f • | x – x |2 1407973


S=
350 – 399 4 374.5 239.5 57360.25 229441 212
400 – 449 6 424.5 189.5 35910.25 215461.5

450 – 499 9 474.5 139.5 19460.25 175142.25


= 6641.3
500 – 549 20 524.5 89.5 8010.25 160205
550 – 599 31 574.5 39.5 1560.25 48367.75
= 81,4
600 – 649 80 624.5 10.5 110.25 8820

650 – 699 42 674.5 60.5 3660.25 153730.5


Entonces,
700 – 749 10 724.5 110.5 12210.25 122102.5 S = 81,4
774.5
750 – 799 8 160.5 25760.25 206082

800 – 849 2 824.5 210.5 44310.25 88620.5

1407973
* Calcular marca de clase * determinar f • |x – x |2
* Calcular las desviaciones * Determinar la sumatoria del producto
* Determinar las desviaciones al cuadrado
 La siguiente tabla muestra el número de brazadas dadas
por 100 nadadores en la prueba de 200 m. Calcular S

Brazadas frecuencia x f•x |x–x| |x–x|2 F •|x – x |2


9845
S=
200 – 204 8 202 1616 16.9 285.61 2284.88 100
205 – 209 12 207 2484 11.9 141.61 1699.32
210 – 214 15 212 3180 6.9 47.61 714.15
S = 98,45
215 – 219 18 217 3906 1.9 3.61 64.98
220 – 224 16 222 3552 3.1 9.61 153.76
225 – 229 14 227 3178 8.1 65.61 918.54 S = 9,9
230 – 234 10 232 2320 13.1 171.61 1716.1
235 – 239 7 237 1659 18.1 327.61 2293.27
Las brazadas
21895 9845 están a 9,9
Respuesta: puntos con
21895
* Promedio d) x = = 218.9 respecto al
100
a) Marca de clase * Calcular las desviaciones promedio
b) f • x * Desviaciones al cuadrado *  del producto
c)  f • x * f • | x – x |2
Varianza
La varianza de un conjunto de datos se define como el cuadrado
de la desviación típica
Se simboliza por S2

k n 
 ( x  x ) 2

S2 = k 1
n

El cálculo de la varianza es similar a la desviación típica


Un alumno obtuvo las siguientes notas en la asignatura de
Biología: 3,9 - 2 - 5 - 6,2 - 5,9 Calcular la varianza
de ellas.
Respuesta:
Primero se debe calcular el promedio.
x = 3,9 + 2 + 5 + 6,2 +5,9 = 23 = 4,6
5 5
* Calcular las desviaciones
|3,9 – 4,6 | = 0,7 | 2 – 4.6 | = 2,6 | 5 – 4,6 | = 0,4
| 6,2 – 4,6 | = 1,6 | 5,9 – 4,6 | = 1,3

* Calcular las desviaciones al cuadrado


0,72 = 0,49 2,62 = 6,76 0,42 = 0,16 1,62 = 2,56 1,32 = 1,69
* Calcular S2
S2 = 0,49 + 6,76 + 0,16 + 2,56 + 1,69 = 11,66 = 2,3
5
Calcular la Varianza de la siguiente distribución que representa
las horas diarias dedicadas al estudio de 20 alumnos, con un
promedio de 4,7

Horas Frecuencia x |x–x| | x – x | 2 f •| x – x | 2 * f •| x – x | 2


0–2 5 1 3,7 13,69 68,45

3–5 7 4 0,7 0,49 3,43 * Se calcula S2


6–8 6 7 2,3 5,29 31,74
159,8
9 - 11 2 10 5,3 28,09 56,18 S2 =
20
159,8 S2 = 7,9
•Primero se debe sacar la marca de clase.
* Determinar las desviaciones Luego, la varianza es
7,9
* Obtener la desviación al cuadrado
* Producto de la frecuencia con la desviación al cuadrado.
INDICE GINI
El Indice Gini (IG) puede tomar valores entre 0 y 1:

IG = 0 : concentración mínima. La muestra está

uniformemente repartida a lo largo de todo su rango.

IG = 1 : concentración máxima. Un sólo valor de la


muestra acumula el 100% de los resultados.
Frecuencias /
absolutas

0-50 25 23 23 575 575 0.0148 0.0885 0.0737


50-100 75 62 95 5400 5975 0.1538 0.3654 0.2116
100-150 125 72 157 7750 13725 0.3533 0.6038 0.2506
150-200 175 48 205 8400 22125 0.5695 0.7885 0.2190
200-250 225 19 224 4275 26400 0.6795 0.8615 0.1820
250-300 275 8 232 2200 28600 0.7362 0.8923 0.1561
300-350 325 14 246 4550 33150 0.8533 0.9462 0.0929
350-400 375 7 253 2625 35775 0.9208 0.9731 0.0522
400-450 425 5 258 2125 37900 0.9755 0.9923 0.0168
450-500 475 2 269 950 38850 1.0000 1.0000 0.0000
260 38850 6.5115 1.2548
La Forma de la distribución

Otra característica de un conjunto de datos es la forma, es decir,


la manera en que están distribuidas las observaciones.
La distribución de los datos puede ser o no simétrica. Si la
distribución de los datos no es simétrica, se llama asimétrica o
sesgada.
Para describir la forma se puede comparar la media y la
mediana.
También puede observarse a través del coeficiente de asimetría
Mide el grado de Simetría / Asimetría de la distribución
Medidas de forma: Coeficiente de
Asimetría

Asimetría
El concepto de asimetría se refiere a si la
curva que forman los valores de la serie
presenta la misma forma a izquierda y derecha
de un valor central (media aritmética)
Parámetros estadísticos
La Forma de la distribución

Media
Mdn

Si es + indicará muchos casos en los valores más bajos y pocos


en los más altos positivamente asimétrica .
Media > Mediana: Positivos o con sesgamiento a la derecha
La Forma de la distribución

Mdn
Media

Si es - indicará muchos casos en los valores más altos y pocos en los


más bajos negativamente asimétrica.
Media < Mediana: Negativos o con sesgaminto a la izquierda.
La Forma de la distribución

Mdn = Media

En la distribución Normal es 0 Simétrica


Media = Mediana: Simétricos o con sesgamiento cero.
La Forma de la distribución
Otra manera de apreciar la forma de una distribución es observar el nivel de
apilamiento o llanura de la curva

leptocúrtica Platicúrtica mesocúrtica


(menor dispersión) (mayor dispersión)
.
El coeficiente de kurtosis mide el grado de apuntamiento de la curva
La Forma de la distribución

El coeficiente de kurtosis

Mide el grado de apuntamiento de la curva

En la distribución Normal es 0 mesocúrtica

Si es + indicará un grado de apilamiento mayor que en la normal leptocúrtica


(menor dispersión)

Si es – indicará que es más aplanada que la normal platicúrtica (mayor


dispersión)
Medidas de forma: Coeficiente
de Curtosis
El Coeficiente de Curtosis analiza el grado
de concentración que presentan los valores
alrededor de la zona central de la
distribución.
Medidas de forma: Coeficiente
de Curtosis
Se definen 3 tipos de distribuciones según
su grado de curtosis:
Distribución mesocúrtica: presenta un
grado de concentración medio alrededor de
los valores centrales de la variable (el
mismo que presenta una distribución
normal).
Medidas de forma: Coeficiente
de Curtosis
Distribución leptocúrtica: presenta un
elevado grado de concentración alrededor
de los valores centrales de la variable.
Distribución platicúrtica: presenta un
reducido grado de concentración alrededor
de los valores centrales de la variable.
Parámetros estadísticos
Los resultados pueden ser los siguientes:
g1 = 0 (distribución simétrica; existe la misma concentración de
valores a la derecha y a la izquierda de la media)
g1 >0 (distribución asimétrica positiva; existe mayor
concentración de valores a la derecha de la media que a su
izquierda)
g1 <0 (distribución asimétrica negativa; existe mayor
concentración de valores a la izquierda de la media que a su
derecha
Ejemplo: Calcular el Coefiente de Asimetría de Fisher de la
serie de datos referidos a la estatura de un grupo de alumnos
Parámetros estadísticos
Parámetros estadísticos
Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

1,20 1 1 3,3% 3,3%


1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%

100,0%
1,30 3 30 10,0% la media de esta
muestra es 1,253
Parámetros estadísticos

You might also like