You are on page 1of 25

CURSO 2017-2018

2º Semestre

ESTADÍSTICA APLICADA A
CIENCIAS SOCIALES

TEMA 2: DISTRIBUCIÓN DE FRECUENCIAS


Prof. Stefano De Marco
Departamento de Sociología y Comunicación
Universidad de Salamanca (despacho 426)

Correo: s.demarco@usal.es
Estadística aplicada a las Ciencias Sociales I

INDICE
I. ¿Qué es y para qué sirve una distribución de
frecuencias?

II. La distribución de frecuencias de una variable

III. Representación gráfica de una distribución de


frecuencias

IV. Datos agrupados e histogramas


Estadística aplicada a las Ciencias Sociales I

I. ¿QUÉ ES Y PARA QUÉ SIRVE UNA DISTRIBUCIÓN DE FRECUENCIAS?

La distribución de frecuencias es la representación estructurada, en forma de


tabla, de toda la información que se ha recogido sobre la variable que se
estudia.

Se utiliza para observar cómo se distribuyen los datos; o sea, para ver la forma
en que varían / se concentran o se encuentran dispersos.

Permite detectar a simple vista el patrón (o forma) que siguen los datos.
Estadística aplicada a las Ciencias Sociales I

I. ¿QUÉ ES Y PARA QUÉ SIRVE UNA DISTRIBUCIÓN DE FRECUENCIAS?

Frecuencia absoluta: ( ni ) El número de veces que se repite


cada valor o dato de la variable.

Frecuencia relativa: ( f i ) La frecuencia absoluta dividida por el


número de datos (proporción o porcentaje).
ni
fi 
N
donde N es el número de datos.

Frecuencia absoluta acumuladas: ( N i ). Es el número de


datos que hay igual al considerado o inferiores a él. ¿Para qué?

Frecuencia relativa acumuladas: ( Fi ). Es cada frecuencia


acumulada dividida por el número de datos. ¿Para qué?
Estadística aplicada a las Ciencias Sociales I

I. ¿QUÉ ES Y PARA QUÉ SIRVE UNA DISTRIBUCIÓN DE FRECUENCIAS?

Frecuencia relativa Frecuencia absoluta Frecuencia relativa


Nivel de estudios Frecuencia absoluta Frecuencia relativa
(%) cumulada acumulada

Sin estudios 39 0,107734807 10,8% 39 10,8%


Primaria 54 0,149171271 14,9% 93 25,7%
ESO 78 0,215469613 21,5% 171 47,2%
Bachiller 102 0,281767956 28,2% 273 75,4%
Universitarios 89 0,245856354 24,6% 362 100,0%

N 362
Estadística aplicada a las Ciencias Sociales I

II. LA DISTRIBUCIÓN DE FRECUENCIAS DE UNA VARIABLE


Ej. La variable religión (Barómetro CIS Abril 2009)
Valores: 1=Católico; 2=Creyente de otra religión; 3=No creyente; 4=Ateo; 9=No
contesta
Frecuencia relativa:
Frecuencia absoluta: Proporción de casos
Nº de observaciones en cada clase o
de cada clase o categoría
categoría

Valores (xi) Frecuencias absolutas (ni) Frecuencias relativas (fi) Porcentaje (%) Fre. ab. Acumulada (Ni) Fre. re. Acumulada (Fi)
1 1853 0,75 74,7% 1853 0,75
2 57 0,02 2,3% 1910 0,77
3 342 0,14 13,8% 2252 0,91
4 172 0,07 6,9% 2424 0,98
9 57 0,02 2,3% 2481 1,00
2481 1,00 100,0%

La última frecuencia
Tamaño de la relativa acumulada
El sumatorio de las
población o muestra. siempre debe tomar
frecuencias relativas
En este caso n=2481 el valor 1.
siempre es 1.
III. REPRESENTACIÓN GRÁFICA DE UNA
DISTRIBUCIÓN DE FRECUENCIAS

VARIABLES DISCRETAS

Tipo de variables Nivel de medición Tipo de valores


Nominal Cualitativa Discretas
Cualitativa (a veces
Ordinal Discretas
cuantitativa)
Intervalo Cuantitativa Discretas y continuas
Razón Cuantitativa Discretas y continuas
Estadística aplicada a las Ciencias Sociales I

III. REPRESENTACIÓN GRÁFICA DE UNA DISTRIBUCIÓN DE FRECUENCIAS


1. El diagrama de barras
Se utiliza con variables cualitativas (nominales y ordinales). También puede
utilizarse con variables cuantitativas discretas (sin decimales) que
presenten un número reducido de valores.

Este tipo de gráficos permite comparar las distintas categorías de una variable.
Para ello:
1. Se presentan los distintos valores de una categoría de una variable por
separado en el eje horizontal
2. Se presentan las frecuencias asociadas a cada categoría en el eje vertical.

En el caso de variables ordinales o cuantitativas discretas los valores se


ordenan en el eje horizontal de forma creciente!!!!

¡¡Máxima!!: cualquier representación gráfica me debe de permitir visualizar de


manera rápida y fácil la distribución de la variable/s
Estadística aplicada a las Ciencias Sociales I

III. REPRESENTACIÓN GRÁFICA DE UNA DISTRIBUCIÓN DE FRECUENCIAS


1. El diagrama de barras
28.2%

24.6%
21.5%

14.9%

10.8%

Sin estudios Primaria ESO Bachiller Universitarios


Universitarios 24.6%

Bachiller 28.2%

ESO 21.5%

Primaria 14.9%

Sin estudios 10.8%


Estadística aplicada a las Ciencias Sociales I

2. Gráfico de sectores (o de tarta)

Es útil únicamente cuando las variables presentan pocas categorías.

Consiste en un círculo segmentado en sectores de tamaño proporcional a la frecuencia


(absoluta o relativa) de cada una de las categorías de la variable.

El área de cada sector se calcula como:

18.3
22.3

Never
From 1 to 3 times
From 4 to 6 times
From 7 to 12 times
16 24.6 More than 12 times

18.8

Frequency of going to cinema, live performances, cultural sites or attending live sport events by sex
and age. Entre 16 y 29 años. España
IV. REPRESENTACIÓN GRÁFICA DE UNA
DISTRIBUCIÓN DE FRECUENCIAS

VARIABLES CONTINUAS

Tipo de variables Nivel de medición Tipo de valores


Nominal Cualitativa Discretas
Cualitativa (a veces
Ordinal Discretas
cuantitativa)
Intervalo Cuantitativa Discretas y continuas
Razón Cuantitativa Discretas y continuas
Estadística aplicada a las Ciencias Sociales I

4.1 Datos agrupados e histogramas


Cuando una variable presenta un gran número de valores
distintos, conviene agrupar los datos en grupos, o intervalos de
clase (recodificación). Ej. Edad

En la elección del número de intervalos de clase se debe


ponderar entre:
a) elegir pocos a costa de perder mucha información sobre los
datos reales de cada intervalo de clase o
b) elegir muchos, con lo que las frecuencias resultantes de
cada intervalo pueden ser demasiado pequeñas para que se
reconozcan patrones de forma.
• “Pensar en el lógica o relación” que se encuentra detrás de la
variable de acuerdo a nuestro objeto de estudio. Una variable
la puedo agrupar y describir de manera diferente en función de
la relación con la variable a explicar:
• Ej. Edad - opinión política; edad - fecundidad; edad – nivel educativo
Estadística aplicada a las Ciencias Sociales I

Según la amplitud, los intervalos pueden ser (justificación):

Intervalos constantes: aquellos que tienen la misma amplitud o


tamaño (igual número de valores).

Intervalos desiguales: aquellos que no tienen la misma


amplitud o tamaño (distinto número de valores)

• A los valores inicial y final de un intervalo se les llama


extremos o límites del intervalo: ( Li 1 ; Li ). Deben definirse si
los límites son abiertos o cerrados, es decir si incluyen el valor
extremo o no: ( a, b] o [ a, b)
* Al punto central de cada intervalo se le llama marca de clase
y lo representaremos por mi. Es el valor representativo de todos
los valores del intervalo. Es su punto medio Li  Li 1
mi 
2
Estadística aplicada a las Ciencias Sociales I

Recorrido de la variable: es la diferencia entre el mayor y el


menor valor.
Re  máx xi  mín xi
i i

Amplitud del intervalo: ci  Li  Li 1


Estadística aplicada a las Ciencias Sociales I

A diferencia del diagrama de barras (variables cualitativas), donde la


frecuencia de cada categoría viene indicada con la altura de la barra
correspondiente, el histograma representa superficies.

El peso de cada categoría se representa a través del área contenida


en cada uno de los rectángulos del histograma siguiendo esta formula

Donde:

S: Superficie o área del rectángulo  frecuencia


b: Base del rectángulo  amplitud del intervalo
h: Altura del rectángulo  varía!!!!

En el caso de que los intervalos sean iguales  la altura del rectángulo


coincide con la frecuencia de un intervalo determinado.

Sin embargo, si los intervalos no son iguales  la altura del rectángulo


se calcula dividiendo la frecuencia por la amplitud del intervalo
Estadística aplicada a las Ciencias Sociales I

Ejemplo 1. Agrupación de valores de la variable EDAD. Encuesta Identidad Nacional (CIS)

Agrupación en intervalos constantes


[…) […)
Intervalos Amplitud (ai) Marca de clase (mi) Extremo Superior Frecuencia (ni)
18 33 15 25,5 32,99999 830
33 48 15 40,5 47,99999 967
48 63 15 55,5 62,99999 668
63 78 15 70,5 77,99999 534
78 93 15 85,5 92,99999 190
93 108 15 100,5 107,9999 1
3190

Histograma
1200

1000
Frecuencias

800

600

400

200

0
33 48 63 78 93 108
18 33 48 63 78 93
Estadística aplicada a las Ciencias Sociales I

Ejemplo. Agrupación de valores de la variable EDAD. Encuesta Identidad Nacional (CIS)

Las alturas (hi) de los rectángulos deben calcularse dividiendo la


Agrupación en intervalos desiguales frecuencia absoluta por la longitud/amplitud del intervalo
[…) ¡¡ponderación!! del peso o densidad
Intervalos Amplitud (ai) Marca de clase (mi) Extremo Superior Frecuencia (ni) Altura (hi)
18 25 7 21,5 24,99999 - [ ) 331 47,29
25 35 10 30 34,99999 - [ ) 660 66,00
35 45 10 40 44,99999 - [ ) 642 64,20
45 55 10 50 54,99999 - [ ) 490 49,00
55 65 10 60 64,99999 - [ ) 432 43,20
65 y más 34 81,5 98,99999 - [ ) 635 18,68
3190

Histograma
70

60

50
Alturas

40

30

20

10

0
18-25 25-35 35-45 45-55 55-65 65 y más
Estadística aplicada a las Ciencias Sociales I

Ejemplo. Notas de una clase

Las alturas (hi) de los rectángulos deben calcularse dividiendo la


frecuencia absoluta por la longitud/amplitud del intervalo
¡¡ponderación!! del peso o densidad

Nota cuali Nota Frecuencia Altura

Suspenso [0,5) 15 3

Aprobado [5,7) 20 10

Notable [7,9) 12 6

Sobresaliente [9,10) 3 3
Estadística aplicada a las Ciencias Sociales I

Ejemplo. Agrupación de valores de la variable EDAD. Encuesta Identidad Nacional (CIS)

Agrupación en intervalos desiguales (sin seguir la regla de inclusión por la izquierda)


[…]
Intervalos Intervalos reales Amplitud (ai) Marca de clase (mi) Extremo Superior Frecuencia (ni) Altura (hi)
18 24 17,5-24,5 7 21 24,5 - [ ] 331 47,29
25 34 24,5-34,5 10 29,5 34,5 - [ ] 660 66,00
35 44 34,5-44,5 10 39,5 44,5- [ ] 642 64,20
45 54 44,5-54,5 10 49,5 54,5- [ ] 490 49,00
55 64 54,5-64,5 10 59,5 64,5- [ ] 432 43,20
65 y más 64,5-98,5 34 81,5 98,5- [ ] 635 18,68
3190

Histograma
70

60

50
Alturas

40

30

20

10

0
24 34 44 54 64
18 25 35 45 55 65 y más
Estadística aplicada a las Ciencias Sociales I

3. Polígono de frecuencias y Ojiva (Gráficos de líneas)


Polígonos de frecuencias

Se utilizan con variables cuantitativas de tipo continuo y permiten comparar entre


ellas dos o más distribuciones de frecuencia.

En el eje de los X se pondrán las categorías de la variable usada para comparar las
dos distribuciones y en el eje de los Y se pone la frecuencia, para ambas
distribuciones, en cada categoría.

Si las dos (o más) distribuciones no tienen el mismo tamaño muestralse usa el


porcentaje
Estadística aplicada a las Ciencias Sociales I

3. Polígono de frecuencias
Diferencia ideología Jóvenes vs mayores

18.7
18-24 años

mayor de 65 años

12.8
12.3 16.6
10.8
9.3 9.1
11.1
7.9
6.4

7.1
3.9 3.9 3.9
2.7 2.9
2
2.9 1 1

Izquierda 2 3 4 5 6 7 8 9 Derecha
Estadística aplicada a las Ciencias Sociales I

3. Polígono de frecuencias y Ojiva (Gráficos de líneas)


Ojiva

Son polígonos de frecuencia que utilizan frecuencias acumuladas.

En el eje Y se indican las frecuencias o porcentajes acumulados, y en el eje X los


valores de la variables o los limites de los intervalos de la variable.

Se utilizan para señalar gráficamente el número de casos que están por encima/por
debajo de un determinado valor

Por lo tanto la forma de la ojiva


Será siempre creciente si se acumula hacia la arriba
Será siempre decreciente si se acumula hacia abajo
Estadística aplicada a las Ciencias Sociales I

3. Ojiva

Edad de matrimonio mujeres en España (2014-Eurostat)


97.35% 98.82% 99.52% 99.80% 99.91% 99.96% 99.98% 100.00%
94.49%
87.50%
69.60%

34.22%

6.23%
0.56%

From 15 From 20 From 25 From 30 From 35 From 40 From 45 From 50 From 55 From 60 From 65 From 70 From 75 80 years
to 19 to 24 to 29 to 34 to 39 to 44 to 49 to 54 to 59 to 64 to 69 to 74 to 79 or over
years years years years years years years years years years years years years
Ejercicio 1
• Aquí encontrarás los PIB de los países de la zona euro. Calcula el
porcentaje que representa cada uno en relación con el PIB de la
zona euro (2016-millones de euros).
• Calcula el porcentaje que representa cada uno respecto al PIB de la
UE28 GEO/TIME 2016
European Union (28 countries) 14.907.852,2
Belgium 423.048,4
Denmark 277.489,1

Germany (until 1990 former territory of the FRG) 3.144.050,0


Estonia 21.098,3
Ireland 275.567,1
Greece 174.199,3
Spain 1.118.522,0
France 2.228.857,0
Italy 1.680.522,8
Cyprus 18.122,5
Latvia 24.926,7
Lithuania 38.668,3
Luxembourg 53.004,8
Malta 9.926,6
Netherlands 702.641,0
Austria 353.296,9
Portugal 185.179,5
Slovenia 40.418,1
Slovakia 81.154,0
Ejercicio 2
• Al visitar 50 hogares de un barrio, un
encuestador encontró los siguientes
números de miembros que viven en cada
hogar:
• 2, 4, 1, 1, 2, 3, 4, 3, 3, 2, 2, 2, 2, 4, 2, 1, 4,
1, 3, 2, 5, 8, 2, 5, 6, 1, 2, 2, 3, 3, 2, 3, 3, 3,
3, 4, 2, 2, 3, 4, 4, 2, 4, 4, 4, 5, 3, 1, 4, 2
• Construir intervalos socialmente
relevantes (tipo de núcleo familiar)
• Dibuja un histograma, polígono de
frecuenicas y ojiva