You are on page 1of 296

Rafael Dez

Vicente Coll
Olga M Blasco

Gua didctica de
Estadstica Descriptiva
para las
Ciencias Sociales
Eumed.net
Universidad de Mlaga

2008

Gua didctica de Estadstica Descriptiva para las


Ciencias Sociales
Rafael Dez Garca, Vicente Coll Serrano y Olga M Blasco
Blasco

Diseo de cubierta:
Rafael Dez Garca
Vicente Coll Serrano
Olga M Blasco Blasco
Reservados los derechos para todos los pases. De conformidad con lo
dispuesto en el artculo 270 del Cdigo penal vigente, podrn ser
castigados con multas y privacin de libertad quienes reprodujeren o
plagiaren, en todo o en parte, una obra literaria, artstica o cientfica
fijada en cualquier tipo de soporte sin la preceptiva autorizacin. Ninguna
parte de esta publicacin, incluido el diseo de la cubierta, puede ser
reproducida, almacenada o transmitida de ninguna forma, ni por ningn
medio, sea ste electrnico, qumico, mecnico, electro-ptico,
grabacin, fotocopia o cualquier otro, sin la previa autorizacin escrita
por parte de los autores.

ISBN:
Depsito Legal:
Maquetacin: Rafael Dez Garca
Vicente Coll Serrano
Olga M Blasco Blasco

ndice

ndice analtico.

Pgina

TEMA 1. INTRODUCCIN.
Ficha del tema 1.
Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
1.1. Estadstica: concepto, contenido y relaciones con el rea econmica y empresarial.
1.2. La investigacin estadstica. Anlisis descriptivo, modelizacin e inferencia.
1.3. Datos estadsticos: naturaleza, descripcin numrica y representacin grfica.
Conceptos clave.
Ejemplos.

16
17
18
19
28
32
43
44

TEMA 2. ANALISIS DE DATOS UNIDIMENSIONALES.


Ficha del tema 2.
Objetivos de aprendizaje.

53
54
Rafael Dez, Vicente Coll y Olga Blasco

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Bibliografa bsica para complementar el tema.


Programacin de la gua didctica:
2.1. Principales medidas de posicin, dispersin y de forma o perfil.
2.2. Transformaciones lineales y tipificacin de variables.
2.2.1. Transformaciones lineales.
2.2.2. Tipificacin de variables.
2.2.3. Regla de Tchebysheff.
2.3. Otras medidas de posicin: moda y cuantiles (mediana).
Conceptos clave.
Ejemplos.

7
Pgina

55
56
76
76
83
86
88
95
96

TEMA 3. MEDIDAS DE CONCENTRACIN.


Ficha del tema 3.
Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
3.1. Introduccin: concepto, instrumentos, concentracin mnima y
mxima.

119

3.2. Curva de Lorenz.

122

Rafael Dez, Vicente Coll y Olga Blasco

116
117
118

ndice analtico.
Pgina

3.3. ndice de Gini.


Conceptos clave.
Ejemplos.

123
124
125

TEMA 4. ANLISIS DE DATOS BIDIMENSINALES.


Ficha del tema 4.
Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
4.1. Representacin de datos multidimensionales: matriz de datos, tablas de correlacin y contingencia, grfico de dispersin.
4.2. Distribuciones conjuntas, marginales y condicionadas. Independencia estadstica.
4.3. Momentos. Vector de valores medios y matriz de varianzascovarianzas.
4.4. El coeficiente de correlacin lineal simple. Matriz de correlacin.
4.5. Asociacin.
Conceptos clave.
Ejemplos.

128
129
130
131
134
146
155
158
163
164

Rafael Dez, Vicente Coll y Olga Blasco

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

9
Pgina

TEMA 5. ANLISIS DE REGRESIN.


Ficha del tema 5.
176
Objetivos de aprendizaje.
177
Bibliografa bsica para complementar el tema.
178
Programacin de la gua didctica:
5.1. Introduccin.
179
5.2. Regresin mnimo-cuadrtica: caso lineal.
187
5.3. Anlisis de la bondad de un ajuste: capacidad explicativa de una
ecuacin de regresin. Coeficiente de determinacin. Caso lineal.
199
5.4. Regresin no lineal: potencial y exponencial.
211
Conceptos clave.
216
Ejemplos.
217

TEMA 6. TASAS DE VARIACIN Y NMEROS NDICE.


Ficha del tema 6.
Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Rafael Dez, Vicente Coll y Olga Blasco

224
225
226

10

ndice analtico.

Programacin de la gua didctica:


6.1. Introduccin.
6.2. Tasas de variacin.
6.3. Nmeros ndices: clasificacin y propiedades.
6.3.1. Definicin y clasificacin.
6.3.2. ndices simples.
6.3.3. ndices complejos.
6.3.4. Propiedades.
6.4. ndices de precios y cantidades ms importantes.
6.4.1. ndice de precios complejo ponderado.
6.4.2. ndice de cantidad complejo ponderado.
6.4.3. ndice complejo de valor.
6.5. Cambio de base, renovacin y enlace.
6.6. Deflactacin de series estadsticas.
Conceptos clave.
Ejemplos.

Pgina

227
229
230
230
231
233
236
237
239
240
241
242
244
248
249

TEMA 7. ANLISIS CLSICO DE SERIES TEMPORALES.


Ficha del tema 7.

256
Rafael Dez, Vicente Coll y Olga Blasco

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
7.1. Introduccin.
7.2. Componentes de una serie. Descomposicin.
7.3. Anlisis de la tendencia.
7.3.1. Tendencia anual.
7.3.2. Tendencia k-esimal.
7.4. Anlisis de la variacin estacional. Desestacionalizacin.
7.4.1. Obtencin de los IVE.
7.4.2. Desestacionalizacin.
7.5. Prediccin. Correccin por estacionalidad.
7.5.1. Prediccin de la tendencia.
7.5.2. Correccin por estacionalidad.
Conceptos clave.
Ejemplos.

Rafael Dez, Vicente Coll y Olga Blasco

11
Pgina

257
258

259
260
262
265
267
270
272
275
276
276
277
278
279

12

PRLOGO

El texto de Estadstica que se presenta con el nombre de Gua Didctica de Estadstica Descriptiva para las Ciencias Sociales, tiene una estructura que lo sita entre un conjunto de fichas resumen de los contenidos de una materia y un libro de texto. Es mucho ms amplio que un mero resumen de conceptos y frmulas, pero no supone un desarrollo exhaustivo de los epgrafes de una
programacin; tampoco contiene demostraciones salvo alguna conveniente excepcin. No por ello
deja de ser un texto riguroso y sistemtico, ajustado a una programacin. Hemos diseado esta
Gua didctica de forma que su contenido sirva de refuerzo a la clase presencial de un curso de introduccin de Estadstica.
La Gua Didctica pretende ser un texto que acompae y encamine a los estudiantes en el estudio de la materia, aportndoles informacin concreta y precisa sobre los conceptos clave y tcnicas de la Estadstica Descriptiva. Cada uno de estos conceptos viene acompaado por ejemplos
ilustrativos que ayudarn al estudiante a asimilarlos.

Rafael Dez, Vicente Coll y Olga Blasco

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

13

Se encuentra tambin disponible, como material complementario de esta Gua Didctica, las Fichas Tcnicas de Estadstica Descriptiva para las Ciencias Sociales.
Cmo utilizar la Gua Didctica de Estadstica Descriptiva para las Ciencias Sociales.
La Gua Didctica se compone de un total de 7 temas. En cada tema se facilita una ficha que
presenta su estructura-organizacin:
Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin del tema.
Conceptos clave.
Ejemplos.
Los apartados de la ficha estn hipervinculados. Tambin estn vinculados los ejemplos propuestos que aparecen en el desarrollo de los epgrafes de cada tema. Observar que el puntero de
ratn cambia de forma. Al hacer clic sobre el texto vinculado se acceder a la parte del documento
donde se desarrolla el contenido.

Rafael Dez, Vicente Coll y Olga Blasco

14

A pie de pgina aparecen dos o tres iconos.

Para acceder al ndice de la Gua Didctica.


ndice

Para volver a la ficha del tema.


Ficha

Para volver al texto (solo disponible en los enunciados de ejemplos)


Texto

Esperamos que los contenidos tratados en la Gua Didctica de Estadstica Descriptiva para las
Ciencias Sociales resulten de utilidad al lector.

Contacto con los autores:


Rafael Dez Garca: Rafael.Dez@uv.es
Vicente Coll Serrano: Vicente.Coll@uv.es
Olga Blasco Blasco: Olga.Blasco@uv.es

Rafael Dez, Vicente Coll y Olga Blasco

TEMA 1
INTRODUCCIN

16

Introduccin.

Ficha del tema 1.


Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
1.1. Estadstica: concepto, contenido y relaciones con el rea econmica y
empresarial.
1.2. La investigacin estadstica. Anlisis descriptivo, modelizacin e inferencia.
1.3. Datos estadsticos: naturaleza, descripcin numrica y representacin
grfica.
Conceptos clave.
Ejemplos.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

17

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

OBJETIVOS DE APRENDIZAJE.
Conocer y distinguir las dos ramas bsicas de la estadstica, la estadstica
descriptiva y la inferencia estadstica, intuyendo como interacciona entre
ambas la teora matemtica de la probabilidad creando modelos.
Distinguir entre datos de tipo cualitativo y cuantitativo, discreto y continuo,
aprendiendo a ordenarlos en distribuciones de frecuencias agrupadas y sin
agrupar.
Construir histogramas y polgonos acumulativos partir de una distribucin de
frecuencias agrupada en intervalos.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

18

Introduccin.

BIBLIOGRAFA BSICA (teora y problemas)


ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2005.
Tema 1. (Con ejercicios, cuestiones de autoevaluacin y problemas
resueltos y propuestos).
MONTIEL, A.M.; RIUS, F.; BARN F.J.: Elementos bsicos de Estadstica
Econmica y Empresarial, Ed. Prentice Hall, Madrid 1997.
Captulos 1 y 2.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

19

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

1.1. ESTADSTICA: CONCEPTO, CONTENIDO Y RELACIONES CON EL


REA ECONMICA Y EMPRESARIAL.
Ejemplo introductorio. Se ha contabilizado el nmero de das de baja, durante un trimestre, de los trabajadores de dos empresas obtenindose los
siguientes resultados:
DATOS empresa A
0 2 1 1 3
2 0 1 5 2
2 3 3 2 1
4 2 2 1 3

DATOS empresa B
0 1 1 2 9 1
0 0 1 1 0 0
1 1 0 1 1 1
9 9 9 0 0 1
0 0 1 1 9 0

Compara el nmero de das de baja en las dos empresas:


Distribucin frecuencias.
Media aritmtica
Varianza

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

20

Introduccin.

La ESTADSTICA, como ciencia, compara series de datos y ayuda a tomar


decisiones ante lo incierto, es decir, a resolver casos de incertidumbre. La
informacin estadstica se utiliza muy a menudo para validar o avalar que
las decisiones que pretendemos tomar son las ms verosmiles o probables.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

21

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

N das baja
empresa A N trabajadores
Valores

Frecuencia
0
1
2
3
4
5

Porcentaje

2
5
7
4
1
1
20

Total
n trabajadores A

8
7
6
5
4
3
2
1
0

10
25
35
20
5
5
100

Porcentaje
acumulado
10
35
70
90
95
100

7
5
4
2

n das de baja A
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

22

Introduccin.

N das baja
empresa B N trabajadores
Valores

Frecuencia
0
1
2
9

11
13
1
5
30

Total
14
n trabajadores

12

Porcentaje

11

36,67
43,33
3,33
16,67
100,00

Porcentaje
acumulado
36,67
80,00
83,33
100,00

13

10
8
5

6
4
1

2
0
0

n das de baja B

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

23

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Clculo de la Media y la Varianza.


N das
baja A

N trabajadores

Valores
0
1
2
3
4
5
Total

Frecuencia

Porcentaje

2
5
7
4
1
1
20

10
25
35
20
5
5
100

N das
baja B

N trabajadores

Valores

Frecuencia

0
1
2
9
Total

Porcentaje

11
13
1
5
30

36,67
43,33
3,33
16,67
100

Porcentaje
Clculo de
acumulado
Media
10
0
35
5
70
14
90
12
95
4
100
5
40

Clculo de
Varianza

Porcentaje
Clculo de
acumulado
Media
36,67
0
80,00
13
83,33
2
100,00
45
60

Clculo de
Varianza
44
13
0
245
302

8
5
0
4
4
9
30

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

24

Introduccin.

DATOS EMPRESA A
Media
2,00
Varianza
1,5
Desviacin tpica 1,22
DATOS EMPRESA B
Media
2,00
Varianza
10,0667
Desviacin tpica 3,17

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

25

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

La Estadstica tiene aplicaciones importantes en el mbito de la economa y


la empresa:
ECONOMA: el anlisis de datos generados por variables como la productividad econmica, inflacin, tipos de inters, empleo desempleo....
James Hechman y Daniel McFadden compartieron el premio Nobel de
Economa en el ao 2000 por desarrollar mtodos de anlisis de datos estadsticos, utilizados actualmente para estudiar comportamientos individuales en economa. Se utilizan mtodos estadsticos para construir
ndices como el IPC, para medir y predecir la inflacin. Asimismo, la estadstica es una herramienta indispensable para la econometra y el
anlisis de series temporales (estudio de variaciones estacionales y cclicas de magnitudes econmicas). El premio Nobel de Economa de 2003
lo ganaron Robert Engle, por desarrollar mtodos de anlisis de series
temporales con volatilidad variante en el tiempo (ARCH) Y Clive Granger
por sus trabajos en el anlisis de series temporales con tendencias comunes (cointegracin).

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

26

Introduccin.

DIRECCIN DE EMPRESAS: se utilizan mtodos de control de calidad


estadsticos para dirigir y perfeccionar constantemente el proceso de
produccin y por consiguiente el rendimiento de la compaa. En 1986
W. Edwards Deming y otros abogaron por una filosofa total de la calidad
con un perfeccionamiento continuo de la misma.
CONTABILIDAD, AUDITORA: toma de decisiones en cuanto al estado
de las cuentas, liquidez de las empresas, inventario... etc., basndose en
el anlisis estadstico, donde los datos a analizar son las tasas de variacin de las finanzas (cuentas de la empresa). Los anlisis estadsticos
pueden demostrar si las tasas de variacin de las finanzas en algunas
empresas difieren significativamente de las que son tpicas o usuales
en el grupo industrial de empresas determinado. Los directivos de las
empresas, los inversionistas y los empleados deben estar interesados en
conocer este tipo de resultados ya que las compaas con unos ndices de
variacin en sus finanzas atpicos suelen ir a la quiebra.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

27

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

GESTIN Y RECURSOS HUMANOS: evaluar y comparar la capacidad


de colectivos de trabajadores para realizar tareas (reparto de tareas),
utilizar resultados de un test de aptitud para complementar la informacin subjetiva de los candidatos a un empleo.
MARKETING: los fabricantes de productos de consumo dirigen la investigacin en marketing a recoger y analizar datos relacionados con las
tcnicas de venta y distribucin de bienes y servicios. La investigacin en
marketing a menudo incluye el mercado potencial y estudios de la cuota de mercado, investigacin acerca del producto, de la promocin y distribucin. Utiliza cuestionarios y encuestas por correo, telfono o entrevista personal para obtener informacin que ayude a las empresas a
decidir si deberan y cmo deberan poner un producto en el mercado.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

28

Introduccin.

1.2. LA INVESTIGACIN ESTADSTICA. ANLISIS DESCRIPTIVO,


MODELIZACIN E INFERENCIA.
Podemos distinguir tres fases implicadas cuando se aplica el mtodo estadstico:
1. MUESTREO: LA RECOPILACIN DE LOS DATOS SIN ELABORAR.

MUESTRA POBLACIN

Tcnicas muestreo

MUESTRA

ALEATORIA

DE

TAMAO ADECUADO.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

29

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

2. ESTADSTICA DESCRIPTIVA: presentacin en informe.


El objetivo de la Estadstica Descriptiva es describir un conjunto de datos:
ORDENAR LOS DATOS
RECOPILARLOS EN TABLAS ESTADSTICAS: DISTRIBUCIONES DE
FRECUENCIAS.
GRFICOS DE LA DISTRIBUCIN DE FRECUENCIAS.
CLCULO DE ESTADSTICOS: RESUMEN DE DATOS.
INTERPRETAR RESULTADOS: PRESENTACIN INFORME.
El organizar los datos de forma tal que se puedan ver las tendencias y
normas, se pueda dibujar grficos, calcular estadsticos y redactar informes se llama ESTADSTICA DESCRIPTIVA.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

30

Introduccin.

Estadstico: una medida que se pueda calcular a partir de los datos reales generados por una variable y que resuma y d una propiedad de
ese conjunto de datos.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

31

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

3. INFERENCIA ESTADSTICA: exposicin de predicciones y toma de decisiones.


El objetivo de la Inferencia Estadstica es hacer afirmaciones sobre la
POBLACIN basadas en la informacin disponible en la MUESTRA.
PREDICCIN. PROBABILIDAD.
ESTIMACIN DE PARMETROS. Parmetro: propiedad de la poblacin.
TOMA DE DECISIONES.
Al no haber absoluta certeza de la veracidad de tales afirmaciones sobre
la poblacin, se ha de utilizar el trmino PROBABILIDAD como una medida de la incertidumbre de esas conclusiones: el propsito de la estadstica es ayudar al que toma la decisin a tener razn ms veces que lo contrario. Darle una idea sobre el peligro que hay de que no tenga razn
cuando toma una decisin particular.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

32

Introduccin.

1.3. Datos estadsticos: naturaleza, descripcin numrica y representacin grfica.

CARCTER: el aspecto, fenmeno, propiedad que se desea estudiar de la


poblacin.
MODALIDAD: diferentes formas de manifestarse el carcter.
VARIABLE ESTADSTICA

X: el carcter medido sobre los elementos.

DATOS

xi

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

33

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

1.3.1. Clasificacin de los DATOS (VARIABLES) por su NATURALEZA.


CUALITATIVOS: MODALEDADES no numricas, CATEGORAS
VARIABLES CUALITATIVAS:

ORDINALES
NOMINALES o ATRIBUTOS

CUANTITATIVOS: MODALIDADES numricas, VALORES


VARIABLES CUANTITATIVAS: DISCRETAS
CONTINUAS
Ejemplo 1.1.

Ejemplo 1.2.

Ejemplo 1.3.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

34

Introduccin.

1.3.2. DESCRIPCIN NUMRICA de los datos (variables cuantitativas)

VARIABLE

N DATOS
sin elaborar

( xi )iN=1

x1 , x2 ,L , x N

k DATOS diferentes
ordenados
de menor a mayor

( xi )

k
i =1

x1 < x 2 < L < x k

DISTRIBUCIN
DE
FRECUENCIAS

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

35

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

DISTRIBUCIN DE FRECUENCIAS
Organizacin de la serie de DATOS

SIN AGRUPAR:

POCOS DATOS DIFERENTES


(k pequeo comparado con N).
Ejemplo 1.4.

AGRUPADA en intervalos: MUCHOS DATOS DIFERENTES (k grande).


Ejemplo 1.5.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

36

Introduccin.

FRECUENCIA: conteo. TIPOS DE FRECUENCIA.


FRECUENCIAS ABSOLUTAS:

ni
Ni

(frecuencia absoluta)
i

Ni = n j

frecuencia

(frec. absoluta acumulada)

frecuencia acumulada (i

j =1

= 1, 2,, k)

FRECUENCIAS RELATIVAS:

fi

ni
fi =
N

Fi

Ni
Fi = f j ; Fi =
j =1
N
i

fi 100

porcentaje

Fi 100

porcentaje

(frecuencia relativa)

acumulado

(i = 1, 2,, k) (frec. relativa acumulada)


Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

37

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Distribucin de frecuencias SIN AGRUPAR .

VARIABLE X : ( xi , n

k
i i =1

x1 < x 2 < L < x k

(k pequeo comparado con N)

Tabla estadstica: valores diferentes ordenados de menor a mayor y frecuencia.


Ejemplo 1.4.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

38

Introduccin.

Distribucin de frecuencias AGRUPADA EN INTERVALOS.


Cmo agrupar en intervalos muchos datos diferentes:
Observar valor mnimo xm y valor mximo xM.
Recorrido de la variable (amplitud total):

Nmero de intervalos (k):

Amplitud intervalos (a):

Re = x M x m

ln N
Sturges k =
+1
ln 2
k = N (N no muy grande)

Re
a=
k

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

39

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

NOTACIN INTERVALOS
Intervalo isimo:

[Li 1 , Li [ (i = 1, 2,, k).

Marca de clase (m.d.c.):

Li 1 + Li
m.d .c = x i =
2

(punto medio del in-

tervalo).
Amplitud del intervalo isimo:

a i = Li Li 1 .

Ejemplo 1.5.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

40

Introduccin.

1.3.3. Representacin grfica (variables cuantitativas).

DATOS SIN AGRUPAR:

grfico de barras.
Diagrama en escalera (acumulativo).

DATOS AGRUPADOS:

HISTOGRAMA.
Polgono acumulativo.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

41

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

HISTOGRAMA (grfico de REA)


Rectngulos yuxtapuestos.
Un rectngulo para cada intervalo.
rea de rectngulo representa la frecuencia del intervalo.
Altura de rectngulo i - simo:

ni
densidad de frecuencia d i =
ai

fi
di =
ai

Si la amplitud de todos lo intervalos es la misma (a constante), la altura de cada rectngulo puede ser la frecuencia del intervalo.

Ejemplo 1.6.

Ejemplo 1.7.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

42

Introduccin.

ni
di =
ai
densidad frecuencia

HISTOGRAMA

rea
ni

ai
Li 1

Li

Intervalos
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

43

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Conceptos clave.
Datos de naturaleza continua.
Datos de naturaleza discreta.
Densidad de frecuencia.
Distribucin de frecuencias agrupada.
Distribucin de frecuencias sin agrupar.
Estadstica Descriptiva.
Frecuencia absoluta acumulada.
Frecuencia absoluta.
Frecuencia relativa (porcentaje).
Frecuencia relativa acumulada.
Histograma.
Inferencia Estadstica.
Intervalo.
Marca de clase.
Polgono acumulativo.
Variables cualitativas.
Variables cuantitativas.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

44

Introduccin.

EJEMPLOS.
Ejemplo 1.1. Clasifica las siguientes variables en cualitativas o cuantitativas, identificando posibles valores de esas variables y elementos de la poblacin o muestra sobre la que observaramos o mediramos la variable:
a) Edad
b) Forma de pago al realizar una compra
c) Estado civil
d) Nmero de habitaciones por casa
e) Salario mensual percibido por los supervisores de ventas de una consultora.
f) Medio de transporte utilizado para ir a clase por los estudiantes del campus de Tarongers
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Texto

45

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

g) Grado de riesgo de los fondos de inversin de una entidad financiera (1 =


riesgo menor, 5 = riesgo mayor)
h) Dimetro de las tuercas que produce una mquina. (Las tuercas deberan
tener todas 6 mm de dimetro)
i) Nmero de defectos encontrados en n ordenadores porttiles fabricados
durante un mes.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

46

Introduccin.

Ejemplo 1.2. Indicar de las variables siguientes cuales generaran datos


discretos y cuales datos continuos:
a) Nmero de acciones vendidas cada da en un mercado de valores.
b) Temperaturas registradas cada media hora en un observatorio.
c) Censos anuales del colegio de profesores.
d) Longitud de 1.000 cerrojos producidos en una fbrica.
e) 30 analistas financieros dan una prediccin de las ganancias por accin
(en euros) de cierta empresa para el ao prximo.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

47

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 1.3. Preguntadas 300 personas acerca de su estado civil, 145 contestaron estar solteras, 100 casadas, 30 divorciadas y 25 viudas.
a) Identifica la variable estadstica (V.E.) y clasifcala, modalidades del carcter.
b) Clasifica la V.E. en una tabla estadstica o distribucin de frecuencias: obtener frecuencias absolutas, relativas y acumuladas.
Solucin: a) X: Estado Civil. Variable cualitativa con cuatro modalidades: Soltera, Casada, Divorciada, Viuda.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

48

Introduccin.

Ejemplo 1.4. El departamento de prevencin de riesgos laborales de una


gran empresa de la construccin ha recogido informacin sobre el nmero
de accidentes laborales diarios con baja laboral que se han producido durante los 44 das siguientes a la aplicacin de nuevas normas de seguridad,
obteniendo los siguientes resultados:
Nmero de accidentes diarios 44 das)
2 1 0 3 3 4 4 3 7 4 4
1 0 4 2 4 0 2 2 4 3 2
0 3 0 3 5 1 5 0 0 3 0
7 5 4 5 3 9 3 10 3 0 9
Obtener:
a) La tabla estadstica o distribucin de frecuencias.
b) Diagramas de barras (con frecuencias absolutas y relativas).
c) Diagrama en escalera o acumulativo.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

49

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 1.5. El departamento de personal de una empresa aplica un test


de habilidad mental a sus empleados con el objetivo de seleccionar a un
nmero determinado de ellos para la realizacin de ciertas tareas. Las puntuaciones obtenidas han sido las siguientes:
43 40 41 50 62 35 38 50 32 35 36 45 58 30 33 45
49 46 47 51 64 36 39 51 51 48 49 53 66 38 41 43
71 45 46 55 68 40 53 55 52 49 50 59 62 45 48 60
32 30 40 39 42 30 35 40 38 36 46 45 68 50 69 69
a) Forma una distribucin de frecuencias con 7 intervalos.
b) Histograma.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

50

Introduccin.

Ejemplo 1.6. Dada una distribucin con 128 valores:


a) Determnese, mediante la frmula de Sturges, el nmero de intervalos en
que puede agruparse.
b) Si el recorrido de la distribucin es de 48 unidades, cul ser la amplitud
de cada intervalo?.
Solucin: a) K= 8 ; b) 6

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

51

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 1.7. Al representar mediante un histograma la siguiente distribucin de frecuencias:


Intervalos

ni

0-10

100

10-50

200

El intervalo de 0 a 10 se representa por un rectngulo de 18 cm. de altura


Cul debe ser la altura del intervalo de 10 a 50?
vas.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

TEMA 2
ANLISIS DE DATOS
UNIDIMENSIONALES

53

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ficha del tema 2.


Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
2.1. Principales medidas de posicin, dispersin y de forma o perfil.
2.2. Transformaciones lineales y tipificacin de variables.
2.3. Otras medidas de posicin: moda y cuantiles (mediana).
Conceptos clave.
Ejemplos.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

54

Anlisis de datos unidimensionales.

OBJETIVOS DE APRENDIZAJE.
Aprender a calcular e interpretar los estadsticos descriptivos ms importantes.
Conceptos de dispersin absoluta y dispersin relativa.
Comparar dispersin y datos tipificados entre dos o ms variables.
Informacin que aportan la media y la varianza en cuanto a la distribucin
de los datos de una variable alrededor de la media (Regla de Tchebysheff).
Estudiar cmo se ven afectados los estadsticos y coeficientes al transformar
linealmente los datos de una variable.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

55

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

BIBLIOGRAFA BSICA (teora y problemas)


ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2005.
Tema 2. (Con ejercicios, cuestiones de autoevaluacin y problemas
resueltos y propuestos).
MONTIEL, A.M.; RIUS, F.; BARN F.J.: Elementos bsicos de Estadstica
Econmica y Empresarial, Ed. Prentice Hall, Madrid 1997.
Captulos 3 y 4.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

56

Anlisis de datos unidimensionales.

2.1. Principales medidas de posicin, dispersin y de forma o perfil.


2.1.1. Principales medidas de posicin y dispersin.
POSICIN: LA MEDIA ARITMTICA.

Variable estadstica con N datos en total

X : (x

Distribucin de frecuencias

X : ( xi , n

1 N
x = xi
N i =1

N
i i =1

k
i i =1

1 k
x = x i ni
N i =1
k

Tambin:

x = xi f i
i =1

Se utilizar preferentemente la primera expresin.


En una distribucin agrupada en INTERVALOS:

x i m.d .c.
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

57

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

PROPIEDADES DE LA MEDIA
1. La media es el CENTRO DE GRAVEDAD de la distribucin (c.d.g):
N

( xi x ) = 0 (medida de posicin central).


i =1

2. Poblacin con N datos, subdividida en p subpoblaciones disjuntas de


tamaos

N 1 , N 2 ,L ,N p

con

dia total se puede determinar:


Ver ejemplo en:

Nj = N

y medias

j =1

x1 , x2 ,L , x p ,

la me-

1 p
xT = x j N j
N j =1

ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2006.

Tema 2, pgina 29 (ejemplo 2.4)

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

58

Anlisis de datos unidimensionales.

CONSIDERACIONES SOBRE LA MEDIA.


1. La media es un resumen de los N datos de la variable (PROMEDIO).
Datos homogneos (cercanos a la media), media representativa.
Datos heterogneos (alejados de la media, extremos), media no representativa.
2. La media es un ESTADSTICO de tipo ABSOLUTO que tiene la misma unidad de medida que la variable. Adems su valor estar dentro del recorrido de la variable:

Re : x m a x M

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

59

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

DISPERSIN: LA VARIANZA.
En una V.E. con N datos

X : (x

N
i i =1 ,

las medidas de DISPERSIN miden la

amplitud, diseminacin o VARIABILIDAD de los DATOS, en su conjunto.


Miden la posicin que ocupan los datos respecto a un punto de inters que
tomamos como referencia. La referencia ms apropiada, ptima para la varianza, es la media aritmtica, por ser el centro de gravedad de la distribucin.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

60

Anlisis de datos unidimensionales.

VARIANZA

s2:

media de los cuadrados de las desviaciones de los datos a su media.


Variable estadstica con N datos en total:

X : (x

N
i i =1

1 N
2
s = ( xi x )
N i =1
2

Distribucin de frecuencias:

X : ( x i , n i )i = 1
k

1 k
2
s = ( x i x ) ni
N i =1
2

Tambin:

s = ( xi x ) f i
2

i =1

Se utilizar preferentemente la primera expresin.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

61

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

En una distribucin agrupada en INTERVALOS: x i m.d .c .


DESVIACIN TPICA

s:

Desviacin tpica s = + varianza


PROPIEDADES DE LA VARIANZA Y LA D.T.
1. s

0 ; s 0 . Son cero cuando todos los datos son iguales.

2. Se demuestra que:

1 N 2
s = xi x 2
N i =1
2

o bien

1 k 2
s = x i ni x 2 . Esta
N i =1
2

expresin resulta til para el clculo de la varianza sobre una distribucin


de frecuencias.
Ejemplo 2.1.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

62

Anlisis de datos unidimensionales.

CONSIDERACIONES SOBRE LA VARIANZA Y LA DESVIACIN TPICA.


1. La varianza

s2

es una medida de DISPERSIN ABSOLUTA. Tiene la uni-

dad de medida de la variable al cuadrado.


La desviacin tpica

s , sin embargo, tiene la misma unidad de medida que

la variable y es directamente comparable con la media.


2. La desviacin tpica

s,

como medida de DISPERSIN aporta informacin

estadstica sobre la VARIABILIDAD de los DATOS en relacin a su media.


Nos dar informacin acerca de la homogeneidad o heterogeneidad de los
datos en relacin al valor medio de los mismos.

pequea en relacin al valor de la media: media representativa, datos

homogneos.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

63

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

s grande en relacin al valor de la media: media no representativa, datos


heterogneos.
3. COMPARAR DISPERSIN entre dos o ms variables: las desviaciones tpicas de dos o ms variables son comparables directamente si las variables
tienen la misma unidad de medida y el mismo valor para la media.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

64

Anlisis de datos unidimensionales.

DISPERSIN RELATIVA. EL COEFICIENTE DE VARIACIN


Para comparar la dispersin entre diferentes series de datos (variables) independientemente de sus unidades de medida y del valor de sus medias se utilizar una medida
de DISPERSIN RELATIVA.

Dada una variable X

: ( x i )i =1 ,
N

su media

x 0

y su desviacin tpica

s,

se

define el coeficiente de variacin de Pearson:

g0 =

s
|x|

Habr mayor dispersin relativa donde g0 sea mayor.


Ejemplo 2.2.

Ejemplo 2.3.

Ejemplo 2.4.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

65

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

2.1.2. Momentos.
Dada una variable estadstica

X : (x

N
i i =1 ,

X : ( xi , n

k
i i =1

con su media

x,

se definen:
MOMENTOS ORDINARIOS DE ORDEN p

1 N p
a p = xi
N i =1

1 k p
a p = x i ni
N i =1

con p entero p 0

MOMENTOS ORDINARIOS que se van a utilizar:

1 N
p = 1 a1 = xi = x
N i =1
1 N 2
p = 2 a2 = xi
N i =1

(media)

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

66

Anlisis de datos unidimensionales.

MOMENTOS CENTRALES DE ORDEN p

1 N
p
m p = ( xi x )
N i =1

1 k
p
m p = ( x i x ) ni
N i =1

con p entero p 0

MOMENTOS CENTRALES que se van a utilizar:

p = 1 m1
p = 2 m2
p = 3 m3
p = 4 m4

1 N
= ( xi x ) = 0
N i =1
1 N
2
= ( xi x ) = s 2
N i =1
1 N
3
= ( xi x )
N i =1
1 N
4
= ( xi x )
N i =1

( varianza)

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

67

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

LA VARIANZA EN FUNCIN DE LOS MOMENTOS.


En funcin de la segunda propiedad dada para la varianza y de las definiciones de los momentos ordinarios y centrales se tiene que:

1 N
1 N 2
2
s = m2 = ( xi x ) = xi x 2 = a 2 a12
N i =1
N i =1
2

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

68

Anlisis de datos unidimensionales.

2.1.3. Medidas de forma o perfil.


ASIMETRA: perfil horizontal de la distribucin.
La media es el c.d.g. de la distribucin (de la variable, de la serie de datos
ordenada) y se desplazar hacia donde haya mayor densidad de datos. Se
estudia la simetraasimetra de la distribucin tomando como referencia el
c.d.g.
Si hay mayor densidad de datos al principio de la distribucin (datos menores), la
media se desplaza hacia la izquierda, dejando una cola de datos a su derecha:
ASIMETRA A LA DERECHA DE LA MEDIA.
Si hay mayor densidad de datos al final de la distribucin (datos mayores), la
media se desplaza hacia la derecha, dejando una cola de datos a su izquierda:
ASIMETRA A LA IZQUIERDA DE LA MEDIA.
Si la distribucin de datos es igual a izquierda y derecha de la media: SIMETRA
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

69

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

ASIMETRA A LA DERECHA

ASIMETRA A LA IZQUIERDA

media

media

SIMETRA

media

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

70

Anlisis de datos unidimensionales.

COEFICIENTE DE ASIMETRA DE FISHER.


A partir del momento central de orden impar

1 N
3
m 3 = ( xi x )
N i =1

se define

el coeficiente de asimetra de FISHER:

m3
g1 = 3
s
Si m3 > 0 g 1 > 0 ASIMETRA A LA DERECHA
SIMETRA m3 = 0 g 1 = 0 (observar grfico)
Si m3 < 0 g 1 < 0 ASIMETRA A LA IZQUIERDA

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

71

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

APUNTAMIENTO O CURTOSIS: perfil vertical de la distribucin.


Las medidas de apuntamiento proporcionan informacin estadstica de la
distribucin, relativa a la densidad de datos que hay en las proximidades de
la media (c.d.g.).
Si la densidad de datos alrededor de la media es muy dominante: distribucin MUY APUNTADA, rectngulos del histograma centrales con mucha
altura.
Si la densidad de datos alrededor de la media no es dominante: distribucin POCO APUNTADA, rectngulos del histograma centrales con poca altura.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

72

Anlisis de datos unidimensionales.

COEFICIENTE DE APUNTAMIENTO O CURTOSIS DE FISHER.


A partir del momento central de orden cuatro

1 N
4
m 4 = ( xi x )
N i =1

se defi-

ne el coeficiente de apuntamiento de FISHER:

m4
g2 = 4
s
Para medir con este coeficiente el grado de apuntamiento de una distribucin se utilizarn dos MODELOS de distribucin de REFERENCIA:
MODELO NORMAL: distribucin campaniforme con un apuntamiento de

g 2 = 3.
MODELO UNIFORME: distribucin horizontal con un apuntamiento de

g 2 = 1,8 .
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

73

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Apuntamiento = 3
MODELO NORMAL

Apuntamiento = 1,8
MODELO UNIFORME

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

74

Anlisis de datos unidimensionales.

De esta forma se seguirn los siguientes criterios para medir el apuntamiento de una
distribucin:

Si g 2 > 3 ms apuntada que el modelo NORMAL (leptocrtica)


Si g 2 = 3 mismo apuntamiento que el modelo NORMAL (mesocrtica)
Si g 2 < 3 menos apuntada que el modelo NORMAL (platicrtica)
Apuntamiento >3

Apuntamiento<3 y >1,8

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

75

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Si g 2 = 1,8 mismo apuntamiento que modelo UNIFORME (horizontal).


Si g 2 < 1,8 forma de " U" (ms densidad de datos en los extremos) .
Ejemplo 2.5.

Ejemplo 2.6.

Apuntamiento <1,8

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

76

Anlisis de datos unidimensionales.

2.2.Transformaciones lineales y tipificacin de variables.


2.2.1. Transformaciones lineales.
Dada una V.E.

X : ( x i )i = 1
N

y dos nmeros reales k, c, se distinguirn tres tipos de

transformaciones lineales de la variable X en otra variable X:

1.

N
X : ( xi )i =1 X ( xi = xi + c )

2.

X : (x

3.

X : ( xi )i =1 X ( xi = kxi + c )

) X ( xi = kxi )

N
i i =1

cambio de origen o unidad

cambio de escala

transforma cin lineal completa

EN GENERAL LO PODEMOS EXPRESAR:

1. X' = X + c
2. X' = kX
3. X' = kX + c

(cambio de origen)
(cambio de escala)
(transformacin lineal completa)
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

77

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

PROPIEDADES DE TRANSFORMACIN LINEAL.


Si transformamos linealmente los datos de una variable, los estadsticos de la misma
(media, varianza, momentos, coeficientes) se ven afectados como sigue:

1. x ' = x + c
MEDIA

VARIANZA

2. x ' = kx
3. x = kx + c

(cambio de origen)
(cambio de escala)
(transformacin lineal completa)

1. s X2 = s X2

(cambio de origen)

2. s X2 = k 2 s X2

(cambio de escala)

3. s X2 = k 2 s X2

(transformacin lineal completa)

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

78

Anlisis de datos unidimensionales.

DESVIACIN
TPICA

1. s X = s X

(cambio de origen)

2. s X = k s X

(cambio de escala)

3. s X2 = k s X

(transformacin lineal completa)

1. m p ( X ) = m p ( X )
MOMENTOS

( cambio de origen)

2. m p ( X ) = k p m p ( X ) ( cambio de escala)
3. m p ( X ) = k p m p ( X ) ( transformacin lineal completa)
Ejemplo 2.7.

Ejemplo 2.8.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

79

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

COEFICIENTE DE VARIACIN DE PEARSON

1. X' = X + c

(cambio de origen)

sX
sX
1. g 0 ( X ) =
=
g0 ( X )
| x | | x + c |

2. X' = kX

(cambio de escala)

sX | k | sX sX
2. g 0 ( X ) =
=
=
= g0 ( X )
| x | | k || x | | x |

3. X' = kX + c (transformacin lineal completa)


sX
| k | sX
3. g 0 ( X ) =
=
g0 ( X )
| x | | kx + c |
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

80

Anlisis de datos unidimensionales.

COEFICIENTE ASIMETRA DE FISHER

1. X' = X + c

(cambio de origen)

m3 ( X ) m3 ( X )
1. g 1 ( X ) =
=
= g1( X )
3
3
sX
sX

2. X' = kX

(cambio de escala)

m 3 ( X ) k 3 m 3 ( X ) m 3 ( X )
=
=
= g1(X )
Si k > 0 g 1 ( X ) =
3
3 3
3
sX
k sX
sX

2.
3
3
Si k < 0 g ( X ) = m 3 ( X ) = k m 3 ( X ) = k m 3 ( X ) = g ( X )
1
1
3
3
3
3 3

|
|
s
k
s
k
s

X
X
X
Si k es negativo cambia el signo de la asimetra, pero el grado de asimetra no.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

81

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

3. X' = kX + c

(transformacin lineal completa)

Lo mismo que en 2.:

m 3 ( X ) k 3 m 3 ( X ) m 3 ( X )
=
=
= g1(X )
Si k > 0 g 1 ( X ) =
3
3 3
3
sX
k sX
sX

3.
3
3

(
)
(
)
m
X
k
m
X
k
m3 ( X )
Si k < 0 g ( X ) = 3
3
=
=
= g1(X )
1
3
3
3
3 3

k sX
| k | sX
sX

El coeficiente de asimetra es invariante por transformacin lineal, salvo en el signo.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

82

Anlisis de datos unidimensionales.

COEFICIENTE DE APUNTAMIENTO DE FISHER

1. X' = X + c

(cambio de origen)

m4 ( X ) m4 ( X )
1. g 2 ( X ) =
=
= g2( X )
4
4
sX
sX

2. X' = kX

(cambio de escala)

m4 ( X ) k 4 m4 ( X )
2. g 2 ( X ) =
=
= g2( X )
4
4 4
sX
k sX

3. X' = kX + c

(transformacin lineal completa)

m4 ( X ) k 4 m3 ( X )
3. g 2 ( X ) =
=
= g2( X )
4
4 4
sX
k sX
El coeficiente de apuntamiento es invariante por transformacin lineal.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

83

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

2.2.2. Tipificacin de variables.


Sea X : ( x i )i =1 una V.E. y
N

x , s2

su media y varianza respectivamente.

Para cada valor x i de la variable se define su PUNTUACIN TIPIFICADA


como:

zi =
zi

xi x
s

es un valor relativo y mide la distancia del valor

xi

a la media x , en

unidades de desviacin tpica.


Si un valor

zi

es positivo, el valor

Si un valor

zi

es negativo, el valor

xi
xi

ser mayor que la media.


ser menor que la media.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

84

Anlisis de datos unidimensionales.

Si se tipifican los N valores de una V.E., se obtendrn N puntuaciones tipificadas que constituyen otra variable que se denominar:
VARIABLE ESTADSTICA TIPIFICADA

Z : ( z i )i =1
N

PROPIEDADES DE LA VARIABLE TIPIFICADA.


1. La media de la V.E. tipificada es cero:

z =0

2. La varianza de la V.E. tipificada es uno:

s Z2 = 1

Por tanto cualquier variable que tipifiquemos se transforma en otra de media


cero y desviacin tpica uno:

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

85

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

X (x )
x sX

N
i i =1

VARIABLE TIPIFICADA

Z (z i )

Y ( y i )i =1
y sY
N

N
i =1

z = 0 sZ = 1

LOS VALORES TIPIFICADOS se utilizarn para:


Comparar valores de diferentes variables, independientemente de la
unidad de medida de las mismas y del valor de sus medias y desviaciones tpicas.
Para medir la dispersin relativa de un valor concreto de una variable.
Ejemplo 2.9.

Ejemplo 2.10.

Ejemplo 2.11.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

86

Anlisis de datos unidimensionales.

2.2.3. Regla de Tchebysheff.

Dada una variable estadstica cualquiera X : ( x i )i =1 con N observaciones, de


N

media

y desviacin tpica s, y dado un nmero real positivo k mayor que

1; al menos un porcentaje

de 1 2
k

cuentra dentro del intervalo de valores

x 100 de las observaciones se en-

x ks ,

es decir, entre k desviacio-

nes tpicas alrededor de la media aritmtica.


Ejemplo 2.12.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

87

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

UTILIDAD DE LA REGLA DE TCHEBYSHEFF


Si de una V.E. X no se tiene informacin de sus valores concretos, ni de
su distribucin de frecuencias, pero se conoce el valor de su media x y
la desviacin tpica s se puede obtener informacin sobre el recorrido de
los datos de la variable dando intervalos de valores alrededor de la media x ks .
As por ejemplo:
Para

Para

Para

1
= 0 ,75 ms del 75% de los datos de una V.E. estar
2
k
en el intervalo x 2 s .
1
k = 2,5 1 2 = 0 ,84 ms del 84% de los datos de una V.E. estar
k
en el intervalo x 2 ,5 s

k=2

k=3

1
k

= 0,8889 ms del 88%-89% de los datos de una V.E.


estar en el intervalo

x 3s .

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

88

Anlisis de datos unidimensionales.

2.3. Otras medidas de posicin: moda, cuantiles (mediana).


MODA (Mo):
La moda es una medida de posicin que identifica en la distribucin de una
V.E. el valor o la zona de valores ms frecuente o de mayor densidad de frecuencia (zona modal). En una misma distribucin puede haber ms de una
moda o zonas modales.
DETERMINACIN DE LA MODA:
En una distribucin con pocos datos diferentes, y por tanto, SIN AGRUPAR, la MODA es el valor (o valores) de la distribucin con mayor frecuencia.
En distribuciones con muchos datos diferentes y, por tanto, AGRUPADA
en intervalos, se determinar el INTERVALO, ZONA o CLASE MODAL
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

89

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

[Li 1 , Li [ como aquel intervalo con mayor densidad de frecuencia


frecuencia

d i (o

ni , si todos tienen la misma amplitud).

Como valor representante de la MODA dentro de la clase modal i-sima

[Li 1, Li [ de densidad d i

y amplitud

a i se dar el siguiente:

d i +1
ai
Mo = Li 1 +
d i 1 + d i + 1
Ejemplo 2.13.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

90

Anlisis de datos unidimensionales.

CUANTILES: Q
DEFINICIN GENERAL: Dada una V.E.

X : ( x i )i = 1
N

NADOS DE MENOR A MAYOR y dado un nmero real


que el valor

con N valores ORDE-

(0 < < 1), se dir

x del recorrido de la variable es un CUANTIL DE ORDEN si:

como mnimo, un porcentaje del


o iguales que

( 100 )

de los valores son menores

x.

y, como mnimo, un porcentaje del


mayores o iguales que

(( 1 ) 100 )

de los valores son

x.

NOTACIN:

Q = x

(cuantil de orden

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

91

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

DETERMINACIN DE CUANTILES.
Sea una V.E.

X : ( xi )i =1
N

con N valores, y sea

X : ( xi , ni , N i , Fi )i =1
k

su dis-

tribucin de frecuencias con los datos ordenados de menor a mayor.


REGLA GENERAL: se tomar como cuantil de orden ,
lor

xi

Q , el primer va-

de la distribucin de frecuencias que tenga asignada una frecuen-

cia relativa acumulada


taje acumulado
acumulada

Ni

Fi

superior al orden del cuantil

( Fi 100 )

superior a

superior al

( 100 ),

. (O un porceno una frecuencia

N ).

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

92

Anlisis de datos unidimensionales.

CASO ESPECIAL: si un valor

xi

de la distribucin de frecuencias tiene

asociada una frecuencia relativa acumulada


te con el orden del cuantil

Fi

( Fi = ),

que coincide exactamense tomar como cuantil

xi + xi +1
Q =
, es decir el punto medio entre x i
2
la distribucin x i +1 .

y el siguiente valor de

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

93

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Si la distribucin contiene muchos datos diferentes, AGRUPADOS EN INTERVALOS y se pretende determinar los cuantiles manualmente sobre la
distribucin agrupada, se proceder como sigue:
se determinar el intervalo o clase del cuantil

[Li 1 , Li [

como el

Fi

superior

primer intervalo con una frecuencia relativa acumulada


al orden del cuantil

y, dentro de ese intervalo se dar como una

aproximacin al cuantil:

Fi 1
Q = Li 1 +
ai
fi

o tambin, la expresin equivalente:

N N i 1
Q = Li 1 +
ai
ni
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

94

Anlisis de datos unidimensionales.

FAMILIAS DE CUANTILES MS UTILIZADAS:


LA MEDIANA (Me): la mediana es el cuantil de orden

= 0 ,5

Me = Q0 ,5
Es decir, la MEDIANA es un valor que divide por la MITAD la distribucin (MEDIDA DE POSICIN CENTRAL).
CUARTILES (Ci): los cuartiles son tres cuantiles que dividen la distribucin en cuartos. Son los cuantiles de rdenes

C1 = Q0 ,25 C 2 = Q0 ,50

: 0,25 , 0,50 y 0,75.

C 3 = Q0 ,75

PERCENTILES (Pi): 99 cuantiles que dividen en 100 partes la distribucin.

P1 = Q0 ,01 ,L P30 = Q0 ,30 ,L P50 = Q0 ,50 ,L P80 = Q0 ,80 ,L P99 = Q0 ,99


Ejemplo 2.14.

Ejemplo 2.15.
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

95

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Conceptos clave.

Apuntamiento o curtosis (coeficientes de Fisher).


Asimetra.
Coeficiente de variacin.
Cuantil.
Desviacin tpica.
Dispersin absoluta.
Dispersin relativa.
Media (aritmtica).
Mediana.
Moda.
Puntuacin tipificada.
Transformacin lineal.
Varianza.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

96

Anlisis de datos unidimensionales.

EJEMPLOS.
Ejemplo 2.1.
2.1.A. Calclese la media y la varianza de las siguientes series de valores:

X: 1
Y: 6
Z: -19
W: 2
Solucin:

2
7
4
2

3
8
7
3

4
9
12
2

x = 3 s X2 = 2
z = 5 s Z2 = 177 ,2

5
10
21
6

y = 8 sY2 = 2
w = 4 sW2 = 4 ,2857

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

97

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

2.1.B. Calclese la media y la varianza de la siguiente distribucin de frecuencias agrupada:


Intervalos

Solucin:

x = 3 ,5

Frecuencia

23

10

34

40

45

10

1
s = = 0 ,33
3
2

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

98

Anlisis de datos unidimensionales.

2.1.C. Calcula la media de la siguiente distribucin de frecuencias agrupada:


Intervalos

Frecuencia

0 15

Solucin:

15 25

12

25 30

12

x 20 ,5

2.1.D. Calclese la media y la varianza de la siguiente distribucin:


xi
fi

frecuencia relativa

0,2

0,4

0,3

0,1

Solucin: media 5,4 y varianza 4,44.


Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Texto

99

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 2.2.
2.2.A. Las dos muestras siguientes tienen la misma dispersin absoluta
(desviacin tpica y varianza) pero diferente dispersin relativa (coeficiente
variacin):
a) 1

b) 1321

1322

1323

1324

1325

1326

1327

Sin realizar ningn clculo: razona cul de ellas tendr menor dispersin relativa, es decir, qu conjunto de datos es ms homogneo. Tiene algo que
ver con la distancia de los datos al origen y el valor de las medias respectivas?
Por qu tienen la misma dispersin absoluta? (distancia de los datos a la
media).
En un cambio de origen, la dispersin absoluta (S) no cambia pero la disper-

s
sin relativa s . Calcula la media y varianza de las dos series de datos y
x

comprueba lo anterior.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

100

Anlisis de datos unidimensionales.

2.2.B. Las dos muestras siguientes tienen diferente dispersin absoluta pero
la misma dispersin relativa:
a) 1

b) 5

10

15

20

25

30

35

Sin realizar ningn clculo: razona cul de ellas tendr menor dispersin absoluta.
Por qu tienen la misma dispersin relativa? Guardan alguna proporcin
los datos de a) con los datos de b)? Tiene esto algo que ver con un cambio
de escala?
En un cambio de escala, la dispersin absoluta s cambia pero la relativa no
cambia. Calcula la media y varianza de las dos series de datos y comprueba
lo anterior.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Texto

101

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 2.3. Un fabricante de detergentes quiere comprar una mquina


empaquetadora que realice la operacin de llenar bolsas de 250 gramos. La
casa A le ofrece una mquina con la cual realiza unas pruebas y obtiene los
siguientes resultados: 250, 252, 248, 253, 247.La casa B le ofrece otra y,
realizando pruebas, obtiene los siguientes resultados: 258, 252, 247, 248,
245. Qu mquina le interesa ms comprar? (Calcular media y varianza y
comparar dispersin).
Solucin:

x A = 250 gr . s A = 2 ,28 x B = 250 gr . s B = 4 ,604

Como las medias son iguales y tienen la misma unidad de medida,


las desviaciones tpicas son comparables directamente: la de A es
menor que la de B.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

102

Anlisis de datos unidimensionales.

Ejemplo 2.4. En dos empresas se ha observado al colectivo de trabajadores


que causa baja laboral por motivos de enfermedad. El nmero medio de
horas perdidas por este motivo en la empresa A ha sido de 130h y en la
empresa B de 40h. As mismo, las desviaciones tpicas respectivas han sido
de 60h y 45h. En qu empresa hay mayor dispersin relativa en el nmero
de horas perdidas? Dnde es ms representativa la media?

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

103

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 2.5. Calcula los coeficientes de asimetra y curtosis de Fisher de


los valores:
a) 1
2
3
4
5
b) 1

c) 1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

104

Anlisis de datos unidimensionales.

Ejemplo 2.6. Explica cul de las siguientes variables estadsticas tiene una
curva de frecuencias ms aproximada al modelo normal, comentando en cada caso la forma de la curva de frecuencias correspondiente (asimetra y
apuntamiento):

1
1
2
3
A ) m2 = ( xi x ) ni = 144 m3 = ( xi x ) ni = 0
N
N
1
4
m4 = ( xi x ) ni = 103.680
N
B ) s = 12
m3 = 936 m4 = 20.736
s = 10

C)

m3 = 85 m4 = 29.740

Sol.: La C es la ms aproximada al modelo normal.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

105

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 2.7. Dada la variable estadstica X de media 15 y varianza 4, calcular la media y la varianza de las siguientes variables:
a) Z = X + 3
b) Y = 4 X
c) Y = -4X
d) W = 6 X 1

En qu variable el coeficiente de variacin de Pearson sern igual al de X?

Solucin:

a)

z = 18

s Z2 = 4

b)

y = 60

sY2 = 64

c)

y = 60

sY2 = 64

d)

w = 89

sW2 = 144 )

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

106

Anlisis de datos unidimensionales.

Ejemplo 2.8. Analizadas las ventas (en miles de u.m.) en 1999 de 100
empresas de un determinado sector se ha obtenido una media de 500 u.m.
y una desviacin tpica de 3,5 u.m.
Calcular la media y la varianza para el ao 2000 en los siguientes supuestos:
a) Las ventas sufren un aumento del 20% en todas las empresas.
b) Las ventas se incrementan en todas las empresas en 100 miles de u.m.

Solucin: a)

y = 600, sY2 = 17,64

b)

y = 600, sY2 = 12,25

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

107

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 2.9. Tipifica los valores obtenidos en el ejemplo 2.3 para la casa B
y comprueba que la media de las puntuaciones tipificadas es 0 y la desviacin tpica 1.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

108

Anlisis de datos unidimensionales.

Ejemplo 2.10. Los estudiantes de un grupo determinado de primer curso


de la licenciatura en ECO han realizado dos pruebas, A y B. La calificacin
media en la primera de ellas es de 6,5 puntos con una desviacin tpica de
2,36, mientras que en la segunda prueba, la media y la desviacin tpica han
sido respectivamente de 5 y 1,32 puntos. Un estudiante ha obtenido una calificacin de 7,5 en la prueba A y de 7 en la prueba B. En qu examen ha
obtenido una nota relativa ms alta?

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

109

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 2.11. Cristina y Ral, dos compaeros de un grupo de Estadstica,


mantienen la siguiente conversacin:
Cristina: creo que como estudiante universitaria soy ms alta que t, Ral.
Ral: lo dudo, cunto mides?
1,70 m. contest Cristina- y t?
1,76 m., replic Ral mientras diriga su mirada hacia los zapatos de
Cristina- las apariencias engaan.
S, puede ser que las apariencias engaen, pero la Estadstica no
argument Cristina-. He ledo un estudio sobre la estatura de los estudiantes de la Universidad de Valencia y da como resultado que la altura media
de las chicas es de 168 cm. con una desviacin tpica de de 5 cm., mientras que las de los chicos son de 174 y 10 centmetros respectivamente.
y? pregunt Ral-.

Contestar a Ral (con instrumentos estadsticos).

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

110

Anlisis de datos unidimensionales.

Ejemplo 2.12. Se lleva a cabo un estudio para determinar el tiempo necesario para realizar una operacin especfica en una empresa. El tiempo necesario (en minutos) para realizar la operacin se midi para N = 40 trabajadores (entre los que ests incluido t) y los resultados fueron los siguientes:

x = 13,8

s = 1,7

Describir aproximadamente los datos aplicando el coeficiente de variacin de


Pearson y los intervalos

x ks (regla de Tchebysheff).

Si t has tardado en realizar ese trabajo 10 minutos solamente, Consideras


que tu tiempo est muy por debajo de la media, o por el contrario crees que
est dentro de unos lmites normalmente razonables?

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

111

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

NOTA: REGLA DE TCHEBYSHEFF: Dada una variable estadstica cualquiera


X(xi) con N observaciones, de media

y desviacin tpica s, y dado un n-

mero real positivo k mayor que 1; al menos un porcentaje de 1 2 x100


k

de las observaciones se encuentra dentro del intervalo de valores x ks , es


decir, entre k desviaciones tpicas alrededor de la media aritmtica.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

112

Anlisis de datos unidimensionales.

Ejemplo 2.13. Calclese la MODA de los siguientes conjuntos de datos y


distribuciones:
a)

X : 2, 2, 3, 2, 6, 7, 6

b)

1,5 2,5

12

Intervalos
0,2 0,3
0,3 0,4

2,5 3,0

12

0,4 0,5

Intervalos
0,0 1,5

Solucin:

Frecuencia

a ) Mo = 2

Frecuencia
10
40
8

b ) Mo = 2 ,5 Mo = 0 ,35 o 0 ,344

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

113

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 2.14. Se les pide a doce economistas que den una prediccin sobre el incremento del IPC para el ao 2003. Dichas predicciones fueron:

4,0

3,9

3,2

3,5

3,8

3,3

3,5

3,4

3,7

3,6

3,4

3,2

Calclese la mediana, la moda y el primer cuartil de dichas predicciones.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

114

Anlisis de datos unidimensionales.

Ejemplo 2.15. Calclese la moda y los cuantiles de orden 0,25, 0,50 (mediana) y 0,75 (cuartiles) en los ejemplos 4 y 5 del tema 1.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

TEMA 3
MEDIDAS DE CONCENTRACIN

116

Medidas de concentracin.

Ficha del tema 3.


Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
3.1. Introduccin: concepto, instrumentos, concentracin mnima y mxima.
3.2. Curva de Lorenz.
3.3. ndice de Gini.
Conceptos clave.
Ejemplos.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

117

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

OBJETIVOS DE APRENDIZAJE.
Estudiar como se reparte o distribuye la masa o volumen total de la variaN

ble, x n , entre los N elementos de la muestra o poblacin tanto grfica


i

i =1

(curva de Lorenz) como analticamente (ndice de Gini)

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

118

Medidas de concentracin.

BIBLIOGRAFA BSICA (teora y problemas)


ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2005.
Tema 2 (2.6, pgina 55). (Con ejercicios, cuestiones de autoevaluacin y problemas resueltos y propuestos).
MONTIEL, A.M.; RIUS, F.; BARN F.J.: Elementos bsicos de Estadstica
Econmica y Empresarial, Ed. Prentice Hall, Madrid 1997.
Captulo 4 (4.5, pgina 102).

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

119

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

3.1. INTRODUCCIN. CONCEPTO. INSTRUMENTOS. CONCENTRACIN


MNIMA Y MXIMA.
Concepto: dada una variable estadstica X (x ) y su distribucin de frecuencias (x , n ) , con los datos ordenados de menor a mayor, estudiar la concentracin de la V.E. consiste en medir cmo est repartida (distribuida) la
masa o volumen total de la variable entre los N elementos de la poblacin.
N
i i =1

k
i i =1

El volumen total de la variable es la agregacin de todos los valores y lo


llamamos
v = xn
k

i =1

i i

Instrumentos para medir la concentracin: la concentracin se medir comparando dos indicadores que se obtendrn a partir de la distribucin de frecuencias de los valores de la variable:
Uno relativo a los N elementos de la poblacin y que se obtiene a partir
de las frecuencias acumuladas:
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

120

Medidas de concentracin.

N i = n j pi =
j =1

Ni
x100
N

(i = 1, 2,, k)

pk=100 siempre.
pi representa el porcentaje acumulado de elementos de la poblacin
hasta el lugar i-simo (Fi x 100).
El otro relativo a la masa o volumen de variable y que se obtiene a partir de la cantidad de variable (xi ni) que van acumulando los elementos
de la poblacin:
i

vi = x j n j qi =
j =1

vi
x100
vk

(i = 1, 2,, k)

qk=100 siempre.
qi representa el porcentaje acumulado de volumen de variable hasta el
lugar i-simo.
vi es la cantidad de variable acumulada hasta el lugar i-simo de la distribucin (ordenada de menor a mayor).
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

121

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Concentracin mnima y mxima:


Mnima: cuando el volumen total vk est equidistribuido entre los N elementos de la poblacin. En este caso cada elemento acumulara el misxn
v
mo volumen de variable: =
=x
k

i =1

i i

Entonces: pi = qi (i = 1, 2,, (k-1)). (pK = qk siempre).


Mxima: en este caso el volumen vk total lo acumulara un solo elemento y los (N-1) restantes nada. Como los valores de la distribucin estn
ordenados de menor a mayor, este elemento aparecera al final de la
distribucin y entonces:
Para cada pi , qi = 0 (i = 1, 2,, (k-1)).

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

122

Medidas de concentracin.

3.2. CURVA DE LORENZ...


La curva de Lorenz es la representacin grfica de la concentracin: se obtiene al representar en unos ejes de coordenadas los valores (pi , qi).

La concentracin mnima vendra representada por la bisectriz pi = qi (i = 1,


2,, (k-1))
La concentracin mxima dara lugar a una curva pegada al eje de abscisas.
Ejemplo 3.1.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

123

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

3.3. ndice de Gini.


El ndice de Gini es el cociente entre el rea que encierra la curva de Lorenz
con la bisectriz y el rea del tringulo OPQ.
Una aproximacin del ndice de Gini es:
k 1

IG =

(p
i =1

qi )

k 1

p
i =1

Concentracin mnima I = 0
Concentracin mxima I = 1
G

Ejemplo 3.2.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

124

Medidas de concentracin.

Conceptos clave.
Concentracin.
Curva de Lorenz.
ndice de Gini.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

125

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

EJEMPLOS.
Ejemplo 3.1. Observa las curvas de Lorenz representadas a continuacin:
q

Cul de las dos situaciones representa una distribucin ms equitativa?

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

126

Medidas de concentracin.

Ejemplo 3.2. Los salarios (en euros) de los obreros de cierta empresa se
distribuyen como sigue:
n obre- Masa
ros
salarial
540 660
4
2280
660 780
6
4200
780 900
5
4320
Salarios

Obtener la curva de concentracin y el ndice de Gini.


Solucin. Ig=0,131

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

TEMA 4
ANLISIS DE DATOS
MULTIDIMENSIONALES

128

Anlisis de datos bidimensionales.

Ficha del tema 4.


Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
4.1. Representacin de datos multidimensionales: matriz de datos, tablas de
correlacin y contingencia, grfico de dispersin.
4.2. Distribuciones conjuntas, marginales y condicionadas. Independencia
estadstica.
4.3. Momentos. Vector de valores medios y matriz de varianzas-covarianzas.
4.4. El coeficiente de correlacin lineal simple. Matriz de correlacin.
4.5. Asociacin.
Conceptos clave.
Ejemplos.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

129

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

OBJETIVOS DE APRENDIZAJE.
Manejo de tablas de correlacin o distribuciones de frecuencias conjuntas
para dos variables numricas.
Obtencin de las distribuciones marginales y condicionadas a partir de la
conjunta.
Clculo e interpretacin de los estadsticos de la variable bidimensional, especialmente de la covarianza y del coeficiente de correlacin lineal.
Aspecto y propiedades de la matriz de varianzas covarianzas.
Clculo de los estadsticos de una variable combinacin lineal de otras dos.
Cmo observar la independencia entre dos variables o atributos a partir de
la distribucin conjunta.
Estudio del grado de asociacin entre dos atributos a partir de la tabla de
contingencia, calculando el estadstico ji cuadrado y el coeficiente de contingencia de Pearson.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

130

Anlisis de datos bidimensionales.

BIBLIOGRAFA BSICA (teora y problemas)


ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2006 (segunda impresin).
Tema 3 para tema 4. (Con ejercicios, cuestiones de autoevaluacin y
problemas resueltos y propuestos).
MONTIEL, A.M.; RIUS, F.; BARN F.J.: Elementos bsicos de Estadstica
Econmica y Empresarial, Ed. Prentice Hall, Madrid 1997.
Captulo 5 para tema 4.
MARTN PLIEGO, F.J.: Introduccin a la Estadstica Econmica y Empresarial, Ed. Thomson. Madrid 2004 (3 edicin).
Captulo 14 (pgina 564, tablas de contingencia) para epgrafe 5.
Asociacin.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

131

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

4.1. Representacin de datos bidimensionales: matriz de datos, tablas de correlacin y contingencia, grfico de dispersin.
VARIABLE ESTADSTICA BIDIMENSIONAL (V.E.B.):
Si se observan y miden simultneamente dos caractersticas o propiedades
sobre los mismos elementos de una poblacin se obtiene una V.E.B. (X, Y)
que generar una serie de N datos de aspecto bidimensional

( xi , yi )iN=1

N datos sin elaborar

V.E.B.
(X, Y)

(x , y )
i

N
i =1

( x1 , y1 ),( x 2 , y 2 ),L ,( x N , y N )

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

132

Anlisis de datos bidimensionales.

MATRIZ DE DATOS

X
x1
x2
M

Y
y1
y2
M

xi
M
xN

yi
M
yN

Si X tiene k valores
diferentes.
Si Y tiene m valores
diferentes

( xi , y j ) nij
i = 1 ,2 , L , k
j = 1 ,2 , L , m

Vector de valores que


se repite

nij

veces

TABLA DE CORRELACIN

y1

y2

x1

n11

n12

L n1 j

L n1 m

x2

n 21

n 22

L n2 j

L n2 m

M
xi

M
ni 1

nij

M
L nim

xk

nk 1

ni 2

yj

ym

M
nk 2

L n kj
k

L n km
m

n = N
i =1 j =1

ij

Tambin se podran agrupar los valores de X en k intervalos y los de Y en m intervalos.


Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

133

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

GRFICO DE DISPERSIN
N
Parejas de valores ( xi , y i )i =1
grfico dispersin

Ejemplo 4.1.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

134

Anlisis de datos bidimensionales.

4.2. Distribuciones conjuntas, marginales y condicionadas. Independencia estadstica.


DISTRIBUCIN CONJUNTA: la distribucin conjunta de una V.E.B. (X, Y)
puede venir representada tanto por la matriz de datos como por la tabla de
correlacin, con las parejas de valores y sus frecuencias.

( X ,Y ) :

(( x , y

); nij ) nij frecuencia absoluta conjunta


nij
i = 1 ,2 , L , k
frecuencia relativa conjunta
f ij =
j = 1 ,2 , L , m
N
i

Ejemplo 4.1.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

135

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

DISTRIBUCIONES MARGINALES.

X \Y

y1

y2

x1

n11

n12

n1j

n1m n1

x2

n21

n22

n2j

n2m n2

yj

ym

ni

MARGINAL X
valores
frecuencia

xi
ni

ni = suma

por filas

(n )
ij

xi

ni1

ni2

nij

nim

ni

xk

nk1

nk2

nkj

nkm nk

nj

n1

n2

nj

nm

ni = nij
j =1

ni
f i =
N

frec. relativa

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

136

Anlisis de datos bidimensionales.

X \Y

y1

y2

x1

n11

n12

n1j

x2

n21

n22

n2j

xi

ni1

ni2

yj

nij

ym

ni

MARGINAL DE Y:

n1m n1 valores
frecuencia
n2m n2

n j = suma

nim

ni

yj
n j
por columnas

(n )
ij

n j = nij
i =1

xk

nk1

nk2

nkj

nkm

nk

nj

n1 n2

nj

nm

f j =

n j
N

frec. relativa

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

137

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

DISTRIBUCIONES CONDICIONADAS
Y
X

VARIABLE X CONDICIONAy1

y2

yj

ym

ni

x1

n11

n12

n1j

n1m n1

x2

n21

n22

n2j

n2m n2

xi

ni1

ni2

nij

nim

ni

xk

nk1

nk2

nkj

nkm

nk

nj

n1

n2

nj

nm

DA A UN VALOR DE Y.
X/yj (j fijo):
valores
frecuencia :
columna j - sima nij

( i = 1,2 ,L , k )

xi
ni / j

fi / j

nij
=
n j

frec. relativa cond.

fi / j

f ij
=
f j

frec. relativa cond.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

138

Anlisis de datos bidimensionales.

Y
X

VARIABLE Y CONDICIONADA A

y1

y2

yj

ym

ni

x1

n11

n12

n1j

n1m n1

x2

n21

n22

n2j

n2m n2

xi

ni1

ni2

nij

nim

ni

xk

nk1

nk2

nkj

nkm

nk

nj

n1

n2

nj

nm

Ejemplo 4.2.

UN VALOR DE X.

Y/xi (i fijo):

yj

valores
frecuencia :
fila i - sima nij

nj / i
( j = 1,2 ,L , m )

f j/i

nij
=
ni

frec. relativa cond.

f j/i

f ij
=
f i

frec. relativa cond.

Ejemplo 4.3.
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

139

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

INDEPENDENCIA ESTADSTICA.
CARCTERIZACIN DE LA INDEPENDENCIA. Dada una V.E.B.
Y
X

( X ,Y ) :
y1

y2

yj

ym

ni

x1

n11

n12

n1j

n1m n1

x2

n21

n22

n2j

n2m n2

(( x , y
i

); nij )i =1 j =1
k

X e Y son INDEPENDIENTES
si:

f ij = f i f j i , j
es decir:

xi

ni1

ni2

nij

nim

ni

xk

nk1

nk2

nkj

nkm

nk

nj

n1

n2

nj

nm

nij ni n j
=
i , j
N N N
Equivalente a:

nij =

ni n j
N

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

140

Anlisis de datos bidimensionales.

PROPIEDAD.
Si dos variables X e Y son independientes, la frecuencias relativas condicionadas coinciden con las respectivas marginales.

(f )
(f )

i=

= ( f i )i =1

X e Y independientes entonces:

i/ j

j/i

j =1

= ( f j ) j =1

(para cada

X / yj )

(para cada Y / x )
i

Es decir:
las columnas de frecuencias relativas condicionadas coinciden entre s y,
a su vez, con las frecuencias relativas de la marginal X.
las filas de frecuencias relativas condicionadas coinciden entre s y, a su
vez, con las frecuencias relativas de la marginal Y.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

141

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

CONSIDERACIONES SOBRE LA INDEPENDENCIA.


En general, una variable bidimensional (X, Y) (su distribucin conjunta)
se obtiene al medir simultneamente las dos variables sobre los mismos
elementos de una poblacin. Si se miden (estudian) por separado las variables X e Y y se obtienen las distribuciones unidimensionales de X e Y
(marginales), a partir de ellas no se puede construir la distribucin conjunta de (X, Y).
Pero si las variables X e Y son independientes, la caracterizacin de la
independencia indica que lo conjunto se descompone en producto de lo
marginal

f ij = f i f j i , j , por tanto:

Si las variables X e Y son independientes, se puede obtener fcilmente la


distribucin conjunta a partir de las marginales:

f i f j = f ij i , j

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

142

Anlisis de datos bidimensionales.

EJEMPLO DE VARIABLES INDEPENDIENTES:


Sea la siguiente distribucin conjunta de dos variables (X, Y):
Comprubese que son independientes a partir de

Y
X

la caracterizacin de la independencia y de la propiedad que relaciona las distribuciones condicionadas con las marginales.

Solucin:
Obsrvese que las columnas de frecuencias conjuntas son claramente proporcionales, al igual que las filas de frecuencias conjuntas.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

143

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

POR LA CARACTERIZACIN DE LA INDEPENDENCIA:

nij =

Y
X

ni

12

nj

6 8
4=
12

ni n j
N

Por ejemplo:

n 2 n 1
n21 =
N
38
2=
12

y as sucesivamente, lo cumplen todas las frecuencias conjuntas.

(Basta comprobarlo para (k-1)x(m-1) celdas nij). En este caso: 2x1.


Por tanto las variables son independientes.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

144

Anlisis de datos bidimensionales.

POR LA PROPIEDAD QUE RELACIONA LAS CONDICIONADAS CON LAS MARGINALES:


Distribuciones condicionadas X/y y marginal X (frecuencias relativas):
Y
1

fi

2/8

1/4

3/12

2/8

1/4

3/12

4/8

2/4

6/12

nj

12

ni
f i =
N
nij
fi / j =
n j

frec. relativa

2 1 3
= =
8 4 12

frec. relativa cond.

Coinciden las dos columnas de distribuciones condicionadas con


la marginal X.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

145

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Distribuciones condicionadas Y/x y marginal Y (frecuencias relativas):


Y
1

ni

2/3

1/3

2/3

1/3

4/6

2/6

fj

8/12

4/12

12

f j =
f j/i

n j

N
nij
=
ni

frec. relativa

frec. relativa cond.

2 2 4 8
= = =
3 3 6 12

Coinciden las tres filas de distribuciones condicionadas con la marginal Y.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

146

Anlisis de datos bidimensionales.

4.3.MOMENTOS. VECTOR DE VALORES MEDIOS Y MATRIZ DE VARIANZAS COVARIANZAS.


MOMENTOS DE UNA V.E.B. (X, Y).
Dada una V.E.B.

( X ,Y ) :

( xi , y i )

(( x , y

N parejas

( k m) parejas diferentes

N
i =1

); nij )i =1 j =1
k

Definimos:
MOMENTOS ORDINARIOS DE ORDEN (p + q)

1 N p q
a pq = xi y i
N i =1

1 k m p q
a pq = xi y j nij
N i =1 j =1

con p y q enteros

p,q 0

(Se utilizar preferentemente la primera expresin)

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

147

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

1 N
1 N
a10 = xi = x a01 = y i = y medias marginales
N i =1
N i =1
1 N
1 k m
o bien a11 =
xi y j nij
a 20 a02
a11 = xi y i

N i =1
N i =1 j =1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

148

Anlisis de datos bidimensionales.

MOMENTOS CENTRALES DE ORDEN (p + q)

1 k m
p
q
o m pq =
(
x

x
)
(
y

y
)
nij

i
j
N i =1 j =1
con p y q enteros p , q 0

1 N
m pq = ( xi x ) p ( y i y ) q
N i =1

(Se utilizar preferentemente la primera expresin).


VARIANZA marginal de X

1 N
m20 = ( xi x ) 2 = s X2
N i =1

VARIANZA marginal de Y

1 N
m02 = ( y i y ) 2 = sY2
N i =1

COVARIANZA sXY

1 N
m11 = ( xi x )( y i y )
N i =1

1 k m
o bien m11 =
( xi x )( y j y )nij

N i =1 j =1
s XY = m11
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

149

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

LA COVARIANZA sXY
La covarianza es el momento central de orden dos m11.

s XY

1 N
= m11 = ( xi x )( y i y )
N i =1

La covarianza es un estadstico conjunto que mide la covariacin (variabilidad conjunta) lineal de las variables X e Y.
La covarianza puede ser positiva o negativa. Su signo marca la direccin
de la covariacin.

s XY > 0 , covariacin positiva: si la variable X crece, entonces la tendencia de la variable Y es a crecer tambin.

s XY < 0 ,

covariacin negativa: si la variable X crece, entonces la ten-

dencia de la variable Y es a decrecer (o viceversa).


Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

150

Anlisis de datos bidimensionales.

grfico dispersin

grfico dispersin
covarianza positiva

2,71

covarianza negativa

y3

y3

0
0

4
x

-2,71

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

151

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

s XY = 0 ,

covariacin nula: no hay una variabilidad conjunta lineal domi-

nante (positiva o negativa) entre X e Y.


grfico dispersin

grfico dispersin
covarianza cero pero dependientes

covarianza cero e independencia

y 2

y
2

4; 2

4; 2

medias
c.d.g.

PROPIEDAD: si las variables X e Y son independientes estadsticamente, la


covarianza es cero. El recproco no es necesariamente cierto.

X e Y independientes

s XY = 0

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

152

Anlisis de datos bidimensionales.

PROPIEDADES DE LA COVARIANZA.
1. Clculo de la covarianza: se demuestra fcilmente que la covarianza se
puede determinar como:

s XY
o en forma de momentos:

s XY

1 N
= xi y i x y
N i =1
= m11 = a11 a10 a01

2. Transformacin lineal:

X = k1 X + c1
s X ' Y ' = k1k 2 s XY

Y = k 2Y + c2

siendo

k 1 , k 2 , c1 , c 2

nmeros reales

Por tanto la covarianza es sensible al cambio de escala y su valor depende de las unidades de medida de las variables X e Y. Es un estadstico de
tipo absoluto.
3. Obviamente

s XY = sYX .
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

153

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

VECTOR DE VALORES MEDIOS

r x
m=
y
MATRIZ DE VARIANZAS COVARIANZAS

sX
S =
s XY
2

s XY

2
sY

La matriz de varianzas covarianzas es simtrica y semidefinida positiva det( S ) 0 .

Medias y varianzas marginales y covarianza


en funcin de los momentos:

Ejemplo 4.4.

Ejemplo 4.6.

x = a 10
y = a 01
s X2 = m 20 = a 20 a 102
sY2 = m02 = a 02 a 012
s XY = m11 = a 11 a 10 a 01

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

154

Anlisis de datos bidimensionales.

PROPIEDADES DE COMBINACIN LINEAL DE VARIABLES.


Sea (X, Y) una V.E.B. y sean

r x
m=
y

sX
S =
s XY

s XY

2
sY

su vector de me-

dias y matriz de var cov respectivamente.


Sea

Z = k 1 X + k 2Y + c

una COMBINACIN LINEAL de X e Y con k1, k2 y c

nmeros reales.
La MEDIA y la VARIANZA de Z se pueden determinar como sigue:

z = k1 x + k 2 y + c
s Z2 = k 12 s X2 + k 22 sY2 + 2k 1 k 2 s XY
Solo si la covarianza es cero

s Z2 = k12 s X2 + k 22 sY2 .

As, si X e Y independientes

s XY = 0

y entonces:

s Z2 = k12 s X2 + k 22 sY2 .

Ejemplo 4.8.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

155

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

4.4. EL COEFICIENTE DE CORRELACIN LINEAL. MATRIZ DE CORRELACIN.


EL COEFICIENTE DE CORRELACIN LINEAL SIMPLE.

sX
S =
s XY
2

Dada (X, Y) una V.E.B. y

s XY

2
sY

su matriz de var cov, se define

el coeficiente de correlacin lineal de Pearson como:


El coeficiente

s XY
rXY =
s X sY

r tiene el mismo signo que la covarianza.

r es un estadstico de tipo relativo, es decir, independiente de las unidades de medida de las variables X e Y.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

156

Anlisis de datos bidimensionales.

Mide la intensidad de la variabilidad conjunta lineal entre X e Y es decir


la correlacin lineal.
PROPIEDADES DEL COEFICIENTE DE CORRELACIN.
1. El coeficiente de correlacin lineal est acotado:

correlacin perfecta positiva

1 r 1.

correlacin perfecta negativa

r=1

r = -1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

157

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

2. Transformacin lineal:

X = k 1 X + c1
rX ' Y ' = rXY .

Y = k 2Y + c2

Donde k1 , k2 y c

son nmeros reales, con k1 y k2 del mismo signo. Es decir, que el coeficiente
es invariante por transformacin lineal (salvo en el signo).
MATRIZ DE CORRELACIN.
Dada (X, Y) una V.E.B. y el coeficiente de correlacin lineal
define:

rXX
R=
rYX

rXY 1
=
rYY rXY

s XY
, se
rXY =
s X sY

rXY

MATRIZ DE CORRELACIN

Es una matriz simtrica y semidefinida positiva

det( R ) = 1 rXY2 0

Ejemplo 4.9.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

158

Anlisis de datos bidimensionales.

4.5. ASOCIACIN.
TABLA DE CONTINGENCIA
B
A

Sean dos atributos

b1

b2

bj

bm

ni

a1

n11

n12

n1j

n1m n1

a2

n21

n22

n2j

n2m n2

(A, B): (ai, bj); nij con k y m


categoras respectivamente, organizados en una tabla de contingencia (distribucin conjunta). Se estudiar la asociacin

ai

ni1

ni2

nij

nim

ni

entre A y B utilizando el criterio


de independencia estadstica.

ak

nk1

nk2

nkj

nkm

nk

nj

n1

n2

nj

nm

N
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

159

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

A\B

b1

b2

bj

bm

ni

a1

n11

n12

n1j

n1m n1

a2

n21

n22

n2j

n2m n2

A y B independientes si

nij =

ni n j
N

ESTADSTICO

ai

ni1

ni2

nij

nim

ni

ak

nk1

nk2

nkj

nkm

nk

nj

n1

n2

nj

nm

i , j .

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

160

Anlisis de datos bidimensionales.

Se denominar:

nij

a la frecuencia real u observada y

ni n j
Eij =
N

a la frecuencia esperada o terica: frecuencia que se

tendra en caso de independencia.


El estadstico 2 compara las frecuencias reales con las tericas:
k

2 =
I =1 j =1

( Eij nij )2
Eij

2 0

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

161

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

EL COEFICIENTE DE CONTINGENCIA DE PEARSON


Se define a partir del estadstico 2:

2
N + 2

CP =

El coeficiente de contingencia de Pearson mide la intensidad de la asociacin entre dos atributos.


Est acotado:

0 C P < 1, pero su mximo no alcanza el valor de 1.

VALOR MXIMO DEL COEFICIENTE CP.


El valor mximo del coeficiente de contingencia de Pearson CP depende del
tamao de la tabla de contingencia

( k m ) . Cuanto mayor es el nmero de

filas y columnas ms se acerca a 1.


Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

162

Anlisis de datos bidimensionales.

Se demuestra que en tablas de contingencia cuadradas


mximo es

C MAX

(kk )

su valor

k 1
=
.
k
Ejemplo 4.11.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

163

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Conceptos clave.

Coeficiente de contingencia de Pearson.


Coeficiente de correlacin lineal.
Combinacin lineal de variables.
Covarianza.
Distribucin conjunta.
Distribuciones condicionadas.
Distribuciones marginales.
2

Estadstico .
Independencia estadstica.
Matriz de correlacin.
Matriz de varianzas-covarianzas.
Tabla de contingencia.
Tabla de correlacin.
Transformacin lineal.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

164

Anlisis de datos bidimensionales.

EJEMPLOS
Ejemplo 4.1. Ordenar la siguiente serie de datos bidimensionales en una
distribucin conjunta o distribucin de frecuencias bidimensional (tabla de
correlacin):
X
Y
Solucin:

1
1

1
2

2
1

2
2

3
1

3
2

1
1

2
1

3
2

2
1

Y
X
1
2
3

1
2
3
1

2
1
1
2

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

165

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 4.2.
a) Obtener las distribuciones de frecuencias marginales de X e Y a partir de
la distribucin conjunta del ejemplo 4.1.
b) Obtener las siguientes distribuciones condicionadas a partir de la conjunta
del ejemplo 4.1.: X / y = 1 e Y / x = 2

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

166

Anlisis de datos bidimensionales.

Ejemplo 4.3. Hemos observado la retribucin mensual de los 40 trabajadores de una empresa segn su antigedad en la misma obteniendo la siguiente tabla de correlacin o distribucin de frecuencias bidimensional:
Y: retribucin mensual (en euros.)
X: antigedad en la empresa (en aos)
a) Qu porcentaje de emY 420-600 600-780 780-960 960-1200
pleados tiene una antigeX
mdc 510
690
870
1080
dad entre 2 y 4 aos y una
retribucin entre 600 y 780
02
7
3
1
0
mdc 1
euros? (conjunta)
24
3
46
5

b)Cuntos empleados tienen


una antigedad entre 4 y 6
aos? (marginal)
0
2
3
6
c) Observa la retribucin de
los empleados con una antigedad entre 0 y 2 aos y comprala con la retribucin de los que tienen una antigedad entre 4 y 6 aos (condicionada).
1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

167

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 4.4. Determina el vector de medias y la matriz de varianzas covarianzas de la siguiente distribucin conjunta obtenida en el ejemplo 4.1.
Y
X
1
2
3

r 2
Solucin: m =

1
,
4

0 ,6

S =
0 ,1

1
2
3
1

2
1
1
2

0 ,24
0 ,1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

168

Anlisis de datos bidimensionales.

Ejemplo 4.5. Son independientes las variables del Ejemplo 4.3? Calcula la
media de las retribuciones de los empleados con menor antigedad y comprala con la media marginal de las retribuciones de todos los trabajadores.
Cmo habran sido las medias anteriores en caso de independencia?

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

169

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 4.6. Es posible que la siguiente matriz:


zas-covarianzas? Razona la respuesta.

16
24

24

sea

25

de varian-

Solucin: No.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

170

Anlisis de datos bidimensionales.

Ejemplo 4.7. Dada la siguiente distribucin de frecuencias bidimensional:


Y
X
-5
0
5

2
1
0
1

4
0
1
0

a) Estn X e Y incorreladas?
b) Son estadsticamente independientes X e Y?
Solucin: 1) s, 2) no

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

171

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 4.8. De dos variables X e Y se conocen los siguientes datos:

r 10
vector de valores medios m = ; matriz de varianzas-covarianzas
15
16 2
S =
. Hallar la media y la varianza de la variable: Z = 2 X + 3Y + 8
2 25
Solucin: z = 73

S Z2 = 265

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

172

Anlisis de datos bidimensionales.

Ejemplo 4.9. Calcula el coeficiente de correlacin lineal en el ejemplo 4.4. e


interpreta el resultado. Obtener la matriz de correlaciones.
Solucin: 0,265

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

173

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 4.10. A partir de la siguiente matriz de datos para las variables X1,
X2, X3, obtener:

Observacin
1
2
3
4
5
6
7
8
9
10

X1
1
0
0
2
1
0
0
1
1
2

X2
2
2
2
3
3
2
1
3
1
1

X3
-1
-1
-1
0
1
0
-1
-1
0
1

a) Las distribuciones marginales


b) Algunas de las distribuciones
condicionadas
c) El vector de medias y la matriz
de varianzas-covarianzas
d) La matriz de correlaciones

0 ,8
0 ,56 0 ,10 0 ,34
1 0 ,17 0 ,58

r
0 d) = 0 ,17
1
0
Solucin: c) m = 2 S = 0 ,10 0 ,60
0 ,3
0 ,34
0 ,58
0
0 ,61
0
1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

174

Anlisis de datos bidimensionales.

Ejemplo 4.11. Un fabricante de herramientas compra una serie de piezas a


tres proveedores diferentes. Cada pieza es analizada para detectar si presenta alguno de los tres tipos de defectos ms usuales, antes de ser introducida en la cadena de produccin. Durante un mes se han recogido datos
relativos al tipo de defecto encontrado en las piezas compradas a cada uno
de los tres proveedores obtenindose la siguiente tabla de contingencia:
Proveedor
Tipo de
Defecto

I
II
III

A
19
25
12

B
30
45
15

C
20
33
20

Analizar si existe alguna relacin entre el tipo de defecto y el proveedor.


Si la asociacin fuese mxima qu aspecto tendra la tabla de contingencia?
Solucin: Cp = 0,117 para un mximo de 0,8165

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

TEMA 5
ANLISIS DE
REGRESIN

Anlisis de Regresin.

176

Ficha del tema 5.


Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
5.1. Introduccin.
5.2. Regresin mnimo-cuadrtica: caso lineal.
5.3. Anlisis de la bondad de un ajuste: capacidad explicativa de una ecuacin de regresin. Coeficiente de determinacin. Caso lineal.
5.4. Regresin no lineal: potencial y exponencial.
Conceptos clave.
Ejemplos.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

177

OBJETIVOS DE APRENDIZAJE.
Estudio exhaustivo de la regresin lineal simple (dos variables X, Y): clculo
de los parmetros a, b, a, b de las rectas de regresin Y* = a + bX y
X* = a + bY a partir del principio de mnimos cuadrados.
Expresin de esos parmetros en funcin de los estadsticos de la variable
bidimensional (X, Y).
Interpretacin de los coeficientes de regresin b y b.
Obtencin de una medida de la bondad del ajuste efectuado a partir de la
relacin existente entre la varianza total y las varianzas residual y de la regresin: coeficiente de determinacin R2 (capacidad explicativa de una ecuacin de regresin).
Relacin entre el coeficiente de determinacin y los coeficientes de regresin
b y b.
Introduccin a la regresin no lineal: casos potencial y exponencial.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Anlisis de Regresin.

178

BIBLIOGRAFA BSICA (teora y problemas)


ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2005.
Tema 4 para tema 5. (Con ejercicios, cuestiones de autoevaluacin y
problemas resueltos y propuestos).
MONTIEL, A.M.; RIUS, F.; BARN F.J.: Elementos bsicos de Estadstica
Econmica y Empresarial, Ed. Prentice Hall, Madrid 1997.
Captulo 6.
MARTN PLIEGO, F.J.: Introduccin a la Estadstica Econmica y Empresarial, Ed. Thomson. Madrid 2004 (3 edicin).
Captulo 10 para punto 4 (pgina 273).

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

179

5.1. INTRODUCCIN.
El estudio conjunto de dos variables (X, Y) tiene como objetivo fundamental determinar si estn relacionadas esas variables y, si hay alguna relacin, cuantificar esa relacin. Cmo primer paso se puede observar el grfico de dispersin:
la nube de puntos nos puede ayudar a buscar un modelo de relacin adecuado.
grfico de dispersin

correlacin lineal

datos no correlacionados

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

180

relacin no lineal

relacin no lineal

relacin potencial

relacin exponencial

relacin parablica
y

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

181

Para CUANTIFICAR la relacin entre X e Y se utilizarn dos teoras fundamentales:


Teora de la CORRELACIN: clculo de estadsticos conjuntos y coeficientes que midan la intensidad o el grado de relacin entre X e Y
(como el coeficiente de correlacin lineal definido en el tema 4).
Teora de la REGRESIN: una vez elegido el modelo de relacin que
se desea estudiar y cuantificar entre X e Y (lineal, exponencial), con
la teora de la REGRESIN se obtendr la ecuacin de la funcin, del
tipo elegido, que mejor relacione a las variables X e Y. Este tipo de
ecuaciones se denominan ECUACIONES DE REGRESIN. Estas ecuaciones cuantifican la RELACIN ESTADSTICA entre X e Y.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

182

RELACIN ESTADSTICA RELACIN FUNCIONAL.


Antes de estudiar cmo se obtienen las ecuaciones de regresin, conviene
distinguir entre una relacin estadstica y una, ms conocida, relacin funcional entre dos variables:
Una relacin funcional entre X e Y

y = f ( x ) es una corresponden-

cia exacta, tal que cada valor de X est asociado con un nico valor
de Y.
Una relacin estadstica entre dos variables X e Y es una correspondencia no necesariamente exacta, tal que cada valor de X

tiene asociado la prediccin de un valor de Y que se identificar como

y.

Este valor se obtendr a partir de la ecuacin de regresin

y = f ( x )
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

183

Relacin funcional
120

y
y = 2x + 7

100
80
60
40
20

0
0

10

15

20

25

30

35

40

45

50

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

184

Dada una serie de datos bivariantes

Relacin estadstica

(X, Y) la ecuacin de regresin

y
y* = f(x)

y* = f ( x ) cuantifica la relacin estadstica entre X e Y.

(x,y)

En este contexto:

y
e=y - y*

X es la variable independiente

y*

(variable control)
Y es la variable dependiente
x

(variable respuesta).
Cada valor de X tendr asociado:

y i valor real de la variable Y ( xi , y i )


e
=
y

y
i
i
i
X xi
y i valor de prediccin (terico, estimado) RESIDUO

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

185

AJUSTE.
Para obtener las ecuaciones de regresin

y* = f ( x )

se utilizan mtodos

matemticos de ajuste: hallar la ecuacin de un tipo de funcin que mejor


ajuste a la nube de puntos del grfico de dispersin.
MTODO DE AJUSTE: PRINCIPIO DE MNIMOS CUADRADOS (P.M.C.)
Dada una serie de datos bidimensionales
po de funcin que queremos ajustar

( X ,Y ) : ( xi , y i )iN=1

y* = f ( x ),

y elegido el ti-

la ecuacin que mejor

ajusta a la nube de puntos es la que minimiza la suma de los cuadrados de


los residuos.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

186

RESDUOS
e=y - y*

y* = f(x)

2
e
=
(
y

i i)
i =1

2
i

i =1

MNIMA

y
A

y*

y = f ( x )

la

llamare-

mos:
Ecuacin de regresin

mnimo cuadrtica
de Y sobre X.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

187

5.2. REGRESIN MNIMO CUADRTICA: CASO LINEAL.


Dada una serie de datos bivariantes
elegida

y* = f ( x )

( X ,Y ) : ( xi , y i )iN=1 , si el tipo de funcin

para relacionar las variables X e Y es una RECTA, su

ecuacin en forma explcita es:

y = a + bx

a ,b nmeros

reales .

Aplicando el P.M.C. como mtodo de ajuste: la ecuacin de la recta

y = a + bx

que mejor ajustar a la nube de puntos

( xi , y i )iN=1

del grfico

de dispersin ser la que minimice la suma de los cuadrados de los residuos.


N

e = ( yi y ) = ( yi ( a + bxi ))
N

i =1

2
i

i =1

MNIMA

i =1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

188

Regresin lineal

y* = a + bx
yi

yi*

x
N

e = ( y y ) = ( y ( a + bx ))
N

i =1

2
i

i =1

i =1

MNIMA

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

189

OBTENCIN DE LA RECTA DE REGRESIN DE Y SOBRE X.


N

Sea la funcin:

H ( a ,b ) = ( y i ( a + bxi ))

Los posibles valores de

i =1

que minimicen

a y b parmetros.

H(a, b)

sern los que anulen

las derivadas parciales:


N
N
N
H

= 2 ( y i ( a + bxi )) = 0 y i = N a + b xi

i =1
a
i =1
i =1
N

N
N
N
H
2
= 2 ( y i ( a + bxi ))xi = 0 xi y i = a xi + b xi

i =1
i =1
i =1
i =1

SISTEMA DE ECUACIONES NORMALES

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

190

La resolucin del sistema de ecuaciones anterior da los siguientes valores


para los parmetros

a y b:

s XY
b= 2
sX

a = y b x

Se demuestra adems que son un mnimo:

(Cf.: ESTEBAN, J.; y otros.: Estadstica Descriptiva y

nociones de Probabilidad, Ed. Thomson, 2005, 2006 segunda impresin, pginas 156-157).

Por tanto la recta de regresin de Y sobre X que mejor ajusta a la nube


N
de puntos ( xi , y i )i =1 es:

y = a + bx

s XY

b = 2
sX

a = y bx

Expresin que se utilizar para dar la recta de regresin.


Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

INTERPRETACIN DE LOS PARMETROS

a = y b x

191

a y b: y = a + bx

representa el valor de la ordenada Y en el origen.

COEFICIENTE DE REGRESIN: representa la variacin experimentada por

s XY
b= 2
sX

la variable Y para un incremento unitario de X. Por cada incremento unitario de la variable X, la variable Y cambia su valor b unidades (de promedio).

(Tambin es la pendiente de la recta).


Ejemplo 5.1.
(a partir de los datos del problema 4.1.)
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Anlisis de Regresin.

192

OTRAS EXPRESIONES PARA LA RECTA DE REGRESIN de Y sobre X:


Sustituyendo los valores obtenidos de

a y b en y = a + bx

queda:

s XY
y = a + bx = y bx + bx = y + 2 ( x x )
sX
sY
s XY

rXY =
y = y + rXY ( x x )
s X sY
sX

PREDICCIN.
Con la recta de regresin de Y sobre X,
lores de prediccin de Y,

y = a + bx , se pueden obtener va-

sustituyendo en la ecuacin el valor

x de X.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

193

EJEMPLO DE RECTA DE REGRESIN DE Y SOBRE X. PRCTICA.


Obtngase la recta de regresin mnimo cuadrtica ajustada a los tres datos bivariantes que aparecen en el siguiente grfico:

Regresin de Y sobre X

y* = 1+0,5x
R2 = 0,75

7; 5

4
Y3

1; 2

4; 2

1
0
0

X
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Anlisis de Regresin.

194

REGRESIN DE X SOBRE Y.
Si quisiramos obtener valores de prediccin de X,
la variable Y

a partir de valores de

y se necesitara la recta de regresin de X sobre Y:

x = a + by .
Para obtener esta recta se permutaran los papeles de las variables X e Y.
Ahora Y sera la variable independiente (control) y X la variable dependiente
(respuesta).
En este caso la suma de los cuadrados de los residuos sera:
N

e = ( xi x ) = ( xi ( a + by i ))

=
i =1
i =1
N

2
i

MNIMA

i 1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Al minimizar la expresin anterior se obtendran los parmetros

195

a y b:

s XY
b = 2

x = a + by
sY
a = x by
s XY

b = 2
sY

COEFICIENTE DE REGRESIN de X sobre Y: representa la va-

riacin experimentada por la variable X para un incremento unitario de Y.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

196

OTRAS EXPRESIONES PARA LA RECTA DE REGRESIN de X sobre Y:


Sustituyendo los valores obtenidos de

a y b en x = a + by

x = a + by = x by + by = x +

queda:

s XY
(y y)
2
sY

s XY
sX

rXY =
x = x + rXY ( y y )
sY
s X sY

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

197

RELACIN ENTRE LA REGRESIN Y LA CORRELACIN LINEALES.

s XY
b= 2
sX
rXY = b b

s XY

b = 2
sY
Teniendo en cuenta que el signo de rXY sera el mismo que el de b y b.
PROPIEDADES DE LAS RECTAS.

sY
y = y + rXY ( x x )
sX

Se cruzan en el punto

( x , y ) (si se representan en unos mismos ejes coordenados (X, Y)).

Son perpendiculares si
Son iguales si

sX
x = x + rXY ( y y )
sY

rXY = 0 ,

y = y

x = x

rXY = 1.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

198

EJEMPLO DE LAS DOS RECTAS DE REGRESIN. PRCTICA.


Determnese la recta de regresin mnimo cuadrtica de X/Y ajustada a los
tres datos bivariantes del siguiente grfico. (Es el mismo que el de Y/X de la pag. 180).
Dos rectas de regresin

x* = -0,5+1,5y

7; 5

4
medias; (4; 3)

Y3

y* = 1+0,5x

1; 2
4; 2

2
1
0
0

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

199

5.3. ANLISIS DE LA BONDAD DE UN AJUSTE: CASO LINEAL.


Coeficiente de determinacin.
Sea

( X ,Y ) : ( xi , y i )iN=1 una serie de datos bivariantes.

Supongamos que se ha obtenido una ecuacin de regresin de

sobre

y = f ( x ). Con esta ecuacin se obtienen valores de prediccin de Y, y i .


El anlisis de la bondad de un ajuste consiste en obtener una medida de la
similitud de los valores reales de la variable
variable

Y : ( y i ),

Y : ( yi ) con los estimados de la

variable de la regresin. En la comparacin de estos va-

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

200

lores jugar un papel esencial la variable que conforman los residuos

E : (ei = y i y i ), variable residual.

Se partir de la siguiente relacin: los valores de la variable dependiente

Y : ( yi )

se pueden descomponer en

y i = y i + ei

y la medida de la bon-

dad del ajuste se obtendr de la comparacin de la variabilidad de esas tres


variables:

Y : ( yi ) Y : ( y i ) E : (ei = y i y i ).

Para ello se estudiar el aspecto de sus medias y varianzas, que dependern


del tipo de ecuacin de regresin que ajustemos.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

VARIABLE

Valores

Media

yi

201

Varianza

1 N
s = ( yi y )2
N i =1
2
Y

VARIABLE REGRESIN
Valores

y i = f ( x )

Y*

Media

VARIABLE RESIDUAL
Valores

ei = y i y i

Varianza de la regresin

Varianza residual

1 N
s = ( yi y )2
N i =1

1 N
s = ( ei e ) 2
N i =1

2
Y*

E = Y-Y*

Media

2
E

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

202

CASO LINEAL: BONDAD DEL AJUSTE.


En el caso lineal, la recta de regresin de Y sobre X es:

y = a + bx

La media

y la varianza

siendo

s E2

s XY
b= 2
sX

de la variable residual

a = y b x

E = Y Y

tienen el si-

guiente aspecto:
La variable residual

E = Y Y = Y ( a + bX ) = Y bX a , es decir, es

combinacin lineal de

X e Y, por tanto:

e = y b x a = y b x ( y b x ) = 0
2
2
s
s
s
s E2 = sY2 + b 2 s X2 2bs XY = sY2 + 2XY 2 s X2 2 XY2 s XY = sY2 XY2
( sX )
sX
sX
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

203

Es decir:

e =0
2
s
2
2
s E = sY XY2
sX

Por otra parte, la media

y la varianza

sY2*

de la variable de la regresin

toman el siguiente aspecto en la regresin lineal:

La variable de la regresin

Y = a + bX , es una transformacin lineal de X

por tanto:

y = a + bx = y bx + bx = y
2
2
s
s
sY2* = b 2 s X2 = 2XY 2 s X2 = XY2
( sX )
sX

es decir:

y = y
2
s
2
sY * = XY2
sX

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

204

Por tanto en la regresin lineal de Y sobre X, las medias y varianzas de las


variables implicadas en el estudio quedan:
VARIABLE

VARIABLE de la regresin

y = y
media y
1 N
2
2
N
=

s
(
y
y
)
1

Y*
i
=
i
1
sY2 = ( y i y ) 2
N
2
N i =1
s
sY2* = XY2
varianza total
sX
varianza de la regresin

VARIABLE residual

e =0
1 N
s = ( y i y i ) 2
N i =1
2
s
s E2 = sY2 XY2
sX
2
E

varianza residual

Es decir, que se obtiene la siguiente relacin entre las varianzas:

s =s s s =s +s
2
E

2
Y

2
Y*

2
Y

2
Y

2
E

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

205

Esta relacin nos permite descomponer la variabilidad total de los valores


reales de

Y : ( yi ) en la variabilidad de los valores de Y : ( y i ) (obtenidos a

partir de

X con la recta de regresin y i = a + bxi ) y la variabilidad de los

residuos

E : (ei = y i y i ).

Obviamente cuanto menor sea la varianza residual

s E2

mejor ser el

ajuste.
Si

s E2 = 0

el ajuste ser ptimo y si

s E2 = sY2

(su valor mximo) el

ajuste ser psimo.


El peso de estas varianzas en la relacin anterior se medir mejor con un
indicador de tipo relativo.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Anlisis de Regresin.

206

EL COEFICIENTE DE DETERMINACIN R2.


Expresamos en trminos relativos la relacin entre las tres varianzas:
2
2
2
2
2
s
s
s
s
s
2
2
2
sY = sY + s E Y2 = Y2 + E2 1 = Y2 + E2
sY sY sY
sY sY

El primer cociente

sY2
sY2

representa la parte de la variabilidad de

Y : ( yi ) explicada por la regresin.


El segundo conciente

2
E
2
Y

s
s

, complementario del anterior, representa la

parte de la variabilidad de

Y : ( yi ) que queda por explicar.


Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

207

El coeficiente de determinacin se define precisamente a partir de esas rela-

ciones:

2
2
s
s
R 2 = Y2 = 1 E2
sY
sY

PROPIEDADES DE COEFICIENTE.
En general, en los tipos de regresiones donde se cumpla la relacin

sY2 = sY2 + s E2 , se define el coeficiente de determinacin

entre varianzas
de esta forma:

2
s
R 2 = 1 E2 .
sY

0 R 2 1: se deduce fcilmente de la definicin, teniendo en cuenta


que

R2

0 s E2 sY2

y que es cociente de varianzas (siempre positivas).

proporciona una medida de la bondad del ajuste.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

208

Interpretacin del coeficiente:


2
2
2
2
s
R
0
s
s
=

=
(residuo mximo) ajuste

2
E
Y
E
R = 1 2 2
2
R
1
s
=

= 0 ajuste ptimo
sY

R 2 100
diente

psimo

mide el porcentaje de la variabilidad de la variable depen-

Y : ( yi )

que explica la regresin

Y : ( y i = a + bx i ).

otra forma: en qu medida la informacin de la variable


independiente) determina los valores de
travs de la ecuacin de regresin

En este sentido se

Dicho de

X (variable

Y (variable dependiente) a

y = f ( x ).

X ( y = f ( x )) Y
2
interpreta tambin R como

una medida de la ca-

pacidad explicativa de la ecuacin de regresin.


Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

209

EL COEFICIENTE DE DETERMINACIN EN LA REGRESIN LINEAL.


Teniendo en cuenta que en la regresin lineal:
2
s
s E2 = sY2 XY2
sX

2
s
sY2* = XY2
sX

y el coeficiente de correlacin

s XY
rXY =
s X sY

2
2
s
s
R 2 = Y2 = 2XY 2 = rXY2
sY s X sY

Es decir, en la regresin lineal el coeficiente de determinacin coincide con


el de correlacin lineal al cuadrado.
Adems las varianzas de la regresin y residual se pueden determinar tambin en funcin de

rXY2 :

2
Y*

= r s
2
XY

2
Y

s = (1 r ) s
2
E

2
XY

2
Y

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

210

Por tanto la BONDAD DEL AJUSTE en la regresin lineal se medir a partir


de

R 2 = rXY2 , coeficiente de determinacin:


rXY2 100
diente

mide el porcentaje de la variabilidad de la variable depen-

Y : ( yi ) que explica la regresin Y : ( y i = a + bxi ).

( 1 rXY2 ) 100

representa el porcentaje de la variabilidad de

Y : ( yi ) que queda por explicar (residuo).


Ejemplo 5.2.
Cotas del coeficiente de correlacin: el coeficiente de correlacin lineal

rXY

est acotado entre -1 y 1 ya que:

0 R 2 1 0 rXY2 1 1 rXY 1.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

211

5.4. Regresin no lineal: potencial y exponencial.


Dada una serie de datos bivariantes
elegida

( X ,Y ) : ( xi , y i )iN=1 , si el tipo de funcin

y* = f ( x ) para relacionar las variables X e Y es una funcin poten-

cial o exponencial, su ecuacin en forma explcita tendr el aspecto:

Ajuste potencial

y = a x b a y b parmetros.

Ajuste exponencial

y = a b x a y b parmetros.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

212

AJUSTE POR UNA FUNCIN POTENCIAL.

y = a xb
Para determinar los parmetros
La expresin

y = a xb

a y b, se procede como sigue.

se reduce a forma lineal tomando logaritmos:

ln y * = ln a + b ln x .
Sobre la expresin anterior se opera un ajuste lineal:

llamando

u = ln x
v = ln y

= A + b u,
v

v = ln y
A = ln a

recta de regresin de

es decir, se obtiene la

V sobre U.
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Se obtienen
riable

213

A y b ajustando una recta por mnimos cuadrados a la va-

( U ,V ) (ln X ,ln Y ):
sUV
b= 2
sU

A = v bu .

Finalmente se determina el parmetro

a:

A = ln a a = anti ln A a = e A .
Ejemplo 5.4.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

214

AJUSTE POR UNA FUNCIN EXPONENCIAL.

y = a bx
Para determinar los parmetros
La expresin

y = a bx

a y b, se procede como sigue.

se reduce a forma lineal tomando logaritmos:

ln y * = ln a + x ln b .
Sobre la expresin anterior se opera un ajuste lineal:

llamando

v = ln y
v = ln y

= A + Bx ,
v

A = ln a
B = ln b

recta de regresin de

es decir, se obtiene la

V sobre X.
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Se obtienen
variable

215

ajustando una recta por mnimos cuadrados a la

( X ,V ) ( X ,ln Y ):
s XV
B= 2
sX

A = v B x.

Finalmente se determinan los parmetros

a y b:

A = ln a a = anti ln A a = e A
.
B
B = ln b b = anti ln B b = e
Ejemplo 5.5.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Anlisis de Regresin.

216

Conceptos clave.

Ajuste
Bondad de ajuste
coeficiente de determinacin.
Coeficiente de regresin.
Correlacin
Error cuadrtico medio (ECM).
Principio mnimos cuadrados.
Recta de regresin mnimo-cuadrtica
Regresin
Regresin no lineal
Residuo
Varianza de la regresin
Varianza residual

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

217

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

EJEMPLOS
Ejemplo 5.1. Se ha estudiado las calificaciones de 100 alumnos en dos
asignaturas: Estadstica (variable X) y Matemticas Financieras (variable Y),
obtenindose los siguientes datos:

x =110

y = 2,5

SX =10

SY = 0,5

Adems se sabe que el coeficiente de correlacin entre ambas es

rXY = 0,85.

Obtener la recta de regresin de Y/X.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

218

Anlisis de Regresin.

Ejemplo 5.2. Analizar la bondad de los ajustes efectuados en el ejemplo


anterior calculando la varianza residual, la varianza de la regresin y el coeficiente de determinacin. (Capacidad explicativa de la recta de regresin).

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

219

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 5.3. En la estimacin de los parmetros de un modelo de regresin


lineal se han obtenido los siguientes valores:

x=5

y=8

s XY = 15

s = 20 r = 0 ,9
2
Y

A partir de los datos anteriores determnese:


1. La varianza de X
2. La recta de regresin X/Y
3. La recta de regresin Y/X.
Solucin: 1) 12,5

2) a=-1, b=0,75

3) a =2, b =1,2

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

220

Anlisis de Regresin.

Ejemplo 5.4. Dada la siguiente distribucin bidimensional:


X

Realizar un ajuste potencial del tipo

Solucin:

33 260 840

yi* = a x ib

yi* = 4 x i3

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

221

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 5.5. Dada la siguiente distribucin bidimensional

16

Se pide:
a) Realizar un ajuste exponencial del tipo

y* = a b x

b) El error cuadrtico medio e interpretar el resultado obtenido.

Solucin:

a)y = 2
*

b ) ECM = 0

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

222

Anlisis de Regresin.

Ejemplo 5.6. A partir de los siguientes datos de las variables X1, X2 y X3,
obtener:
X1

X2

X3

-1

-1

-1

a) El plano de regresin de X1/X2,X3 y la bondad del ajuste efectuado.


b) La matriz de correlacin.
c) El coeficiente de correlacin parcial entre X1 y X2.
Solucin: a) X1* = 3 - 0,5 X2 0,5 X3

RX2

=1

c) r12.3= -1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

TEMA 6
TASAS DE VARIACIN Y
NMEROS NDICES

224

Tasas de Variacin y Nmeros ndice.

Ficha del tema 6.


Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
6.1. Introduccin.
6.2. Tasas de variacin.
6.3. Nmeros ndices: clasificacin y propiedades.
6.4. ndices de precios y cantidades ms importantes.
6.5. Cambio de base, renovacin y enlace.
6.6. Deflactacin de series estadsticas.
Conceptos clave.
Ejemplos.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

225

OBJETIVOS DE APRENDIZAJE.
Definir el concepto de nmero ndice y tasa de variacin.
Estudiar los tipos de nmeros ndices complejos ms relevantes tipo Laspeyres y Paasche, haciendo especial hincapi en los ndices de precios.
Acercar el perodo de referencia o la base de una serie de ndices al perodo
actual, operando cambios de base.
Enlace de series de ndices utilizando el cambio de base.
Deflactacin de magnitudes econmicas expresadas en u.m. corrientes, utilizando ndices de precios.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

226

Tasas de Variacin y Nmeros ndice.

BIBLIOGRAFA BSICA (teora y problemas)


ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2005.
Tema 5 para tema 6. (Con ejercicios, cuestiones de autoevaluacin y
problemas resueltos y propuestos).
MONTIEL, A.M.; RIUS, F.; BARN F.J.: Elementos bsicos de Estadstica
Econmica y Empresarial, Ed. Prentice Hall, Madrid 1997.
Captulo 7.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

227

6.1. INTRODUCCIN.
Los instrumentos que se van a definir, servirn para medir la evolucin del
valor de una variable en el tiempo o en el espacio.
Normalmente se tratar de variables de tipo socioeconmico. Una variable
de esta naturaleza se denominar magnitud.
Se comparar el valor de una magnitud en dos situaciones (habitualmente
temporales):
Situacin inicial: perodo de referencia o BASE, se denotar por 0
Situacin final: perodo actual que se pretende comparar con el base,
se denotar por t

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

228

Tasas de Variacin y Nmeros ndice.

TIPOS DE MAGNITUDES:
MAGNITUD SIMPLE: variable unidimensional

Y valores : y0 , y1 ,... , yt ,..., yT


perodos : t = 0 ,1, 2 ,... ,T
MAGNITUD COMPLEJA: variable n dimensional

(Y ,Y ,...,Y ,...,Y )
1

valores :

perodo

0 ( y10 , y20 ,..., yi 0 ,..., yn 0 )

perodo

t ( y1t , y2 t ,..., yit ,..., ynt )

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

229

6.2. TASA DE VARIACIN.


Sea

Y magnitud simple y sean los valores y0 , yt 1 e yt .

Tasa de variacin de

Tasa de variacin de

y t y t 1
yt
=Yt =
=
1
y t 1
y t 1

(t 1) t

TV

0t

y t y0 y t
TV =
= 1
y0
y0

t
t 1

t
0

TASAS DE VARIACIN EN TANTO POR UNO


(X 100) EN PORCENTAJE

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

230

Tasas de Variacin y Nmeros ndice.

6.3. NMEROS NDICES. CLASIFICACIN Y PROPIEDADES.


6.3.1 Definicin y clasificacin.
NMERO NDICE: medida estadstica de tipo relativo (en tanto por uno o
porcentaje) que sirve para comparar el valor de una magnitud (variable) en
dos situaciones, una de las cuales se considera de referencia (base).
Los nmeros ndices se escriben en PORCENTAJE, tomando como referencia
el 100.

NMEROS

SIMPLES

NDICES
SIN PONDERAR
COMPLEJOS

PONDERADOS (ponderaciones

)
i

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

231

6.3.2. ndices simples


Sea Y una magnitud simple y sean

y0 e y t

el valor de la magnitud en el pe-

rodo BASE y el perodo ACTUAL.


Se denotar el NDICE SIMPLE del perodo 0 al perodo t por:

yt
I =
y0
t
0

(en tanto por uno).

Los nmeros ndices se escriben en porcentaje:

I 0t 100

(en porcentaje).

Relacin entre la tasa de variacin y en nmero ndice:

yt y0 yt
TV =
= 1 = I 0t 1
y0
y0
t
0

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

232

Tasas de Variacin y Nmeros ndice.

NOTA: las series de ndices se suelen expresar de dos formas fundamentalmente:


INDICES CON BASE FIJA 0:
NDICES EN CADENA:

I tt1

I 0t
(con base el ao inmediatamente ante-

rior).

Ejemplo 6.1.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

233

6.3.3. ndices complejos.


Dada una magnitud compleja

(Y ,Y ,...,Y ,...,Y ), sean dos valores de esa


1

magnitud en el perodo 0 y en el perodo t:

0 ( y10 , y 20 ,..., y i 0 ,..., y n 0 )


.
t ( y1t , y 2 t ,..., y it ,..., y nt )
Destacamos dos formas de definir INDICES COMPLEJOS:
1. Como MEDIA ARITMTICA de ndices simples.
2. Como MEDIA AGREGATIVA.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

234

Tasas de Variacin y Nmeros ndice.

Si se denota por

y it
Ii = I ( i ) =
yi 0
t
0

el ndice simple de los valores de la varia-

ble i sima (i = 1, 2,, n), las formas de definir ndices complejos SIN
PONDERAR y PONDERADOS quedan como siguen:
INDICES COMPLEJOS SIN PONDERAR.
1. MEDIA ARITMTICA de ndices simples:

1 n
1 n y it
I = Ii =
n i =1
n i =1 y i 0
n

2. MEDIA AGREGATIVA:

IA =

y
i =1
n

y
i =1

it

io

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

235

NDICES COMPLEJOS PONDERADOS.


Se denotar por i la ponderacin de la variable i sima de la magnitud
compleja.
1. MEDIA ARITMTICA ponderada:

2. MEDIA AGREGATIVA ponderada:

IA

=
y

i
i
i0
it

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

236

Tasas de Variacin y Nmeros ndice.

6.3.4. Propiedades.
1. EXISTENCIA: el valor de un ndice ha de ser finito y distinto de cero.
2. IDENTIDAD: cuando
3. INVERSIN: Dado

0t

el ndice ha de ser 1 (o 100)

I 00 = I tt = 1

1
I I = t
I0
t
0

4. PROPORCIONALIDAD:

0
t

y t y t' = y t + kyt = ( 1 + k ) y t
I 0t' = ( 1 + k )I 0t

5. CCLICA: dados tres perodos (o ms) distintos 0, h y t se ha de cumplir que

I 0h I ht = I 0t .

Esta propiedad se utilizar para operar con NDICES

EN CADENA (ndices con base el perodo inmediatamente anterior).

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

237

6.4. NDICES DE PRECIOS Y CANTIDADES.


Se van a definir ndices complejos ponderados para magnitudes tipo
PRECIO Y CANTIDAD utilizando la siguiente notacin:
Magnitud PRECIO:

Magnitud CANTIDAD:

Pi ( i = 1,2 ,...,n ) con ndice SIMPLE

p it
I (i ) =
pi0

Qi ( i = 1,2 ,...,n ) con ndice SIMPLE

qit
I (i ) =
qi 0

t
0

t
0

Se destacarn los dos tipos de ndices complejos ponderados ms importantes para precio y cantidad: TIPO LASPEYRES y TIPO PAASCHE,
que sern medias aritmticas ponderadas de ndices simples.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

238

Tasas de Variacin y Nmeros ndice.

Tambin se definir un ndice complejo de VALOR sin ponderar:


Magnitud VALOR:

Vi ( i = 1,2 ,...,n ) con ndice SIMPLE

vit
pit qit
I (i ) =
=
vi 0 p i 0 q i 0
t
0

Se definir el ndice complejo de valor como una media agregativa sin ponderar.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

239

6.4.1. ndices de PRECIOS complejos ponderados.


PONDERACIN TIPO LASPEYRES: ponderacin fija

i = pi 0 qi 0

PONDERACIN TIPO PAASCHE: ponderacin variable

i = pi 0 qit

NDICE DE LASPEYRES DE PRECIOS

NDICE DE PAASCHE DE PRECIOS

p it
p it
p i 0 q it
pi 0 qi 0
t
t
I 0 ( i )i
pi0
I 0 ( i )i
pi 0

t
t
=
P0 ( P ) =
L0 ( P ) =
=
i
p i 0 q it
i
pi 0 qi 0
p q

L (P)=
p q
t
0

it

i0

i0

i0

p q

P (P)=
p q
t
0

it

it

i0

it

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

240

Tasas de Variacin y Nmeros ndice.

6.4.2. ndices de CANTIDAD complejos ponderados.


PONDERACIN TIPO LASPEYRES: ponderacin fija

i = q i 0 p i 0

PONDERACIN TIPO PAASCHE: ponderacin variable

i = q i 0 p it

NDICE DE LASPEYRES DE CANTIDAD

NDICE DE PAASCHE DE CANTIDAD

q it
q it
q i 0 p it
qi 0 pi 0
t
t
I 0 ( i )i
qi0
I 0 ( i )i
qi 0

t
t
P0 ( Q ) =
L0 ( Q ) =
=
=
i
qi 0 pi 0
i
q i 0 p it
q p

L (Q ) =
q p
t
0

it

i0

i0

i0

q p

P (Q )=
q p
t
0

it

it

i0

it

Ejemplo 6.2.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

241

6.4.3. ndice complejo de valor.


Se define el ndice complejo de valor como una media agregativa: cociente
entre el valor de la magnitud compleja en el perodo t (actual) y el valor
de la magnitud compleja en el perodo 0 (referencia).
NDICE DE VALOR

v
p q

IV =
=
v p q
t
0

it

it

it

i0

i0

i0

PROPIEDAD: INDICE DE PRECIO X NDICE DE CANTIDAD = NDICE DE VALOR.

Concretamente es fcil comprobar que se cumple la siguiente relacin entre


los ndices de Laspeyres y Paasche:

Lt0 ( P ) P0t ( Q ) = Lt0 ( Q ) P0t ( P ) = IV0t


Comprobar en Ejemplo 6.2.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

242

Tasas de Variacin y Nmeros ndice.

6.5. CAMBIO DE BASE, RENOVACIN Y ENLACE.


Sea una serie de ndices

I 0t

con base fija en el perodo 0, es decir,

I 00 = 100 .
Si se quiere cambiar la base de la serie de ndices del perodo 0 a un perodo h posterior (h>0) se proceder como sigue:
Teniendo en cuenta la propiedad cclica para los perodos 0, h y t
se tiene la siguiente relacin:

I 0h I ht = I 0t .

Por tanto los nuevos ndices con base el perodo h se obtendrn:


t
I
0 h I ht = 0h
I0

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

243

Al ndice que relaciona las dos bases se le denomina ENLACE

I 0h .

Obviamente si se quisiera devolver la base del perodo h al 0 se


procedera:

h 0 I 0h I ht = I 0t

Los cambios de base se utilizan para RENOVAR la base (acercarla a un


perodo ms actual) o para ENLAZAR O EMPALMAR series de ndices
que aparecen en distintas bases y expresarlos en una NICA base.

Ejemplo 6.3.

PROBLEMA 6.2

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

244

Tasas de Variacin y Nmeros ndice.

6.6. DEFLACTACIN.
Concepto: transformar el valor de una magnitud en precios corrientes
del perodo t (valor nominal) a un valor en precios constantes de un
perodo fijo 0 (valor real).
De esta forma se puede comparar de una manera ms homognea y
realista como va evolucionando el valor de una magnitud en diferentes
perodos de tiempo.
Esto se consigue dividiendo el valor a precios corrientes por un ndice
de precios adecuado que denominaremos DEFLACTOR.
valor a precios corrientes(t)
deflactor ( ndice de precios base perodo 0)

= valor a precios constantes (0)

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

245

Con ndices simples la operacin es obvia:


Si llamamos

vt = pt q t

al valor de la cantidad qt de la magnitud a precios

corrientes del perodo t (NOMINAL).


Llamamos

v ot = p0 q t

al valor de la misma cantidad qt, pero a precios

del perodo 0 (REAL).


Y llamamos

pt
I =
p0
t
0

al ndice de precios del perodo

vt v ot

0t

se tiene que:

vt pt qt
=
= p 0 q t = v ot .
t
pt
I0
p0

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

246

Tasas de Variacin y Nmeros ndice.

Deflactacin con ndices de precios complejos (Laspeyres y Paasche)


n

Sea

Vt = p it q it

el valor de una magnitud compleja a precios corrien-

i =1

tes del perodo t.


n

Sea

V0 t = p i 0 q it

el valor de la magnitud compleja a precios constan-

I =1

tes del perodo 0.


NDICE DE PRECIOS DE PAASCHE COMO DEFLACTOR

Vt
p it q it

=
= p i 0 q it = V0 t
t
P0 ( P ) p it q it
p i 0 q it
ES UN DEFLACTOR EXPLCITO
Se obtiene el valor de la magnitud a precios constantes del perodo 0.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

247

Se puede comprobar fcilmente que si se deflacta con el ndice de precios de


LASPEYRES el resultado no es tan explcito pero se utiliza igualmente.
Ejemplo 6.5.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

248

Tasas de Variacin y Nmeros ndice.

Conceptos clave:

Cambio de base.
Deflactacin.
ndice de Laspeyres.
ndice de Paasche.
ndice simple y complejo.
ndices de precios.
ndices en cadena.
Nmero ndice.
Perodo base.
Serie de ndices con base fija.
Tasa de variacin.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

249

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

EJEMPLOS.
Ejemplo 6.1. Los salarios anuales (en euros) de los oficiales administrativos
en una empresa han evolucionado durante el perodo 2001-2005 de la forma
siguiente:
Aos

Salarios
Anuales

2001

15.350,00

2002
2003
2004
2005

15.887,25
16.363,87
17.018,42
17.648,10

a) Construye una tabla de ndices simples salariales

con base el ao 2001.


b) Construye otra serie de ndices con base el ao inmediatamente anterior.
c) Por ltimo construye otra tabla que indique la tasa
de variacin del salario anual respecto al ao inmediatamente anterior.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

250

Tasas de Variacin y Nmeros ndice.

Ejemplo 6.2. Una empresa fabrica tres tipos de artculos: A, B y C. La siguiente estadstica nos proporciona los precios y las cantidades producidas
de dichos artculos durante los aos 1990-1992.
Aos
Artculo

1990

pi0

1991

qi0

pit

1992

qit

pit

qit

10

15

20

12

10

10

a) s de Laspeyres y Paasche de 1991 y 1992, tomando como base 100 el

ao 1990.
b) Comprubese que: L p Pq = Pp Lq

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

251

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 6.3. Los siguientes ndices salariales reflejan la evolucin de los


salarios en un determinado sector durante 7 aos, consecuencia de las negociaciones entre los sindicatos y los empresarios del sector:

aos

a) Expresa la serie de ndices


1998
b) Expresa los ndices con base
mente anterior
c) Qu porcentaje aumentaron
al 96?
d) Qu porcentaje aumentaron
al 98?
e) Y del 2000 al 2001?

ndice
Base 95

1995

100,00

1996

105,00

1997

109,20

1998

113,02

1999

117,54

2000

121,07

2001

124,10

Solucin: c) el 5%

d) el 13,02%

con base el ao
el ao inmediatalos salarios del 95
los salarios del 95

e) el 2,5%

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

252

Tasas de Variacin y Nmeros ndice.

Ejemplo 6.4. El valor de un bien en 1992 es un 20% superior al que tena


en 1986 y un 9% superior a su valor en 1990. Cul era el valor relativo de
ese bien en 1990 respecto a 1986?
90
Solucin: un 10% superior, I 86 = 1,10

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

253

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 6.5. El salario mnimo interprofesional, en euros corrientes, ha sufrido las siguientes variaciones durante el perodo 2001 2006:
Aos

2001

2002

2003

2004

2005

2006

Salario mnimo 433,45 442,20 451,20 460,50 513,00 540,90


Si el I.P.C. durante esos mismos aos fue:
Aos
I.P.C.

2001

2002

2003

2004

2005

2006

100,00 103,54 106,68 109,93 113,63 117,62

(Fuente: Boletn de Estadsticas Laborales. Ministerio de Trabajo y Asuntos


Sociales. Contacto: www.ine.es)

Estdiese la evolucin del salario mnimo en trminos reales y nominales durante el perodo 01 06. (En valor absoluto y en porcentaje).
Obtngase la tasa de variacin interanual del salario (real y nominal).
Solucin: El salario mnimo pasa de 433,45 a 459,87 constantes
del 01, lo que, en trminos relativos, equivale a un aumento del
6,1%.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Texto

254

Tasas de Variacin y Nmeros ndice.

Ejemplo 6.6. Las pensiones se revalorizan anualmente segn la expectativa


de crecimiento del IPC nacional. Si una pensin es de 540 euros/mes en el
ao actual y la inflacin esperada para el ao que viene es del 3,2%, cul
deber ser el importe de dicha pensin el ao prximo?
Solucin: 557,28

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

TEMA 7
ANLISIS CLSICO DE
SERIES TEMPORALES

256

Anlisis Clsico de Series Temporales.

Ficha del tema 7.


Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
7.1. Introduccin.
7.2. Componentes de una serie. Descomposicin.
7.3. Anlisis de la tendencia.
7.4. Anlisis de la variacin estacional. Desestacionalizacin.
7.5. Prediccin. Correccin por estacionalidad.
Conceptos clave.
Ejemplos.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

257

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

OBJETIVOS DE APRENDIZAJE.
Descomposicin de una serie temporal en cuatro componentes siguiendo un
esquema multiplicativo.
Obtencin de la ecuacin de tendencia anual aplicando el principio de mnimos cuadrados a la serie temporal (t, Y).
Obtencin de la ecuacin de tendencia k esimal a partir de la anual. Cambios de origen en las ecuaciones de tendencia.
Utilidad de las ecuaciones de tendencia para hacer predicciones.
Los ndices de variacin estacional (IVE) como indicadores de la componente
estacional de una serie, bajo hiptesis de estacionalidad estable.
Utilidad de los IVE para corregir por estacionalidad las predicciones de la
tendencia.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

258

Anlisis Clsico de Series Temporales.

BIBLIOGRAFA BSICA (teora y problemas)


ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2005.
Tema 6 para tema 7. (Con ejercicios, cuestiones de autoevaluacin y
problemas resueltos y propuestos).
MONTIEL, A.M.; RIUS, F.; BARN F.J.: Elementos bsicos de Estadstica
Econmica y Empresarial, Ed. Prentice Hall, Madrid 1997.
Captulo 8 para tema 7.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

259

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

7.1. INTRODUCCIN.
Una SERIE TEMPORAL se puede definir como una sucesin de valores ordenados en el tiempo y generados por una variable cuya referencia es una
unidad temporal.
A la variable objeto de estudio se la denomina VARIABLE DE INTERS:

Y.

A la variable tiempo se la representar por: t.


Se considerar al par
un valor de

(t ,Y ) como una variable estadstica bidimensional y a

Y en el tiempo t se denotar por yt.

( t , y ) yt
Ejemplo 7.1.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

260

Anlisis Clsico de Series Temporales.

7.2. COMPONENTES DE UNA SERIE TEMPORAL.


El anlisis clsico de series temporales distingue cuatro componentes para el
estudio descriptivo de la misma.

1. TENDENCIA

Tt :

direccin que toma la serie temporal al largo plazo, es

decir, si crece, decrece o permanece estable en largos perodos de tiempo


y sin oscilaciones.
2. CCLICA

Ct :

fluctuaciones de la serie en perodos de tiempo superiores

al ao (CICLOS o variaciones cclicas).

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

261

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

3. ESTACIONALIDAD S t : movimientos oscilatorios de la variable de inters


Y en perodos inferiores al ao. (Variaciones estacionales). Cuando son
repetitivos cada ao se habla de la regularidad de la componente estacional (estacionalidad estable).
4. IRREGULAR

It

o variaciones irregulares: recoge los movimientos de la

variable de inters que no explican el resto de componentes (deficiencias


del modelo).
DESCOMPOSICIN DE UNA SERIE TEMPORAL.
MODELO ADITIVO:

Yt = Tt + Ct + S t + I t

MODELO MULTIPLICATIVO:

Yt = Tt Ct S t I t .

Se asumir un modelo multiplicativo con estacionalidad estable.


Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

262

Anlisis Clsico de Series Temporales.

7.3. ANLISIS DE LA TENDENCIA

Tt

Mtodo que se va a utilizar para determinar la tendencia de la serie:


MTODO ANALTICO.
Otros mtodos: medias mviles y alisado exponencial.
El MTODO ANALTICO consiste en la obtencin de la ecuacin de una
funcin que ponga la variable de inters

Y en funcin del tiempo:

y t* = f ( t )
Esta funcin se obtendr por medio de un ajuste lineal mnimo cuadrtico:

y t* = a + bt
Recta de regresin de

Y sobre t
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

263

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

La TENDENCIA de la serie

Tt

la proporcionarn los valores estimados de

Y: y t

Tt = y t*

Tt = a + bt
ecuacin de tendencia (recta de tendencia)
proporciona la tendencia lineal de la serie a largo plazo.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

264

Anlisis Clsico de Series Temporales.

Su interpretacin depender de la unidad de medida del tiempo

t.

Se analizar la TENDENCIA desde una doble perspectiva:


ANUAL: tiempo t en aos.
K ESIMAL: tiempo

t en unidades inferiores al ao,

SEMESTRES k = 2 tendencia semestral.


CUATRIMESTRES k = 3, tendencia cuatrimestral.
TRIMESTRES k = 4 tendencia trimestral.
BIMESTRES k = 6 tendencia bimensual.
MESES k = 12 tendencia mensual.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

265

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

7.3.1. Tendencia anual.


La ecuacin de tendencia anual se obtendr por una ajuste lineal mnimo
cuadrtico en la variable

(t ,Y ).

PASOS A SEGUIR:
1. El tiempo vendr en aos y los datos sern anuales. Si los valores de la
serie
res

yt

yt

se tuvieran por k simos, en cada ao se sumaran los k valo-

para obtener datos anuales.

2. Se opera una cambio de variable sobre el tiempo t en aos:


con

t0

t' = t t 0 ,

ao fijo.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

266

Anlisis Clsico de Series Temporales.

3. Obtencin de la recta de regresin de Y sobre t:

st' Y

b = 2
*
y t' = a + bt'
st
a = y bt '

4. Ecuacin de tendencia anual:

Tt' = a + bt'

t en aos, origen t = 0, t = t0 (parte central del ao t0.)


CAMBIO DE ORIGEN EN LA ECUACIN DE TENDENCIA ANUAL.
Si

Tt = a + bt

tiene origen en t = 0 y se quiere cambiar el origen a t = h

(h nmero entero), se opera el cambio

t = t' + h Tt' = a + b( t' + h ).


Ejemplo 7.2.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

267

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

7.3.2. Tendencia Kesimal.


Tendencia de la serie a largo plazo, pero el tiempo vendr en k simos
(trimestres, meses...).
La ECUACIN DE TENDENCIA K ESIMAL se obtendr a partir de la anual
como sigue:
1. Sea

Tt = a + bt

la ecuacin de tendencia anual con origen

t = 0.

2. Dividimos por k la ecuacin anual:

a b
b
Tt = + t ,
k k
k

representa la tendencia k esimal promedia del ao t.

3. Operamos el CAMBIO EN LA UNIDAD TEMPORAL de aos

t a k simos

t'
a b t' a b
(k)
t: t' = kt t = Tt ' = +
= + 2 t'
k
k kk k k
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

268

Anlisis Clsico de Series Temporales.

(k)
t'

a b
= + 2 t'
k k

representa la ecuacin de tendencia k esimal.

El tiempo
ORIGEN:

t viene en k simos.

t = 0 en el k simo central del ao t0 (origen de la ecuacin


anual)

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

269

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

TRASLADO DEL ORIGEN DE LA ECUACIN DE TENDENCIA K ESIMAL AL CENTRO DEL PRIMER K SIMO.
Sobre la ecuacin anterior se operar el siguiente cambio de origen:

k 1
k 1
a b
(k)
Tt'' = + 2 t' '
t' = t' '

k k
2
2
Ecuacin de tendencia k esimal con origen

t = 0 en la parte central del

primer k simo del ao t0 (origen de la ecuacin anual)


As si

t = 0 ,1,2 ,...,( N 1 ) aos t' ' = 0 ,1,2 ,...,( kN 1 ) k simos

Por ejemplo, si N = 3 aos entonces

t = 0, 1, 2. Y si k = 4 (trimestres), en-

tonces los 3x4 = 12 trimestres de los tres aos quedan:

t = 0,1,2,3,...,11.

Ejemplo 7.3.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

270

Anlisis Clsico de Series Temporales.

7.4. ANLISIS DE LA VARIACIN ESTACIONAL


La componente estacional

St

St .

es la responsable de los altibajos en el grfico

de la serie (picos y valles).


Para simplificar el anlisis de la componente estacional se supondr un comportamiento estacional repetitivo cada ao en la serie temporal (ESTACIONALIDAD ESTABLE). Adems, se asumir, en un esquema MULTIPLICATIVO,
que con el anlisis de la tendencia realizado se ha obtenido una componente
conjunta de TENDENCIA CICLO

Tt C t .

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

271

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

As, se partir, para el anlisis de las variaciones estacionales, de una situacin inicial:

yt = Tt S t I t
(Tt representa a la tendencia y el ciclo)
Los indicadores de la COMPONENTE ESTACIONAL

St

sern unos ndices

que se denominan NDICES DE VARIACIN ESTACIONAL (IVE). Se obtendrn aislando la componente estacional en la relacin anterior.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

272

Anlisis Clsico de Series Temporales.

7.4.1. Obtencin de los IVE.


MTODO DE LA RAZN A LA TENDENCIA.
Pasos a seguir:
1. A partir de la ecuacin de tendencia k esimal

Tt

(k)

a b k 1
= + 2 t

k k
2

se obtienen los valores de tendencia-ciclo k esimales de la serie,


tuyendo los valores

susti-

t = 0 ,1,2 ,...,( kN 1 ) en la ecuacin.

2. Dividimos los datos k esimales de la serie


da:

Tt

yt

por la tendencia obteni-

y t Tt S t I t
=
= St I t
Tt
Tt
Rafael Dez, Vicente Coll y Olga Blasco

ndice

Ficha

273

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

3. Se promedian todos los valores

St I t

todos los aos. Se obtienen as los

obtenidos, en cada k simo para

k MOVIMIENTOS ESTACIONALES,

ME(i) (i = 1,2,..,k), de la serie.


4. Se determinan los

IVE, que son los Movimientos Estacionales ajustados:

IVE( i ) =

ME( i )

k 100
ME( i )
k

i =1

Ejemplo 7.4.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

274

Anlisis Clsico de Series Temporales.

ASPECTO DE LOS IVE.


Los IVE son nmeros ndices, y por tanto vendrn en porcentaje o tanto por
uno. La referencia es el 100.

IVE(i) = 100, significa que en el k simo (i) los valores que toma la
serie no tienen un comportamiento estacional que difiera de la tendencia usual de la serie.

IVE(i) > 100 (< 100), significa que en el k simo (i) los valores que
toma la serie son usualmente mayores (menores), a los que tendra en
un comportamiento sin efecto estacional.
NOTA: como el ao est subdividido en k partes, habr un

IVE para cada k

simo, de forma que:

IVE( i ) = k

o ( kx100 )

i =1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

275

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

7.4.2. Desestacionalizacin.
Desestacionalizar una serie consiste en eliminar la componente estacional

S t , representada por el IVE respectivo, de los datos originales y t .


Si

yt

es un dato k esimal de la serie original en el k simo (i), el dato

desestacionalizado ser:

yt
Dt =
IVE( i )
Datos que supuestamente hubisemos observado de no haber existido influencia estacional.
Ejemplo 7.5.
(Ver ejercicio 6.6 del libro ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2005. pgina 226).

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

276

Anlisis Clsico de Series Temporales.

7.5. PREDICCIN Y CORRECCIN POR ESTACIONALIDAD.


7.5.1. Prediccin de la tendencia.
A partir de las ecuaciones de tendencia:

( 1 ) Tt = a + bt
(2)T

(k)
t'

ANUAL con origen

a b k 1
= + 2 t'

k k
2

t = 0 en el ao t0.

K ESIMAL con origen

t = 0 en el pri-

mer k simo del ao t0.


Se pueden obtener PREDICCIONES de la tendencia:
(1) predicciones anuales de la tendencia para un ao
t = 0 ,1,2 ,...,( N 1 ) .

t determinado

(2) Predicciones k esimales de la tendencia para un k simo


nado t' = 0 ,1,2 ,...,( kN 1 )

t determi-

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

277

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

7.5.2. Correccin por estacionalidad.


Si

Tt '( k ) ( i )

representa la prediccin de la tendencia k esimal en un k

simo (i) determinado y el

IVE(i) representa el efecto estacional de los valo-

res de la serie en ese k simo, la prediccin CORREGIDA POR ESTACIONALIDAD se obtendr multiplicando la prediccin de tendencia por el IVE respectivo:

Tt '( k ) ( i ) xIVE ( i ) .
Ejemplo 7.6.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

278

Anlisis Clsico de Series Temporales.

Conceptos clave.
Componente estacional.
Dato desestacionalizado.
Ecuacin de tendencia.
ndice de variacin estacional (IVE).
Prediccin corregida por estacionalidad.
Prediccin de la tendencia.
Serie temporal.
Tendencia anual.
Tendencia k-esimal.
Tendencia.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

279

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

EJEMPLOS.
Los ejemplos de este tema dedicado a las series temporales estn basados
en los datos del Ejemplo 7.1 y siguen el desarrollo terico del tema.
Ejemplo 7.1. Vamos a analizar la siguiente serie temporal Yt: volumen de
ventas trimestrales de una pequea empresa (en miles de euros), calculando la TENDENCIA, aislando la COMPONENTE ESTACIONAL (IVE) y desestacionalizando la serie. Supondremos un esquema multiplicativo y estacionalidad estable.
DATOS: ventas trimestrales durante el perodo 2000 a 2002.

2000
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre
Totales Yt

2001
10
21
4
25
60

2002
15
25
8
30
78

17
29
9
33
88

TABLA 1

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

280

Anlisis Clsico de Series Temporales.

SERIE TEMPORAL

35
30
ventas

25
20
15
10
5
0
1

2000

2001

2002

trimestres

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

281

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 7.2. A partir de las ventas trimestrales de una empresa en el periodo 2000-02 (datos facilitados en el Ejemplo 7.1), calcular la ecuacin de
tendencia anual con origen en el ao 2000.
Solucin: Para calcular la ecuacin lineal de tendencia anual con origen el
ao 2000, en primer lugar tomamos como valores de la serie los totales
anuales de la variable Yt.
Para hallar la lnea de tendencia utilizamos un mtodo analtico: ajustamos
una recta por el mtodo mnimos cuadrados.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

282

Anlisis Clsico de Series Temporales.

Clculos previos
Ao t
2000
2001
2002
Totales

Momentos a10
ordinarios

(Yt)2

Yt

t'=t-2000
0
1
2
3

60
78
88
226
a01

1,00

(t')2

3600
6084
7744
17428
a02

75,33

t'Yt
0
1
4
5

a20
5809,33

0
78
176
254
a11

1,67

84,67

2
m02 = S2Y m11 = St'Y
Momentos m20 = S t'
centrales
0,67
134,22
9,33

Parmetros b

r2

a
14,00

61,33

r
0,974

0,987

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

283

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Por tanto, se tendr la Ecuacin de tendencia anual

st' Y

b = 2
st'
Tt' = a + bt'
a = y bt '

Tt' = 61,33 + 14t'

t = 0, 1, 2....aos. Ecuacin de tendencia anual.


Origen: t0 = 2000, ao 0. Unidad: un ao.
La bondad del ajuste es

r2 = 0,974 (97,4%, buen ajuste). El modelo lineal

para determinar la tendencia sera adecuado.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

284

Anlisis Clsico de Series Temporales.

Ejemplo 7.3. A partir de la ecuacin de tendencia anual obtenida en el


Ejemplo 7.2 (Tt'

= 61,33 + 14t'

con origen e t0 = 2000, ao 0.), obtener la

ecuacin de tendencia trimestral con origen el primer trimestre del ao


2000.
Solucin: Ecuacin de la tendencia trimestral (k = 4).

61,33 14
Tt' =
+ t'
4
4
Tendencia trimestral promedia del ao t (t en aos).
Cambiamos la unidad anual de la ecuacin de tendencia a una unidad trimestral:
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Texto

285

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

t = 4t (t en trimestres). En general t = kt (t en k-simos); K = 2


semestres, k = 12 meses... En nuestro caso transformamos la variable t
(tiempo medio en aos) en otra t medida en trimestres, haciendo el cambio
t = 4t:

61.33 14 t' ' 61.33 14


t' '
(4)
t' =
Tt' ' =
+
=
+ 2 t' '
4
4
4 4
4
4

(t en trimestres)

Por tanto, la ecuacin de tendencia trimestral quedar:

Tt'('4 ) = 15 ,33 + 0 ,875t' '


Ecuacin de tendencia trimestral.
Origen: trimestre central del ao 2000.
Unidad: t un trimestre.
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Texto

286

Anlisis Clsico de Series Temporales.

Cambiamos el origen de la ecuacin de tendencia trimestral al primer trimestre de 2000: el origen lo situamos en la parte central del trimestre, nos
trasladamos un trimestre y medio hacia la izquierda:

4 1
k 1
t' '
= t' '
= t' ' 1,5 :
2
2

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

287

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Tt'(' 4 ) = 15 ,33 + 0 ,875( t' ' 1,5 ) = 15 ,33 + 0 ,875( 1,5 ) + 0 ,875t' ' =
= 14 ,0175 + 0 ,875t' '
Con lo cual,

Tt'('4 ) = 14 ,0175 + 0 ,875t' '


ecuacin de tendencia trimestral.
Origen (t = 0) primer trimestre de 2000.
Unidad: t un trimestre. t = 0, 1, 2, ...,11

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

288

Anlisis Clsico de Series Temporales.

Con la ecuacin anterior, evaluamos la tendencia para cada uno de los 12


trimestres de la serie (3 aos por 4 trimestres). Dando valores a t = 0, 1,
2, ...,11, obtenemos la siguiente tabla:
Tt''
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre

2000
14,0175
14,8925
15,7675
16,6425

2001
17,5175
18,3925
19,2675
20,1425

2002
21,0175
21,8925
22,7675
23,6425

TABLA 2
Tendencia para cada trimestre:
forma una serie aritmtica de razn 0,875 = b/42. En general b/k2.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

289

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Representacin grfica de la componente de tendencia (trimestral)

SERIE TEMPORAL
VENTAS

tendencia

35
30

ventas

25
20
15
10
5
0
1

3
2000

3
2001

2002

trimestres

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

290

Anlisis Clsico de Series Temporales.

Ejemplo 7.4. A partir de las ventas trimestrales (datos originales, TABLA 1)


y la tendencia trimestral (resultados del Ejemplo 7.3, TABLA 2), calcular los
ndices de variacin estacional (IVE), interpretar su significado y representar
grficamente la componente estacional.
Solucin: Eliminamos la tendencia y el ciclo (dividimos los datos originales
por su correspondiente tendencia trimestral, supuesto un esquema multiplicativo):
TABLA 1/TABLA 2 = TABLA 3.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

291

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

2000
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre

2001
10
21
4
25

2002
15
25
8
30

Tt''
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre

17
29
9
33

TABLA1

2000
14,0175
14,8925
15,7675
16,6425

2001
17,5175
18,3925
19,2675
20,1425

2002
21,0175
21,8925
22,7675
23,6425

TABLA2

TABLA3
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre

2000
0,7134
1,4101
0,2537
1,5022

2001
0,8563
1,3592
0,4152
1,4894

2002
0,8088
1,3247
0,3953
1,3958

Suma
2,3785
4,0940
1,0642
4,3874

ME(i)
0,7928
1,3647
0,3547
1,4625
3,9747

IVE%
79,79
137,34
35,70
147,18
400,00

Tanto por uno


0,7979
1,3734
0,3570
1,4718
4,0000

Eliminamos las variaciones irregulares promediando los valores obtenidos sin tendencia en cada trimestre para todos los aos, es decir, calculando
lo que llamaremos MOVIMIENTOS ESTACIONALES (ME): medias aritmticas
de los valores sin tendencia para cada trimestre. (ver TABLA 3):
Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Texto

292

Anlisis Clsico de Series Temporales.

ME(i) i = 1, 2,..., k
Calculamos los ndices de Variacin Estacional (IVE):
Teniendo en cuenta que un ndice representa un cambio porcentual sobre
una base de referencia del 100%, en este caso los cuatro ME deberan sumar 4 (o 400 en porcentaje) para que representaran de una forma consistente la componente estacional por trimestre. Pero suman 3,9747, por lo
que procede un ligero ajuste tcnico para que sumen 4. De esta forma obtenemos los ME ajustados o NDICES DE VARIACIN ESTACIONAL (IVE):

IVE( i ) =

ME( i )
k

ME( i )

k 100

i =1

En este caso k = 4 (trimestres).


Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Texto

293

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Representacin grfica de la componente estacional obtenida (IVE):

ndice Variacin Estacional

160
140

147,18

137,34

147,18

137,34

147,18

137,34

120
IVE

100
79,79

80

79,79

79,79

60
40

35,70

35,70

35,70

20
0
1

2000

2001

2002

trimestres

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

294

Anlisis Clsico de Series Temporales.

Significado de los IVE: los IVE representan el efecto estacional para cada
trimestre. Al suponer estacionalidad estable, son los mismos para todos los
aos de la serie, as:
4 trimestre: IVE (4) = 147,18. Las ventas de la empresa son un

47.18% superiores (147,18 - 100) al nivel medio de referencia que


sera 100.
3 trimestre: IVE (3) = 35,70. Las ventas de la empresa son un 64,30

inferiores (35,70 - 100) al nivel medio de referencia.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

295

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 7.5. Desestacionalizar la serie de ventas trimestrales (datos originales, TABLA 1).
Solucin: Eliminamos la estacionalidad de la serie dividiendo los datos originales (Tabla 1) por los IVE de cada trimestre expresados en tantos por
uno.
Tabla 1 / IVE = Tabla 4
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre
Totales Yt

2000
10
21
4
25
60

2001
15
25
8
30
78

TABLA 1

2002
17
29
9
33
88

IVE
0,7979
1,3734
0,3570
1,4718
4,0000

2000
12,5329
15,2905
11,2045
16,9860

2001
18,7993
18,2030
22,4090
20,3832

2002
21,3059
21,1155
25,2101
22,4215

TABLA 4
Serie desestacionalizada

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

296

Anlisis Clsico de Series Temporales.

La serie desestacionalizada contiene los valores que supuestamente hubiramos observado de no haber existido ninguna influencia estacional. Vemos
que hay una diferencia significativa con los datos originales, sobre todo en el
tercer trimestre.

Dt ventas
desestacionalizadas

Datos desestacionalizados

30
25
20
15
10
5
0
1

2000

2001

2002

trimestres

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

297

Gua didctica de Estadstica Descriptiva para las Ciencias Sociales.

Ejemplo 7.6. A partir de la ecuacin de tendencia trimestral con origen el


trimestre central del ao 2000

Tt'('4 ) = 15 ,33 + 0 ,875t' ' ,


Obtener una prediccin de las ventas de la empresa para el tercer trimestre
del ao 2008. Corregir la prediccin por estacionalidad (utilizar los datos obtenidos en el Ejemplo 7.4).
Solucin: Del ao 00 al 08 hay 8 aos, es decir 32 trimestres. Con este clculo llegamos al trimestre central del ao 08; por tanto aadiendo 0.5 trimestres llegamos a la parte central del tercer trimestre.
As para t = 32.5 trimestres tenemos:

Tt'('4 ) ( t' ' = 32 ,5 ) = 15 ,33 + 0 ,875( 32 ,5 ) = 43 ,7675


Rafael Dez, Vicente Coll y Olga Blasco
ndice

Ficha

Texto

298

Anlisis Clsico de Series Temporales.

Anlogamente lo podemos hacer a partir de la ecuacin con origen el primer


trimestre del 00:

Tt'('4 ) = 14 ,0175 + 0 ,875t' '


Aqu t = 34 trimestres y sustituyendo:

Tt'('4 ) ( t' ' = 34 ) = 14 ,0175 + 0 ,875( 34 ) = 43 ,7675


Correccin por estacionalidad: como el IVE para el tercer trimestre es de
35,70, la prediccin tendra que ser realmente un 64,30% inferior (si la estacionalidad se mantiene estable): 43,7675 0,3570 = 15,6250 que representa la prediccin corregida por estacionalidad.

Rafael Dez, Vicente Coll y Olga Blasco


ndice

Ficha

Texto

You might also like