Professional Documents
Culture Documents
Vicente Coll
Olga M Blasco
Gua didctica de
Estadstica Descriptiva
para las
Ciencias Sociales
Eumed.net
Universidad de Mlaga
2008
Diseo de cubierta:
Rafael Dez Garca
Vicente Coll Serrano
Olga M Blasco Blasco
Reservados los derechos para todos los pases. De conformidad con lo
dispuesto en el artculo 270 del Cdigo penal vigente, podrn ser
castigados con multas y privacin de libertad quienes reprodujeren o
plagiaren, en todo o en parte, una obra literaria, artstica o cientfica
fijada en cualquier tipo de soporte sin la preceptiva autorizacin. Ninguna
parte de esta publicacin, incluido el diseo de la cubierta, puede ser
reproducida, almacenada o transmitida de ninguna forma, ni por ningn
medio, sea ste electrnico, qumico, mecnico, electro-ptico,
grabacin, fotocopia o cualquier otro, sin la previa autorizacin escrita
por parte de los autores.
ISBN:
Depsito Legal:
Maquetacin: Rafael Dez Garca
Vicente Coll Serrano
Olga M Blasco Blasco
ndice
ndice analtico.
Pgina
TEMA 1. INTRODUCCIN.
Ficha del tema 1.
Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
1.1. Estadstica: concepto, contenido y relaciones con el rea econmica y empresarial.
1.2. La investigacin estadstica. Anlisis descriptivo, modelizacin e inferencia.
1.3. Datos estadsticos: naturaleza, descripcin numrica y representacin grfica.
Conceptos clave.
Ejemplos.
16
17
18
19
28
32
43
44
53
54
Rafael Dez, Vicente Coll y Olga Blasco
7
Pgina
55
56
76
76
83
86
88
95
96
119
122
116
117
118
ndice analtico.
Pgina
123
124
125
128
129
130
131
134
146
155
158
163
164
9
Pgina
224
225
226
10
ndice analtico.
Pgina
227
229
230
230
231
233
236
237
239
240
241
242
244
248
249
256
Rafael Dez, Vicente Coll y Olga Blasco
Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin de la gua didctica:
7.1. Introduccin.
7.2. Componentes de una serie. Descomposicin.
7.3. Anlisis de la tendencia.
7.3.1. Tendencia anual.
7.3.2. Tendencia k-esimal.
7.4. Anlisis de la variacin estacional. Desestacionalizacin.
7.4.1. Obtencin de los IVE.
7.4.2. Desestacionalizacin.
7.5. Prediccin. Correccin por estacionalidad.
7.5.1. Prediccin de la tendencia.
7.5.2. Correccin por estacionalidad.
Conceptos clave.
Ejemplos.
11
Pgina
257
258
259
260
262
265
267
270
272
275
276
276
277
278
279
12
PRLOGO
El texto de Estadstica que se presenta con el nombre de Gua Didctica de Estadstica Descriptiva para las Ciencias Sociales, tiene una estructura que lo sita entre un conjunto de fichas resumen de los contenidos de una materia y un libro de texto. Es mucho ms amplio que un mero resumen de conceptos y frmulas, pero no supone un desarrollo exhaustivo de los epgrafes de una
programacin; tampoco contiene demostraciones salvo alguna conveniente excepcin. No por ello
deja de ser un texto riguroso y sistemtico, ajustado a una programacin. Hemos diseado esta
Gua didctica de forma que su contenido sirva de refuerzo a la clase presencial de un curso de introduccin de Estadstica.
La Gua Didctica pretende ser un texto que acompae y encamine a los estudiantes en el estudio de la materia, aportndoles informacin concreta y precisa sobre los conceptos clave y tcnicas de la Estadstica Descriptiva. Cada uno de estos conceptos viene acompaado por ejemplos
ilustrativos que ayudarn al estudiante a asimilarlos.
13
Se encuentra tambin disponible, como material complementario de esta Gua Didctica, las Fichas Tcnicas de Estadstica Descriptiva para las Ciencias Sociales.
Cmo utilizar la Gua Didctica de Estadstica Descriptiva para las Ciencias Sociales.
La Gua Didctica se compone de un total de 7 temas. En cada tema se facilita una ficha que
presenta su estructura-organizacin:
Objetivos de aprendizaje.
Bibliografa bsica para complementar el tema.
Programacin del tema.
Conceptos clave.
Ejemplos.
Los apartados de la ficha estn hipervinculados. Tambin estn vinculados los ejemplos propuestos que aparecen en el desarrollo de los epgrafes de cada tema. Observar que el puntero de
ratn cambia de forma. Al hacer clic sobre el texto vinculado se acceder a la parte del documento
donde se desarrolla el contenido.
14
Esperamos que los contenidos tratados en la Gua Didctica de Estadstica Descriptiva para las
Ciencias Sociales resulten de utilidad al lector.
TEMA 1
INTRODUCCIN
16
Introduccin.
Ficha
17
OBJETIVOS DE APRENDIZAJE.
Conocer y distinguir las dos ramas bsicas de la estadstica, la estadstica
descriptiva y la inferencia estadstica, intuyendo como interacciona entre
ambas la teora matemtica de la probabilidad creando modelos.
Distinguir entre datos de tipo cualitativo y cuantitativo, discreto y continuo,
aprendiendo a ordenarlos en distribuciones de frecuencias agrupadas y sin
agrupar.
Construir histogramas y polgonos acumulativos partir de una distribucin de
frecuencias agrupada en intervalos.
Ficha
18
Introduccin.
Ficha
19
DATOS empresa B
0 1 1 2 9 1
0 0 1 1 0 0
1 1 0 1 1 1
9 9 9 0 0 1
0 0 1 1 9 0
Ficha
20
Introduccin.
Ficha
21
N das baja
empresa A N trabajadores
Valores
Frecuencia
0
1
2
3
4
5
Porcentaje
2
5
7
4
1
1
20
Total
n trabajadores A
8
7
6
5
4
3
2
1
0
10
25
35
20
5
5
100
Porcentaje
acumulado
10
35
70
90
95
100
7
5
4
2
n das de baja A
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
22
Introduccin.
N das baja
empresa B N trabajadores
Valores
Frecuencia
0
1
2
9
11
13
1
5
30
Total
14
n trabajadores
12
Porcentaje
11
36,67
43,33
3,33
16,67
100,00
Porcentaje
acumulado
36,67
80,00
83,33
100,00
13
10
8
5
6
4
1
2
0
0
n das de baja B
Ficha
23
N trabajadores
Valores
0
1
2
3
4
5
Total
Frecuencia
Porcentaje
2
5
7
4
1
1
20
10
25
35
20
5
5
100
N das
baja B
N trabajadores
Valores
Frecuencia
0
1
2
9
Total
Porcentaje
11
13
1
5
30
36,67
43,33
3,33
16,67
100
Porcentaje
Clculo de
acumulado
Media
10
0
35
5
70
14
90
12
95
4
100
5
40
Clculo de
Varianza
Porcentaje
Clculo de
acumulado
Media
36,67
0
80,00
13
83,33
2
100,00
45
60
Clculo de
Varianza
44
13
0
245
302
8
5
0
4
4
9
30
Ficha
24
Introduccin.
DATOS EMPRESA A
Media
2,00
Varianza
1,5
Desviacin tpica 1,22
DATOS EMPRESA B
Media
2,00
Varianza
10,0667
Desviacin tpica 3,17
Ficha
25
Ficha
26
Introduccin.
Ficha
27
Ficha
28
Introduccin.
MUESTRA POBLACIN
Tcnicas muestreo
MUESTRA
ALEATORIA
DE
TAMAO ADECUADO.
Ficha
29
Ficha
30
Introduccin.
Estadstico: una medida que se pueda calcular a partir de los datos reales generados por una variable y que resuma y d una propiedad de
ese conjunto de datos.
Ficha
31
Ficha
32
Introduccin.
DATOS
xi
Ficha
33
ORDINALES
NOMINALES o ATRIBUTOS
Ejemplo 1.2.
Ejemplo 1.3.
Ficha
34
Introduccin.
VARIABLE
N DATOS
sin elaborar
( xi )iN=1
x1 , x2 ,L , x N
k DATOS diferentes
ordenados
de menor a mayor
( xi )
k
i =1
DISTRIBUCIN
DE
FRECUENCIAS
Ficha
35
DISTRIBUCIN DE FRECUENCIAS
Organizacin de la serie de DATOS
SIN AGRUPAR:
Ficha
36
Introduccin.
ni
Ni
(frecuencia absoluta)
i
Ni = n j
frecuencia
frecuencia acumulada (i
j =1
= 1, 2,, k)
FRECUENCIAS RELATIVAS:
fi
ni
fi =
N
Fi
Ni
Fi = f j ; Fi =
j =1
N
i
fi 100
porcentaje
Fi 100
porcentaje
(frecuencia relativa)
acumulado
Ficha
37
VARIABLE X : ( xi , n
k
i i =1
Ficha
38
Introduccin.
Re = x M x m
ln N
Sturges k =
+1
ln 2
k = N (N no muy grande)
Re
a=
k
Ficha
39
NOTACIN INTERVALOS
Intervalo isimo:
Li 1 + Li
m.d .c = x i =
2
tervalo).
Amplitud del intervalo isimo:
a i = Li Li 1 .
Ejemplo 1.5.
Ficha
40
Introduccin.
grfico de barras.
Diagrama en escalera (acumulativo).
DATOS AGRUPADOS:
HISTOGRAMA.
Polgono acumulativo.
Ficha
41
ni
densidad de frecuencia d i =
ai
fi
di =
ai
Si la amplitud de todos lo intervalos es la misma (a constante), la altura de cada rectngulo puede ser la frecuencia del intervalo.
Ejemplo 1.6.
Ejemplo 1.7.
Ficha
42
Introduccin.
ni
di =
ai
densidad frecuencia
HISTOGRAMA
rea
ni
ai
Li 1
Li
Intervalos
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
43
Conceptos clave.
Datos de naturaleza continua.
Datos de naturaleza discreta.
Densidad de frecuencia.
Distribucin de frecuencias agrupada.
Distribucin de frecuencias sin agrupar.
Estadstica Descriptiva.
Frecuencia absoluta acumulada.
Frecuencia absoluta.
Frecuencia relativa (porcentaje).
Frecuencia relativa acumulada.
Histograma.
Inferencia Estadstica.
Intervalo.
Marca de clase.
Polgono acumulativo.
Variables cualitativas.
Variables cuantitativas.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
44
Introduccin.
EJEMPLOS.
Ejemplo 1.1. Clasifica las siguientes variables en cualitativas o cuantitativas, identificando posibles valores de esas variables y elementos de la poblacin o muestra sobre la que observaramos o mediramos la variable:
a) Edad
b) Forma de pago al realizar una compra
c) Estado civil
d) Nmero de habitaciones por casa
e) Salario mensual percibido por los supervisores de ventas de una consultora.
f) Medio de transporte utilizado para ir a clase por los estudiantes del campus de Tarongers
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
Texto
45
Ficha
Texto
46
Introduccin.
Ficha
Texto
47
Ejemplo 1.3. Preguntadas 300 personas acerca de su estado civil, 145 contestaron estar solteras, 100 casadas, 30 divorciadas y 25 viudas.
a) Identifica la variable estadstica (V.E.) y clasifcala, modalidades del carcter.
b) Clasifica la V.E. en una tabla estadstica o distribucin de frecuencias: obtener frecuencias absolutas, relativas y acumuladas.
Solucin: a) X: Estado Civil. Variable cualitativa con cuatro modalidades: Soltera, Casada, Divorciada, Viuda.
Ficha
Texto
48
Introduccin.
Ficha
Texto
49
Ficha
Texto
50
Introduccin.
Ficha
Texto
51
ni
0-10
100
10-50
200
Ficha
Texto
TEMA 2
ANLISIS DE DATOS
UNIDIMENSIONALES
53
Ficha
54
OBJETIVOS DE APRENDIZAJE.
Aprender a calcular e interpretar los estadsticos descriptivos ms importantes.
Conceptos de dispersin absoluta y dispersin relativa.
Comparar dispersin y datos tipificados entre dos o ms variables.
Informacin que aportan la media y la varianza en cuanto a la distribucin
de los datos de una variable alrededor de la media (Regla de Tchebysheff).
Estudiar cmo se ven afectados los estadsticos y coeficientes al transformar
linealmente los datos de una variable.
Ficha
55
Ficha
56
X : (x
Distribucin de frecuencias
X : ( xi , n
1 N
x = xi
N i =1
N
i i =1
k
i i =1
1 k
x = x i ni
N i =1
k
Tambin:
x = xi f i
i =1
x i m.d .c.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
57
PROPIEDADES DE LA MEDIA
1. La media es el CENTRO DE GRAVEDAD de la distribucin (c.d.g):
N
N 1 , N 2 ,L ,N p
con
Nj = N
y medias
j =1
x1 , x2 ,L , x p ,
la me-
1 p
xT = x j N j
N j =1
ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2006.
Ficha
58
Re : x m a x M
Ficha
59
DISPERSIN: LA VARIANZA.
En una V.E. con N datos
X : (x
N
i i =1 ,
Ficha
60
VARIANZA
s2:
X : (x
N
i i =1
1 N
2
s = ( xi x )
N i =1
2
Distribucin de frecuencias:
X : ( x i , n i )i = 1
k
1 k
2
s = ( x i x ) ni
N i =1
2
Tambin:
s = ( xi x ) f i
2
i =1
Ficha
61
s:
2. Se demuestra que:
1 N 2
s = xi x 2
N i =1
2
o bien
1 k 2
s = x i ni x 2 . Esta
N i =1
2
Ficha
62
s2
s,
homogneos.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
63
Ficha
64
: ( x i )i =1 ,
N
su media
x 0
y su desviacin tpica
s,
se
g0 =
s
|x|
Ejemplo 2.3.
Ejemplo 2.4.
Ficha
65
2.1.2. Momentos.
Dada una variable estadstica
X : (x
N
i i =1 ,
X : ( xi , n
k
i i =1
con su media
x,
se definen:
MOMENTOS ORDINARIOS DE ORDEN p
1 N p
a p = xi
N i =1
1 k p
a p = x i ni
N i =1
con p entero p 0
1 N
p = 1 a1 = xi = x
N i =1
1 N 2
p = 2 a2 = xi
N i =1
(media)
Ficha
66
1 N
p
m p = ( xi x )
N i =1
1 k
p
m p = ( x i x ) ni
N i =1
con p entero p 0
p = 1 m1
p = 2 m2
p = 3 m3
p = 4 m4
1 N
= ( xi x ) = 0
N i =1
1 N
2
= ( xi x ) = s 2
N i =1
1 N
3
= ( xi x )
N i =1
1 N
4
= ( xi x )
N i =1
( varianza)
Ficha
67
1 N
1 N 2
2
s = m2 = ( xi x ) = xi x 2 = a 2 a12
N i =1
N i =1
2
Ficha
68
Ficha
69
ASIMETRA A LA DERECHA
ASIMETRA A LA IZQUIERDA
media
media
SIMETRA
media
Ficha
70
1 N
3
m 3 = ( xi x )
N i =1
se define
m3
g1 = 3
s
Si m3 > 0 g 1 > 0 ASIMETRA A LA DERECHA
SIMETRA m3 = 0 g 1 = 0 (observar grfico)
Si m3 < 0 g 1 < 0 ASIMETRA A LA IZQUIERDA
Ficha
71
Ficha
72
1 N
4
m 4 = ( xi x )
N i =1
se defi-
m4
g2 = 4
s
Para medir con este coeficiente el grado de apuntamiento de una distribucin se utilizarn dos MODELOS de distribucin de REFERENCIA:
MODELO NORMAL: distribucin campaniforme con un apuntamiento de
g 2 = 3.
MODELO UNIFORME: distribucin horizontal con un apuntamiento de
g 2 = 1,8 .
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
73
Apuntamiento = 3
MODELO NORMAL
Apuntamiento = 1,8
MODELO UNIFORME
Ficha
74
De esta forma se seguirn los siguientes criterios para medir el apuntamiento de una
distribucin:
Apuntamiento<3 y >1,8
Ficha
75
Ejemplo 2.6.
Apuntamiento <1,8
Ficha
76
X : ( x i )i = 1
N
1.
N
X : ( xi )i =1 X ( xi = xi + c )
2.
X : (x
3.
X : ( xi )i =1 X ( xi = kxi + c )
) X ( xi = kxi )
N
i i =1
cambio de escala
1. X' = X + c
2. X' = kX
3. X' = kX + c
(cambio de origen)
(cambio de escala)
(transformacin lineal completa)
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
77
1. x ' = x + c
MEDIA
VARIANZA
2. x ' = kx
3. x = kx + c
(cambio de origen)
(cambio de escala)
(transformacin lineal completa)
1. s X2 = s X2
(cambio de origen)
2. s X2 = k 2 s X2
(cambio de escala)
3. s X2 = k 2 s X2
Ficha
78
DESVIACIN
TPICA
1. s X = s X
(cambio de origen)
2. s X = k s X
(cambio de escala)
3. s X2 = k s X
1. m p ( X ) = m p ( X )
MOMENTOS
( cambio de origen)
2. m p ( X ) = k p m p ( X ) ( cambio de escala)
3. m p ( X ) = k p m p ( X ) ( transformacin lineal completa)
Ejemplo 2.7.
Ejemplo 2.8.
Ficha
79
1. X' = X + c
(cambio de origen)
sX
sX
1. g 0 ( X ) =
=
g0 ( X )
| x | | x + c |
2. X' = kX
(cambio de escala)
sX | k | sX sX
2. g 0 ( X ) =
=
=
= g0 ( X )
| x | | k || x | | x |
Ficha
80
1. X' = X + c
(cambio de origen)
m3 ( X ) m3 ( X )
1. g 1 ( X ) =
=
= g1( X )
3
3
sX
sX
2. X' = kX
(cambio de escala)
m 3 ( X ) k 3 m 3 ( X ) m 3 ( X )
=
=
= g1(X )
Si k > 0 g 1 ( X ) =
3
3 3
3
sX
k sX
sX
2.
3
3
Si k < 0 g ( X ) = m 3 ( X ) = k m 3 ( X ) = k m 3 ( X ) = g ( X )
1
1
3
3
3
3 3
|
|
s
k
s
k
s
X
X
X
Si k es negativo cambia el signo de la asimetra, pero el grado de asimetra no.
Ficha
81
3. X' = kX + c
m 3 ( X ) k 3 m 3 ( X ) m 3 ( X )
=
=
= g1(X )
Si k > 0 g 1 ( X ) =
3
3 3
3
sX
k sX
sX
3.
3
3
(
)
(
)
m
X
k
m
X
k
m3 ( X )
Si k < 0 g ( X ) = 3
3
=
=
= g1(X )
1
3
3
3
3 3
k sX
| k | sX
sX
Ficha
82
1. X' = X + c
(cambio de origen)
m4 ( X ) m4 ( X )
1. g 2 ( X ) =
=
= g2( X )
4
4
sX
sX
2. X' = kX
(cambio de escala)
m4 ( X ) k 4 m4 ( X )
2. g 2 ( X ) =
=
= g2( X )
4
4 4
sX
k sX
3. X' = kX + c
m4 ( X ) k 4 m3 ( X )
3. g 2 ( X ) =
=
= g2( X )
4
4 4
sX
k sX
El coeficiente de apuntamiento es invariante por transformacin lineal.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
83
x , s2
zi =
zi
xi x
s
xi
a la media x , en
zi
es positivo, el valor
Si un valor
zi
es negativo, el valor
xi
xi
Ficha
84
Si se tipifican los N valores de una V.E., se obtendrn N puntuaciones tipificadas que constituyen otra variable que se denominar:
VARIABLE ESTADSTICA TIPIFICADA
Z : ( z i )i =1
N
z =0
s Z2 = 1
Ficha
85
X (x )
x sX
N
i i =1
VARIABLE TIPIFICADA
Z (z i )
Y ( y i )i =1
y sY
N
N
i =1
z = 0 sZ = 1
Ejemplo 2.10.
Ejemplo 2.11.
Ficha
86
media
1; al menos un porcentaje
de 1 2
k
x ks ,
Ficha
87
Para
Para
1
= 0 ,75 ms del 75% de los datos de una V.E. estar
2
k
en el intervalo x 2 s .
1
k = 2,5 1 2 = 0 ,84 ms del 84% de los datos de una V.E. estar
k
en el intervalo x 2 ,5 s
k=2
k=3
1
k
x 3s .
Ficha
88
Ficha
89
d i (o
[Li 1, Li [ de densidad d i
y amplitud
a i se dar el siguiente:
d i +1
ai
Mo = Li 1 +
d i 1 + d i + 1
Ejemplo 2.13.
Ficha
90
CUANTILES: Q
DEFINICIN GENERAL: Dada una V.E.
X : ( x i )i = 1
N
( 100 )
x.
(( 1 ) 100 )
x.
NOTACIN:
Q = x
(cuantil de orden
Ficha
91
DETERMINACIN DE CUANTILES.
Sea una V.E.
X : ( xi )i =1
N
X : ( xi , ni , N i , Fi )i =1
k
su dis-
xi
Q , el primer va-
Ni
Fi
( Fi 100 )
superior a
superior al
( 100 ),
N ).
Ficha
92
xi
Fi
( Fi = ),
xi + xi +1
Q =
, es decir el punto medio entre x i
2
la distribucin x i +1 .
y el siguiente valor de
Ficha
93
Si la distribucin contiene muchos datos diferentes, AGRUPADOS EN INTERVALOS y se pretende determinar los cuantiles manualmente sobre la
distribucin agrupada, se proceder como sigue:
se determinar el intervalo o clase del cuantil
[Li 1 , Li [
como el
Fi
superior
aproximacin al cuantil:
Fi 1
Q = Li 1 +
ai
fi
N N i 1
Q = Li 1 +
ai
ni
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
94
= 0 ,5
Me = Q0 ,5
Es decir, la MEDIANA es un valor que divide por la MITAD la distribucin (MEDIDA DE POSICIN CENTRAL).
CUARTILES (Ci): los cuartiles son tres cuantiles que dividen la distribucin en cuartos. Son los cuantiles de rdenes
C1 = Q0 ,25 C 2 = Q0 ,50
C 3 = Q0 ,75
Ejemplo 2.15.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
95
Conceptos clave.
Ficha
96
EJEMPLOS.
Ejemplo 2.1.
2.1.A. Calclese la media y la varianza de las siguientes series de valores:
X: 1
Y: 6
Z: -19
W: 2
Solucin:
2
7
4
2
3
8
7
3
4
9
12
2
x = 3 s X2 = 2
z = 5 s Z2 = 177 ,2
5
10
21
6
y = 8 sY2 = 2
w = 4 sW2 = 4 ,2857
Ficha
Texto
97
Solucin:
x = 3 ,5
Frecuencia
23
10
34
40
45
10
1
s = = 0 ,33
3
2
Ficha
Texto
98
Frecuencia
0 15
Solucin:
15 25
12
25 30
12
x 20 ,5
frecuencia relativa
0,2
0,4
0,3
0,1
Ficha
Texto
99
Ejemplo 2.2.
2.2.A. Las dos muestras siguientes tienen la misma dispersin absoluta
(desviacin tpica y varianza) pero diferente dispersin relativa (coeficiente
variacin):
a) 1
b) 1321
1322
1323
1324
1325
1326
1327
Sin realizar ningn clculo: razona cul de ellas tendr menor dispersin relativa, es decir, qu conjunto de datos es ms homogneo. Tiene algo que
ver con la distancia de los datos al origen y el valor de las medias respectivas?
Por qu tienen la misma dispersin absoluta? (distancia de los datos a la
media).
En un cambio de origen, la dispersin absoluta (S) no cambia pero la disper-
s
sin relativa s . Calcula la media y varianza de las dos series de datos y
x
comprueba lo anterior.
Ficha
Texto
100
2.2.B. Las dos muestras siguientes tienen diferente dispersin absoluta pero
la misma dispersin relativa:
a) 1
b) 5
10
15
20
25
30
35
Sin realizar ningn clculo: razona cul de ellas tendr menor dispersin absoluta.
Por qu tienen la misma dispersin relativa? Guardan alguna proporcin
los datos de a) con los datos de b)? Tiene esto algo que ver con un cambio
de escala?
En un cambio de escala, la dispersin absoluta s cambia pero la relativa no
cambia. Calcula la media y varianza de las dos series de datos y comprueba
lo anterior.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
Texto
101
Ficha
Texto
102
Ficha
Texto
103
c) 1
Ficha
Texto
104
Ejemplo 2.6. Explica cul de las siguientes variables estadsticas tiene una
curva de frecuencias ms aproximada al modelo normal, comentando en cada caso la forma de la curva de frecuencias correspondiente (asimetra y
apuntamiento):
1
1
2
3
A ) m2 = ( xi x ) ni = 144 m3 = ( xi x ) ni = 0
N
N
1
4
m4 = ( xi x ) ni = 103.680
N
B ) s = 12
m3 = 936 m4 = 20.736
s = 10
C)
m3 = 85 m4 = 29.740
Ficha
Texto
105
Ejemplo 2.7. Dada la variable estadstica X de media 15 y varianza 4, calcular la media y la varianza de las siguientes variables:
a) Z = X + 3
b) Y = 4 X
c) Y = -4X
d) W = 6 X 1
Solucin:
a)
z = 18
s Z2 = 4
b)
y = 60
sY2 = 64
c)
y = 60
sY2 = 64
d)
w = 89
sW2 = 144 )
Ficha
Texto
106
Ejemplo 2.8. Analizadas las ventas (en miles de u.m.) en 1999 de 100
empresas de un determinado sector se ha obtenido una media de 500 u.m.
y una desviacin tpica de 3,5 u.m.
Calcular la media y la varianza para el ao 2000 en los siguientes supuestos:
a) Las ventas sufren un aumento del 20% en todas las empresas.
b) Las ventas se incrementan en todas las empresas en 100 miles de u.m.
Solucin: a)
b)
Ficha
Texto
107
Ejemplo 2.9. Tipifica los valores obtenidos en el ejemplo 2.3 para la casa B
y comprueba que la media de las puntuaciones tipificadas es 0 y la desviacin tpica 1.
Ficha
Texto
108
Ficha
Texto
109
Ficha
Texto
110
Ejemplo 2.12. Se lleva a cabo un estudio para determinar el tiempo necesario para realizar una operacin especfica en una empresa. El tiempo necesario (en minutos) para realizar la operacin se midi para N = 40 trabajadores (entre los que ests incluido t) y los resultados fueron los siguientes:
x = 13,8
s = 1,7
x ks (regla de Tchebysheff).
Ficha
Texto
111
Ficha
Texto
112
X : 2, 2, 3, 2, 6, 7, 6
b)
1,5 2,5
12
Intervalos
0,2 0,3
0,3 0,4
2,5 3,0
12
0,4 0,5
Intervalos
0,0 1,5
Solucin:
Frecuencia
a ) Mo = 2
Frecuencia
10
40
8
b ) Mo = 2 ,5 Mo = 0 ,35 o 0 ,344
Ficha
Texto
113
Ejemplo 2.14. Se les pide a doce economistas que den una prediccin sobre el incremento del IPC para el ao 2003. Dichas predicciones fueron:
4,0
3,9
3,2
3,5
3,8
3,3
3,5
3,4
3,7
3,6
3,4
3,2
Ficha
Texto
114
Ejemplo 2.15. Calclese la moda y los cuantiles de orden 0,25, 0,50 (mediana) y 0,75 (cuartiles) en los ejemplos 4 y 5 del tema 1.
Ficha
Texto
TEMA 3
MEDIDAS DE CONCENTRACIN
116
Medidas de concentracin.
Ficha
117
OBJETIVOS DE APRENDIZAJE.
Estudiar como se reparte o distribuye la masa o volumen total de la variaN
i =1
Ficha
118
Medidas de concentracin.
Ficha
119
k
i i =1
i =1
i i
Instrumentos para medir la concentracin: la concentracin se medir comparando dos indicadores que se obtendrn a partir de la distribucin de frecuencias de los valores de la variable:
Uno relativo a los N elementos de la poblacin y que se obtiene a partir
de las frecuencias acumuladas:
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
120
Medidas de concentracin.
N i = n j pi =
j =1
Ni
x100
N
(i = 1, 2,, k)
pk=100 siempre.
pi representa el porcentaje acumulado de elementos de la poblacin
hasta el lugar i-simo (Fi x 100).
El otro relativo a la masa o volumen de variable y que se obtiene a partir de la cantidad de variable (xi ni) que van acumulando los elementos
de la poblacin:
i
vi = x j n j qi =
j =1
vi
x100
vk
(i = 1, 2,, k)
qk=100 siempre.
qi representa el porcentaje acumulado de volumen de variable hasta el
lugar i-simo.
vi es la cantidad de variable acumulada hasta el lugar i-simo de la distribucin (ordenada de menor a mayor).
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
121
i =1
i i
Ficha
122
Medidas de concentracin.
Ficha
123
IG =
(p
i =1
qi )
k 1
p
i =1
Concentracin mnima I = 0
Concentracin mxima I = 1
G
Ejemplo 3.2.
Ficha
124
Medidas de concentracin.
Conceptos clave.
Concentracin.
Curva de Lorenz.
ndice de Gini.
Ficha
125
EJEMPLOS.
Ejemplo 3.1. Observa las curvas de Lorenz representadas a continuacin:
q
Ficha
Texto
126
Medidas de concentracin.
Ejemplo 3.2. Los salarios (en euros) de los obreros de cierta empresa se
distribuyen como sigue:
n obre- Masa
ros
salarial
540 660
4
2280
660 780
6
4200
780 900
5
4320
Salarios
Ficha
Texto
TEMA 4
ANLISIS DE DATOS
MULTIDIMENSIONALES
128
Ficha
129
OBJETIVOS DE APRENDIZAJE.
Manejo de tablas de correlacin o distribuciones de frecuencias conjuntas
para dos variables numricas.
Obtencin de las distribuciones marginales y condicionadas a partir de la
conjunta.
Clculo e interpretacin de los estadsticos de la variable bidimensional, especialmente de la covarianza y del coeficiente de correlacin lineal.
Aspecto y propiedades de la matriz de varianzas covarianzas.
Clculo de los estadsticos de una variable combinacin lineal de otras dos.
Cmo observar la independencia entre dos variables o atributos a partir de
la distribucin conjunta.
Estudio del grado de asociacin entre dos atributos a partir de la tabla de
contingencia, calculando el estadstico ji cuadrado y el coeficiente de contingencia de Pearson.
Ficha
130
Ficha
131
4.1. Representacin de datos bidimensionales: matriz de datos, tablas de correlacin y contingencia, grfico de dispersin.
VARIABLE ESTADSTICA BIDIMENSIONAL (V.E.B.):
Si se observan y miden simultneamente dos caractersticas o propiedades
sobre los mismos elementos de una poblacin se obtiene una V.E.B. (X, Y)
que generar una serie de N datos de aspecto bidimensional
( xi , yi )iN=1
V.E.B.
(X, Y)
(x , y )
i
N
i =1
( x1 , y1 ),( x 2 , y 2 ),L ,( x N , y N )
Ficha
132
MATRIZ DE DATOS
X
x1
x2
M
Y
y1
y2
M
xi
M
xN
yi
M
yN
Si X tiene k valores
diferentes.
Si Y tiene m valores
diferentes
( xi , y j ) nij
i = 1 ,2 , L , k
j = 1 ,2 , L , m
nij
veces
TABLA DE CORRELACIN
y1
y2
x1
n11
n12
L n1 j
L n1 m
x2
n 21
n 22
L n2 j
L n2 m
M
xi
M
ni 1
nij
M
L nim
xk
nk 1
ni 2
yj
ym
M
nk 2
L n kj
k
L n km
m
n = N
i =1 j =1
ij
Ficha
133
GRFICO DE DISPERSIN
N
Parejas de valores ( xi , y i )i =1
grfico dispersin
Ejemplo 4.1.
Ficha
134
( X ,Y ) :
(( x , y
Ejemplo 4.1.
Ficha
135
DISTRIBUCIONES MARGINALES.
X \Y
y1
y2
x1
n11
n12
n1j
n1m n1
x2
n21
n22
n2j
n2m n2
yj
ym
ni
MARGINAL X
valores
frecuencia
xi
ni
ni = suma
por filas
(n )
ij
xi
ni1
ni2
nij
nim
ni
xk
nk1
nk2
nkj
nkm nk
nj
n1
n2
nj
nm
ni = nij
j =1
ni
f i =
N
frec. relativa
Ficha
136
X \Y
y1
y2
x1
n11
n12
n1j
x2
n21
n22
n2j
xi
ni1
ni2
yj
nij
ym
ni
MARGINAL DE Y:
n1m n1 valores
frecuencia
n2m n2
n j = suma
nim
ni
yj
n j
por columnas
(n )
ij
n j = nij
i =1
xk
nk1
nk2
nkj
nkm
nk
nj
n1 n2
nj
nm
f j =
n j
N
frec. relativa
Ficha
137
DISTRIBUCIONES CONDICIONADAS
Y
X
VARIABLE X CONDICIONAy1
y2
yj
ym
ni
x1
n11
n12
n1j
n1m n1
x2
n21
n22
n2j
n2m n2
xi
ni1
ni2
nij
nim
ni
xk
nk1
nk2
nkj
nkm
nk
nj
n1
n2
nj
nm
DA A UN VALOR DE Y.
X/yj (j fijo):
valores
frecuencia :
columna j - sima nij
( i = 1,2 ,L , k )
xi
ni / j
fi / j
nij
=
n j
fi / j
f ij
=
f j
Ficha
138
Y
X
VARIABLE Y CONDICIONADA A
y1
y2
yj
ym
ni
x1
n11
n12
n1j
n1m n1
x2
n21
n22
n2j
n2m n2
xi
ni1
ni2
nij
nim
ni
xk
nk1
nk2
nkj
nkm
nk
nj
n1
n2
nj
nm
Ejemplo 4.2.
UN VALOR DE X.
Y/xi (i fijo):
yj
valores
frecuencia :
fila i - sima nij
nj / i
( j = 1,2 ,L , m )
f j/i
nij
=
ni
f j/i
f ij
=
f i
Ejemplo 4.3.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
139
INDEPENDENCIA ESTADSTICA.
CARCTERIZACIN DE LA INDEPENDENCIA. Dada una V.E.B.
Y
X
( X ,Y ) :
y1
y2
yj
ym
ni
x1
n11
n12
n1j
n1m n1
x2
n21
n22
n2j
n2m n2
(( x , y
i
); nij )i =1 j =1
k
X e Y son INDEPENDIENTES
si:
f ij = f i f j i , j
es decir:
xi
ni1
ni2
nij
nim
ni
xk
nk1
nk2
nkj
nkm
nk
nj
n1
n2
nj
nm
nij ni n j
=
i , j
N N N
Equivalente a:
nij =
ni n j
N
Ficha
140
PROPIEDAD.
Si dos variables X e Y son independientes, la frecuencias relativas condicionadas coinciden con las respectivas marginales.
(f )
(f )
i=
= ( f i )i =1
X e Y independientes entonces:
i/ j
j/i
j =1
= ( f j ) j =1
(para cada
X / yj )
(para cada Y / x )
i
Es decir:
las columnas de frecuencias relativas condicionadas coinciden entre s y,
a su vez, con las frecuencias relativas de la marginal X.
las filas de frecuencias relativas condicionadas coinciden entre s y, a su
vez, con las frecuencias relativas de la marginal Y.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
141
f ij = f i f j i , j , por tanto:
f i f j = f ij i , j
Ficha
142
Y
X
la caracterizacin de la independencia y de la propiedad que relaciona las distribuciones condicionadas con las marginales.
Solucin:
Obsrvese que las columnas de frecuencias conjuntas son claramente proporcionales, al igual que las filas de frecuencias conjuntas.
Ficha
143
nij =
Y
X
ni
12
nj
6 8
4=
12
ni n j
N
Por ejemplo:
n 2 n 1
n21 =
N
38
2=
12
Ficha
144
fi
2/8
1/4
3/12
2/8
1/4
3/12
4/8
2/4
6/12
nj
12
ni
f i =
N
nij
fi / j =
n j
frec. relativa
2 1 3
= =
8 4 12
Ficha
145
ni
2/3
1/3
2/3
1/3
4/6
2/6
fj
8/12
4/12
12
f j =
f j/i
n j
N
nij
=
ni
frec. relativa
2 2 4 8
= = =
3 3 6 12
Ficha
146
( X ,Y ) :
( xi , y i )
(( x , y
N parejas
( k m) parejas diferentes
N
i =1
); nij )i =1 j =1
k
Definimos:
MOMENTOS ORDINARIOS DE ORDEN (p + q)
1 N p q
a pq = xi y i
N i =1
1 k m p q
a pq = xi y j nij
N i =1 j =1
con p y q enteros
p,q 0
Ficha
147
1 N
1 N
a10 = xi = x a01 = y i = y medias marginales
N i =1
N i =1
1 N
1 k m
o bien a11 =
xi y j nij
a 20 a02
a11 = xi y i
N i =1
N i =1 j =1
Ficha
148
1 k m
p
q
o m pq =
(
x
x
)
(
y
y
)
nij
i
j
N i =1 j =1
con p y q enteros p , q 0
1 N
m pq = ( xi x ) p ( y i y ) q
N i =1
1 N
m20 = ( xi x ) 2 = s X2
N i =1
VARIANZA marginal de Y
1 N
m02 = ( y i y ) 2 = sY2
N i =1
COVARIANZA sXY
1 N
m11 = ( xi x )( y i y )
N i =1
1 k m
o bien m11 =
( xi x )( y j y )nij
N i =1 j =1
s XY = m11
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
149
LA COVARIANZA sXY
La covarianza es el momento central de orden dos m11.
s XY
1 N
= m11 = ( xi x )( y i y )
N i =1
La covarianza es un estadstico conjunto que mide la covariacin (variabilidad conjunta) lineal de las variables X e Y.
La covarianza puede ser positiva o negativa. Su signo marca la direccin
de la covariacin.
s XY > 0 , covariacin positiva: si la variable X crece, entonces la tendencia de la variable Y es a crecer tambin.
s XY < 0 ,
Ficha
150
grfico dispersin
grfico dispersin
covarianza positiva
2,71
covarianza negativa
y3
y3
0
0
4
x
-2,71
Ficha
151
s XY = 0 ,
grfico dispersin
covarianza cero pero dependientes
y 2
y
2
4; 2
4; 2
medias
c.d.g.
X e Y independientes
s XY = 0
Ficha
152
PROPIEDADES DE LA COVARIANZA.
1. Clculo de la covarianza: se demuestra fcilmente que la covarianza se
puede determinar como:
s XY
o en forma de momentos:
s XY
1 N
= xi y i x y
N i =1
= m11 = a11 a10 a01
2. Transformacin lineal:
X = k1 X + c1
s X ' Y ' = k1k 2 s XY
Y = k 2Y + c2
siendo
k 1 , k 2 , c1 , c 2
nmeros reales
Por tanto la covarianza es sensible al cambio de escala y su valor depende de las unidades de medida de las variables X e Y. Es un estadstico de
tipo absoluto.
3. Obviamente
s XY = sYX .
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
153
r x
m=
y
MATRIZ DE VARIANZAS COVARIANZAS
sX
S =
s XY
2
s XY
2
sY
Ejemplo 4.4.
Ejemplo 4.6.
x = a 10
y = a 01
s X2 = m 20 = a 20 a 102
sY2 = m02 = a 02 a 012
s XY = m11 = a 11 a 10 a 01
Ficha
154
r x
m=
y
sX
S =
s XY
s XY
2
sY
su vector de me-
Z = k 1 X + k 2Y + c
nmeros reales.
La MEDIA y la VARIANZA de Z se pueden determinar como sigue:
z = k1 x + k 2 y + c
s Z2 = k 12 s X2 + k 22 sY2 + 2k 1 k 2 s XY
Solo si la covarianza es cero
s Z2 = k12 s X2 + k 22 sY2 .
As, si X e Y independientes
s XY = 0
y entonces:
s Z2 = k12 s X2 + k 22 sY2 .
Ejemplo 4.8.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
155
sX
S =
s XY
2
s XY
2
sY
s XY
rXY =
s X sY
r es un estadstico de tipo relativo, es decir, independiente de las unidades de medida de las variables X e Y.
Ficha
156
1 r 1.
r=1
r = -1
Ficha
157
2. Transformacin lineal:
X = k 1 X + c1
rX ' Y ' = rXY .
Y = k 2Y + c2
Donde k1 , k2 y c
son nmeros reales, con k1 y k2 del mismo signo. Es decir, que el coeficiente
es invariante por transformacin lineal (salvo en el signo).
MATRIZ DE CORRELACIN.
Dada (X, Y) una V.E.B. y el coeficiente de correlacin lineal
define:
rXX
R=
rYX
rXY 1
=
rYY rXY
s XY
, se
rXY =
s X sY
rXY
MATRIZ DE CORRELACIN
det( R ) = 1 rXY2 0
Ejemplo 4.9.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
158
4.5. ASOCIACIN.
TABLA DE CONTINGENCIA
B
A
b1
b2
bj
bm
ni
a1
n11
n12
n1j
n1m n1
a2
n21
n22
n2j
n2m n2
ai
ni1
ni2
nij
nim
ni
ak
nk1
nk2
nkj
nkm
nk
nj
n1
n2
nj
nm
N
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
159
A\B
b1
b2
bj
bm
ni
a1
n11
n12
n1j
n1m n1
a2
n21
n22
n2j
n2m n2
A y B independientes si
nij =
ni n j
N
ESTADSTICO
ai
ni1
ni2
nij
nim
ni
ak
nk1
nk2
nkj
nkm
nk
nj
n1
n2
nj
nm
i , j .
Ficha
160
Se denominar:
nij
ni n j
Eij =
N
2 =
I =1 j =1
( Eij nij )2
Eij
2 0
Ficha
161
2
N + 2
CP =
Ficha
162
C MAX
(kk )
su valor
k 1
=
.
k
Ejemplo 4.11.
Ficha
163
Conceptos clave.
Estadstico .
Independencia estadstica.
Matriz de correlacin.
Matriz de varianzas-covarianzas.
Tabla de contingencia.
Tabla de correlacin.
Transformacin lineal.
Ficha
164
EJEMPLOS
Ejemplo 4.1. Ordenar la siguiente serie de datos bidimensionales en una
distribucin conjunta o distribucin de frecuencias bidimensional (tabla de
correlacin):
X
Y
Solucin:
1
1
1
2
2
1
2
2
3
1
3
2
1
1
2
1
3
2
2
1
Y
X
1
2
3
1
2
3
1
2
1
1
2
Ficha
Texto
165
Ejemplo 4.2.
a) Obtener las distribuciones de frecuencias marginales de X e Y a partir de
la distribucin conjunta del ejemplo 4.1.
b) Obtener las siguientes distribuciones condicionadas a partir de la conjunta
del ejemplo 4.1.: X / y = 1 e Y / x = 2
Ficha
Texto
166
Ejemplo 4.3. Hemos observado la retribucin mensual de los 40 trabajadores de una empresa segn su antigedad en la misma obteniendo la siguiente tabla de correlacin o distribucin de frecuencias bidimensional:
Y: retribucin mensual (en euros.)
X: antigedad en la empresa (en aos)
a) Qu porcentaje de emY 420-600 600-780 780-960 960-1200
pleados tiene una antigeX
mdc 510
690
870
1080
dad entre 2 y 4 aos y una
retribucin entre 600 y 780
02
7
3
1
0
mdc 1
euros? (conjunta)
24
3
46
5
Ficha
Texto
167
Ejemplo 4.4. Determina el vector de medias y la matriz de varianzas covarianzas de la siguiente distribucin conjunta obtenida en el ejemplo 4.1.
Y
X
1
2
3
r 2
Solucin: m =
1
,
4
0 ,6
S =
0 ,1
1
2
3
1
2
1
1
2
0 ,24
0 ,1
Ficha
Texto
168
Ejemplo 4.5. Son independientes las variables del Ejemplo 4.3? Calcula la
media de las retribuciones de los empleados con menor antigedad y comprala con la media marginal de las retribuciones de todos los trabajadores.
Cmo habran sido las medias anteriores en caso de independencia?
Ficha
Texto
169
16
24
24
sea
25
de varian-
Solucin: No.
Ficha
Texto
170
2
1
0
1
4
0
1
0
a) Estn X e Y incorreladas?
b) Son estadsticamente independientes X e Y?
Solucin: 1) s, 2) no
Ficha
Texto
171
r 10
vector de valores medios m = ; matriz de varianzas-covarianzas
15
16 2
S =
. Hallar la media y la varianza de la variable: Z = 2 X + 3Y + 8
2 25
Solucin: z = 73
S Z2 = 265
Ficha
Texto
172
Ficha
Texto
173
Ejemplo 4.10. A partir de la siguiente matriz de datos para las variables X1,
X2, X3, obtener:
Observacin
1
2
3
4
5
6
7
8
9
10
X1
1
0
0
2
1
0
0
1
1
2
X2
2
2
2
3
3
2
1
3
1
1
X3
-1
-1
-1
0
1
0
-1
-1
0
1
0 ,8
0 ,56 0 ,10 0 ,34
1 0 ,17 0 ,58
r
0 d) = 0 ,17
1
0
Solucin: c) m = 2 S = 0 ,10 0 ,60
0 ,3
0 ,34
0 ,58
0
0 ,61
0
1
Ficha
Texto
174
I
II
III
A
19
25
12
B
30
45
15
C
20
33
20
Ficha
Texto
TEMA 5
ANLISIS DE
REGRESIN
Anlisis de Regresin.
176
Ficha
177
OBJETIVOS DE APRENDIZAJE.
Estudio exhaustivo de la regresin lineal simple (dos variables X, Y): clculo
de los parmetros a, b, a, b de las rectas de regresin Y* = a + bX y
X* = a + bY a partir del principio de mnimos cuadrados.
Expresin de esos parmetros en funcin de los estadsticos de la variable
bidimensional (X, Y).
Interpretacin de los coeficientes de regresin b y b.
Obtencin de una medida de la bondad del ajuste efectuado a partir de la
relacin existente entre la varianza total y las varianzas residual y de la regresin: coeficiente de determinacin R2 (capacidad explicativa de una ecuacin de regresin).
Relacin entre el coeficiente de determinacin y los coeficientes de regresin
b y b.
Introduccin a la regresin no lineal: casos potencial y exponencial.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
Anlisis de Regresin.
178
Ficha
179
5.1. INTRODUCCIN.
El estudio conjunto de dos variables (X, Y) tiene como objetivo fundamental determinar si estn relacionadas esas variables y, si hay alguna relacin, cuantificar esa relacin. Cmo primer paso se puede observar el grfico de dispersin:
la nube de puntos nos puede ayudar a buscar un modelo de relacin adecuado.
grfico de dispersin
correlacin lineal
datos no correlacionados
Ficha
Anlisis de Regresin.
180
relacin no lineal
relacin no lineal
relacin potencial
relacin exponencial
relacin parablica
y
Ficha
181
Ficha
Anlisis de Regresin.
182
y = f ( x ) es una corresponden-
cia exacta, tal que cada valor de X est asociado con un nico valor
de Y.
Una relacin estadstica entre dos variables X e Y es una correspondencia no necesariamente exacta, tal que cada valor de X
y.
y = f ( x )
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
183
Relacin funcional
120
y
y = 2x + 7
100
80
60
40
20
0
0
10
15
20
25
30
35
40
45
50
Ficha
Anlisis de Regresin.
184
Relacin estadstica
y
y* = f(x)
(x,y)
En este contexto:
y
e=y - y*
X es la variable independiente
y*
(variable control)
Y es la variable dependiente
x
(variable respuesta).
Cada valor de X tendr asociado:
y
i
i
i
X xi
y i valor de prediccin (terico, estimado) RESIDUO
Ficha
185
AJUSTE.
Para obtener las ecuaciones de regresin
y* = f ( x )
se utilizan mtodos
( X ,Y ) : ( xi , y i )iN=1
y* = f ( x ),
y elegido el ti-
Ficha
Anlisis de Regresin.
186
RESDUOS
e=y - y*
y* = f(x)
2
e
=
(
y
i i)
i =1
2
i
i =1
MNIMA
y
A
y*
y = f ( x )
la
llamare-
mos:
Ecuacin de regresin
mnimo cuadrtica
de Y sobre X.
Ficha
187
y* = f ( x )
y = a + bx
a ,b nmeros
reales .
y = a + bx
( xi , y i )iN=1
del grfico
e = ( yi y ) = ( yi ( a + bxi ))
N
i =1
2
i
i =1
MNIMA
i =1
Ficha
Anlisis de Regresin.
188
Regresin lineal
y* = a + bx
yi
yi*
x
N
e = ( y y ) = ( y ( a + bx ))
N
i =1
2
i
i =1
i =1
MNIMA
Ficha
189
Sea la funcin:
H ( a ,b ) = ( y i ( a + bxi ))
i =1
que minimicen
a y b parmetros.
H(a, b)
= 2 ( y i ( a + bxi )) = 0 y i = N a + b xi
i =1
a
i =1
i =1
N
N
N
N
H
2
= 2 ( y i ( a + bxi ))xi = 0 xi y i = a xi + b xi
i =1
i =1
i =1
i =1
Ficha
Anlisis de Regresin.
190
a y b:
s XY
b= 2
sX
a = y b x
nociones de Probabilidad, Ed. Thomson, 2005, 2006 segunda impresin, pginas 156-157).
y = a + bx
s XY
b = 2
sX
a = y bx
Ficha
a = y b x
191
a y b: y = a + bx
s XY
b= 2
sX
la variable Y para un incremento unitario de X. Por cada incremento unitario de la variable X, la variable Y cambia su valor b unidades (de promedio).
Ficha
Anlisis de Regresin.
192
a y b en y = a + bx
queda:
s XY
y = a + bx = y bx + bx = y + 2 ( x x )
sX
sY
s XY
rXY =
y = y + rXY ( x x )
s X sY
sX
PREDICCIN.
Con la recta de regresin de Y sobre X,
lores de prediccin de Y,
x de X.
Ficha
193
Regresin de Y sobre X
y* = 1+0,5x
R2 = 0,75
7; 5
4
Y3
1; 2
4; 2
1
0
0
X
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
Anlisis de Regresin.
194
REGRESIN DE X SOBRE Y.
Si quisiramos obtener valores de prediccin de X,
la variable Y
a partir de valores de
x = a + by .
Para obtener esta recta se permutaran los papeles de las variables X e Y.
Ahora Y sera la variable independiente (control) y X la variable dependiente
(respuesta).
En este caso la suma de los cuadrados de los residuos sera:
N
e = ( xi x ) = ( xi ( a + by i ))
=
i =1
i =1
N
2
i
MNIMA
i 1
Ficha
195
a y b:
s XY
b = 2
x = a + by
sY
a = x by
s XY
b = 2
sY
Ficha
Anlisis de Regresin.
196
a y b en x = a + by
x = a + by = x by + by = x +
queda:
s XY
(y y)
2
sY
s XY
sX
rXY =
x = x + rXY ( y y )
sY
s X sY
Ficha
197
s XY
b= 2
sX
rXY = b b
s XY
b = 2
sY
Teniendo en cuenta que el signo de rXY sera el mismo que el de b y b.
PROPIEDADES DE LAS RECTAS.
sY
y = y + rXY ( x x )
sX
Se cruzan en el punto
Son perpendiculares si
Son iguales si
sX
x = x + rXY ( y y )
sY
rXY = 0 ,
y = y
x = x
rXY = 1.
Ficha
Anlisis de Regresin.
198
x* = -0,5+1,5y
7; 5
4
medias; (4; 3)
Y3
y* = 1+0,5x
1; 2
4; 2
2
1
0
0
Ficha
199
sobre
Y : ( y i ),
Ficha
Anlisis de Regresin.
200
Y : ( yi )
se pueden descomponer en
y i = y i + ei
y la medida de la bon-
Y : ( yi ) Y : ( y i ) E : (ei = y i y i ).
Ficha
VARIABLE
Valores
Media
yi
201
Varianza
1 N
s = ( yi y )2
N i =1
2
Y
VARIABLE REGRESIN
Valores
y i = f ( x )
Y*
Media
VARIABLE RESIDUAL
Valores
ei = y i y i
Varianza de la regresin
Varianza residual
1 N
s = ( yi y )2
N i =1
1 N
s = ( ei e ) 2
N i =1
2
Y*
E = Y-Y*
Media
2
E
Ficha
Anlisis de Regresin.
202
y = a + bx
La media
y la varianza
siendo
s E2
s XY
b= 2
sX
de la variable residual
a = y b x
E = Y Y
tienen el si-
guiente aspecto:
La variable residual
E = Y Y = Y ( a + bX ) = Y bX a , es decir, es
combinacin lineal de
X e Y, por tanto:
e = y b x a = y b x ( y b x ) = 0
2
2
s
s
s
s E2 = sY2 + b 2 s X2 2bs XY = sY2 + 2XY 2 s X2 2 XY2 s XY = sY2 XY2
( sX )
sX
sX
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
203
Es decir:
e =0
2
s
2
2
s E = sY XY2
sX
y la varianza
sY2*
de la variable de la regresin
La variable de la regresin
por tanto:
y = a + bx = y bx + bx = y
2
2
s
s
sY2* = b 2 s X2 = 2XY 2 s X2 = XY2
( sX )
sX
es decir:
y = y
2
s
2
sY * = XY2
sX
Ficha
Anlisis de Regresin.
204
VARIABLE de la regresin
y = y
media y
1 N
2
2
N
=
s
(
y
y
)
1
Y*
i
=
i
1
sY2 = ( y i y ) 2
N
2
N i =1
s
sY2* = XY2
varianza total
sX
varianza de la regresin
VARIABLE residual
e =0
1 N
s = ( y i y i ) 2
N i =1
2
s
s E2 = sY2 XY2
sX
2
E
varianza residual
s =s s s =s +s
2
E
2
Y
2
Y*
2
Y
2
Y
2
E
Ficha
205
partir de
residuos
E : (ei = y i y i ).
s E2
mejor ser el
ajuste.
Si
s E2 = 0
s E2 = sY2
Ficha
Anlisis de Regresin.
206
El primer cociente
sY2
sY2
2
E
2
Y
s
s
parte de la variabilidad de
ndice
Ficha
207
ciones:
2
2
s
s
R 2 = Y2 = 1 E2
sY
sY
PROPIEDADES DE COEFICIENTE.
En general, en los tipos de regresiones donde se cumpla la relacin
entre varianzas
de esta forma:
2
s
R 2 = 1 E2 .
sY
R2
0 s E2 sY2
Ficha
Anlisis de Regresin.
208
=
(residuo mximo) ajuste
2
E
Y
E
R = 1 2 2
2
R
1
s
=
= 0 ajuste ptimo
sY
R 2 100
diente
psimo
Y : ( yi )
Y : ( y i = a + bx i ).
En este sentido se
Dicho de
X (variable
Y (variable dependiente) a
y = f ( x ).
X ( y = f ( x )) Y
2
interpreta tambin R como
Ficha
209
2
s
sY2* = XY2
sX
y el coeficiente de correlacin
s XY
rXY =
s X sY
2
2
s
s
R 2 = Y2 = 2XY 2 = rXY2
sY s X sY
rXY2 :
2
Y*
= r s
2
XY
2
Y
s = (1 r ) s
2
E
2
XY
2
Y
Ficha
Anlisis de Regresin.
210
( 1 rXY2 ) 100
rXY
0 R 2 1 0 rXY2 1 1 rXY 1.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
211
Ajuste potencial
y = a x b a y b parmetros.
Ajuste exponencial
y = a b x a y b parmetros.
Ficha
Anlisis de Regresin.
212
y = a xb
Para determinar los parmetros
La expresin
y = a xb
ln y * = ln a + b ln x .
Sobre la expresin anterior se opera un ajuste lineal:
llamando
u = ln x
v = ln y
= A + b u,
v
v = ln y
A = ln a
recta de regresin de
es decir, se obtiene la
V sobre U.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
Se obtienen
riable
213
( U ,V ) (ln X ,ln Y ):
sUV
b= 2
sU
A = v bu .
a:
A = ln a a = anti ln A a = e A .
Ejemplo 5.4.
Ficha
Anlisis de Regresin.
214
y = a bx
Para determinar los parmetros
La expresin
y = a bx
ln y * = ln a + x ln b .
Sobre la expresin anterior se opera un ajuste lineal:
llamando
v = ln y
v = ln y
= A + Bx ,
v
A = ln a
B = ln b
recta de regresin de
es decir, se obtiene la
V sobre X.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
Se obtienen
variable
215
( X ,V ) ( X ,ln Y ):
s XV
B= 2
sX
A = v B x.
a y b:
A = ln a a = anti ln A a = e A
.
B
B = ln b b = anti ln B b = e
Ejemplo 5.5.
Ficha
Anlisis de Regresin.
216
Conceptos clave.
Ajuste
Bondad de ajuste
coeficiente de determinacin.
Coeficiente de regresin.
Correlacin
Error cuadrtico medio (ECM).
Principio mnimos cuadrados.
Recta de regresin mnimo-cuadrtica
Regresin
Regresin no lineal
Residuo
Varianza de la regresin
Varianza residual
Ficha
217
EJEMPLOS
Ejemplo 5.1. Se ha estudiado las calificaciones de 100 alumnos en dos
asignaturas: Estadstica (variable X) y Matemticas Financieras (variable Y),
obtenindose los siguientes datos:
x =110
y = 2,5
SX =10
SY = 0,5
rXY = 0,85.
Ficha
Texto
218
Anlisis de Regresin.
Ficha
Texto
219
x=5
y=8
s XY = 15
s = 20 r = 0 ,9
2
Y
2) a=-1, b=0,75
3) a =2, b =1,2
Ficha
Texto
220
Anlisis de Regresin.
Solucin:
33 260 840
yi* = a x ib
yi* = 4 x i3
Ficha
Texto
221
16
Se pide:
a) Realizar un ajuste exponencial del tipo
y* = a b x
Solucin:
a)y = 2
*
b ) ECM = 0
Ficha
Texto
222
Anlisis de Regresin.
Ejemplo 5.6. A partir de los siguientes datos de las variables X1, X2 y X3,
obtener:
X1
X2
X3
-1
-1
-1
RX2
=1
c) r12.3= -1
Ficha
Texto
TEMA 6
TASAS DE VARIACIN Y
NMEROS NDICES
224
Ficha
225
OBJETIVOS DE APRENDIZAJE.
Definir el concepto de nmero ndice y tasa de variacin.
Estudiar los tipos de nmeros ndices complejos ms relevantes tipo Laspeyres y Paasche, haciendo especial hincapi en los ndices de precios.
Acercar el perodo de referencia o la base de una serie de ndices al perodo
actual, operando cambios de base.
Enlace de series de ndices utilizando el cambio de base.
Deflactacin de magnitudes econmicas expresadas en u.m. corrientes, utilizando ndices de precios.
Ficha
226
Ficha
227
6.1. INTRODUCCIN.
Los instrumentos que se van a definir, servirn para medir la evolucin del
valor de una variable en el tiempo o en el espacio.
Normalmente se tratar de variables de tipo socioeconmico. Una variable
de esta naturaleza se denominar magnitud.
Se comparar el valor de una magnitud en dos situaciones (habitualmente
temporales):
Situacin inicial: perodo de referencia o BASE, se denotar por 0
Situacin final: perodo actual que se pretende comparar con el base,
se denotar por t
Ficha
228
TIPOS DE MAGNITUDES:
MAGNITUD SIMPLE: variable unidimensional
(Y ,Y ,...,Y ,...,Y )
1
valores :
perodo
perodo
Ficha
229
Tasa de variacin de
Tasa de variacin de
y t y t 1
yt
=Yt =
=
1
y t 1
y t 1
(t 1) t
TV
0t
y t y0 y t
TV =
= 1
y0
y0
t
t 1
t
0
Ficha
230
NMEROS
SIMPLES
NDICES
SIN PONDERAR
COMPLEJOS
PONDERADOS (ponderaciones
)
i
Ficha
231
y0 e y t
yt
I =
y0
t
0
I 0t 100
(en porcentaje).
yt y0 yt
TV =
= 1 = I 0t 1
y0
y0
t
0
Ficha
232
I tt1
I 0t
(con base el ao inmediatamente ante-
rior).
Ejemplo 6.1.
Ficha
233
Ficha
234
Si se denota por
y it
Ii = I ( i ) =
yi 0
t
0
ble i sima (i = 1, 2,, n), las formas de definir ndices complejos SIN
PONDERAR y PONDERADOS quedan como siguen:
INDICES COMPLEJOS SIN PONDERAR.
1. MEDIA ARITMTICA de ndices simples:
1 n
1 n y it
I = Ii =
n i =1
n i =1 y i 0
n
2. MEDIA AGREGATIVA:
IA =
y
i =1
n
y
i =1
it
io
Ficha
235
IA
=
y
i
i
i0
it
Ficha
236
6.3.4. Propiedades.
1. EXISTENCIA: el valor de un ndice ha de ser finito y distinto de cero.
2. IDENTIDAD: cuando
3. INVERSIN: Dado
0t
I 00 = I tt = 1
1
I I = t
I0
t
0
4. PROPORCIONALIDAD:
0
t
y t y t' = y t + kyt = ( 1 + k ) y t
I 0t' = ( 1 + k )I 0t
I 0h I ht = I 0t .
Ficha
237
Magnitud CANTIDAD:
p it
I (i ) =
pi0
qit
I (i ) =
qi 0
t
0
t
0
Se destacarn los dos tipos de ndices complejos ponderados ms importantes para precio y cantidad: TIPO LASPEYRES y TIPO PAASCHE,
que sern medias aritmticas ponderadas de ndices simples.
Ficha
238
vit
pit qit
I (i ) =
=
vi 0 p i 0 q i 0
t
0
Se definir el ndice complejo de valor como una media agregativa sin ponderar.
Ficha
239
i = pi 0 qi 0
i = pi 0 qit
p it
p it
p i 0 q it
pi 0 qi 0
t
t
I 0 ( i )i
pi0
I 0 ( i )i
pi 0
t
t
=
P0 ( P ) =
L0 ( P ) =
=
i
p i 0 q it
i
pi 0 qi 0
p q
L (P)=
p q
t
0
it
i0
i0
i0
p q
P (P)=
p q
t
0
it
it
i0
it
Ficha
240
i = q i 0 p i 0
i = q i 0 p it
q it
q it
q i 0 p it
qi 0 pi 0
t
t
I 0 ( i )i
qi0
I 0 ( i )i
qi 0
t
t
P0 ( Q ) =
L0 ( Q ) =
=
=
i
qi 0 pi 0
i
q i 0 p it
q p
L (Q ) =
q p
t
0
it
i0
i0
i0
q p
P (Q )=
q p
t
0
it
it
i0
it
Ejemplo 6.2.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
241
v
p q
IV =
=
v p q
t
0
it
it
it
i0
i0
i0
Ficha
242
I 0t
I 00 = 100 .
Si se quiere cambiar la base de la serie de ndices del perodo 0 a un perodo h posterior (h>0) se proceder como sigue:
Teniendo en cuenta la propiedad cclica para los perodos 0, h y t
se tiene la siguiente relacin:
I 0h I ht = I 0t .
Ficha
243
I 0h .
h 0 I 0h I ht = I 0t
Ejemplo 6.3.
PROBLEMA 6.2
Ficha
244
6.6. DEFLACTACIN.
Concepto: transformar el valor de una magnitud en precios corrientes
del perodo t (valor nominal) a un valor en precios constantes de un
perodo fijo 0 (valor real).
De esta forma se puede comparar de una manera ms homognea y
realista como va evolucionando el valor de una magnitud en diferentes
perodos de tiempo.
Esto se consigue dividiendo el valor a precios corrientes por un ndice
de precios adecuado que denominaremos DEFLACTOR.
valor a precios corrientes(t)
deflactor ( ndice de precios base perodo 0)
Ficha
245
vt = pt q t
v ot = p0 q t
pt
I =
p0
t
0
vt v ot
0t
se tiene que:
vt pt qt
=
= p 0 q t = v ot .
t
pt
I0
p0
Ficha
246
Sea
Vt = p it q it
i =1
Sea
V0 t = p i 0 q it
I =1
Vt
p it q it
=
= p i 0 q it = V0 t
t
P0 ( P ) p it q it
p i 0 q it
ES UN DEFLACTOR EXPLCITO
Se obtiene el valor de la magnitud a precios constantes del perodo 0.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
247
Ficha
248
Conceptos clave:
Cambio de base.
Deflactacin.
ndice de Laspeyres.
ndice de Paasche.
ndice simple y complejo.
ndices de precios.
ndices en cadena.
Nmero ndice.
Perodo base.
Serie de ndices con base fija.
Tasa de variacin.
Ficha
249
EJEMPLOS.
Ejemplo 6.1. Los salarios anuales (en euros) de los oficiales administrativos
en una empresa han evolucionado durante el perodo 2001-2005 de la forma
siguiente:
Aos
Salarios
Anuales
2001
15.350,00
2002
2003
2004
2005
15.887,25
16.363,87
17.018,42
17.648,10
Ficha
Texto
250
Ejemplo 6.2. Una empresa fabrica tres tipos de artculos: A, B y C. La siguiente estadstica nos proporciona los precios y las cantidades producidas
de dichos artculos durante los aos 1990-1992.
Aos
Artculo
1990
pi0
1991
qi0
pit
1992
qit
pit
qit
10
15
20
12
10
10
ao 1990.
b) Comprubese que: L p Pq = Pp Lq
Ficha
Texto
251
aos
ndice
Base 95
1995
100,00
1996
105,00
1997
109,20
1998
113,02
1999
117,54
2000
121,07
2001
124,10
Solucin: c) el 5%
d) el 13,02%
con base el ao
el ao inmediatalos salarios del 95
los salarios del 95
e) el 2,5%
Ficha
Texto
252
Ficha
Texto
253
Ejemplo 6.5. El salario mnimo interprofesional, en euros corrientes, ha sufrido las siguientes variaciones durante el perodo 2001 2006:
Aos
2001
2002
2003
2004
2005
2006
2001
2002
2003
2004
2005
2006
Estdiese la evolucin del salario mnimo en trminos reales y nominales durante el perodo 01 06. (En valor absoluto y en porcentaje).
Obtngase la tasa de variacin interanual del salario (real y nominal).
Solucin: El salario mnimo pasa de 433,45 a 459,87 constantes
del 01, lo que, en trminos relativos, equivale a un aumento del
6,1%.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
Texto
254
Ficha
Texto
TEMA 7
ANLISIS CLSICO DE
SERIES TEMPORALES
256
Ficha
257
OBJETIVOS DE APRENDIZAJE.
Descomposicin de una serie temporal en cuatro componentes siguiendo un
esquema multiplicativo.
Obtencin de la ecuacin de tendencia anual aplicando el principio de mnimos cuadrados a la serie temporal (t, Y).
Obtencin de la ecuacin de tendencia k esimal a partir de la anual. Cambios de origen en las ecuaciones de tendencia.
Utilidad de las ecuaciones de tendencia para hacer predicciones.
Los ndices de variacin estacional (IVE) como indicadores de la componente
estacional de una serie, bajo hiptesis de estacionalidad estable.
Utilidad de los IVE para corregir por estacionalidad las predicciones de la
tendencia.
Ficha
258
Ficha
259
7.1. INTRODUCCIN.
Una SERIE TEMPORAL se puede definir como una sucesin de valores ordenados en el tiempo y generados por una variable cuya referencia es una
unidad temporal.
A la variable objeto de estudio se la denomina VARIABLE DE INTERS:
Y.
( t , y ) yt
Ejemplo 7.1.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
260
1. TENDENCIA
Tt :
Ct :
Ficha
261
It
Yt = Tt + Ct + S t + I t
MODELO MULTIPLICATIVO:
Yt = Tt Ct S t I t .
Ficha
262
Tt
y t* = f ( t )
Esta funcin se obtendr por medio de un ajuste lineal mnimo cuadrtico:
y t* = a + bt
Recta de regresin de
Y sobre t
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
263
La TENDENCIA de la serie
Tt
Y: y t
Tt = y t*
Tt = a + bt
ecuacin de tendencia (recta de tendencia)
proporciona la tendencia lineal de la serie a largo plazo.
Ficha
264
t.
Ficha
265
(t ,Y ).
PASOS A SEGUIR:
1. El tiempo vendr en aos y los datos sern anuales. Si los valores de la
serie
res
yt
yt
t0
t' = t t 0 ,
ao fijo.
Ficha
266
st' Y
b = 2
*
y t' = a + bt'
st
a = y bt '
Tt' = a + bt'
Tt = a + bt
Ficha
267
Tt = a + bt
t = 0.
a b
b
Tt = + t ,
k k
k
t a k simos
t'
a b t' a b
(k)
t: t' = kt t = Tt ' = +
= + 2 t'
k
k kk k k
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
268
(k)
t'
a b
= + 2 t'
k k
El tiempo
ORIGEN:
t viene en k simos.
Ficha
269
TRASLADO DEL ORIGEN DE LA ECUACIN DE TENDENCIA K ESIMAL AL CENTRO DEL PRIMER K SIMO.
Sobre la ecuacin anterior se operar el siguiente cambio de origen:
k 1
k 1
a b
(k)
Tt'' = + 2 t' '
t' = t' '
k k
2
2
Ecuacin de tendencia k esimal con origen
t = 0, 1, 2. Y si k = 4 (trimestres), en-
t = 0,1,2,3,...,11.
Ejemplo 7.3.
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
270
St
St .
Tt C t .
Ficha
271
As, se partir, para el anlisis de las variaciones estacionales, de una situacin inicial:
yt = Tt S t I t
(Tt representa a la tendencia y el ciclo)
Los indicadores de la COMPONENTE ESTACIONAL
St
que se denominan NDICES DE VARIACIN ESTACIONAL (IVE). Se obtendrn aislando la componente estacional en la relacin anterior.
Ficha
272
Tt
(k)
a b k 1
= + 2 t
k k
2
susti-
Tt
yt
y t Tt S t I t
=
= St I t
Tt
Tt
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
273
St I t
k MOVIMIENTOS ESTACIONALES,
IVE( i ) =
ME( i )
k 100
ME( i )
k
i =1
Ejemplo 7.4.
Ficha
274
IVE(i) = 100, significa que en el k simo (i) los valores que toma la
serie no tienen un comportamiento estacional que difiera de la tendencia usual de la serie.
IVE(i) > 100 (< 100), significa que en el k simo (i) los valores que
toma la serie son usualmente mayores (menores), a los que tendra en
un comportamiento sin efecto estacional.
NOTA: como el ao est subdividido en k partes, habr un
IVE( i ) = k
o ( kx100 )
i =1
Ficha
275
7.4.2. Desestacionalizacin.
Desestacionalizar una serie consiste en eliminar la componente estacional
yt
desestacionalizado ser:
yt
Dt =
IVE( i )
Datos que supuestamente hubisemos observado de no haber existido influencia estacional.
Ejemplo 7.5.
(Ver ejercicio 6.6 del libro ESTEBAN, J.; y otros.: Estadstica Descriptiva y nociones de Probabilidad, Ed. Thomson, 2005. pgina 226).
Ficha
276
( 1 ) Tt = a + bt
(2)T
(k)
t'
a b k 1
= + 2 t'
k k
2
t = 0 en el ao t0.
t = 0 en el pri-
t determinado
t determi-
Ficha
277
Tt '( k ) ( i )
res de la serie en ese k simo, la prediccin CORREGIDA POR ESTACIONALIDAD se obtendr multiplicando la prediccin de tendencia por el IVE respectivo:
Tt '( k ) ( i ) xIVE ( i ) .
Ejemplo 7.6.
Ficha
278
Conceptos clave.
Componente estacional.
Dato desestacionalizado.
Ecuacin de tendencia.
ndice de variacin estacional (IVE).
Prediccin corregida por estacionalidad.
Prediccin de la tendencia.
Serie temporal.
Tendencia anual.
Tendencia k-esimal.
Tendencia.
Ficha
279
EJEMPLOS.
Los ejemplos de este tema dedicado a las series temporales estn basados
en los datos del Ejemplo 7.1 y siguen el desarrollo terico del tema.
Ejemplo 7.1. Vamos a analizar la siguiente serie temporal Yt: volumen de
ventas trimestrales de una pequea empresa (en miles de euros), calculando la TENDENCIA, aislando la COMPONENTE ESTACIONAL (IVE) y desestacionalizando la serie. Supondremos un esquema multiplicativo y estacionalidad estable.
DATOS: ventas trimestrales durante el perodo 2000 a 2002.
2000
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre
Totales Yt
2001
10
21
4
25
60
2002
15
25
8
30
78
17
29
9
33
88
TABLA 1
Ficha
Texto
280
SERIE TEMPORAL
35
30
ventas
25
20
15
10
5
0
1
2000
2001
2002
trimestres
Ficha
Texto
281
Ejemplo 7.2. A partir de las ventas trimestrales de una empresa en el periodo 2000-02 (datos facilitados en el Ejemplo 7.1), calcular la ecuacin de
tendencia anual con origen en el ao 2000.
Solucin: Para calcular la ecuacin lineal de tendencia anual con origen el
ao 2000, en primer lugar tomamos como valores de la serie los totales
anuales de la variable Yt.
Para hallar la lnea de tendencia utilizamos un mtodo analtico: ajustamos
una recta por el mtodo mnimos cuadrados.
Ficha
Texto
282
Clculos previos
Ao t
2000
2001
2002
Totales
Momentos a10
ordinarios
(Yt)2
Yt
t'=t-2000
0
1
2
3
60
78
88
226
a01
1,00
(t')2
3600
6084
7744
17428
a02
75,33
t'Yt
0
1
4
5
a20
5809,33
0
78
176
254
a11
1,67
84,67
2
m02 = S2Y m11 = St'Y
Momentos m20 = S t'
centrales
0,67
134,22
9,33
Parmetros b
r2
a
14,00
61,33
r
0,974
0,987
Ficha
Texto
283
st' Y
b = 2
st'
Tt' = a + bt'
a = y bt '
Ficha
Texto
284
= 61,33 + 14t'
61,33 14
Tt' =
+ t'
4
4
Tendencia trimestral promedia del ao t (t en aos).
Cambiamos la unidad anual de la ecuacin de tendencia a una unidad trimestral:
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
Texto
285
(t en trimestres)
Ficha
Texto
286
Cambiamos el origen de la ecuacin de tendencia trimestral al primer trimestre de 2000: el origen lo situamos en la parte central del trimestre, nos
trasladamos un trimestre y medio hacia la izquierda:
4 1
k 1
t' '
= t' '
= t' ' 1,5 :
2
2
Ficha
Texto
287
Tt'(' 4 ) = 15 ,33 + 0 ,875( t' ' 1,5 ) = 15 ,33 + 0 ,875( 1,5 ) + 0 ,875t' ' =
= 14 ,0175 + 0 ,875t' '
Con lo cual,
Ficha
Texto
288
2000
14,0175
14,8925
15,7675
16,6425
2001
17,5175
18,3925
19,2675
20,1425
2002
21,0175
21,8925
22,7675
23,6425
TABLA 2
Tendencia para cada trimestre:
forma una serie aritmtica de razn 0,875 = b/42. En general b/k2.
Ficha
Texto
289
SERIE TEMPORAL
VENTAS
tendencia
35
30
ventas
25
20
15
10
5
0
1
3
2000
3
2001
2002
trimestres
Ficha
Texto
290
Ficha
Texto
291
2000
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre
2001
10
21
4
25
2002
15
25
8
30
Tt''
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre
17
29
9
33
TABLA1
2000
14,0175
14,8925
15,7675
16,6425
2001
17,5175
18,3925
19,2675
20,1425
2002
21,0175
21,8925
22,7675
23,6425
TABLA2
TABLA3
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre
2000
0,7134
1,4101
0,2537
1,5022
2001
0,8563
1,3592
0,4152
1,4894
2002
0,8088
1,3247
0,3953
1,3958
Suma
2,3785
4,0940
1,0642
4,3874
ME(i)
0,7928
1,3647
0,3547
1,4625
3,9747
IVE%
79,79
137,34
35,70
147,18
400,00
Eliminamos las variaciones irregulares promediando los valores obtenidos sin tendencia en cada trimestre para todos los aos, es decir, calculando
lo que llamaremos MOVIMIENTOS ESTACIONALES (ME): medias aritmticas
de los valores sin tendencia para cada trimestre. (ver TABLA 3):
Rafael Dez, Vicente Coll y Olga Blasco
ndice
Ficha
Texto
292
ME(i) i = 1, 2,..., k
Calculamos los ndices de Variacin Estacional (IVE):
Teniendo en cuenta que un ndice representa un cambio porcentual sobre
una base de referencia del 100%, en este caso los cuatro ME deberan sumar 4 (o 400 en porcentaje) para que representaran de una forma consistente la componente estacional por trimestre. Pero suman 3,9747, por lo
que procede un ligero ajuste tcnico para que sumen 4. De esta forma obtenemos los ME ajustados o NDICES DE VARIACIN ESTACIONAL (IVE):
IVE( i ) =
ME( i )
k
ME( i )
k 100
i =1
Ficha
Texto
293
160
140
147,18
137,34
147,18
137,34
147,18
137,34
120
IVE
100
79,79
80
79,79
79,79
60
40
35,70
35,70
35,70
20
0
1
2000
2001
2002
trimestres
Ficha
Texto
294
Significado de los IVE: los IVE representan el efecto estacional para cada
trimestre. Al suponer estacionalidad estable, son los mismos para todos los
aos de la serie, as:
4 trimestre: IVE (4) = 147,18. Las ventas de la empresa son un
Ficha
Texto
295
Ejemplo 7.5. Desestacionalizar la serie de ventas trimestrales (datos originales, TABLA 1).
Solucin: Eliminamos la estacionalidad de la serie dividiendo los datos originales (Tabla 1) por los IVE de cada trimestre expresados en tantos por
uno.
Tabla 1 / IVE = Tabla 4
1r Trimestre
2 Trimestre
3r Trimestre
4 Trimestre
Totales Yt
2000
10
21
4
25
60
2001
15
25
8
30
78
TABLA 1
2002
17
29
9
33
88
IVE
0,7979
1,3734
0,3570
1,4718
4,0000
2000
12,5329
15,2905
11,2045
16,9860
2001
18,7993
18,2030
22,4090
20,3832
2002
21,3059
21,1155
25,2101
22,4215
TABLA 4
Serie desestacionalizada
Ficha
Texto
296
La serie desestacionalizada contiene los valores que supuestamente hubiramos observado de no haber existido ninguna influencia estacional. Vemos
que hay una diferencia significativa con los datos originales, sobre todo en el
tercer trimestre.
Dt ventas
desestacionalizadas
Datos desestacionalizados
30
25
20
15
10
5
0
1
2000
2001
2002
trimestres
Ficha
Texto
297
Ficha
Texto
298
Ficha
Texto