Professional Documents
Culture Documents
ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012 Revista do Mestrado em Administrao e Desenvolvimento Empresarial da Universidade Estcio de S Rio de Janeiro (MADE/UNESA). ISSN: 2237-5139 Contedo publicado de acesso livre e irrestrito, sob licena Creative Commons 3.0. Editora responsvel: Isabel de S Affonso da Costa Organizador do nmero temtico: Marco Aurlio Carino Bouzada
Uma
verso
preliminar
deste
artigo
foi
apresentada
e
publicada
nos
Anais
do
XVI
Congreso
Latino-
Iberoamericano
de
Investigacin
Operativa/XLIV
Simpsio
Brasileiro
de
Pesquisa
Operacional
-
CLAIO/SBPO,
setembro
de
2012,
Rio
de
Janeiro
RJ.
Artigo
recebido
em
17/11/2012
e
aprovado
em
17/12/2012.
Artigo
convidado
submisso
e
avaliado
em
double
blind
review.
1
Mestre
pelo
Programa
de
Ps-Graduao
em
Modelagem
Computacional
e
Tecnologia
Industrial
do
Centro
Integrado
de
Manufatura
e
Tecnologia
(PPGMCTI/CIMATEC/SENAI).
Endereo:
Av.
Orlando
Gomes,
1845
-
Piat
-
Salvador,
BA
-
CEP:
41650-010.
Email:
esquivel.renata@hotmail.com.
2
Doutor
em
Pesquisa
Operacional
com
Ps-Doutorado
em
Estatstica
pela
University
of
Southampton
(UK).
Professor
do
PPGMCTI/CIMATEC/
SENAI.
Av.
Orlando
Gomes,
1845
-
Piat
-
Salvador,
BA
-
CEP:
41650-010.
Email:
valter.senna@gmail.com.
3
Doutora
em
Cincias
da
Computao
pela
Universidade
Federal
de
Pernambuco
(UFPE).
Professora
do
Departamento
de
Estatstica
da
Universidade
Federal
da
Bahia
(EST/UFBA).
Endereo:
Av.
Adhemar
de
Barros,
s/n
Campus
de
Ondina
Salvador,
BA
CEP:
40170-110.
Email:
gecynalda@yahoo.com.
88
1.
Introduo
O
desenvolvimento
de
mtodos
estatsticos
para
anlise
de
dados
obtidos
em
situaes
em
que
as
observaes
so
dependentes
tem
apresentado
crescimento
vertiginoso
nas
ltimas
dcadas.
Em
particular,
as
novas
propostas
de
tcnicas
para
a
modelagem
de
dados
provenientes
de
sries
temporais
tm
ganhado
destaque
na
literatura
especializada.
Ao
se
trabalhar
com
sries
temporais,
o
objetivo
mais
usual
a
predio
de
valores
Revista
ADM.MADE,
Rio
de
Janeiro,
ano
12,
v.16,
n.2,
p.87-101,
maio/setembro,
2012.
89
futuros.
A
necessidade
de
obter
previses
precisas
de
eventos
futuros
ou
suas
consequncias,
sejam
climticas,
econmicas,
epidemiolgicas
ou
de
qualquer
natureza,
tem
levado
a
um
constante
desenvolvimento
de
tcnicas
de
previso
em
sries
temporais.
Os
mtodos
estatsticos
clssicos
para
anlise
de
sries
temporais
encontram-se
bem
documentados
na
literatura
pertinente.
Contudo,
boa
parte
desses
mtodos
requer
conhecimento
especializado
para
sua
correta
aplicao.
Sendo
assim,
o
uso
adequado
dos
modelos
clssicos
exigir
verificaes
das
suas
suposies,
o
que
demanda
esforos
e
experincia,
na
anlise
exploratria
dos
dados.
A
Anlise
Espectral
Singular
(SSA,
do
ingls
Singular
Spectrum
Analysis),
se
apresenta
como
uma
alternativa
relativamente
simples
e
poderosa.
A
SSA
um
mtodo
no
paramtrico
usado
na
anlise
de
sries
temporais
e
que
exige
pouco
conhecimento
prvio
do
comportamento
da
srie.
Essa
tcnica
investiga
o
comportamento
das
sries
histricas
atravs
da
decomposio
e
da
reconstruo
dos
seus
componentes
constitutivos,
caracterizando
os
estgios
da
SSA.
A
ferramenta
SSA,
na
literatura
tcnica,
tem-se
mostrado
til
nas
anlises
de
sries
das
reas
de
meteorologia,
geofsica,
fsica,
climatologia,
economia,
sade
e
em
vrios
outros
campos
do
conhecimento.
Essa
ferramenta
pode
ser
aplicada
em
sries
curtas
ou
longas,
sries
no
estacionrias
ou
estacionrias,
ruidosas
ou
no,
ou
seja,
em
qualquer
srie
temporal
com
alguma
estrutura
(GOLYANDINA;
NEKRUTKIN;
ZHIGLJAVSKY,
2001;
HASSANI,
2007).
Vale
salientar
que
a
SSA
no
se
detm
a
realizar
previses
de
valores
futuros,
mas
tambm
tem
a
finalidade
de
identificar
e
de
extrair
padres
geradores
da
srie
temporal.
O
presente
artigo
objetiva
comparar
o
algoritmo
de
previso
SSA
e
algumas
estratgias
preditivas
clssicas.
Com
esta
finalidade,
analisamos
duas
sries
temporais
com
caractersticas
distintas:
uma
srie
proveniente
da
rea
da
meteorologia
(estudo
emprico)
e
uma
srie
artificial
(estudo
simulado).
2.
Materiais
e
Mtodos
2.1.
Tcnicas
clssicas
Os
mtodos
clssicos
-
que
comumente
apresentam
bom
poder
preditivo
-
utilizados
nesse
trabalho
comparativo
so
os
algoritmos
de
alisamento
exponencial
de
Holt
(SEH)
e
de
Holt-Winters
(H-W),
os
mtodos
de
Box
e
Jenkins
(os
modelos
autorregressivos
integrados
de
mdias
mveis
-
ARIMA
-
e
a
classe
de
modelos
autorregressivos
integrados
de
mdias
mveis
sazonais
-SARIMA).
A
descrio
dessas
estratgias
preditivas
clssicas
pode
ser
encontrada
em
muitos
referenciais
tericos,
por
exemplo
Box
e
Jenkins
(1970),
Brillinger
(2001),
Brockwell
e
Davis
(2002)
e
Morettin
e
Toloi
(2006).
O
uso
adequado
do
algoritmo
de
Holt-Winters
se
faz
em
decorrncia
da
presena
de
sazonalidade
nos
dados
da
srie,
independentemente
da
presena
da
tendncia.
J
o
Revista
ADM.MADE,
Rio
de
Janeiro,
ano
12,
v.16,
n.2,
p.87-101,
maio/setembro,
2012.
90
algoritmo de Holt adequado se existe basicamente uma tendncia linear na srie. Para a utilizao do mtodo de Box e Jenkins se exige conhecimento sobre as propriedades das classes de modelos, alm da experincia do analista, no que tange identificao do modelo mais apropriado aos dados - fatos que dificultam a aplicao da metodologia de Box e Jenkins. 2.2. Singular Spectrum Analysis (SSA) 2.2.1. Breve descrio da SSA Bsica A tcnica SSA bsica fundamenta-se em dois estgios complementares: decomposio e reconstruo da srie temporal. Cada estgio composto por dois passos que formam os quatro passos da tcnica (em ingls): embedding, singular value decomposition (SVD), grouping e diagonal averaging . Decomposio No estgio da decomposio, a srie temporal inicial decomposta em uma soma de poucas subsries, de modo que cada subsrie possa ser identificada e interpretada como componentes constitutivos. Primeiro passo: embedding
Considere uma srie temporal unidimensional real e no nula, isto , com pelo menos um valor diferente de zero, Yt = Y1,... , YN, sendo N o comprimento da srie ou a quantidade de observaes ao longo do intervalo de tempo investigado. Inicialmente, a srie original unidimensional transformada em uma srie multidimensional com dimenso L, onde L dito o comprimento da janela. Este o nico parmetro deste passo e representa a quantidade de componentes em que a srie decomposta. Ele deve ser um valor inteiro, entre 2 L N, e, segundo resultados tericos, o tamanho de L deve ser suficientemente grande, mas no superior a N / 2 (HASSANI, 2007). A srie temporal multidimensional, que uma sequncia de vetores constitudos por elementos da srie Yt , forma a matriz apresentada na expresso (1), denominada matriz trajetria, resultado desse primeiro passo (GOLYANDINA; NEKRUTKIN; ZHIGLJAVSKY, 2001; HASSANI, 2007; HASSANI; HERAVIC; ZHIGLJAVSKY, 2009).
(1),
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.
91
em que K = N L + 1 o nmero de vetores deslocados no tempo. Segundo passo: singular value decomposition (SVD)
Neste
passo,
decomposio
do
valor
singular,
realizada
a
decomposio
da
matriz
trajetria
X
em
uma
soma
de
matrizes
elementares.
Seja
S
=
X
XT
e
1
...
L
0
autovalores
de
S,
com
U1
,
...,
UL,
os
correspondentes
autovetores,
formando
um
sistema
ortonormal.
Representando
os
componentes
principais
da
matriz
trajetria
como
Vi = X Ui
T
X = E1 + ... + Ed (2) , T E onde d denota o nmero de autovalores diferentes de zero da matriz S e i = i U i V i matrizes elementares. O conjunto ( ,U ,V ) conhecido como o i-simo autotriple da matriz trajetria X i i i e i o seu valor singular (GOLYANDINA; NEKRUTKIN; ZHIGLJAVSKY, 2001; HASSANI, 2007; HASSANI; HERAVIC; ZHIGLJAVSKY, 2009). Reconstruo Terceiro passo: grouping
No
terceiro
passo
ocorre
a
juno
das
matrizes
elementares
Ei
em
vrios
grupos
e
a
soma
delas
dentro
de
cada
grupo.
O
passo
grouping
particiona
o
conjunto
de
ndices
da
expresso
(2)
(1
,
...,
d
)
em
subconjuntos
disjuntos
I1,
...
,
Im.,
fornecendo
a
representao
X=
EI1
+
...
+EIm
(3)
Portanto,
o
resultado
desse
passo
a
representao
da
matriz
trajetria
como
uma
soma
de
matrizes
resultantes
(EI1;...;
EIm).
A
escolha
dos
conjuntos
I1,
,
Im
a
segunda
e
ltima
deciso
necessria
para
a
aplicao
do
mtodo
SSA.
Essa
escolha
baseada
na
propriedade
denominada
separabilidade.
A
separabilidade
entre
os
conjuntos
pode
ser
mensurada
pela
correlao
ponderada,
calculada
da
seguinte
forma:
a
correlao
ponderada
entre
duas
subsries
Yt
(1)
e
Yt
(2)
pode
ser
expressa
como,
Revista
ADM.MADE,
Rio
de
Janeiro,
ano
12,
v.16,
n.2,
p.87-101,
maio/setembro,
2012.
92
em que a norma da i-sima subsrie dada por com o produto interno sendo definido por
onde os pesos wc so dados por wc = min{ c, L, N-c }, e assume-se que L N/2. Em geral, avalia-se a correlao ponderada entre o sinal, que o agrupamento dos principais autotriples, e o rudo, que o grupo formado pelos autotriples remanescentes. Se o valor absoluto da correlao ponderada muito pequeno, tem-se que as duas sries so quase ortogonais. Diz-se, ento, que estes componentes so separveis. Quarto passo: diagonal averaging
A operao realizada neste ltimo passo obtm, para cada uma das matrizes resultantes, uma aproximao para os componentes da srie original; ou seja, transforma cada matriz da decomposio agrupada (3) em uma nova srie de tamanho N, que pode ser considerada como uma aproximao da srie original. 2.2.2. Algoritmo recorrente de previso =Y +Y + + Y a srie reconstruda ou aproximada, conforme o segundo Seja Y 1 2 N estgio da SSA. A previso dos valores futuros !!! , com h = 1, , M, obtida a partir da seguinte expresso recorrente:
Em
que
os
ap
so
os
coeficientes
da
combinao
linear
entre
os
L-1
ltimos
termos
da
srie
reconstruda.
claro
que,
quanto
maior
o
nmero
de
passos
frente
(h),
mais
as
previses
dependero
da
qualidade
das
predies
anteriores.
Para
que
a
predio
considere
pelo
menos
um
valor
aproximado
da
srie
original,
necessrio
um
horizonte
de
no
mximo
M
=
L-1.
Os
nmeros
formam
os
M
termos
preditos
pelo
algoritmo
recorrente
de
previso,
fundamentado
no
SSA
bsico.
Detalhes
sobre
o
funcionamento
do
algoritmo
esto
disponveis
na
obra
de
Revista
ADM.MADE,
Rio
de
Janeiro,
ano
12,
v.16,
n.2,
p.87-101,
maio/setembro,
2012.
93
Golyandina, Nekrutkin e Zhigljavsky (2001). 3. Desenvolvimento dos Estudos 3.1. Cenrios Visando comparar os mtodos propostos e recomendados na literatura de sries temporais com a metodologia SSA, foram definidos dois cenrios, para os quais modelaram- se e estimaram-se valores futuros de uma srie temporal real (estudo emprico) e uma srie artificial (estudo simulado). No estudo emprico considerou-se uma srie meteorolgica, com dados da velocidade mdia do vento, os quais foram armazenados a cada intervalo de 30 minutos. Esta srie abrange o perodo entre 03 de setembro de 2010 s 12:00 e 12 de setembro de 2011 s 11:30, totalizando 17.892 observaes ao longo do perodo especificado. Consideraram-se, para o conjunto de teste, as informaes de 2.688 instncias no tempo. A coleta foi realizada em uma mini estao meteorolgica, localizada na unidade CIMATEC do SENAI-BA, que se encontra instalada altura de 36 metros em relao ao nvel do solo. Esta srie meteorolgica ser rotulada como VENTO neste trabalho. Para o estudo simulado, uma srie temporal foi gerada de acordo com o processo estocstico ARIMA (p=1, d=1, q=2). O parmetro da parte regressiva foi fixado em 0,4 e os valores para os parmetros de mdias mveis foram 1 = 0,3 e 2 = 0,8. A escolha dos parmetros fundamentou-se em exemplos do livro Morettin e Toloi (2006). Para esse processo, foram geradas 212 observaes, as 12 ltimas alocadas no conjunto de teste. 3.2. Medidas de preciso A avaliao das capacidades preditivas dos mtodos considerados foi conduzida em diferentes horizontes de previso. Para a extensa srie meteorolgica, os seguintes horizontes frente foram considerados: 1, 24, 48, 96, 192, 336, 672, 1008, 1344, 2016, 2688. Para as avaliaes na srie simulada foram considerados os 12 passos frente. Os resultados das previses foram comparados utilizando-se o erro quadrtico mdio (MSE) e o erro percentual total (TPE) e, claro, o erro cometido na estimao para cada horizonte. O erro quadrtico mdio (MSE) definido pela expresso abaixo:
94
3.3. Processo de modelagem 3.3.1 Tcnicas clssicas Conforme veremos a seguir, a srie emprica (VENTO) no estacionria, exibindo tendncia e sazonalidade. Usaremos o algoritmo de Holt-Winters na forma aditiva porque a srie possui valores nulos. Para o mtodo de Box-Jenkins, o mais adequado para modelar as variaes na srie meteorolgica foi o SARIMA. A srie emprica precisou de apenas uma diferena para se tornar um processo integrado [I(1)] e, assim, especificou-se a classe do modelo SARIMA (p,1,q)(P,D,Q). A seleo do modelo mais adequado para representar o processo gerador da srie baseou-se no critrio AIC (critrio de informao de Akaike e Akaike (1973, 1974)). Na modelagem clssica para a srie artificial foi utilizado o alisamento exponencial de Holt (SEH) e um modelo correspondente, da classe ARIMA. Utilizou-se a SEH ao invs do Holt-Winters porque a srie simulada no apresenta comportamentos sazonais. O modelo ARIMA foi considerado como um padro ouro, isto , o ARIMA serviu como medida para comparao dos outros mtodos adotados, na medida em que se espera que a predio realizada nos dados oriundos do processo estocstico puro tenha maior preciso do que a feita com as demais tcnicas. 3.3.2. SSA Como foi discutido na Seo 2.2.1, a modelagem via SSA feita mediante a escolha dos dois nicos parmetros, a saber, o comprimento da janela L (no estgio de decomposio) e o processo estrutural de agrupamento, na reconstruo da srie temporal. Na anlise via SSA considerou-se o comprimento timo da janela (Ltimo=N/2) para a srie artificial e, para a srie VENTO, por dificuldades computacionais, baseamos a escolha do valor de L no perodo sazonal da srie - ou seja escolheu-se um comprimento mltiplo da sazonalidade. A separao entre o sinal e o rudo na fase de reconstruo das sries foi avaliada de acordo com os valores singulares e a correlao ponderada. Alm dos critrios ora citados, foi usado tambm o percentual acumulado de explicabilidade dos possveis componentes formadores do sinal.
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.
95
4. Resultados Estudo emprico As caractersticas da srie temporal VENTO podem no ser identificadas facilmente atravs do seu grfico temporal. Assim como apresentado na Figura 1, nota-se uma grande massa de dados ao longo dos instantes de tempo. Para avaliar a suposio de estacionariedade foi usado o bem conhecido teste KPSS (KWIATKOWSKI et. al., 1992), que rejeitou a hiptese (p-valor < 0,01). Alm disso, os testes de Box-Pierce (BOX; PIERCE, 1970) e de Ljung-Box (LJUNG; BOX, 1978) apontaram a existncia de autocorrelaco conjunta, estatisticamente significante (p < 2,210-16). De acordo com esses testes, temos indcios de que a srie VENTO no estacionria. Com o intuito de facilitar a visualizao da periodicidade da srie, considerou-se um recorte da srie temporal VENTO. A Figura 1(b) apresenta uma ampliao do componente sazonal, com o comportamento do componente peridico para os 336 instantes de tempo iniciais. Notamos uma repetio sazonal na srie, com uma amplitude igual a 48, que corresponde aos 48 instantes de medio efetuadas por dia. Figura 1: Velocidade mdia do vento ao longo do tempo (a). Comportamento sazonal para os primeiros 336 instantes de tempo (b).
Revista
ADM.MADE,
Rio
de
Janeiro,
ano
12,
v.16,
n.2,
p.87-101,
maio/setembro,
2012.
96
Modelagem Os dois modelos de Box-Jenkins que apresentaram menores valores no critrio AIC foram SARIMA (2,1,2)x(1,1,1), que rotulamos como SARIMA 1 (AIC igual a 35394,05) e SARIMA (3,1,3)x(1,1,1), identificado como SARIMA 2 (AIC igual a 35389,52). Para a modelagem via SSA, usamos um comprimento de janela L= 4884 = 4032. Ao analisar as correlaes ponderadas, nota-se que, a partir do componente de posto 200, seguem-se muitos componentes com correlaes baixas, os quais iro compor o grupo do rudo. Pela anlise do comportamento dos principais autovetores, notou-se comportamento peridico representado pela formao dos pares de autovetores de postos (2, 3) e (4, 5). Ao finalizar a anlise dos estgios da SSA (decomposio e reconstruo), aplicou-se o algoritmo recorrente de previso SSA na srie reconstruda a partir dos 1000 primeiros componentes da SVD, por motivos computacionais. Previso A Tabela 1 apresenta um comparativo geral dos resultados de previso de cada mtodo analisado. Essa tabela resume a acurcia das tcnicas, apresentando o erro quadrtico mdio (MSE) e o erro percentual total (TPE).
Observa-se
que,
de
acordo
com
o
MSE,
o
mtodo
de
Holt-Winters
sazonal
aditivo
foi
superior
aos
demais,
pois,
para
quase
todos
os
horizontes,
os
MSE's
para
este
mtodo
foram
inferiores
ao
SARIMA
1,
ao
SARIMA
2
e
SSA.
Excetua-se
o
passo
h=
24,
para
o
qual
a
SSA
se
mostrou
superior.
Se
a
avaliao
utiliza
o
erro
relativo,
TPE,
o
algoritmo
Holt-Winters
e
a
SSA
vencem
em
igual
quantidade
de
horizontes.
O
algoritmo
Holt-Winters
apresentou
Revista
ADM.MADE,
Rio
de
Janeiro,
ano
12,
v.16,
n.2,
p.87-101,
maio/setembro,
2012.
97
melhor desempenho em horizontes maiores (h= 672, 1008, 1344, 2016, 2688) enquanto que, para previses de curto e de mdio prazos (h=24, 48, 96, 192 e 336), a previso SSA apresentou melhor performance.
Nota-se,
na
Figura
2,
que
o
algoritmo
recorrente
de
previso
SSA
conseguiu
detectar
melhor
as
flutuaes
das
velocidades
mdias
do
vento
[valor
real]
em
comparao
ao
Holt-Winters
aditivo
e
os
modelos
ARIMA
sazonais,
retratando
melhor
o
conjunto
de
teste.
Nota-se
tambm
que
o
algoritmo
Holt-Winters
resultou
em
predies
melhores
do
que
os
modelos
ARIMA
sazonais,
uma
vez
que
o
segmento
correspondente
(em
verde)
possui
uma
amplitude
um
pouco
maior
do
que
as
observadas
nos
segmentos
em
azul
(SARIMA
1
e
SARIMA
2).
A
ordem
de
performance
dos
mtodos
escolhidos
foi,
portanto,
SSA
(com
componentes
1
a
1000)
seguida
do
Holt-Winters
aditivo,
depois
SARIMA
(3,1,3)x(1,1,1)
e
por
fim
SARIMA
(2,1,2)x(1,1,1).
Estudo
simulado
O
grfico
com
a
estrutura
do
processo
ARIMA
simulado
(ver
Figura
3a)
e
com
o
logaritmo
dos
autovalores
resultantes
da
decomposio
SSA
(ver
Figura
3b),
esto
apresentados
abaixo.
Revista
ADM.MADE,
Rio
de
Janeiro,
ano
12,
v.16,
n.2,
p.87-101,
maio/setembro,
2012.
98
Atravs
da
Figura
3a,
observa-se
que
o
processo
ARIMA
simulado
indica
uma
clara
tendncia
decrescente
com
algumas
flutuaes,
que
aparentemente
no
podem
ser
qualificadas
como
sazonais.
A
Figura
3b
mostra
o
espectro
da
matriz
trajetria
utilizada
na
decomposio
SSA.
Podemos
notar
que
a
decomposio
desta
srie
proveniente
de
um
processo
ARIMA
indica
claramente
um
componente
de
tendncia,
representado
pelo
primeiro
autovalor
em
destaque.
Nota-se
tambm
que
a
Figura
3b
exibe
trs
grandes
fases
ao
longo
dos
100
postos
dos
autovalores.
Ao
investigarmos
a
primeira
fase,
se
considerarmos
um
agrupamento
consistindo
de
somente
os
16
primeiros
autovalores
como
sinal
e
os
demais
componentes
como
rudo,
observamos
uma
correlao
ponderada
entre
o
sinal
e
o
rudo
de
0,0069,
sendo
que
o
sinal
explica
99,66%
da
variao
da
srie.
As
tomamos
os
20
primeiros
autovalores,
observamos
uma
correlao
ponderada
entre
o
sinal
e
o
rudo
de
0,0039,
sendo
que
o
sinal
explica
agora
99,77%
da
variao
da
srie.
Ao
usarmos
os
88
primeiros
autovalores
obtemos
como
resultados
0,0017
e
99,99%
respectivamente.
De
posse
dessas
opes
de
agrupamento,
aplicou-se
o
algoritmo
recorrente
de
previso
na
srie
simulada,
confrontando
as
previses
geradas
a
partir
dos
diferentes
espaos
trajetria.
Os
melhores
resultados
foram
obtidos
utilizando-se
os
88
primeiros
autovalores,
resultado
j
antecipado.
Ou
seja,
para
a
srie
originria
do
processo
ARIMA
(1,1,2),
o
melhor
resultado
preditivo
observado
corresponde
ao
sinal
formado
pelos
88
primeiros
autotriples.
A
Tabela
2
apresenta
os
valores
futuros
(rotulados
na
tabela
como
Real'),
as
Revista
ADM.MADE,
Rio
de
Janeiro,
ano
12,
v.16,
n.2,
p.87-101,
maio/setembro,
2012.
99
diferenas entre os valores originais do conjunto de teste e os previstos por cada tcnica (nomeados como Erro'), alm das medidas MSE e TPE. Pode-se observar que houve superestimao das predies em todos os horizontes e mtodos avaliados. Ao analisar o MSE, nota-se que a liderana do padro ouro permaneceu nos horizontes h = 2, 3, 4, 5 ficando em segundo lugar nos passos h de 6 a 12. Para esses ltimos horizontes a SSA se revelou melhor e ficou em segunda posio no passo 5. Ao avaliar o erro relativo, o desempenho agora foi semelhante ao observado para o MSE. Nota-se que o padro ouro apresenta a melhor performance em trs dos horizontes ( 2, 3 e 4) e fica com a segunda posio para os passos restantes. Por outro lado, a SSA mostrou-se melhor em oito dos horizontes (h = de 5 a 12) e foi o segundo melhor resultado nos passos 2 e 4.
Fonte:
Adaptao
do
autor
(Esquivel,
2012).
A
Figura
4
compara
os
mtodos
preditivos
selecionados
e
o
conjunto
de
teste,
para
o
processo
estocstico
ARIMA.
Revista
ADM.MADE,
Rio
de
Janeiro,
ano
12,
v.16,
n.2,
p.87-101,
maio/setembro,
2012.
100
Observa-se
graficamente
que
o
padro
ouro
e
o
alisamento
exponencial
de
Holt
(SEH)
geraram
predies
quase
em
linha
reta,
simplificando
em
demasia
o
comportamento
real
dos
valores
futuros,
sendo
que,
para
o
padro
ouro,
as
previses
foram
quase
constantes.
Os
resultados
obtidos
pela
SSA,
por
outro
lado,
acompanham
a
curva
do
conjunto
de
teste,
embora
exibam
mais
variaes
do
que
as
apresentadas
pelos
dados
reais.
5.
Consideraes
Finais
O
presente
artigo
teve,
como
objetivo,
apresentar
a
metodologia
SSA
e
fazer
uma
breve
avaliao
da
sua
capacidade
preditiva
em
duas
sries,
uma
emprica
e
outra
simulada,
confrontando-a
com
alguns
importantes
mtodos
clssicos
-
a
saber,
a
suavizao
exponencial
de
Holt
(SEH),
a
suavizao
exponencial
de
Holt-Winters
(H-W)
e
a
classe
de
modelos
de
Box
e
Jenkins.
No
contexto
do
estudo
emprico,
verificou-se
que
a
SSA
mostrou- se
melhor
nas
previses
a
curto
e
a
mdio
prazos,
levando
em
considerao
o
erro
relativo
(TPE).
Por
outro
lado,
utilizando-se
o
MSE,
o
algoritmo
de
Holt-Winters
apresentou
melhor
desempenho
preditivo.
No
estudo
da
srie
simulada,
observou-se
que,
tanto
pelo
MSE
quanto
pelo
TPE,
a
SSA
exibiu
predies
mais
precisas
para
o
processo
ARIMA
(1,1,2),
processo
bastante
comum
em
sries
reais.
De
uma
forma
geral,
nota-se
que
o
algoritmo
recorrente
de
previso
SSA
consegue
representar
melhor
as
variaes
existentes
nos
dados,
como
flutuaes
sazonais
e
picos,
caractersticas
encontradas
com
frequncia
em
sries
histricas.
A
previso
SSA
apresentou,
assim,
comportamento
global
mais
condizente
com
a
realidade
das
sries.
Uma
grande
vantagem
em
aplicar
a
SSA
em
substituio
aos
modelos
de
Box-Jenkins
Revista
ADM.MADE,
Rio
de
Janeiro,
ano
12,
v.16,
n.2,
p.87-101,
maio/setembro,
2012.
101
refere-se
sua
simplificao
no
entendimento
das
sries
temporais
e
consequente
diminuio
da
interveno
do
analista.
Isto
porque
o
processo
de
modelagem
e
previso
via
SSA
leva
em
considerao
fundamentao
terica
que
envolve
a
decomposio
e
a
reconstruo
dos
componentes
constitutivos
da
srie
temporal,
sem
prejuzo
da
sua
capacidade
preditiva.
Sua
utilizao
produziu
resultados
to
bons
ou
mesmo
superiores
aos
gerados
pelos
mtodos
clssicos
considerados
neste
artigo.
Referncias
AKAIKE,
H.
Maximum
likelihood
identification
of
Gaussian
autoregressive
moving
average
models.
Biometrika,
v.60,
p.255-265,
1973.
______.
A
new
look
at
the
statistical
model
identification.
IEEE
Transactions
on
Automatic
Control,
AC-19,
p.716-723,
1974.
BOX,
G.E.P.;
JENKINS,
G.M.
Time
series
analysis:
forecasting
and
control.
So
Francisco:
Holden-Day,
1970.
______.;
PIERCE,
D.A.
Distribution
of
residual
correlations
in
autoregressive-integrated
moving
average
time
series
models.
Journal
of
the
American
Statistical
Association,
v.65,
p.1509-1526,
1970.
BRILLINGER,
D.R.
Time
series:
data
analysis
and
theory.
Philadelphia:
SIAM,
2001.
(Classics
in
Applied
Mathematics
Series).
BROCKWELL,
P.J.;
DAVIS,
R.A.
Introduction
to
time
series
and
forecasting.
2nd
ed.
New
York:
Springer,
2002.
(Springer
Texts
in
Statistics).
ESQUIVEL,
R.M.
Anlise
espectral
singular:
modelagem
de
sries
temporais
atravs
de
estudos
comparativos
usando
diferentes
estratgias
de
previso.
173
p.
Dissertao
(Mestrado)
-
Programa
de
Ps-graduao
em
Modelagem
Computacional
e
Tecnologia
Industrial
(PPGMCTI),
Universidade
Federal
da
Bahia,
Salvador,
2012.
GOLYANDINA,
N.,
NEKRUTKIN,
V.
e
ZHIGLJAVSKY,
A.
Analysis
of
time
series
structure:
SSA
and
related
techniques.
New
York:
Chapman
&
Hall/CRC,
2001.
HASSANI,
H.
Singular
Spectrum
Analysis:
methodology
and
comparison.
Journal
of
Data
Science,
v.5,
p.239-257,
2007.
HASSANI,
H.,
HERAVIC,
S.
e
ZHIGLJAVSKY,
A.
Forecasting
European
industrial
production
with
SSA.
International
Journal
of
Forecasting,
v.25,
p.103118,
2009.
KWIATKOWSKI,
D;
PHILLIPS,
P.C.B.;
SCHMIDT,
P.
e
SHIN,
Y.
Testing
the
null
hypothesis
of
stationarity
against
the
alternative
of
a
unit
root.
Journal
of
Econometrics,
v.54,
p.159-178,
1992.
LJUNG,
G.M.;
BOX,
G.E.P.
On
a
measure
of
lack
of
fit
in
time
series
models.
Biometrika,
v.65,
p.297- 303,
1978.
MORETTIN,
P.A.;
TOLOI,
C.M.C.
Anlise
de
sries
temporais.
So
Paulo:
Edgard
Blucher/
ABE-
Projeto
Fisher,
2006.
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.