You are on page 1of 38

MODELOS DIRECCIONALES DEL PRECIO ACCIONARIO

BASADOS EN REDES NEURONALES ARTIFICIALES Y


ALGORITMOS GEN

ETICOS
Pablo A. Mu noz Ceballos
Consulting Forex Chile S.A.
Abstract
Gracias al desarrollo tecnologico y de la ciencia, se han podido construir
modelos cada vez mas complejos y efectivos en la resolucion de problemas
que antiguamente eran difciles de abordar. En este sentido, las aplica-
ciones de Redes Neuronales Articiales, Algoritmos Geneticos y Logica
difusa (Fuzzy Logic), son cada vez mas usadas en el ambito nanciero
[5, 18, 23, 31]. En este artculo, nos concentramos en desarrollar modelos
de RNA optimizados por la aplicacion de algoritmos geneticos, que sean
capaces de capturar (predecir) los movimientos direccionales del precio de
las acciones descritos por una se nal borrosa (Fuzzy) mediante la inclusion
de variables propias del analisis tecnico; y ademas generar rentabilidades
mayores a la del mercado (IPSA con estrategia Buy/hold) considerando
los costos de comision en las transacciones.
Dadas las caractersticas del Mercado Bursatil Chileno, se consideran
solo estrategias tipo Long con acciones lquidas y maduras, puesto que en
Chile, el mercado no es lquido y operativo en la implementacion de una es-
trategia en corto. Las tipologas de redes estudiadas son las MLP, Redes
Modulares, Redes Jordan/Elman, Recurrentes, y Recurrentes de Tiempo
Retardado; obteniendo los mejores resultados con las Time-lag Recurrent
Networks. Los resultados muestran que es sin lugar a dudas mejor utilizar
RNA con optimizacion de algoritmos geneticos y variables provenientes
del analisis tecnico como inputs para la prediccion de movimientos direc-
cionales, que en la prediccion del precio de las acciones o en la prediccion
de los retornos accionarios (que es la mayora de los estudios hechos y que
reejan el estado del arte).
Key words: Redes Neuronales Articiales, An alisis Tecnico Bursatil,
Algoritmos Geneticos.
JEL Classication: C45; C53; G14.
1
1 Analisis tecnico
El an alisis tecnico es usado principalmente por los analistas burs atiles en sus ta-
reas de especulaci on. La piedra angular del an alisis tecnico es la informacion
hist orica de los stocks (precio de cierre, precio de apertura, volumen, precio
m aximo, precio mnimo) con los cuales se construyen otros indicadores tecnicos
como:

Indice de Fuerza Relativa, Oscilador Estoc astico, Direcci on de Cambio,
etc.
Las 3 premisas b asicas que sustentan el analisis tecnico son:
1. Los precios son dirigidos por la oferta y la demanda y no necesariamente
representan su valor.
2. Los precios usualmente se mueven en torno a una tendencia; en otras pala-
bras, los precios no se mueven por simples variaciones aleatorias.
3. La ultima premisa, es que las tendencias descritas anteriormente contienen
comportamientos estructurados (patterns), que son posibles de ser detecta-
dos en forma temprana.
Principalmente existen 2 tipos de analisis tecnico. Uno, es el reconocimiento
de los patterns a traves de la interpretaci on graca. Este tipo de analisis es mas
un arte que una ciencia y sus resultados se basan subjetivamente en el juicio del
analista experto.
Figure 1: Ejemplo de la aplicacion del tipo de analisis tecnico basado en los
juicios del analista experto.
El segundo tipo de analisis tecnico se basa en el uso de indicadores mec anicos
basados en el precio, volumen y otros datos con el n de predecir los movimien-
tos futuros del precio y/o determinar cu ando comprar y cu ando vender. Los
datos usados para crear los indicadores pueden ser netamente tecnicos o even-
tualmente basados en el an alisis fundamental. Los datos son aplicados a una
2
funci on matem atica que genera un indicador que puede ser usado directamente
para tomar las decisiones de trading y/o combinado con otros indicadores y siendo
procesado por una serie de reglas para generar una se nal (entrada/salida) y de-
terminar cuando es el momento de hacer la operaci on.
Figure 2: Ejemplo de la aplicacion del tipo de an alisis tecnico basado en el uso
de indicadores.
1.1 Invertir versus especular
Existe una gran diferencia entre 2 terminos que a veces se emplean indistinta-
mente, nos referimos a la especulacion y la inversion.
Graham (2003) [12] expone ambos terminos en forma antagonica diciendo
que Una operacion de inversion es una que bajo un minucioso an alisis promete
preservar el capital y obtener un adecuado retorno. Las operaciones que no
cumplen con estos requerimientos, son operaciones de especulaci on.
Tradicionalmente, el acto de invertir, se reere a la compra de acciones o
alg un otro instrumento nanciero y mantenerlo por un largo perodo de tiempo,
generalmente varios a nos con el n de alcanzar una rentabilidad de largo plazo.
El analisis fundamental (proyecciones de ingresos, crecimiento de mercado, etc.)
como tambien el an alisis tecnico de largo plazo, ayudan a encontrar destinos de
inversi on bastante atractivos que conjugan la sinfona cl asica de la optimizaci on
del riesgo y el retorno esperado de los activos.
Por otro lado, la especulacion, se reere tpicamente al acto de comprar y
vender acciones u otros instrumentos nancieros que generen un benecio mas
inmediato, generalmente son operaciones intradiarias, es decir, durante el da.
Se basa principalmente en encontrar la oportunidad de comprar barato y vender
caro [24].
3
2 Redes neuronales articiales
El avance tecnologico durante los ultimos a nos ha permitido desarrollar y poner
en pr actica metodologas nuevas y otras antiguas, que por razones tecnologicas
no era posible implementar. Una de estas metodologas son las redes neuronales
articiales (ANN).
Las redes neuronales son sistemas complejos de procesamiento de datos que
tratan de emular las caractersticas del cerebro humano. Algunos de los usos de
las redes neuronales son:
An alisis de riesgo crediticio.
Medici on de los niveles de riesgo.
Proyecciones econ omicas y nancieras.
Data mining.
Automatizaci on.
Para ver detalles en aplicaciones nancieras vea [32, 33, 23, 31, 5].
Una denicion formal que especica que son las redes neuronales es:
Denition 2.1. Las Redes Neuronales son sistemas de procesamiento que copian
esquematicamente la estructura neuronal del cerebro para tratar de reproducir sus
capacidades, como por ejemplo, aprender de la experiencia a partir de las se nales
o datos del exterior, con el objeto de construir sistemas de procesamiento de la
informacion paralelos, distribuidos y adaptativos [8].
2.1 Estructura de un sistema neuronal articial
Seg un del Brio y Sanz (2002), existen tres conceptos claves de los sistemas
nerviosos que las redes articiales tratan de emular, ellos son: paralelismo de
c alculo, memoria distribuida y adaptabilidad al entorno.
Paralelismo: Los sistemas neuronales funcionan en paralelo. Es decir, algunas
tareas no son secuenciales sino simultaneas.
Memoria distribuida: Este concepto se relaciona a la tolerancia a fallos. Es
decir si una neurona falla es poca la cantidad de informaci on que se pierde
pues los sistemas neuronales est an interconectados entre s. Por lo tanto, si
este caso se da otra neurona transmitir a la informaci on.
Adaptabilidad:

Esta es quiz a la caracterstica m as importante, pues reeja la
capacidad de aprendizaje sobre los hechos pasados de los sistemas neu-
ronales.
Para entender c omo funciona un Sistema Neuronal Articial, es necesario
analizar cada uno de sus elementos con el n de evitar confusiones:
Neurona: Una neurona o procesador elemental es el elemento mas simple de un
sistema neuronal y est a compuesta por un conjunto de entradas x
j
(t),
pesos sinapticos de la neurona i w
ij
, regla de propagaci on (w
ij
, x
j
(t))
que proporciona el valor del potencial postsin aptico h
i
= (w
ij
, x
j
(t)) de
4
la neurona i en funcion de sus pesos y entradas, funcion de activaci on
f
i
(a
i
(t 1), h
i
(t)) que proporciona el estado de activaci on actual a
i
(t) =
f
i
(a
i
(t 1), h
i
(t)) de la neurona i en funci on de su estado anterior a
i
(t 1)
y de su potencial postsin aptico actual, funcion de salida F
i
(a
i
(t)) que
proporciona la salida actual y
i
(t) = F
i
(a
i
(t)) de la neurona i en funci on de
su estado de activaci on. Luego la operaci on de la neurona puede expresarse
como:
y
i
(t) = F
i
(f
i
[a
i
(t 1),
i
(w
ij
, x
j
(t))]) (1)
Capas: Las capas (ocultas o no) son conjuntos de neuronas de un mismo nivel.
Red: Una red es un conjunto de capas de distinto nivel que esta interrelacionado.
Sistema neuronal: El sistema neuronal agrega a la red las entradas y salidas.
2.1.1 Entradas y salidas
Las variables de entrada de un modelo de red neuronal pueden ser categoricas
o continuas, dependiendo del modelo y aplicaci on. Por ejemplo, un Perceptr on
Multicapa admite ambos tipos de se nales. En este estudio se trabajara con ambos
tipos de variables.
2.1.2 Regla de propagaci on
La regla de propagaci on permitir a obtener, a partir de las entradas y los pesos,
el valor del potencial postsinaptico h
i
de la neurona (Del Brio y Sanz, op.cit.):
h
i
(t) = (w
ij
, x
j
(t)) (2)
La funcion tpica es del tipo lineal:
h
i
(t) =

j
w
ij
x
j
(3)
que es el producto escalar de los vectores de entrada y pesos.
Otra regla de propagaci on utilizada frecuentemente en modelos como RBF es
la distancia eucldea al cuadrado:
h
2
i
=

j
(x
j
w
ij
)
2
(4)
que representa la distancia al cuadrado entre el vector de entradas y el de los
pesos.
2.1.3 Funcion de transferencia
La funci on de transferencia (funci on de activacion), proporciona el estado de
activacion actual a
i
(t) a partir del potencial postsin aptico h
i
(t) y del propio
estado de activaci on anterior a
i
(t 1), as:
a
i
(t) = f
i
(a
i
(t 1), h
i
(t)) (5)
Las funciones de transferencia se consideran deterministas [16]. Las m as usadas
son:
5
Identidad:
y = x (6)
Escal on:
y = signo(x) (7)
Sigmoidea:
y =
1
1 + e
x
(8)
y = tanh(x) (9)
Gaussiana:
y = Ae
Bx
2
(10)
Sinusoidal:
y = Asin(x +) (11)
Donde A y B son constantes para simplicar las expresiones.
2.1.4 Funcion de salida
Esta funci on proporciona la salida global de la neurona y
i
(t), es funci on de su
estado de activaci on a
i
(t). A menudo se utiliza la funci on identidad F(x) = x,
formalmente es:
y
i
(t) = F
i
(a
i
(t)) = a
i
(t) (12)
2.2 Tipos de redes neuronales
A continuaci on se har a una descripcion de algunas tipologas de redes neuronales
usadas en problemas con series de tiempo. Es importante mencionar que existen
m as tipologas, y que en general est an orientadas a la resoluci on de otro tipo de
problemas. Por ejemplo, el procesamiento de se nales en tiempo real.
Las principales tipologas de red neuronal utilizadas en el an alisis de series de
tiempo con entrenamiento por lotes
1
son:
2.2.1 Red lineal (linear)
Es la red mas simple existente, se basa en el principio de que un modelo simple se
debe escoger a un modelo complejo a menos que el desempe no del modelo simple
sea signicativamente menor al del modelo complejo.
Este tipo de red no tiene capas ocultas (hidden layers), su estructura es:
Linear sL I : x
j
y
i
: O, donde: s indica que se trata de una red para series de
tiempo, L el n umero de rezagos considerados, I el n umero de inputs, x
i
el n umero
de neuronas de entrada, y
i
el n umero de neuronas de salida y O el n umero de
outputs.
La red lineal consta unicamente de una capa de neuronas lineales, donde la
operaci on del asociador lineal es:
y
i
=
n

j=1
w
ij
x
j
(13)
es decir, la suma ponderada de los inputs con sus pesos sin apticos.
1
El entrenamiento por lotes, supone que todos los datos estan disponibles al momento de
entrenar la red. Como contrapartida se encuentra el entrenamiento en lnea, que es tpico de
las redes no supervisadas (Del Bro y Molina 2002).
6
2.2.2 El perceptron multicapa (MLP)
El perceptr on multicapa es sin lugar a dudas la arquitectura de red neuronal mas
popular y de mayor uso hoy en da. Sus usos se centran en: ajuste funcional (gran
desempe no en ajuste no lineales), predicci on de series de tiempo, clasicaci on,
discriminaci on, entre otros.
La caracterstica del MLP, es el uso de hidden layers (capas ocultas) y su
regla de aprendizaje hacia atr as. De hecho es com unmente llamada como red
BP (back propagation) por el algoritmo que identica el entrenamiento de esta
arquitectura de red.
Formalmente una red MLP es: x
i
entradas en la red, y
j
las salidas de la
capa oculta y z
k
las salidas de la capa nal; t
k
ser an las salidas objetivo, w
ij
los pesos sinapticos de la capa oculta,
j
los umbrales de la capa oculta, w

kj
los
pesos sin apticos de la capa de salida y

k
los umbrales de la capa de salida. La
operaci on de un MLP de una capa oculta y neuronas de salida lineal es:
z
k
=

j
w

kj
y
j

i
=

j
w

kj
f

i
w
ji
x
i

i
(14)
siendo f(.) funcion del tipo sigmoidal. Esta es la estructura m as com un de los
MLP, aunque existen variantes como: aumento de capas ocultas, arquitecturas
recurrentes, etc.
Funahashi (1989)[11] demostr o que mediante una MLP es posible aproximar
hasta el nivel deseado cualquier funci on continua en un intervalo denido. Es
por esto que a los MLP se les conoce como los aproximadores universales de
funciones.
Los algoritmos de aproximaci on mas usados en los MLP son:
1. Back propagation(BP).
2. Gradiente Conjugado (CG).
3. Levenberg-Marquardt (LM).
4. Quickprop.
2.2.3 Red de funcion de base radial (RBF)
Las RBF son similares a las MLP puesto que permiten modelar con relativa
facilidad sistemas no lineales arbitrarios, del Brio y Sanz, op.cit. La diferencia
fundamental entre las MLP y las RBF radica en la operacion de las capas ocultas,
pues las RBF operan en base a la distancia que separa el vector de entradas
respecto del vector postsinaptico, cantidad a la que se le aplica una funcion
radial con forma gaussiana.
Sea x
i
las entradas de la red, y
j
las salidas de la capa oculta, z
k
las salidas de
la capa nal (y globales de la red). Cada neurona de la capa oculta almacena un
vector c
ji
(centroide), cada una de estas neuronas calcula la distancia eucldea r
j
que separa el vector de entradas x
i
de su centroide:
r
2
j
= ||X C
j
||
2
=

i
[x
i
c
ji
]
2
(15)
7
La salida de la neurona y
j
se calcula a partir de una funcion de activaci on radial
(r):
(r) = e

r
2
2
2
(16)
Esta funci on es simetrica. El par ametro mide la anchura de la gaussiana y es
el radio de inuencia de la neurona en el espacio de las entradas; mientras mas
grande es m as amplia ser a la region que domina la neurona sobre el centroide.
La salida de la neurona oculta j ser a:
y
j
= e

r
2
j
2
2
j
= e

i[
x
i
c
ji]
2
2
2
j
(17)
Las salidas de las neuronas ocultas son a la vez las entradas de la neurona de
salida:
z
k
=

j
w
kj
y
j
+
k
=

j
w
kj
(r
j
) +
k
(18)
Los algoritmos de entrenamiento m as usados en RBF son:
1. k-medias (KM) (usado tambien en metodos de clasicacion).
2. Optimizacion de mnimos cuadrados Pseudo Invertidos (PI).
3. K-Nearest Neighbors (KN).
4. Sub muestras. (SS).
2.2.4 Redes neuronales de regresion generalizadas (GRNN)
Las GRNN son similares a las RBF y las MLP, tienen caractersticas de ambas,
por lo tanto se pude decir que es un hbrido de estas redes. Las caractersticas
de las GRNN es que tiene mejor desempe no cuando las variables categoricas del
modelo son relativamente importantes. A la vez, el proceso de entrenamiento de
una GRNN es extremadamente m as r apido que una MLP o una RBF.
Esta arquitectura de red es nueva y los detalles matematicos de ella no estan al
alcance de esta memoria, sin embargo usted puede encontrar referencias teoricas
sobre las GRNN en, del Bro y Sanz, op.cit.
2.3 Capacidad de generalizaci on de la red
Denition 2.2. Generalizacion es la capacidad de la red de dar una respuesta
correcta ante patrones que no han sido empleados en su entrenamiento.
Una red que tiene un adecuado entrenamiento sera capaz de generalizar, del
Bro y Sanz, op.cit.
2.3.1 Validacion cruzada (cross-validation)
El sobre-entrenamiento de la red puede traer problemas como un sobre ajuste.
Esto signica que la red aprende incluso el ruido de los datos, perdiendo la ca-
pacidad de generalizacion.
Para asegurar que la red pueda generalizar, se utilizan tecnicas de validaci on.
Tales tecnicas dividen el conjunto de datos en distintos grupos con el objetivo de
entrenar y testear la red con los indicadores de desempe no y error seleccionados
[22].
8
3 Algoritmos geneticos
Los algoritmos geneticos (GA) se inspira en los procesos de la naturaleza referen-
tes a la evolucion de las especies y en su adaptaci on a distintos habitats [8]. La
codicaci on en el genoma de las caractersticas de los seres vivos, la reproduccion
y las mutaciones de las especies, permite la adaptacion de ellas al entorno en el
que viven [17].
Para la mayora de los problemas en los que se aplican algoritmos geneticos,
estos encuentran una buena soluci on (cercana a la optima) despues de las 100
generaciones.
Como se mencion o, los algoritmos geneticos son capaces de encontrar una
soluci on optima (o al menos cercana) haciendo uso de los principios b asicos de
la evoluci on en la naturaleza. Esto incluye 3 areas: selecci on, cruza (crossover) y
mutaci on. A continuaci on se describir a como un algoritmo genetico aplica estos
principios en la b usqueda de una solucion optima.
1. Creacion de la poblaci on inicial de cromosomas. Cada cromosoma est a
compuesto por un conjunto de genes (par ametros a optimizar) y estos rep-
resentan una solucion al problema propuesto. Los valores de cada gen usual-
mente son inicializados por un conjunto de valores aleatorios pudiendo el
usuario especicar lmites a ellos.
2. Evaluar cada cromosoma en la poblaci on inicial. Los cromosomas son eval-
uados mediante una funci on de ajuste (tness) que determina la calidad de
la soluci on. Esta funci on de ajuste dene el objetivo del algoritmo para el
problema en cuesti on, ejemplos de ella pueden ser: 1. Error (objetivo =
minimizar) 2. Rentabilidad (objetivo = maximizar).
3. Seleccionar los cromosomas que tendr an la informaci on y pasaran a la
siguiente generaci on. El criterio mas com un para la seleccion es el lla-
mado roulette selection. Esta selecci on est a basada en los principios de
la evoluci on, donde sobrevive el m as fuerte, esto implica que la proba-
bilidad de selecci on de cada cromosoma es directamente proporcional a su
nivel de ajuste (tness), esto es, Las mejores soluciones son m as probables
de sobrevivir.
4. Cruzar los cromosomas para producir los cromosomas descendientes. El
crossover mas usado es de cruce de 1 punto (one point crossover) y se
basa en escoger un punto aleatorio entre los cromosomas, luego intercambia
los genes de cada cromosoma con el n de producir los cromosomas descen-
dientes. Cada descendiente toma las mejores partes (genes) de sus cromo-
somas ascendientes (parents), esto lleva a conseguir una mejor soluci on al
problema.
5. Mutaci on de los genes en los cromosomas descendientes. La mutacion sirve
para introducir variabilidad en la fuente genetica de los cromosomas, sin
esta, los cromosomas descendientes estaran limitados solo a la disponibili-
dad genetica de la primera poblaci on. Uno de los mecanismos de mutaci on
m as com un es agregar valores aleatorios de una distribuci on normal a los
genes que est an mutando.
9
6. Repetici on de los pasos 3 a 5 en el contexto de una nueva poblacion de
cromosomas. Dos cromosomas son seleccionados, cruzados y mutados con
el n de producir dos cromosomas descendientes.
7. Evaluar cada uno de los cromosomas en la nueva poblaci on. Los cromo-
somas de la poblacion actual son evaluados mediante la funci on de ajuste
(tness function), tal cual fue evaluada la primera poblaci on en el paso 2.
8. Repetir los pasos 3 a 7 hasta que se cumpla una condici on denida ante-
riormente por el usuario. La condici on de termino del algoritmo pude ser:
n umero de generaciones, o tiempo transcurrido, o algo m as complejo como
convergencia del ajuste, etc.
Figure 3: Conguracion tipo de un algoritmo genetico.
La gura 3 muestra una conguraci on estandar en la denici on del algoritmo
genetico. En este caso el tama no de la poblacion es 25 la probabilidad de cruce
entre los cromosomas es de 0.9 (generalmente se usa un valor alto), la probabilidad
de mutaci on de los genes, y el criterio de termino.
Despues de la evoluci on de la poblacion inicial a traves del paso de una gran
cantidad de generaciones (generalmente 100 o m as), los cromosomas (soluciones)
de la poblacion nal seran mucho mejores que los cromosomas de la poblaci on
inicial.
3.1 Redes neuronales y algoritmos geneticos aplicados al
analisis tecnico
En las secciones pasadas se introdujeron algunas ideas b asicas acerca de las redes
neuronales, los algoritmos geneticos y el an alisis tecnico. La idea de este trabajo es
10
aplicar estos topicos en conjunto para demostrar la capacidad de las metodologas
de aprendizaje y evoluci on en la generaci on de mejores modelos que ayuden al
especulador y/o trader.
En general existen 4 combinaciones clasicas en el uso de estas metodologas:
1. Los algoritmos geneticos pueden ser usados para optimizar valores cons-
tantes en las entradas de los sistemas de entrada-salida del mercado. Esto
permite acercamientos generales a la sintona na de un activo en particular.
2. Una red neuronal puede ser usada para crear un modelo predictivo del precio
futuro de un activo nanciero, dado los valores actuales e hist oricos de
dicho activo y en conjunto con indicadores tecnicos y/o fundamentales. Los
valores predichos pueden ser usados para crear sistemas de entrada y salida
del mercado produciendo una se nal de cuando es el momento oportuno
para comprar y vender. Los algoritmos geneticos pueden ser usados para
optimizar los par ametros de entrada de la red neuronal con el n de producir
el mejor modelo posible.
3. Un tercer metodo consiste en entrenar una red neuronal para predecir una
se nal de entrada/salida. La se nal objetivo para la fase de entrenamiento se
genera mirando el comportamiento futuro del instrumento nanciero con el
n de determinar cuando es el momento apropiado para comprar y vender
el instrumento nanciero considerando una rentabilidad esperada y los cos-
tos de las comisiones. La red neuronal es entrenada para predecir estas
se nales con los datos hist oricos como variables de entrada y la se nal ob-
jetivo hist orica como variable objetivo (desired). Los algoritmos geneticos
juegan nuevamente un papel en la optimizaci on de la red neuronal.
4. Por ultimo, una red neuronal puede ser usada para crear un modelo predic-
tivo del desempe no de un portafolio de instrumentos nancieros pronosti-
cando por ejemplo las rentabilidades semanales esperadas para cada activo
y con esta informaci on se decide en que activos invertir. La funci on de los
algoritmos geneticos principalmente consiste en mejorar (optimizar) la red
en un caracterstico proceso evolutivo.
11
4 El mercado bursatil en Chile
El mercado burs atil en Chile se desarrolla desde 1893 a traves de la bolsa de
comercio de Santiago, que es una sociedad an onima abierta en la que m as del
70% de la propiedad pertenece a las corredoras de bolsa.
Los objetivos de la bolsa de comercio de santiago (denidos por ellos mismos)
son:
1. facilitar el ujo de ahorro en inversi on en el mercado de capitales.
2. Realizar la colocacion primaria de instrumentos del mercado accionario y
de bonos.
3. Promover la libre determinacion de precios y la transparencia de las opera-
ciones.
4. Promover medidas que fomenten la liquidez a precios de mercado en el
mercado secundario.
5. Regular las operaciones del mercado y supervisar las operaciones.
6. Proveer servicios, sistemas e infraestructura requeridas por los corredores
de bolsa y los participantes del mercado burs atil
4.1 Estructura del mercado de valores en Chile
La gura 4 muestra esquem aticamente la estructura organizacional del mercado
de valores en Chile.
Figure 4: Estructura del mercado de valores en Chile
La Superintendencia de Valores y Seguros es la autoridad dominante que
regula el mercado, puesto que es una institucion aut onoma con personalidad
jurdica y patrimonio propio.
12
4.2 Representaci on del mercado (

Indice)
El IPSA (

Indice de Precios Selectivo de Acciones) es un indicador de precios en


el mercado bursatil chileno. Se calcula desde el a no 1977 y est a conformado por
las 40 acciones con mayor actividad en el mercado.
El IPSA tiene una base ja al 31 de diciembre de 2002. La selecci on de la
cartera del a no en curso, se hace el ultimo da h abil del a no anterior, ese da se
seleccionan los 40 ttulos con mayor presencia promedio ponderada anual (PPPA)
la que se calcula as:
PPPA = 0, 45(PP
4
) + 0, 30(PP
3
) + 0, 15(PP
2
) + 0, 10(PP
1
), (19)
donde:
PP
4
= Presencia promedio del ultimo trimestre.
PP
3
= Presencia promedio del pen ultimo trimestre.
PP
2
= Presencia promedio del antepen ultimo trimestre.
PP
2
= Presencia promedio del tercer trimestre anterior al c alculo.
Matem aticamente el IPSA est a denido por la siguiente expresi on:
IPSA =

40
i=1
(F
i
C
i
)
t

40
i=1
(F
i
C
i
)
b
1.000, (20)
donde:
F
i
= Factor IPSA de la empresa i.
C
i
= Precio de cierre de la empresa i.
t = Momento de c alculo.
b = Fecha Base (30/Dic/2002).
Adem as:
F
i
=

P
i
R
i
S
i
10
8
E
i
, (21)
con,

P
i
=

12
t=1
d
it
d
t
100
12
(22)
donde:
d
it
= N umero de das en el mes t que se transa la accion i.
d
t
= N umero de das h abiles del mes t.
La rotacion R
i
se obtiene despues de eliminar los 2 valores extremos mnimos y
los 2 valores extremos m aximos mensuales de cada a no, es decir:
R
i
=

8
t=1
AT
it
AC
it
100
8
(23)
en los que:
AT
it
= N umero de acciones transadas de la empresa i en el mes t.
AC
it
= N umero de acciones en circulacion de la empresa i en el mes
t.
13
El n umero de acciones en circulaci on S de la empresa i, S
i
se expresa en centenas
de millones y corresponde al n umero de acciones en circulaci on de la empresa al
da h abil anterior al da de la determinacion de la cartera ( ultimo da h abil del
a no anterior al c alculo).
El factor de enlace E
i
se calcula de la siguiente forma:
E
i
=

40
i=1
FI
i
C
i

40
i=1
FI

i
C
i
100, (24)
donde:
FI
i
C
i
es la valorizaci on del IPSA seg un la cartera vigente a la fecha
de enlace (30 de diciembre de cada a no).
FI

i
C
i
es la valorizaci on del IPSA seg un la cartera que regir a el
pr oximo a no.
FI

i
=

P
i
R
i
S
i
10
8
(25)
14
5 Metodologa
5.1 Seleccion de la muestra de acciones
Con el n de obtener una muestra representativa del mercado, se denio un pro-
cedimiento de varios pasos para la incorporaci on de las respectivas acciones. El
enfoque de este trabajo est a orientado al especulador, es decir aquel que saca
ventaja de las oscilaciones del mercado comprando y vendiendo en los momen-
tos optimos. Desde este punto de vista, los instrumentos nancieros que el
especulador elija deben cumplir con la caracterstica fundamental necesaria para
operar, esta es la liquidez.
Con el n de, en cierto modo asegurar la liquidez de los instrumentos -
nancieros, se tom o una muestra de las acciones que conforman el IPSA y que
cuya metodologa de calculo se mostro en la secci on 4.
Obtenidos los pesos relativos de cada acci on en la cartera IPSA, se procedi o
a ordenar los instrumentos de mayor a menor peso, dando como punto de corte
la representaci on de al menos el 90% del mercado en la muestra.
Accion Peso IPSA Peso Muestra
Enersis 0.1027 0.1127
Cencosud 0.0961 0.1054
Endesa 0.0776 0.0851
SQM 0.0692 0.0759
CAP 0.0533 0.0585
DS 0.0523 0.0574
Colbun 0.0481 0.0528
Copec 0.0424 0.0465
Lan 0.0415 0.0456
Cervezas 0.0373 0.0410
La Polar 0.0355 0.0390
Vapores 0.0336 0.0369
CTC 0.0325 0.0357
Entel 0.0315 0.0346
Almendral 0.0287 0.0315
Corpbanca 0.0217 0.0239
Iansa 0.0211 0.0232
Bsantander 0.0208 0.0229
Falabella 0.0207 0.0228
Madeco 0.0159 0.0175
CMPC 0.0150 0.0165
Andina 0.0133 0.0147
Suma 0.9120 1.0000
Table 1: Pesos de cada acci on en el IPSA y en la muestra
15
5.2 Preparaci on de la base de datos
La preparacion de la base de datos involucr o el tratamiento que se la dara a los
valores perdidos y la conguracion de las variables para el posterior an alisis en el
software.
Desde la base de datos Economatica c , se obtuvieron las siguientes series:
1. Precio de cierre (close
i
).
2. Precio m aximo (high
i
).
3. Precio mnimo (low
i
).
4. Volumen (vol
i
).
Adem as se agrego el precio de apertura, ya que la base de datos de Economatica c
no incluye la serie de precios de apertura, para esto se retardo la serie y se asigno
como precio de apertura en el da t el precio de cierre del da anterior, esto es:
open
t
= close
t1
(26)
Con respecto a los valores perdidos, el tratamiento fue el siguiente: los das
en los que la accion no se cotiz o, el precio de cierre fue el valor de la ultima
cotizaci on disponible y se estableci o un vol
t
= 0 y precios mnimo y maximo
iguales al precio de cierre close
t
= close
t1
= low
t
= high
t
.
5.3 Denici on del estilo de trading
La denicion del estilo de trading considero las caractersticas del mercado burs atil
Chileno y las consideraciones para la gesti on del riesgo en el portafolio esto im-
plic o las siguientes decisiones:
Tipo de trade: Como en el mercado burs atil Chileno, las posiciones cortas (es-
trategias short) no estan desarrolladas, s olo se considero una estrategia de
especulaci on tipo long.
Comisiones: La determinaci on de las comisiones fue algo mas complejo, ya que
las ofertas del mercado son variadas y ademas los derechos de bolsa dismi-
nuyen escalonadamente a medida que los vol umenes transados aumentan.
El exito en la tarea de especulacion requiere de costos transaccionales ra-
zonables que no jueguen en contra de la eciencia en las operaciones. En
promedio cada accion tiene 28 operaciones completas por a no, es decir 56
transacciones (entrar y salir del mercado), esto equivale a 4.7 operaciones
por mes; si consideramos que nuestro portafolio consta de 22 acciones, el
a no tendra en promedio 103 transacciones. Por otro lado, si vericamos
que para obtener unos derechos de bolsa del 0.1%, se deben transar m as
de 20.000UF por mes y considerando que el valor de la UF es cerca de los
$17.800 pesos chilenos, mensualmente se deben transar $356.000.000 de pe-
sos; con lo que se necesitaran invertir $76.409.756 pesos en el portafolio y
que equivalen a US$147.000 dolares americanos. Si suponemos adem as que
el broker cobra una comisi on ja de US$170 (consideramos una comision
mayor a la del mercado con el n de absorver cualquier otro costo opera-
cional no considerado) con esto la comision aproximadamente de 0.125%
por transaccion.
16
Proteccion contra perdidas: Para proteger el capital, se aplic o una protecci on
stop loss del 5% sobre el precio de entrada.
Rangos en U.F. % Comision
Volumen acumulado mensual bajo 10.000UF 0.5
Volumen acumulado mensual entre 10.000UF y 19.999UF 0.3
Volumen acumulado mensual entre 20.000UF y 59.999UF 0.1
Volumen acumulado mensual sobre 60.000UF 0.05
Table 2: Tabla con los tramos cobrados por concepto de derechos de bolsa.
Figure 5: Conguracion del estilo de trading.
5.4 Parametrizaci on de la se nal a predecir
La correcta parametrizaci on de la se nal es fundamental, ya que esta dar a origen al
sistema borroso completo (Fuzzy System), desde las funciones de inclusion hasta
las variables ling usticas borrosas (barato/caro).
La se nal se obtiene despues de un proceso Fuzzy y es el producto principal
que necesitamos predecir.
Los parametros de la se nal consideraron 3 aspectos fundamentales:
1. Rentabilidad mnima por transacci on.
17
2. Perdida maxima antes de obtener la ganancia.
3. M aximo n umero de periodos a observar en el futuro.
Figure 6: Conguracion de la se nal.
En el estudio, se exigio a cada trade una rentabilidad mnima del 3% sobre
el precio de entrada; se permiti o una perdida m axima de un 1 % antes de la
obtenci on de la ganancia; por ultimo, se observaron los 7 periodos siguientes
para la determinacion de la se nal.
La gura 7 muestra el resultado del criterio denido anteriormente.
Los tri angulos verdes , representan se nales de entrada al mercado (long
enter).
Los triangulos rojos y , implican una salida del mercado.
5.5 Variables de entrada al modelo
Las variables de entrada para cada modelo, deben ser capaces de obtener una ade-
cuada representaci on del comportamiento de cada instrumento modelado. Seg un
la literatura, cada accion opera por las fuerzas psicol ogicas y l ogicas del mercado
[24, 10, 20, 25, 27, 1, 34, 6, 7, 30, 12, 9, 28, 19].
18
Figure 7: Se nal optima para la accion Copec.
5.5.1 Variables propias de cada serie
Fecha: La fecha es una forma de introducir el tiempo en el analisis. En este
sentido, los modelos de redes neuronales son similares a los modelos de re-
gresi on para series de tiempo, que incluyen una variable de tiempo para
capturar el aporte real de la(s) variable(s) regresora(s)[14, 13, 29]. El indi-
cador de tiempo, fue introducido como el n umero de barras en cada serie
de precios.
Serie implcita: De cada serie de precios, se incluyeron como variables de en-
trada los distintos precios y el volumen transado.
Da de la semana: Como se demuestra a continuacion, el retorno esperado de
las acciones es dependiente del da de la semana.
El an alisis de varianza (gura 8) hecho a la distribuci on de los retornos dia-
rios para la serie IPSA (en representaci on del mercado), demuestra que que hay
evidencia signicativa de que los retornos diarios dependen del da de la semana.
La validacion del an alisis de varianza, supone normalidad en la distribuci on
de la variable y adem as el cumplimiento de la hip otesis de homogeneidad de
varianza (a pesar de que el estadstico F muestra robustez con varianzas het-
erogeneas [2, 3, 15]). Las pruebas estadsticas aplicadas (ver tabla 4), demuestran
19
Figure 8: An alisis de varianza de la distribuci on de los retornos diarios del ndice
IPSA
Eect SS DoF MS F p
Intercept 37.85 1 37.85 26.86 0.0000
Day of Week 71.20 4 17.80 12.63 0.0000
Error 6302.16 4472 1.41
Table 3: Test de signicancia para los retornos diarios del IPSA.
la homogeneidad de varianza. Sin embargo, la prueba de normalidad muestra que
la distribucion de los retornos diarios es simetrica pero leptoc urtica.
A pesar de que la distribuci on de los retornos es leptoc urtica, Box, 1954
[4] y Lindman, 1974 [21] muestran que para una distribuci on con alto grado de
kurtosis, el estadstico F es subvalorado, pudiendo cometer el error de no rechazar
la hip otesis de igualdad de medias cuando en realidad es falsa, por lo que se puede
armar que hay diferencias signicativas en los retornos diarios entre los distintos
das de la semana.
MS Eect MS Error F p
Retorno % 0.795144 0.694551 1.144831 0.333398
Table 4: Test de Levene para homogeneidad de varianza. Retornos diarios IPSA
por da de la semana
20
5.5.2 Indicadores tecnicos
Se introdujeron algunos indicadores tecnicos como variables de entrada para cada
modelo. Todos los indicadores tecnicos se introdujeron con rangos variables de
c alculo, por ejemplo para algunas acciones un RSI de orden 9 es optimo en
la representacion de la fuerza relativa y para otras es de orden 20, se dejo al
algoritmo genetico optimizar los rangos de c alculo de cada indicador tecnico.
Los indicadores tecnicos introducidos fueron:
Promedios Moviles MA(n): Los promedios m oviles capturan la tendencia de
la serie, el orden n del promedio m ovil especica si se quiere obtener una
descripci on de corto o mediano plazo. La metodologa de calculo es:
MA(n) =
t

i=t
close
i
n
; = {0, 1, 2 . . . , n 1} (27)
Bollinger Bands: Las bandas de Bollinger originalmente desarrolladas por John
Bollinger, muestran el rango de movimiento de un promedio m ovil con re-
specto a desviaciones estandar de la serie.
BB(n, ) = MA(n)

i=t

C
i

t
i=t
C
i
n

2
n 1
(28)
= {0, 1, 2 . . . , n 1} ; C
i
= close
i
Relative Strength Index RSI(n): El ndice de fuerza relativa es muy usado
en el an alisis tecnico por los traders y sirve para identicar periodos Bullish
(valores crecen hasta llegar a 100) y Bearish (valores decrecen hasta llegar
a 0). Se calcula de la siguiente forma:
RSI(n) =
up(n)
up(n) + |down(n)|
100 (29)
donde:
up(n) =
t

i=t
C
i
n
; C
i
> 0 ; = {0, 1, 2 . . . , n 1} (30)
down(n) =
t

i=t
C
i
n
; C
i
< 0 ; = {0, 1, 2 . . . , n 1} (31)
y
C
i
= C
i
C
i1
(32)
Direction of Change DC(n): Este indicador muestra la direcci on del cambio
que ha tenido una acci on en un periodo n de tiempo. Los valores de DC(n)
son:
1 C
t
< C
tn
0 C
t
= C
tn
1 C
t
> C
tn
21
El parametro n no considera el valor actual, por ejemplo:
Close DC(1)
1 na
3 1
4 1
5 1
5 0
4 -1
Market Facilitation Index: Esta Funcion determina la eciencia del movi-
miento en el precio, a traves del an alisis del cambio en el precio por unidad
de volumen transado. Este indicador no incluye informacion acerca de la
direcci on del cambio en el precio, en lugar de eso, muestra la eciencia con
que el precio est a cambiando. Se calcula de la siguiente forma:
MFI =
high
i
low
i
vol
i
(33)
Cambios en el valor del ndice son comparados tpicamente con cambios
en el volumen, con el n de determinar el interes del mercado sobre la
tendencia actual en el precio. Existen 4 combinaciones posibles, estas son:
1.

Indice y volumen suben. El mercado se est a moviendo en una direcci on
y una mayor cantidad de gente participa en el mercado. Conrma la
tendencia de los precios.
2.

Indice y volumen bajan. El mercado entra en un proceso de letargo,
aparentemente por el descenso en el interes. Es posible que exista un
cambio de tendencia.
3.

Indice sube y volumen baja. El mercado se mueve en una direcci on,
pero no hay nuevos participantes que generen mayor volumen.
4.

Indice baja y volumen sube. El mercado transa m as, pero el precio no
se mueve fuertemente en la misma direcci on
% Dierence from Median: La mediana es un indicador m as robusto que la
media ya que elimina el efecto de los outliers. El porcentaje de la diferencia
con respecto a la media es:
%dMe(n) =
Me(n) close
i
Me(n)
(34)
Positive Volume Index: Esta funci on determina la tendencia de los precios de
mercado cuando el volumen est a creciendo.
PV I(n) =
t

i=t
C
i
C
i1
C
i1
, vol
i
vol
i1
> 0 (35)
= {0, 1, 2 . . . , n 1} ; C
i
= close
i
El valor del ndice es acumulativo y va creciendo a medida que la serie
cumple el valor n. Seg un la literatura, este ndice se usa habitualmente
22
para 1 a no de trading (255 periodos) y cuando el indicador supera el 79%,
se dice que el mercado esta al alza (bullish); si el indicador baja del 67%,
se dice que el mercado est a a la baja (bearish). Sin embargo y como se dijo
anteriormente, se dej o al algoritmo genetico determinar que valor de n es
el optimo para el indicador.
Stochastic Oscillator: Este indicador calcula la diferencia existente entre el
precio de cierre actual close
t
y su precio mnimo mas bajo ll, relativo
a su precio maximo mas alto hh para un periodo de tiempo dado. Los
par ametros habituales de este indicador son:
Close: Precio de cierre close
i
.
High: Precio maximo high
i
.
Low: Precio mnimo low
i
.
%K Period: N umero de periodos incluidos en el c alculo incluyendo el pe-
riodo actual.
%K Slowing: N umero de c alculos recientes al promedio en conjunto con
suavizamiento adicional. Por ejemplo, un Slowing=1 es un estocastico
r apido, en cambio un Slowing=3 es un estocastico lento.
SO(n) =
close
t
ll
n
hh
n
ll
n
100 (36)
El parametro s (%K Slowing), es de suavizamiento y consiste en calcular el
promedio del indicador en un periodo dado, es decir:
SO(n, s) =
t

i=t
SO(n)
s
(37)
= {0, 1, 2, . . . , s}
Time Series Forecast: Esta funci on predice el valor futuro del precio de cierre
usando una regresi on lineal de los valores hist oricos de la serie. Para ver
c omo se calcula esto, vea: [26].
Vertical Horizontal Filter V HF(n): Esta funci on determina si la serie est a
tendiendo a una fase de trading activo a traves del an alisis los valores ex-
tremos y las uctuaciones diarias.
V HF(n) =
max{C
i
} min{C
i
}
t

i=t
C
i
(38)
= {0, 1, 2, . . . , n 1}
23
5.6 Optimizaci on de los modelos
La optimizacion de los modelos consistio en la introducci on de las variables,
la denici on de la tipologa de red, el entrenamiento, la optimizaci on mediante
algoritmos geneticos, la validacion y la evaluaci on del desempe no de cada modelo.
5.6.1 Inclusion de las variables
Se introdujeron en cada modelo todas las variables especicadas en la secci on
anterior, permitiendo ademas al algoritmo genetico la exclusi on de 1 o m as de
ellas en el modelo a traves de la optimizaci on misma.
La gura 9 c omo se incluyeron las variables de entrada para el modelo pre-
dictivo de la acci on Enersis.
Figure 9: Ingreso de las variables a optimizar y de las que seran los inputs en el
modelo
5.6.2 Optimizaci on parametrica del entrenamiento
El algoritmo genetico optimiz o tanto la inclusi on de las variables de entrada,como
los siguientes componentes de la etapa de entrenamiento de las redes neuronales:
Profundidad de memoria. Implica el almacenamiento de rezagos en la va-
riable de entrada. Es aplicable s olo a tipologas de red con memoria como
las Time-Lag Recurrent.
Optimizaci on del n umero de neuronas (PE).
Optimizaci on de la tasa de aprendizaje.
Optimizaci on de los pesos sin apticos.
24
Optimizaci on del grado de aprendizaje.
Adem as, en esta etapa, se deni o cual sera la funcion de ajuste que midio
el desempe no de los modelos, se uso la minimizaci on del error de predicci on. La
gura 10 muestra la conguraci on de estos parametros en el software.
Figure 10: Conguracion de la optimizaci on hecha al proceso de entrenamiento
por el algoritmo genetico
5.6.3 Distribuci on de la muestra
El rango de datos asociado a la predicci on es usado en diferentes tareas. Parte
de los datos son usados para entrenar la red neuronal, otra parte es usada para
validar el modelo asegurando que el entrenamiento esta generando resultados
v alidos y otra parte de los datos es usada solo para testear el modelo.
Los mismos rangos de datos son usados para la optimizaci on de la predicci on
y el postprocesamiento de las se nales predichas. En general, los datos usados
en el entrenamiento son usados para determinar el nivel de ajuste del modelo.
Los datos usados para la validaci on son usados para determinar que generaci on
otorga los mejores resultados. Los datos usados para el testeo no son usados en
el proceso de optimizaci on.
Se asignaron las proporciones de la muestra total a los distintos procesos del
modelamiento, la tabla 5 muestra la asignaci on de las proporciones para cada
tem en la muestra.
La gura 11 muestra c omo fueron congurados los par ametros en el software
para la distribucion del tama no muestral en cada tem.
25

Item Porcentaje
Entrenamiento 60%
Validacion Cruzada 20%
Testeo 20%
Table 5: Distribuci on del tama no muestral
Figure 11: Conguracion de las proporciones muestrales
5.6.4 Parametrizaci on del entrenamiento
Hubo que congurar otras opciones que son especcas del entrenamiento de las
redes.
Raz on S/W: Especica un valor objetivo para la razon entre el n umero de datos
disponible para el entrenamiento sobre el n umero de pesos sinapticos en la
red neuronal. Este ratio s olo se congur o para la poblacion inicial, ya que
el algoritmo genetico optimiz o este valor.
N umero de entrenamientos: Cada entrenamiento comienza con un set de pe-
sos sinapticos iniciales los cuales pueden ser optimizados y testeados en otros
procesos de entrenamiento.
N umero de Epochs: Este valor es usado para especicar el n umero m aximo
de veces que los datos pasaran por la red para determinar el aprendizaje.
Mientras mayor sea este valor, mayor sera la probabilidad de obtener un
mejor aprendizaje.
Maximas fases sin mejora: Este parametro es usado para disminuir el tiempo
empleado en el entrenamiento y optimizaci on de los modelos, ya que si no
26
se registran mejoras en el entrenamiento de la red en periodos consecutivos,
es poco probable que exista una mejora signicativa.
La gura 12 muestra la conguracion de estos par ametros en el software.
Figure 12: Conguracion del entrenamiento de las redes
27
6 Resultados
A continuacion se presentan algunos resultados obtenidos por la aplicaci on de los
modelos de redes neuronales y optimizacion genetica al portafolio seleccionado.
Como se mostrara m as adelante, la rentabilidad obtenida por el modelo es con-
sistentemente mayor que la rentabilidad obtenida por el mercado (representada
por el IPSA) y la rentabilidad de seguir una estrategia de comprar y mantener
(Buy/Hold).
6.1 Una acci on como ejemplo
Para hacer m as f acil la comprensi on de los resultados, analizaremos gr acamente
los resultados de una accion cualquiera del portafolio, veamos por ejemplo la
primera de la lista (por orden alfabetico) Almendral.
6.1.1 Mejor modelo de red ajustado
Figure 13: Resumen de los modelos ajustados para la accion Almendral.
El mejor modelo ajustado para esta acci on fue una red TLR ver guras 13 y
14. Esta red tiene una memoria de 7 periodos y consta de 2 capas ocultas (gura
14). Adem as, el retorno anualizado es de 60.8% con 33 transacciones promedio
por a no (gura 13).
En general, a la mayora de las acciones en la muestra, la mejor arquitectura
de red que se les ajust o fue la TLR, s olo para 1 acci on se ajusto mejor un MLP,
con lo que la tipologa de red por excelencia en la descripci on de los modelos
direccionales (al menos en el mercado Chileno) seria la Time-Lag Recurrent.
28
Figure 14: Red TLR ajustada para la accion Almendral.
6.1.2 Inputs optimizados
Las variables de entrada nales obtenidas por la optimizacion del algoritmo
genetico son mostradas por la gura 15. En general cada accion tiene inputs
y par ametros de los mismos diferentes, esto implica que cada accion tiene distin-
tos patrones de comportamiento, ya sea por volatilidad de las series de precios o
volumen, o por que los fundamentos del mercado de esa acci on en particular se
mueven con caractersticas distintas al resto.
Figure 15: Inputs nales para la acci on Almendral.
29
6.1.3 Capacidad de generalizaci on
Con respecto a la capacidad de generalizaci on de la red para predecir los movimien-
tos direccionales, podemos analizar en terminos pr acticos 2 factores, uno es la
matriz de predicci on para la variable objetivo gura 16, y el otro es el desempe no
de la red como instrumento de generaci on de riqueza y que puede ser medido a
traves del an alisis de la curva de capital (equity curve) en las distintas etapas
de la muestra gura 17. La forma de leer la gura 16 es simple. La diagonal
Figure 16: Matriz de predicci on para la validaci on del modelo neuronal en la
acci on Almendral.
principal de cada una de las 3 matrices, representa el porcentaje de predicci on
perfecta de las se nales; las casillas de color gris claro, representan se nales que
no son perfectas pero que son correctas ( utiles); las casillas de color gris oscuro
(cruz sin la casilla centra) representa la proporci on de los datos indiferente (no
perjudica ni favorece las predicciones); por ultimo, las casillas rojas representan
los errores en la prediccion y que van en desmedro de los resultados.
Note que como solo estamos evaluando una estrategia larga (long), interesa
que la se nal no sea predicha por una se nal .
En este caso, el error pr actico de entrar al mercado es del 7%, 5% y 6% en
las etapas de entrenamiento, validacion y testeo respectivamente, lo que signica
un excelente desempe no.
Lo anterior es demostrado en la equity curve de la gura 17, ya que el aumento
en el patrimonio originado por la se nal es consistente en todos los segmentos
muestrales, inclusive con un aumento sustancial en los datos de testeo, datos que
no son usados en los procesos de entrenamiento y validaci on.
30
Figure 17: Comportamiento de la equity curve en las distintas etapas de la mues-
tra.
6.1.4 Analisis de rentabilidad
La gura 18 presenta un resumen del modelo ajustado, mostrando la rentabilidad
total y anualizada de: la se nal (el modelo), una estrategia de comprar y mantener,
y la rentabilidad del mercado medida por el IPSA. En este caso, la rentabilidad
total de Almendral en el periodo de analisis fue de un 346.745,88% mientras que
las rentabilidades BH e IPSA son del 79.448.73% y 4.342,78 respectivamente para
el mismo periodo de an alisis.
Adem as, se presenta un resumen el detalle de las transacciones y algunos
indicadores de riesgo y rentabilidad como el ndice de Sharpe.
Figure 18: Resumen del modelo optimizado para la accion Almendral.
31
Para terminar con el an alisis de esta acci on, a continuaci on se presenta un
resumen de cada operaci on generada por el modelo, con los respectivos efectos
en el patrimonio invertido. Se asumi o una inversion inicial en esta acci on de
10.000, pero este valor no tiene signicado puesto que el costo de cada transacci on
es un porcentaje de la inversi on (distinto sera si la comision se presenta en
forma ja, ya que a mayor inversion menor ser a el el costo de la comisi on en
terminos %), lo importante es ver los resultados en terminos porcentuales, ya
que a cualquier nivel de inversion inicial, los resultados habran sido los mismos.
Note que con una inversi on de $10.000 el 24/04/1989, para el 28/02/2006 el valor
Table 6: Resumen operacional para la acci on Almendral.
patrimonial de esa inversi on es de $34.657.587,65. Otro hecho importante es
que los costos de comision por operaci on completa (entrar y salir del mercado)
pasaron de ser $24.87 a $86.294.97, lo que explica la ineciencia existente en este
mercado por la poltica en los costos transaccionales. Para ver esto en forma
m as clara, suponga que usted invierte en el mercado FOREX (internacional) con
costos transaccionales jos equivalentes a U$60,00 dolares por operacion cerrada,
si decide invertir U$1.000,00 d olares (sin apalancamiento), el costo transaccional
equivale al 6% por lo que estamos exigiendo una variaci on favorable de al menos
6% para obtener una rentabilidad positiva; si en cambio usted decide invertir
U$10.000,00 dolares, el costo transaccional es el 0.6% del valor de la inversion
que es una exigencia signicativamente menor al 6% calculado anteriormente
y tambien mucho menor al 1.25% aplicado al mercado local. Adem as con el
crecimiento esperado en patrimonio, el costo se reduce signicativamente.
32
6.2 Resultados generales del portafolio
En esta secci on presentaremos los resultados a un nivel macro del desempe no
de los modelos. En particular interesa demostrar que es posible obtener una
rentabilidad superior al mercado utilizando esta metodologa sin la necesidad de
asumir un riesgo mayor ya que el portafolio es el mismo.
6.2.1 Resultados para el rango total de la muestra
A continuacion se presentar an los resultados obtenidos por la aplicacion de los
modelos a sus respectivas acciones, mostrando en la tabla 7 la rentabilidad del
portafolio obtenida con el modelo versus una estrategia BH.
Table 7: Resumen del portafolio.
Las deniciones de cada columna de la tabla anterior es la siguiente:
w: Representa el peso relativo de la acci on en la muestra. Como se mostr o en la
metodologa, los pesos asignados representan al portafolio IPSA que a su
vez es representa al mercado.
BH: Es la rentabilidad obtenida a traves de una estrategia comprar-mantener
(Buy/Hold). El valor al nal de la columna (4.814,4%) representa la ren-
tabilidad obtenida si se invierte en proporciones iguales para todas las ac-
ciones.
BHw: Es la misma estrategia anterior pero ponderada por los pesos de cada
acci on en la muestra. El valor al nal de la columna (4.566,4%) es la
rentabilidad del IPSA en todo el periodo.
oBH: Es la rentabilidad del modelo por sobre la rentabilidad de un estrategia
Buy/Hold, sirve como medida de desempe no.
oBHw: Es la misma anterior pero ponderada por el peso muestral de cada
acci on. Es el desempe no del modelo por sobre el mercado.
33
%Gain: Es la rentabilidad total obtenida en cada instrumento a traves de la
aplicaci on de los modelos. El valor al nal de la columna (56.145,83%)
representa la rentabilidad obtenida si se invierte en proporciones iguales en
cada accion.
%Gain w: Es la rentabilidad total obtenida y ponderada por los pesos mues-
trales de cada accion. El valor al nal de la columna es la rentabilidad
(58.588,96%) total del portafolio y es directamente comparable con la ren-
tabilidad del IPSA.
n: Es la cantidad de datos disponibles en cada serie. Es el n umero de das que
se ha transado la accion y que est a disponible en la base de datos.
A nos: Con el n umero de datos disponible, es posible calcular la cantidad de
a nos dividiendo por el n umero de das h abiles promedio que tiene cada a no
(255).
Trades: Es el n umero de trades (completos) totales efectuados en cada accion.
%GbY: Es la rentabilidad anualizada del modelo en cada accion, el valor al nal
de la columna es la rentabilidad anualizada del portafolio si se invierte en
iguales proporciones para cada acci on. La forma de calcular la rentabilidad
anualizada es:
%GbY = [
n

1 + %Gain 1]100. (39)


%GbYw: Es la misma rentabilidad anterior pero ponderada por los pesos mues-
trales de cada acci on. El valor al nal de la columa, es la rentabilidad
anualizada del portafolio.
Mk: Es la rentabilidad anualizada de cada accion utilizando una estrategia BH.
El valor al nal de la columna es la rentabilidad anual si se invierte en
proporciones iguales en cada accion. Se obtiene de la siguiente forma:
Mk = [
n

1 + BH 1]100. (40)
Mkw: Es la misma rentabilidad anterior pero ponderada por los pesos mues-
trales de cada acci on. El valor al nal de la columna, es consistente con la
rentabilidad anualizada del IPSA.
34
6.2.2 Resultados para el ultimo a no
El comportamiento de cada accion en terminos de sus patrones, va evolucionando
a traves del tiempo, por lo que se analiz o el desempe no de los modelos por
separado en el ultimo a no para ver demostrar que los resultados son actualmente
v alidos y no son un sobreaprendizaje del proceso de entrenamiento de las redes.
La tabla 8 muestra los resultados del portafolio analizados desde el ultimo
a no. Las deniciones de cada columna son las mismas que en la tabla 7.
Accion w BH BHw %GM %GMw %oBH %oBHw
Enersis 0.112 28.05% 3.16% 54.84% 6.18% 20.92% 2.36%
Cencosud 0.105 34.76% 3.66% 26.22% 2.76% -6.33% -0.67%
Endesa 0.085 50.17% 4.27% 65.70% 5.59% 10.34% 0.88%
SQM 0.075 51.04% 3.88% 51.04% 3.88% 0.00% 0.00%
CAP 0.058 39.11% 2.29% 85.29% 4.99% 33.19% 1.94%
DS 0.057 5.37% 0.31% 12.65% 0.73% 6.91% 0.40%
Colbun 0.052 20.66% 1.09% 51.03% 2.69% 25.17% 1.33%
Copec 0.046 4.97% 0.23% 23.50% 1.09% 17.66% 0.82%
Lan 0.045 6.88% 0.31% 30.30% 1.38% 21.91% 1.00%
Cervezas 0.041 0.02% 0.00% 20.92% 0.86% 20.89% 0.86%
La Polar 0.039 35.46% 1.38% 57.23% 2.23% 16.07% 0.63%
Vapores 0.036 -36.27% -1.34% -6.05% -0.22% 47.42% 1.75%
CTC 0.035 -28.31% -1.01% 12.39% 0.44% 56.77% 2.03%
Entel 0.034 42.27% 1.46% 73.08% 2.53% 21.66% 0.75%
Almendral 0.031 23.27% 0.73% 52.99% 1.67% 24.11% 0.76%
Corpbanca 0.023 -2.72% -0.06% 17.49% 0.42% 20.78% 0.50%
Iansa 0.023 245.00% 5.68% 254.91% 5.91% 2.87% 0.07%
Bsantander 0.022 30.71% 0.70% 22.69% 0.52% -6.14% -0.14%
Falabella 0.022 19.32% 0.44% 28.27% 0.64% 7.51% 0.17%
Madeco 0.017 -26.54% -0.46% 25.41% 0.44% 70.72% 1.24%
CMPC 0.016 8.62% 0.14% 29.38% 0.48% 19.11% 0.31%
Andina 0.014 6.29% 0.09% 49.50% 0.73% 40.66% 0.60%
Totales 1 25.37% 26.96% 47.22% 45.96% 21.46% 17.57%
Table 8: Resumen de resultados
Se puede observar que la rentabilidad obtenida por el IPSA en el ultimo a no
es de un 26.96% versus la rentabilidad obtenida por la aplicaci on del modelo en
los mismos instrumentos y proporciones que es de un 45.96%. Esto conrma la
validez actual de los modelos.
35
7 Conclusiones
Vistos los resultados obtenidos a traves de la aplicaci on de la metodologa ex-
puesta es posible hacer conclusiones relevantes y consistentes en los siguientes
puntos:
1. La aplicacion de redes neuronales articiales en conjunto con el analisis
tecnico y la optimizaci on por algoritmos geneticos, genera ventajas signi-
cativas en la obtencion de rentabilidades consistentes a traves del tiempo,
sobrepasando el desempe no del mercado.
2. Cada instrumento nanciero tiene sus propios patrones de comportamiento,
por lo que con los resultados obtenidos, no es posible armar que un mo-
delo de red neuronal es general y operativamente satisfactorio en todos los
instrumentos nancieros.
3. Las acciones evolucionan en sus patrones de comportamiento, ya que hubo
modelos que funcionaron muy bien por algunos periodos pero despues su
desempe no disminuy o. Esto requiere un seguimiento constante en el de-
sempe no de los modelos y la continua mejora en ellos (optimizacion da a
da).
4. Los costos transaccionales operantes en el mercado burs atil Chileno, gene-
ran ineciencias que incentivan la salida de los capitales locales con el n de
buscar rentabilidades menos exigidas; entonces el primer objetivo denido
por la BCS no se cumple, siendo responsabilidad la autoridad (Superinten-
dencia de Valores y Seguros) regular que el mercado de burs atil funcione
ecientemente.
36
References
[1] L. Blume, D. Easley, and M. OHara. Market statistics and technical anal-
ysis: The role of volume. The Journal of Finance, 49(1):153181, March
1994.
[2] G. Box. Some theorems on quadratic forms applied in the study of analysis
of variance problems: I. eect of inequality of variances in the one-way
classication. Annals of Mathematical Statistics, 25, 1954.
[3] G. Box. Some theorems on quadratic forms applied in the study of analysis
of variance problems: Ii. eect of inequality of variances and of correlation
of errors in the two-way classication. Annals of Mathematical Statistics, 25,
1954.
[4] G. Box and S. Anderson. Permutation theory in the derivation of robust
criteria and the study of departures from assumptions. Journal of the Royal
Statistical Society, 17, 1955.
[5] T. Chenoweth. A multi-component nonlinear prediction system for the s&p
500 index. Neurocomputing, 10, 1996.
[6] M. Conway and A. Behle. Professional Stock Trading: System Design and
Automation. Acme Trader, 2002. technical analysis.
[7] G. Dagnino. Proting in Bull or Bear Markets. McGraw-Hill, 2001.
[8] B. M. del Bro and A. S. Molina. Redes Neuronales y Sistemas Difusos.
Alfaomega Ra-Ma, 2a edici on edition, 2002. ISBN 970-15-0733-9.
[9] A. Elder. Trading for a Living. John Wiley & Sons, 1993. technical analysis.
[10] A. Elder. Come Into My Trading Room. John Wiley & Sons, 2002. Technical
analysis.
[11] K. Funahashi. On the approximte realization of continuous mappings by
neural networks. Neural Networks, 2, 1989.
[12] B. Graham. The Intelligent Investor. HarperCollins, 2003.
[13] W. H. Greene. Econometric Analysis. Prentice-Hall, 4th ed. edition, 2000.
[14] D. Gujarati. Econometra. McGraw-Hill, 3th edition, 1997.
[15] P. Hsu. Contributions to the theory of students t test as applied to the
problem of two samples. Statistical Research Memoirs, 2, 1938.
[16] Y. H. Hu and J.-N. Hwang. Handbook of Neural Network Signal Processing.
CRC Press, 2002.
[17] L. Jain and N. Martin. Fusion of Neural Networks, Fuzzy Systems and
Genetic Algorithms: Industrial Applications. CRC Press, 1998.
[18] E. Kalyvas. Using neural networks and genetic algorithms to predict stock
market returns. Masters thesis, University of Manchester, October 2001.
37
[19] P. Kaufman. Trading Systems and Methods. John Wiley & Sons, 3th edition,
1998. Technical and statistical analysis.
[20] A. Kostolany. El Fabuloso Mundo del Dinero y la Bolsa. Planeta, 1990.
[21] H. Lindman. Analysis of variance in complex experimental designs. Freeman
& Co, 1974.
[22] T. Masters. Practical Neural Networks Recipes in C++. Academic Press,
1993.
[23] L. Medsker, E. Turban, and R. Trippi. Neural network fundamentals for
nancial analysts. Neural networks in nance and investing. Probus Pub-
lishing Company, 1993.
[24] J. Meli. Todo Sobre la Bolsa: acerca del dinero, los toros y los osos. StrikeOp-
tion, 2002.
[25] J. Murphy. Intermarket Technical Analysis. John Wiley & Sons, 1991.
[26] J. Neter and [et al.]. Applied Linear Statistical Models. WCB/McGraw-Hill,
3rd ed. edition, 1996.
[27] V. Niederhoer and M. Osborne. Market making and reversal on the stock
exchange. Journal of the American Statistical Association, 61(316):897916,
December 1996.
[28] J. Owen and D. McCormick. The encyclopedia of trading strategies. McGraw-
Hill, 1997. Nets, Genetic and tech.
[29] D. Pollock. A Handbook of Time-Series Analysis, Signal Processing and
Dynamics. Signal Processing and its Applications. Academic Press, 1999.
[30] B. Rudd. Stock Patterns for day Trading and swing Trading. Traders Press,
Inc., 1998.
[31] M. Steiner and H. Wittkemper. Neural networks as an alternative stock
market model. Neural networks in the capital markets. John Wiley and
Sons, 1996.
[32] G. Tsibouris and M. Zeidenberg. Testing the ecient market hypothesis with
gradient descent algorithms. Neural networks in the capital markets. John
Wiley and Sons, 1996.
[33] H. White. Economic prediction using neural networks: The case of IBM daily
stock returns. Neural networks in nance and investing. Probus Publishing
Company, 1993.
[34] J. Yao, C. L. Tan, and H.-L. Poh. Neural networks for technical analysis:
A study on klci. International Journal of Theoretical and Applied Finance,
2(2):221241, 1999.
38

You might also like