You are on page 1of 5

Neurobiologa de las adicciones/ 1

Carta bsica (mini-review)


Neurobiologa de las adicciones
Juan M. Prez Franco Departamento de Psiquiatra Sur Universidad de Chile Dependencia y adiccin Dependencia y adiccin no son lo mismo y tienen diferentes connotaciones desde el punto de vista clnico, neurobiolgico y del tratamiento. Caractersticas de la dependencia Uso para evitar consecuencias desagradables de la abstinencia (hay un uso preventivo y otro paliativo). Mecanismos homeostticos: up y down-regulation de receptores es el mecanismo ms aceptado. Tolerancia/abstinencia, que constituyen dos aspectos del mismo fenmeno, son la manifestacin clnica de la dependencia. Reversible: tolerancia y abstinencia son fenmenos reversibles. Ocurre ms con administracin continua (en animales de laboratorio). Enmascara la sensibilizacin. Sustancias que provocan dependencia: benzodiazepinas, alcohol, opioides (tolerancia y sd. de abstinencia). Nicotina y cannabinol provocan menor tolerancia y sndrome de abstinencia. Cocana y estimulantes no parecen provocar abstinencia. Caractersticas de la adiccin Uso compulsivo gatillado por claves internas o ambientales. Mecanismos plsticos (aprendizaje): estn involucrados mecanismos normales de aprendizaje que son secuestrados por las sustancias de abuso. Sensibilizacin: fenmeno opuesto a la tolerancia; se ha sugerido como modelo de la adiccin (discutible). Irreversible? Fenmenos adictivos podran ser irreversibles. Ocurre ms con administracin intermitente (en animales de laboratorio). Subyace a la tolerancia; cuando desaparece la tolerancia, se hacen evidentes los fenmenos tanto de sensibilizacin como de conductas compulsivas de consumo. Sustancias que provocan adiccin: nicotina, cocana, alcohol, opioides; cannabinol tiene una baja capacidad de provocar adiccin; benzodiazepinas no provocan adiccin. Ambos fenmenos (dependencia y adiccin) son modulados de una manera crtica por el contexto donde se desarrollan y por las condiciones de actividad de los sujetos. El problema que pacientes, familiares y sistema de salud tienen que afrontar no es la tolerancia/abstinencia, sino que es la adiccin (la conducta compulsiva de consumo). Elementos clnicos relevantes Los elementos clnicos ms relevantes de la adiccin son: La desaparicin del efecto placentero: una manifestacin de tolerancia. La persistencia de la compulsin a consumir: pueden pasar aos en abstinencia, y el sujeto podra responder con consumo compulsivo ante un estmulo. La progresiva influencia de las seales ambientales e internas sobre el consumo: es muy raro que un sujeto adicto consuma sin percibir un estmulo externo (seales ambientales) o interno (tristeza, rabia o ansiedad por estrs). La incapacidad de valorar correctamente las consecuencias del consumo: el sujeto cree que consumir no traer consecuencias desagradables, a pesar de que siempre las trae; o bien no logra valorar el dao personal o social a mayor escala. La incapacidad de inhibir las conductas desadaptativas: cuando aparece el ansia y el impulso por consumir, el sujeto se muestra incapaz de controlarlos. Todos estos fenmenos tienen un fundamento neurobiolgico. Elementos que sugieren aprendizaje Hay varios elementos clnicos que sugieren que la adiccin es un fenmeno ligado a mecanismos de aprendizaje: Su persistencia ms all del trmino del sindrome de abstinencia (no parece ser el sindrome de abstinencia el que mantiene la adiccin). Progresiva transformacin de seales ambientales neutras en poderosos imanes motivacionales que gatillan el consumo compulsivo. La presencia de conductas habituadas (hbitos) compulsivos insensibles a la evaluacin de resultados. Por este motivo, para entender el fenmeno adictivo es necesario conocer los tipos y mecanismos de aprendizaje.

Aprendizaje Se pueden distinguir varios tipos de aprendizaje. Aprendizaje clsico (pavloviano) En el aprendizaje pavloviano se asocia en el tiempo un estmulo incondicionado (EI) (p.e., alimento) a un estmulo condicionado (EC) (una luz o sonido). Al presentar luego el EC, el animal tiene una respuesta de alerta, neurovegetativa, de orientacin o de aproximacin. Este aprendizaje parece asociado a una red lmbica, donde el ncleo acummbens (estriado ventral) es un elemento de integracin. Aprendizaje instrumental Aprendizaje instrumental significa que un animal realiza alguna accin a la que se asocia un resultado, y luego repite la accin si el resultado es un premio, o la evita si es un castigo. Originalmente se consider que el premio no era ms que un simple refuerzo para consolidar una relacin estmulo-respuesta (E-Rp). Sin embargo, para el animal es igualmente importante el valor que tenga el resultado. Es decir, podr realizar o no una accin en funcin del valor, y no como una simple respuesta automtica ante un estmulo. Existen por lo tanto dos tipos de aprendizaje instrumental: uno habituado (estmulo-respuesta, E-Rp), que es insensible a los cambios de valor del resultado (premio) y lleva a la formacin de

Red lmbica EI-EC Estriado ventral (accumbens)

Red sensomotora E-Rp Estriado dorsal (putamen)

Red asociativa A-Rs Estriado dorsal (caudado)

Aprendizaje pavloviano

Aprendizaje de hbitos (orientado por estmulos)

Aprendizaje contingente (orientado por resultados)

Departamento de Psiquiatra Sur Universidad de Chile

2/ Neurobiologa de las adicciones

hbitos, y otro contingente (accin-resultado, A-Rs) que s es sensible a esos cambios (por ejemplo, al satisfacer el apetito por un nutriente especfico, ese nutriente pierde valor como premio). Estos tres tipos de aprendizaje dependen de vas neurales paralelas diferenciadas y seriales, en las que los ganglios basales juegan un papel esencial. Entre el aprendizaje contingente y el de hbitos existe un permanente balance. Que resulte uno u otro depende de una serie de factores. Por ejemplo, los premios peridicos (es decir, no asociados a la tasa de respuesta sino a un ritmo temporal) tienden a generar hbito. En cambio, los premios asociados a tasa de respuesta (mientras ms acciones, ms premio) tienden a generar respuestas contingentes (orienta-das por resultados), que son sensibles a la devaluacin del premio (p.e. al permitirle al sujeto que satisfaga su apetito por el premio; o al asociar el premio con un elemento aversivo, como una sustancia que provoque nuseas). El sobreaprendizaje tambin genera hbito. El animal inicia su actividad guiado por el valor del premio (aprendizaje orientado por resultado, accin-resultado); pero si la conducta se repite, pasa a ser controlada por la red senso-motora y se transforma en un hbito (estmulo-respuesta). Una conducta habituada puede volver a ser controlada por el resultado; p.e. si el premio deja de aparecer (extincin), o si se devala (por satisfaccin o aversin), la conducta habituada poco a poco deja de producirse. Un hecho muy relevante es que el aprendizaje clsico (pavloviano) puede modular estas respuestas y favorecer el aprendizaje habituado, llegando a controlar las conductas automticas. Hay varios mecanismos a travs de los que el aprendizaje pavloviano favorece los hbitos.

tienen como premio este refuerzo condicionado y no el refuerzo incondicionado original. En todos estos procesos la DA que proviene del rea ventro tegmental (AVT) y de la sustantia nigra pars compacta (SNc) es un elemento clave, actuando como una seal instructora para la adquisicin del aprendizaje pavloviano, pero tambin tiene un rol primordial en la ejecucin instrumental. Dopamina y aprendizaje Las sustancias adictivas provocan un aumento considerable de la DA en los sitios de inervacin dopaminrgica. Posiblemente sea ste el mecanismo comn con el que las sustancias adictivas provocan la compulsin a consumir. Cul es la funcin de la DA en el aprendizaje? En trminos generales, la DA transforma el gusto (liking) por consumir, en deseo (wanting) de consumir. La DA responde a la pregunta: cmo repetir una conducta que lleve a la consumacin de un acto que tiene recompensa? Esto involucra: a. reconocer una sustancia placentera, b. las seales ambientales que garantizan su presencia (futura), y c. discriminar y repetir todas las acciones que se dan para lograr el consumo. Cmo opera la dopamina? Hay al menos dos teoras acerca de la participacin de la DA en el aprendizaje, pero ambas reconocen algunos hechos bsicos: La DA se presenta en dos estados: tnico y en rfagas (o fsico). Tiene una funcin compleja y bidireccional dependiendo de una serie de factores: concentracin alcanzada, momento en que aparezca la rfaga, estado de activacin previo de la clula, concentracin extracelular de DA base, presencia diferenciada de receptores D1 y D2, topografa cerebral y neuronal, y otros estados como el estrs.

aprendizaje habituado E-Rp

aprendizaje contingente A-Rs

Cmo repetir una conducta con la que se obtuvo una recompensa?


Asociar evaluacin emocional con elementos ambientales. Discriminar seales ambientales que pronostiquen correctamente el premio futuro. Seleccionar conductas que lleven al estado de premio guiadas por seales predictoras de premio. Si el premio no aparece cuando se le esperaba, inhibir conducta. Si el premio aparece antes o despus de lo el premio tiene forma, color y olor de pan. el olor a pan recin hecho indica que hay uno muy cerca. si hay olor a pan, acercarse a la panadera, comprar y comerse el pan. no hay pan; detener conducta de aproximacin. s haba pan, pero se acab; para otra vez

aprendizaje pavloviano EI-EC

Uno de ellos es lo que se conoce como transferencia pavlovianainstrumental (TPI). La TPI tiene tres pasos: Paso 1: el animal aprende a asociar un estmulo condicionado con uno incondicionado (aprendizaje pavloviano). Paso 2: el animal aprende a realizar una conducta (p.e. bajar una palanca) con un premio posterior (aprendizaje instrumental) que es el mismo estmulo incondicionado que se utiliz en la respuesta pavloviana. Paso 3: se le presenta el estmulo condicionado del paso 1 y el animal responde bajando la palanca. Se ha producido una transferencia pavloviana-instrumental. La TPI est fuertemente asociada a la funcin dopaminrgica. El hbito inducido por TPI es sensible a la manipulacin de dopamina (DA); el aprendizaje contingente no lo es. Un segundo efecto relevante es la produccin de refuerzos condicionados. En este caso el aprendizaje pavloviano provoca que el sujeto (animal o humano) trabaje por un refuerzo que no es primario (p.e. obtener un sonido, o dinero en el caso humano). El refuerzo condicionado puede permanecer largo tiempo activo y ser bastante insensible a la extincin. Incluso los animales son capaces de aprender nuevas asociaciones (conductas instrumentales) que

Departamento de Psiquiatra Sur

Universidad de Chile

Neurobiologa de las adicciones/ 3

La DA es un modulador y no un neurotransmisor (modifica la respuesta neuronal a la accin de otros transmisores). Su accin final la cumple a travs de la induccin de LTP y LTD; es decir, la DA induce una potenciacin o una inhibicin de sinapsis. De esta manera parece consolidar circuitos asociativos y estados emergentes en asambleas neurales. En aprendizaje asociativo: Asocia elementos sensoriales y respuestas motoras marcando cules acciones estaban presentes en el momento de percibir un refuerzo. Marca errores en la prediccin de la recompensa. Esta funcin la cumple a travs de la actividad fsica (rfagas de actividad neural) y probablemente la participacin de receptores D1. En este caso la DA parece operar dentro de la sinapsis donde es retirada rpidamente por el transportador presinptico. En flexibilidad de respuestas: Consolidacin de respuestas en la corteza prefrontal (CPF), evitando interferencias irrelevantes. Abre la puerta de la CPF para actualizar nuevos requerimientos conductuales-ambientales. Esta funcin bidireccional (estabilizacin-apertura) probablemente la cumple a travs de la actividad tnica asociada a receptores D2. La DA en este caso difunde hacia sitios extrasinpticos, donde se encuentra la mayora de los receptores D2, con un horizonte temporal mucho mayor que en la actividad fsica. Hay estudios que sugieren que las neuronas AVT productoras de DA son capaces de producir tambin glutamato, y que DA y GLU tienen acciones muy diferenciadas. Funcin tnica de la dopamina La actividad tnica de la DA genera una concentracin de DA constante que difunde hacia el espacio extrasinptico y liga receptores D2. La actividad D2 impide que las seales de la corteza prefrontal (CPF) activen el ncleo accumbens (NAcc) (acta como un freno), y simultneamente podra ser un modulador que estabiliza la emergencia de estados en la misma CPF, evitando la interferencia de otros estados neurales. El descenso de actividad tnica (cuando no aparece la recompensa esperada) permite la entrada de la CPF en el NAcc (saca el freno) y abre la organizacin de la CPF para

actualizarse en una nueva situacin. De esta manera, la CPF genera una nueva estrategia para abordar la nueva situacin (esto es aprendizaje). Funcin fsica de la dopamina La aparicin de rfagas de actividad ante seales ambientales novedosas, ante un premio (incondicionado) y ante las seales que pronostican un premio, ha sido explicada por dos teoras ms o menos contrastantes. 1. Error de diferencia temporal Las fases de DA marcan un evento que es mejor de lo esperado, de manera que miden el valor del resultado real y le restan al valor del resultado esperado (sera una seal interna que indica la discrepancia entre las expectativas y las observaciones). Las fases de DA se van trasladando desde la aparicin de una recompensa hacia aquellas seales ambientales que las predicen. Sin embargo, si el premio no ocurre en el momento esperado, la actividad de DA muestra una depresin (el valor sera menor a lo esperado) y vuelve a aparecer ante la aparicin del premio en un momento no esperado, anterior o posterior (es decir, es mejor de lo esperado porque no se lo esperaba en ese momento). Esto ha dado lugar a una importante teora acerca de la funcin fsica de la DA, que se ha llamado aprendizaje por error de diferencia temporal (temporal difference error learning,TDEL). 2. Reseleccin de conductas El TDEL ha tenido detractores y se ha propuesto otra teora que

evento inesperado

contexto (GLU) seal motora (GLU) moduladora (DA)

EC

EI

Reseleccin de conductas. Evento causado por el agente. Cuando es el agente la causa del evento, aquellos componentes contextuales y motores relevantes provocan descargas neurales que preceden las descargas fsicas dopaminrgicas.

Tiempo 1 Tiempo 2 EI precoz evento inesperado

contexto (GLU) Tiempo 3 EI retrasado EI ausente Tiempo 4


Reseleccin de conductas. Evento causado por una fuente externa. Cuando no existen descargas motoras precediendo las seales fsicas dopaminrgicas, es probable que el evento inesperado haya sido causado por una fuente externa.

seal motora (GLU) moduladora (DA)

Temporal difference error. El esquema muestra el traslado de las rfagas de DA hacia seales predictoras de recompensa, y los cambios tnicos y fsicos cuando se modifica el tiempo esperado de la recompensa.

Departamento de Psiquiatra Sur Universidad de Chile

4/ Neurobiologa de las adicciones

explica el rol de la DA en el aprendizaje, tomando en cuenta que ante la aparicin de un evento inesperado: La seal fsica de DA es previa a la observacin neta del estmulo (es pre-sacdica o pre-atencional, antes que el ojo mire). No podra por lo tanto discriminar el valor del estmulo si este no ha sido analizado en sus componentes sensoriales ni valricos. Por lo tanto no puede saber si es mejor o peor de lo esperado. El rol de la DA fsica sera ms bien marcar la multitud de eventos motores y sensoriales presentes cuando surgi la seal o la recompensa (Qu estaba haciendo cuando apareci el premio? Hice algo que lo hizo aparecer?). As es posible repetir conductas de manera selectiva (reseleccionar conductas) que pudieran haber hecho surgir la recompensa. Al repetir las conductas que probablemente provocaron la aparicin de la recompensa en un proceso iterativo, se seleccionarn poco a poco aquellas que son tiles descartando el resto (se repetirn muchas conductas supersticiosas que sern descartadas a la larga). Ante eventos displacenteros (dolor) se produce una inhibicin breve de la descarga tnica de DA (tal como cuando no aparece un premio que se esperaba), que se mantiene al menos mientras dura la noxa. Esto evitara que se consolidaran conductas que pudieran haber provocado la molestia. Cuando esta cesa, se produce un breve ascenso fsico de la DA que estara marcando posibles acciones que lograron terminar con la noxa. (Qu hice que logr detener el dolor?). El rol de la DA sera determinar fuentes de agencia fui yo el que provoc la aparicin del premio con esta conducta, y puedo repetirla. La determinacin valrica es posterior y depende de otras redes neurales, las que luego podrn colaborar en desechar conductas intiles. Drogas adictivas y dopamina Todas las drogas con potencial adictivo (alcohol, nicotina, cocana y anfetamina, opioides y cannabis) provocan una violenta elevacin en la concentracin de dopamina en los ncleos blanco de las vas dopaminrgicas (hasta 4 o 5 veces los niveles normales), y probablemente por esta va terminen por controlar un proceso de aprendizaje que, por otra parte, es normal. A este fenmeno se le suele llamar secuestro. Hay por lo menos tres fenmenos ligados al secuestro: A. El aumento (fsico) de DA provocado por las drogas adictivas podra seleccionar conductas que se realizan durante el consumo para ser aprendidas, o bien ser interpretado por el cerebro como que la seal ambiental es mejor que lo esperado (un error en la prediccin), y obliga a un aprendizaje forzado de seales ambientales que terminan transformndose en un imn motivacional. Este fenmeno probablemente sea central en la red lmbica, con el ncleo accumbens (estriado ventral) como su blanco. B. Simultneamente, la accin sobre la CPF lleva a una rigidizacin de las conductas aprendidas, y a una incapacidad de abrir la corteza a nuevas estrategias. El resultado es una conducta estereotipada e impulsiva. La accin de las drogas adictivas sobre la CPF provoca: una dificultad en la valoracin de los resultados de una accin, con lo que se pierde una seal para el cambio de estrategia una disminucin de la inhibicin de conductas que ya no son ms necesarias C. Por ltimo, el aprendizaje forzado por drogas probablemente consolide la prominencia de la red de aprendizaje habituado (estriado dorsal lateral o putamen), bloqueando la posibilidad de control por la red de aprendizaje sensible a resultado (contingente). Las drogas adictivas, a travs de la accin sobre la DA, generaran por una parte un aumento del aprendizaje por seales ambientales, que terminan controlando la apetencia por drogas y gatillando conductas estereotipadas de bsqueda y consumo; y por otra parte, estabilizan estas mismas estrategias desadaptativas, Departamento de Psiquiatra Sur

suprimiendo la valoracin de los resultados e impidiendo la inhibicin de conductas desadaptativas. Efecto de las drogas En suma, las drogas adictivas ejercen su efecto por mltiples canales, y tienen varios resultados. Afectivo (placer). Apetencia asociada a seales. Hbito compulsivo asociado a apetencia. Incapacidad para evaluacin de resultados (miopa del futuro). Incapacidad de inhibir conductas desadaptativas.

Las drogas pueden afectar muchos de estos pasos, en especial la codificacin del valor de la meta y la anticipacin de ella. Son capaces de orientar el aprendizaje hacia el hbito y hacerlo independiente o insensible al resultado. Son capaces de impedir que el sujeto evale correctamente el resultado lo que provoca un aprendizaje insensible a sus modificaciones (por ejemplo a las devaluaciones de este), pero tambin impiden la inhibicin de conductas desadaptativas. En suma, las drogas son capaces de alterar tanto el aprendizaje pavloviano (incrementan el aprendizaje ante seales que son inicialmente neutras), como impedir una correcta evaluacin de los resultados (insensibilidad a los cambios del valor de los resultados) favoreciendo conductas automticas e impulsivas. Las drogas llevan el balance de aprendizaje hacia el hbito y lo mantienen. En resumen: La dependencia es diferente de la adiccin. La adiccin se asocia a aprendizaje. La dopamina tiene un rol esencial en el aprendizaje. El aumento de DA provocado por las drogas probablemente sea el factor comn de la adiccin. Las conductas adictivas surgen a partir de la rigidizacin de respuestas y el aumento del valor de incentivo de los estmulos asociados. En ambos casos el elemento comn sera el aumento de DA. Los factores asociados a la recada tienen orgenes tanto neurobiolgicos como cognitivos. De estos, los ms vinculados a procesos neurobiolgicos suelen ser ms difciles de controlar, en particular el desencadenamiento de conductas automticas ante la presencia de seales vinculadas al consumo de drogas. Referencias Balleine B. Neural bases of food-seeking: Affect, arousal and reward in corticostriatolimbic circuits. Physiol Behav (2005) 86:717 730. Belin D, Jonkman S, Dickinson A, Robbins TW, Everitt BJ. Parallel and interactive learning processes within the basal ganglia: Relevance for the understanding of addiction. Behav Brain Res (2008) (in press) Cohen JD, Braver TS, Brown JW. Computational perspectives on dopamine function in prefrontal cortex. Current Op Neurobiol (2002) 12:223-229. Dayan P and Balleine BW. Reward, motivation, and reinforcement learning. Neuron (2002) 36:285-298. Di Chiara G and Imperato A. Drugs abused by humans preferentially increase synaptic dopamine concentra-tions in the mesolimbic system of freely moving rats. Proc Natl Acad Sci USA (1988) 85:5274-5278. Dom G, Sabbe B, Hulstijn W and Van den Brink W. Substance use disorders and the orbitofrontal cortex. Br J Psychiatry (2005), 187:209220. Goto Y and Grace AA. Limbic and cortical information processing in the nucleus accumbens. Trends Neurosci (2008) (in press). Goto Y, Otani S, Grace AA. The Yin and Yang of dopamine release: a new perspective. Neuropharmacology (2007) 53:583587.

Universidad de Chile

Neurobiologa de las adicciones/ 5

Grace AA, Floresco SB, Goto Y and Lodge D. Regulation of ring of dopaminergic neurons and control of goal-directed behaviors. Trends Neurosci (2007) 30(5):220227. Redgrave P, Gurney K, Reynolds J. What is reinforced by phasic dopamine signals? Brain Res Rev (2008) 58:322-339. Schoenbaum G, Roesch MR and Stalnaker TA. Orbitofrontal cortex, decision-making and drug addiction. Trends Neurosci (2006) 29(2):116124. Schultz W. Predictive reward signal of dopamine neurons. J Neurophysiol (1998) 80:1-27. Seamans JK, and Yang CR. The principal features and mechanisms of dopamine modulation in the prefrontal cortex. Progress in Neurobiology (2004) 74:157. Turnock M and Becker S. A neural network model of hippocampal striatal prefrontal interactions in contextual conditioning. Brain Res (2008) 1202:87 98. Yin HH and Knowlton BJ. The role of the basal ganglia in habit formation. Nature Neurosci (2006) 7(6):464476.

Revisin slo con fines docentes Juan M Prez Franco Departamento de Psiquiatra Sur Universidad de Chile 2008 56(02) 551 4400 jperez@med.uchile.cl

Departamento de Psiquiatra Sur Universidad de Chile

You might also like