Principios de Aprendizaje y Conducta PDF

PSICOLOGIA
PRINCIPIOS DE
APRENDIZAJE Y CONDUCTA
Juan Carlos Cabrera Valderrama

Cádiz 2009-2010
Descargado del campus, http://campus.felizmente.info

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capitulo 1: Introducción
Juan Carlos Cabrera - 2009/2010
Antecedentes históricos
- Desarrollo histórico del estudio de la mente.
- Desarrollo histórico del estudio de los reflejos.
El amanecer de la nueva era

- La cognición comparada y la evolución de la inteligencia.
- Neurología funcional.
- Modelos animales de la conducta humana.
- Modelos animales y robótica.
Definición de aprendizaje:
- La distinción entre aprendizaje y ejecución.
- El aprendizaje y otras fuentes de cambion conductual.
- Diferentes tipos de mecanismos causales.
Aspectos metodológicos del estudio del aprendizaje

- El aprendizaje como ciencia experimental.
- La perspectiva de proceso general en el estudio del aprendizaje.
Uso de animales no humanos en la investigación sobre aprendizaje

- Razones del uso de animales no humanos en la investigación sobre aprendizaje.
- Los animales de laboratorio y la conducta normal.
- El debate público sobre la investigación con animales no humanos.

Juan Carlos Cabrera
Antecedentes Históricos
Las aproximaciones teóricas al estudio del aprendizaje tienen

sus raíces en la filosofía de René Descartes. Antes de
Descartes, se pensaba que el comportamiento humano estaba
enteramente determinado por la intención consciente y por el
libre albedrío. Descartes reconoció que muchas cosas que
hacen las personas son respuestas automáticas a estímulos
externos, aunque no abandonó por completo la idea del libre
albedrío y del control consciente. Por tanto, formuló la visión
dualista del comportamiento humano conocida como dualismo
René Descartes (1596-1650)
cartesiano: conducta voluntaria controlada por la mente y
conducta involuntaria controlada por mecanismos reflejos.
Mundo físico (causa Órganos

de la acción sensoriales
involuntaria)
Glándula
Cerebro pineal Mente
(causa de la
Acción acción
voluntaria Músculos
voluntaria)
o involuntaria
Diagrama de dualismo cartesiano. Los órganos sensoriales detectan los eventos del mundo físico. Desde aquí la
información se trasmite al cerebro. El cerebro está conectado a la mente por medio de la Glándula pineal. La acción
involuntaria se realiza por un arco reflejo que envía mensajes en primer lugar a los órganos sensoriales al cerebro y
después del cerebro a los músculos. La acción voluntaria se inicia en la mente, que envía mensajes al cerebro y después a
los músculos.
Descartes asume que los estímulos del ambiente externo son la causa de toda conducta
involuntaria. Estos estimulos producen respuestas involuntarias por medio de un circuito
neuronal que incluye al cerebro. Sin embargo, creía que los mismos nervios transmitían la
información de los órganos de los sentidos al cerebro y del cerebro a los músculos. Este
circuito permitía reacciones rápidas a estímulos exteros ( ejemplo: retirar rápidamente un
dedo del fogón caliente).
Descartes creía que los animales carecían del libre albedrío y eran incapaces de acciones
voluntarias y conscientes, frente a los seres humanos que se les atribuía una mente o alma.
La mente como una entidad inmaterial, se conectaba al cuerpo a traves de la glándula pineal,
cerca del cerebro, por lo que podía tener conciencia de la conducta involuntaria e iniciar las

Juan Carlos Cabrera
acciones voluntarias. Dado que la conducta voluntaria se iniciaba en la mente, ésta podía
tener lugar independientemente de la estimulación externa.
El dualismo mente-cuerpo introducido por Descartes dio lugar a dos tradiciones

intelectuales, base del estudio del aprendizaje moderno:
1.- El mentalismo, se ocupaba de los contenidos y funcionamiento de la mente.
2.- La reflexología, del mecanismo de la conducta involuntaria.
Desarrollo histórico del estudio de la mente.
Los filósofos preocupados por la mente estaban interesados en descubrir qué era la mente
y cómo funcionaba. Preguntas similares se plantean los psicólogos cognitivos actuales.
En cuanto al contenido de la mente.
Descartes creía que la mente contenía ideas innatas independientemente de la experiencia

personal. La aproximación filosófica según la cual nacemos con ideas innatas acerca de
ciertas cosas se denomina innatismo.
Otros filósofos posteriores a Descartes se enfrentaron a la postura nativista, como John

Locke(1632-1704) creía que las ideas de las personas eran aprendidas directa o
indirectamente a través de experiencias posteriores al nacimiento, recibiendo esta el
nombre de empirismo.
En cuanto a cómo funciona.
Descartes creia en una mente impredecible y desordenada sin ninguna regla estricta o leyes
que pudieran identificar. Mientras que el filósofo Thomas Hobbes ( 1588-1679) fue pionero
en proponer que al igual que los reflejos, la mente operaba de forma predecible y conforme
a leyes. En concreto propuso la conducta voluntaria estaba gobernada por el principio del
hedonismo (las personas tratan de lograr el placer y de evitar el dolor).
Los empiristas británicos propusieron que las sensaciones simples se combinan hasta formar
ideas complejas por medio de asociaciones. Al oir la palabra coche cuando hemos visto un
coche, se establece asociación con estos atributos de los coches, de manera que esta
palabra volverá a activar los recuerdos de los aspectos del coche que hemos experimentado
cuando vuelva a oirla. Los empiristas británicos consideraban que tales asociaciones
constituían los ladrillos de la actividad mental y dedicaran un considerable esfuerzo en
detallar las Leyes de asociación.

Juan Carlos Cabrera
Leyes de asociación. Los empiristas británicos aceptaron dos conjuntos de leyes para el
establecimiento de asociaciones:
• Primarias: formuladas por Aristoteles que propuso tres principios,

Contigüidad: si dos eventos ocurren juntos en el espacio o en el tiempo de
forma repetida quedarán asociados. Por ejemplo, si nos encontramos con el
olor de la salsa de tomate y de los espaguetis con la suficiente frecuencia,
nuestro recuerdo de los espaguetis se activará con el mero olor de la salsa de
tomate.
Similitud y contraste: dos ideas se asocian si son similares en algún aspecto
(por ejemplo, si las dos son rojas) o si tienen alguna característica contraria
(por ejemplo, si una es muy alta y otra muy baja).
• Secundarias: varios filósofos formularon leyes de asociación secundarias, entre

ellos Tomas Brown(1778-1820) propuso que la formación de asociaciones entre
dos sensaciones estaba influida por un número de factores, incluyendo la
intensidad de las sensaciones y la frecuencia y recencia con que las dos ocurrian
conjuntamente. Además, se consideraba que la formación de una asociación entre
dos eventos dependía del número de asociaciones anteriores en las que cada uno
de dichos eventos estaba involucrado, y la similitud entre estas asociaciones
pasadas y la que se forma en el presente.
La investigación empírica de los mecanismos de asociación no comenzaría hasta el siglo XIX,

con el trabajo pionero del psicólogo alemán Hermann Ebbinghaus (1850-1909) inventor de
las sílabas sin sentido, combinaciones de tres letras sin ningún significado, estudió listas
de estas y midió su capacidad de recordarlas bajo diversas condiciones experimentales,
permitió comprobar que :
- la fuerza de las asociaciones mejoraba con el entrenamiento.

- Las sílabas sin sentido que aparecían juntas en una lista quedaban asociadas con mayor
fuerza que las sílabas que estaban más distantes,
- Una sílaba se asocia con mayor fuerza a la siguiente de la lista que a la anterior.

Juan Carlos Cabrera
Desarrollo histórico del estudio de los reflejos.
Al formular el concepto de reflejo, Descartes hizo una gran contribución a la compresión de

la conducta, aunque estaba eqivocado en sus ideas acerca del acto reflejo cuando creia que
los mensajes sensoriales iban de los órganos de los sentidos al cerebro y los mensajes
motores iban del cerebro a los músculos, viajando por los mismo nervios; y cuando pensaba
que los nervios eran tubos huecos y su transmisión neuronal involucraba gases a los que
denominó espíritus animales. Suponía que estos espíritus animales, liberados por la glándula
pineal, se desplazaban por los tubos neurales y entraban en los musculos hinchandolos y
provocando el movimiento. Por último, Descartes consideraba el movimiento reflejo era de
carácter innato y que estaban fijados por la anatomía del sistema nervioso.
Charles Bell (1774-1842) y François Magaendie (1783-1855) mostraron que eran fibras
nerviosas distintas las encargadas de transmitir la información sensorial desde los organos
sensoriales a SNC (sistema nervioso central) y la información motora, del SNC a los
músculos.
John Swanmmerdan (1637-1680) en 1669 mostró que el influjo de espiritus animales desde
la glándula pineal resultaba innecesario y Francis Glisson (1597-1677) demostró que las
contracciones musculares no se debían a que los músculos se hincharan por un gas.
Descartes y la mayor parte de los filósofos posteriores asumieron que los reflejos eran
responsables únicamente de reacciones sencillas a estímulos externos. Se suponía que un
estimulo mayor corresponde a una respuesta más vigorosa. Por ejemplo, si tocamos un
fogón, cuanto mayor sea el calor más rápido se retira la mano.
Hasta el s.XIX I.M. Sechenov (1829-1905) propuso que

los estímulos no siempre elicitan respuestas reflejas de
forma directa. En algunos casos pueden liberar respuesta
que estaba inhibida, cuya fuerza no dependerá de la
intensidad del estimulo. Por ejemplo, pequeñas particulas
de polvo pueden producir potentes estornudos. Sugirió
que formas complejas de comportamiento (acciones o
pensamientos) que ocurrian en ausencia de estímulo
elicitador manifiesto eran de hecho respuestas reflejas.
Así, la conducta voluntaria y los pensamientos están en
realidad elicitados por estímulos débiles y apenas
visibles.
Sechenov no tomó en consideración que la conducta de

I.M. Sechenov ( 1829-1905)
los organismos no permanecía fija e invariable a lo largo

Juan Carlos Cabrera
de su vida, sino que se veia alterada por la experiencia. Desde tiempos de Descartes se
consideró las respuestas reflejas como innatas y fijadas de antemano por las conexiones del
sistema nervioso y por tanto un estímulo dado elicitaría la misma respuesta a lo largo de
toda la vida del individuo.
Pavlov demostró experimentalmente que no todos los reflejos

son innatos. Mediante mecanismos asociativos se pueden
establecer nuevos reflejos para los estímulos. Trabajó desde
la tradición fisiológica de la reflexología tratanto de
determinar las leyes de la asociación mediante la investigación
experimental .
El análisis de tipo asociativo continua jugando un importante

papel en investigaciones tanto fisiológicas como conductuales,
aunque algunos han complementado los mecanismos asociativos
Ivan Pavlov (1849-1936) con otro tipo de procesos.
El Amanecer De Una Nueva Era
Los estudios experimentales sobre los principios básicos de aprendizaje se realizan

frecuentemente con animales no humanos y dentro de la tadición reflexológica.
La cognición comparada y la evolución de la inteligencia.
Surge como consecuencia de los escritos de Charles Darwin

que atacaba los privilegios que Descartes daba a los humanos
cuando asumia que sólo estos poseían mente. En su segunda
obra más importante, El origen del hombre, Darwin, argumentó
que "el hombre desciende de algún ser más primitivo, a pesar
de que por el momento se desconozcan los eslabones
intermedios". Al reclamar la continuiad entre los demás
animales y los humanos, Darwin trató de caracterizar, no sólo
la evolución de los rasgos físicos, sino tambien la evolución de
las capacidades psicológicas o mentales. En su opinión, la mente
humana es producto de la evolución. Sugería que los animales
también poseen capacidades similares a las humanas incluso Charles Darwin (1809-1882)
capaces de creer en entidades espitiruales.

Juan Carlos Cabrera
Darwin recopiló evidencias anecdóticas de formas de comportamiento inteligente en

animales, que hoy no satisface los estandares científicos pero que el tema de investigación
siguen siendo de máxima actualidad por la posibilidad de seguir la huella de la evolución de la
inteligencia por medio de destudios delas capacidades de las diversas especies animales.
George Romanes en su libro inteligencia animal de 1882, sugirió que la inteligencia podría
identificarse determinando si un animal aprende "a hacer nuevos ajustes, o a modificar los
antiguos, de acuerdo con los resultados de su propia experiencia individual". La definió como
la capacidad de aprender.
Neurología Funcional.
De acuerdo con el principio del nervismo, las principales funciones fisiológicas están
gobernadas por el sistema nervioso (SN). Ivan Pavlov dedicó su vida a investigarlo y gran
parte a la identificación de los mecanismos neurales de la digestión. El descubrimiento por
parte de los britanicos Bayliss y Starling evidenciando el control parcial del páncreas por
factores hormonal y no por factores neurales, hizo que abandonara el estudio de la
fisiología del sistema digestivo para investigar los reflejos condicionados. La afirmación de
Pavlov según la cual los estudios de aprendizaje revelan cómo opera el sistema nervioso es
ampliamente aceptada por los neurocientíficos contemporaneos. Kandel, por ejemplo, ha
comentado que "el principio central de las modernas neurociencias es que todo
comportamiento es un reflejo del funcionamiento del cerebro".
El psicólogo del comportamiento es como un conductor que trata de descubrir el

funcionamiento de un vehículo experimental probandolo, en lugar de estudiando el motor.
Los estudios conducturales del aprendizaje pueden proporcionar pistas sobre la maquinaria
del sistema nervioso. Tales estudios nos informan de la plasticidad potencial del sistema
nervioso, de las condiciones en las cuales el aprendizaje puede tener lugar, del mecanismo
por el cual persisten las respuestas aprendidas y de las circunstancias en las cuales la
información aprendida es o no accesible. Al detallar las funciones del sistema nervioso, los
estudios conductuales del aprendizaje definen los rasgos u operaciones que deben ser
explicados por investigaciones de tipo neurofisiológico.

Juan Carlos Cabrera
Modelos animales de la conducta humana.
La realización de inferencias sobre el comportamiento humano partiendo de investigaciones

con otras especies animales puede ser arriesgada, si se realiza de forma injustificada; y
controvertida si las razones para la utilización del modelo no se entiende apropiadamente.
Los modelos bases suelen ser animales de otras especies como palomas, ratones y ratones,
primates.
La utilización de animales como modelo es una herramienta cientifica básica y potente.

Permite el estudio de aspectos de la realidad que representan en condiciones sencillas,
controladas y económicas. Lo importante del modelo animal es que la caracteristica a
estudiar sea similar a las conductas humanas. Por ejemplo, las similitudes entre las ratas y
los humanos en la forma de evitar comidas peligrosas hace que la rata sea un modelo válido
para investigar el aprendizaje de aversión a la comida en humanos.
Dollard y Miller fueron partidarios de una integración en la que los estudios de laboratorio
realizados con animales no humanos se usaran para aislar e identificar los fenómenos que
podrían posteriormente ser estudiados con éxito en personas. La investigación con animales
permite también aumentar nuestra confianza en los datos obtenidos con humanos mediante
métodos de investigación menos rigurosos.
Modelos animales y robótica.
Los modelos animales de aprendizaje y conducta también revisten cierta importancia en

relación a la robótica y a los sistemas de inteligencia artificial. Los robots son máquinas
capaces de realizar funciones o tareas específicas. La meta de la robótica es hacer
máquinas tan "inteligentes" como sea posible. Al igual que Romanes definió el término
"inteligencia" a partir de la capacidad de aprender, los ingenieros actuales contemplan la
capacidad de recordad y aprender a partir de la experiencia como un rasgo importante de
los sitemas artificiales "inteligentes". La información sobre las características y
mecanismos de tal aprendizaje puede obtenerse a partir de estudios de aprendizaje
realizados por animales no humanos. Por ejemplo, en inteligencia artificial se utilizan
frecuentemente mecanismos asociativos para permitir que las respuestas de estos sistemas
sean modificables por la experiencia.

Juan Carlos Cabrera
Definición De Aprendizaje.
No hay una definición de aprendizaje universalmente aceptada. Sien embargo, muchos

aspectos quedan recogidos en las siguiente afirmación:
El aprendizaje es un cambio duradero en los mecanismos de conducta que implica

estímulos y/o respuestas específicas y que es resultado de la experiencia previa con
esos estímulos y respuestas o con otros similares.
La distinción entre aprendizaje y ejecución.
Siempre que contemplamos evidencia de aprendizaje, observamos la aparición de un cambio

en el comportamiento. Es la única forma de saber si el aprendizaje a tenido lugar. El
comportamiento está determinado por muchos otros factores distintos del aprendizaje.
La ejecución se refiere a las acciones de un organismo en un momento concreto. La

ejecución esta determinada por la oportunidad, la motivación y las capacidades sensoriales y
motoras, además del aprendizaje. Por lo que, un cambio de actuación no puede ser
automáticamente considerada como una manifestación de aprendizaje.
El aprendizaje y otras fuentes de cambio conductual.
La fatiga o cansancio , entre otros, es un mecanismo que da lugar a cambios de conducta

que es excesivamene breve para ser considerados como aprendizaje. Se produce por el
esfuerzo físico y provoca una disminución gradual en la fuerza de una respuesta. Este tipo
de cambio está producido por la experiencia, pero no se considera ejemplo de aprendizaje
debido a que la debilitación de la respuesta desaparece si se permite al individuo descansar
un rato.
Un cambio en las condiciones estimulares también puede alterar la conducta temporalmente

(La luz del cine se enciende de repente, el espectador cambia su comportamiento, y cuando
se apaga se vuelve a concentrar en la pelicula). Como tampoco puede considerarse
aprendizaje los que implican alteración en el estado fisiológico o motivacional del organismo
( el hambre, la sed, cambios en niveles hormonas sexuales, drogas psicoactivas, etc.
provocan cambios conductuales transitorios).
En algunos casos, pueden aparecer cambios persistentes en la conducta sin necesidad de la

experiencia con eventos del entorno que requiere la definición de aprendizaje. Destacabel
de este tipo es la maduración. Un niño no alcanza un objeto que está en una estantería alta
hasta que crezca lo suficiente.
10

Juan Carlos Cabrera
Diferentes tipos de mecanismos causales.
Las causas pueden ser conceptualizadas de diversas formas o a diferentes niveles de

explicación. Cuatro tipos de causas descritos por Aristóteles.
Primero , causa eficiente, hace referencia a las condiciones necesarias y suficientes

para producir un resultado en la conducta.
Segundo, causas materiales, cambios en los mecanismos sinápticos; cambios neurales.
Tercera, causas formales son las teorías o modelos de aprendizaje.
Cuarta, causas finales son las explicaciones del aprendizaje que pone énfasis en su
función o utilidad.
Los cientificos de orientación biológica a menudo establecen una distinción entre las causas
próximas o inmediatas del comportamiento y sus causas últimas. Las causas próximas se
corresponden con las causas eficientes y materiales de Aristóteles. Las causas últimas se
corresponden con las causas finales.
Aspectos Metodológicos Del Estudio del Aprendizaje.
La investigación sobre los procesos de aprendizaje se caracteriza por dos rasgos

metodológicos principales. Uno es consecuencia directa de la definición de aprendizaje y
requiere el uso de métodos de investigación experimentales, en lugar de métodos
observacionales. Los fenómenos del aprendizaje no pueden investigarse sin una metodología
experimental. El segundo rasgo metodológico es más una cuestión de preferencia que de
necesidad.
El aprendizaje como ciencia experimental.
De los cuatro tipos de causas, los investigadores del aprendizaje han centrado su atención
en las causas eficiente, materiales y formales. Independientemente del tipo de causa, este
énfasis prescribe que las investigaciones de aprendizaje utilicen una metodología
experimental. Las causas no pueden observarse directamente. Tan sólo pueden ser inferidas
a partir de los resultados de las manipulaciones experimentales.
En el estudio del aprendizaje, lo que nos interesa es la conducta de organismos vivos, en

presencia y en ausencia de la presunta causa. Hay que comparar las acciones de los
individuos que previamente han sido expuestos al procedimiento en cuestión con las acciones
de los individuos que no han sido expuestos a dicho procedimiento. La única forma de
demostrar que la exposición a ese entrenamiento es la causa del cambio conductual
11

Juan Carlos Cabrera
estudiado es manipular experimentalmente la presencia y la ausencia de dicha exposición.

Por esta razón, el aprendizaje sólo puede estudiarse mediante técnicas experimentales y
tiene lugar básicamente en el laboratorio.
La perspectiva de proceso general en el estudio del aprendizaje.
El segundo rasgo metodológico de los estudios de aprendizaje es una perspectiva basada en

procesos generales. Ésta es más una cuestión de preferencia que de necesidad. Sin
embargo, al adoptar una perspectiva de proceso general, los investigadores del aprendizaje
animal siguen una antigua tradición científica.
Elementos de la perspectiva de proceso general. La característica más obvia de la

naturaleza es su diversidad. Los cientificos han elegido fijarse en los aspectos comunes
para buscar la uniformidad y formular leyes generales con las que organizar y explicar la
diversidad de los eventos del universo. Los investigadores del aprendizaje animal han
seguido esta misma tradición.
Un presupuesto fundamental de la perspectiva de proceso general es que los fenómenos

estudiados son el resultado de procesos más elementales. Además, se asume que esos
procesos elementales operan de forma similar independientemente de dónde se encuentren.
Por tanto, se asume que la generalidad emerge a nivel de los procesos básicos o elementales.
Los investigadores del condicionamiento y el aprendizaje se han adherido a la perspectiva

de proceso general desde los comienzos de esta área de estudio en psicología. Se han
centrado en los aspectos comunes de los diversos tipos de aprendizaje y han asumido que
los fenómenos de aprendizaje son producto de procesos elementales que operan de forma
similar en diversas situaciones de aprendizaje.
El presupuesto según el cual las leyes "universales" de la asociación son las responsables de
los fenómenos de aprendizaje no excluye que los animales puedan aprender sobre multitud
de estímulos, respuestas o que cada especie tenga un ritmo de aprendizaje diferente. Se
asume que la generalidad se sitúa en los principios o procesos de aprendizaje; no en el
contenido o en la velociad del mismo. El trabajo del psicólogo del aprendizaje es descubrir
esas leyes universales.
Implicaciones metodológicas de la perspectiva de proceso general. Si asumimos que

existen principios universales de aprendizaje, entonces deberíamos ser capaces de
descubrir esos principios en cualquier situación en la que el aprendizaje tenga lugar. Por
tanto, una importante implicación metodológica de la perspectiva de proceso general es que
se pueden descubrir los principios del aprendizaje estudiando cualquier especie o sistema
de respueta que muestre aprendizaje. Los investigadores han confluido hacia unos
12

Juan Carlos Cabrera
paradigmas experimentales estandarizados o convencionales. La mayor parte de los estudios

de aprendizaje se realizan en estos paradigmas. A lo largo de los años se han ido
perfeccionando estos paradigmas experimentales convencionales, para ajustarse a las
predisposiciones conductuales de los animales de investigación. Debido a estas mejoras,
estas preparaciones experimentales permiten realizar estudios de laboratorio con
respuestas bastante naturales.
Demostración de la generalidad de los fenómenos de aprendizaje. Asumir que existen

procesos elementales de aprendizaje comunes no es lo mismo que demostrar empíricamente
estas similitudes.
La verificación empírica de la existencia de tales mecanismos comunes en diversas

situaciones sigue siendo necesaria para construir una explicación verdaderamente general
del aprendizaje. Una teoría general del aprendizaje no puede verificarse empíricamente
utilizando sólo unos pocos paradigmas experimentales estandarizados. La generalidad del
aprendizaje debe probarse realizando estudios de distintas especies y situaciones.
Uso de Animales No Humanos En La Investigación Sobre Aprendizaje.
Gran parte de los experimentos se han realizado con animales no humanos por razones
tanto teóricas como metodológicas.
Razones del uso de animales no humanos en la investigación sobre aprendizaje.
Para investigar los fenómenos de aprendizaje se requiere el uso de métodos experimentales

que puedan atribuir la adquisición de una nueva conducta a una experiencia previa en
particular. Este control experimental de la experiencia previa no puede alcanzarse con el
mismo grado de precisión cuando se utilizan sujetos humanos que cuando se utilizan
animales de labotatorio. Con los animales de laboratorio, los cientificos pueden estudiar
cómo se aprende las reacciones emocionale intensas y cómo el aprendizaje interviene a la
hora de buscar comida, evitar el dolor o el estrés, o encontrar posible pareja sexual. Con las
personas, se ven limitados a tratar de modificar las respuestas emocionales inadaptadas una
vez que éstas ya han sido aprendidas. Incluso para procedimientos terapéuticos eficaces en
el tratamiento de la conducta inadaptada requiere conocer primero los mecanismos por los
cuales se aprenden dichas respuestas emocionales, conocimiento que requiere estudios con
animales de laboratorio.
13

Juan Carlos Cabrera
Obtener información sobre las bases evolutivas y biológicas del aprendizaje, o cómo
evoluciona la cognición y la inteligencia requieren el apoyo o la utilización de animales de
investigación.
Igualmente el conocimiento de las bases biológicas del aprendizaje necesitan el apoyo de los
animales de laboratorio para desenmarañar cómo aprende y recuerda el sistema nervioso.
Los estudios conductuales de aprendizaje realizados con animales son un requisito necesario
para cualquier intento de investigar las bases biológicas del aprendizaje con animales. La
neurociencia tiene que fundamentarse en la ciencia del comportamiento.
Estudiar los procesos de aprendizaje en animales criados en condiciones de control de

laboratorio es más simples que hacerlo en personas cuyos ambientes son mucho más
variados y difíciles de describir. El comportamiento de los animales no se ve complicado por
los procesos lingüísticos que juegan un papel tan importante en determinados tipos de
conducta humana. Otra ventaja importante es que en la investigación con animales no es
necesario hacer peticiones explícitas a los sujetos. En la investigación con humanos se debe
asegurar que los participantes no están influenciados por el deseo de complacer al
investigador.
Los animales de laboratorio y la conducta normal.
Parece errónea la idea de alguno cuando sugieren que la endogamia y los largos periodos de
cautiverio de los animales domesticados de laboratorio pueden influir en la conducta normal
de estos. De hecho, los animales de laboratorio (ratas) pueden ser preferibles con fines de
investigación a sus equivalentes salvajes ya que viven en un medio tan "artificial" como el del
humano.
El debate público sobre la investigación con animales no humanos.
Ha habido un gran debate acerca de las ventajas y los inconvenientes de realizar

investigaciones con animales. Parte del debate se ha centrado en la necesidad de dar un
trato humano a los animales. Otros aspectos del debate han centrado los requisitos éticos y
que debe cumplir el trato de los animales, en el derecho de los seres humanos a
beneficiarse a expensas de los animales y en posibles alternativas a la investigación con
animales.
La ética de la investigación con animales de laboratorio. La preocupación por el bienestar

de los animales de laboratorio han dado lugar a la adopción de reglas estrictas para el
alojamiento de los animales y para la supervisión de la investigación con animales. En el caso
de la ciencia que estudia la conducta, siempre se preocupan de ese bienestar ya que no se
14

Juan Carlos Cabrera
puede obtener información sobre el aprendizaje y la conducta normales utilizando animales

enfermos o maltratados.
Algunos experimentos conllevan alguna incomodidad, sin embargo, se realizan todos los
esfuerzos necesarios para minimizarlos.
¿Qué es un trato "humano" a los animales? Asumiendo que una especie merece el trato
que establezcan las normas oficiales. A menudo se describe como "trato humano" al
tratamiento que se considera apropiado para los animales de laboratorio.
¿Deben los seres humanos beneficiarse del uso de otros animales? La relación es
simbiótica más que unilateral y de explotación. Además, el uso de animales de laboratorio en
la investigación representa tan sólo una pequeña parte del uso que otros humanos hacen de
los animales domésticos, incluyendo su uso como fuente de alimentación.
Estimaciones del número de animales empleados en avicultura y ganadería
Pollos 7.764.200.000
Gallinas ponedoras 303.604.000
Pavos 301.251.000
Ganado vacuno 59.801.000
Cerdos 104.301.000
Ovejas y corderos 6.691.000
TOTAL AVICULTURA Y GANADERÍA 8.539.848.000
Estimaciones del número de animales empleados en Investigación
Perros 75.429
Gatos 26.091
Primates 56.381
Caballos 217.079
Conejos 309.322
Animales de granja 159.742
Ratas y ratones 7.452.186
Otros 150.987
TOTAL INVESTIGACIÓN 8.452.186
*Datos de 1997 de EEUU.
Porcentaje del total empleado en investigación = 0.099%
Alternativa a la investigación con animales. La creciente preocupación por aspectos éticos

de la investigación con animales ha llevado a la búsqueda de técnicas alternativas. Russell y
Burch (1959) formularon las "tres R": reemplazamiento de animales por otras técnicas de
estudio, reducción del número de animales empeados por técnicas estadísticas y
refinamiento de los procedimientos experimentales para causar menos sufrimiento. Pero en
la investigación sobre aprendizaje no es posible la experimentación sin organismos vivos.
15

Juan Carlos Cabrera
Algunas de las técnicas propuestas:
1. Técnica observacionales. Al necesitar los estudios de aprendizaje manipulacciones

experimentales de la experiencia pasada, las observaciones realizadas sin intervenir
sobre los animales no pueden proporcionar información sobre los mecanismos de
aprendizaje.
2. Uso de plantas. El aprendizaje no puede estudiarse en plantas, ya que carecen de
sistema nervioso, imprescindible para el aprendizaje.
3. Cultivo de tejidos. Aunque los cultivos de tejidos pueden revelar las operaciones de
procesos celulares, el funcionamiento del estos procesos celulares dentro del organismo
intacto sólo puede estudiarse en el organismo intacto. Además, la búsqueda de los
mecanismos celulares del aprendizaje requiere una caracterización previa del
aprendizaje a nivel conductual.
4. Simulaciones informáticas. Sin los conocimientos precisos sobre la naturaleza de los
fenómenos de aprendizaje y de los mecanismos y factores que determinan el
aprendizaje, los programadores no pueden realizar una simulación informática. Por
tanto, la investigación con organismos vivos es un requisito para la simulación
informática efectiva.
TERMINOS CLAVE
Aprendizaje Cambio duradero en los mecanismos de Hedonismo Postura filosófica propuesta por Hobbes
conducta que implica estímulos y/o respuestas según la cual las acciones de un organismo están
específicos y que es resultado de la experiencia enteramente determinadas por la persecución del
previa con esos estímulos y respuestas o con otros placer y la evitación del dolor.
similares.
Maduración Cambio en la conducta causado por el
Asociación Conexión entre la representación mental desarrollo físico o fisiológico del organismo en
de dos eventos (dos estímulos o un estímulo y una ausencia de experiencia con eventos particulares
respuesta) de forma que la ocurrencia de uno de del ambiente.
los eventos activa la representación del otro.
Innatismo Postura filosófica según la cual los seres
Dualismo Visión de la conducta según la cual las humanos nacen con ideas innatas.
acciones pueden dividirse en dos categorías:
conducta voluntaria controlada por la mente y Nervismo Postura filosófica adoptada por Pavlov
conducta involuntaria controlada por mecanismos según la cual todos los procesos conductuales y
reflejos. fisiológicos están regulados por el sistema
nervioso.
Ejecución Actividades de un organismo en un
momento particular. Reflejo Mecanismo que permite que un evento
específico del ambiente elicite una respuesta
Empirismo Corriente filosófica según la cual todas las específica.
ideas de la mente tienen su origen en la
experiencia. Sílaba sin sentido Combinación de tres letras (dos
consonantes y una vocal) sin significado.
16

Capitulo 2: Conducta elicitada, habituación y sensibilización
Juan Carlos Cabrera – 2009/2010
La naturaleza de la conducta elicitada.

- El concepto de reflejo.
- Pautas de acción modal.
- Estímulos elicitantes de las pautas de acción modal.
- La organización secuencial de la conducta.
Efectos de la estimulación repetida.

- Atención visual en los bebés humanos.
- Salivación y evaluación del sabor en humanos.
- Respuesta de sobresalto en ratas.
Los conceptos de hatituación y sensibilización.

- Adaptabilidad y generalidad de la habituación y la sensibilización.
- Diferencias entre habituación y adaptación sensorial y fatiga.
- Teoría de proceso dual de la habituación y la sensibilidad.
Características de la habituación y la sensibilización.

- Curso temporal.
- Especificidad del estímulo.
- Efecto de un estímulo externo intenso.
Aplicación a las emociones y la conducta motivada.

- Reacciones emocionales y sus efectos posteriores.
- La teoría del proceso oponente.
- Variaciones en la conducta dirigida a metas.
17

La Naturaleza de la Conducta Elicitada (pág. 29)
Todos los animales reaccionan a los eventos que tienen lugar en su entorno. Gran parte de la
conducta tiene lugar como respuesta a los estímulos; es decir, ocurre de forma elicitada.
El concepto de reflejo.
Un reflejo conlleva dos elementos íntimamente relacionados, un estímulo elicitante y su

correspondiente respuesta. La respuesta rara vez tiene lugar en ausencia del estímulo.
Estímulo y respuesta es una consecuencia de la organización del sistema nervioso. Los

reflejos simples suelen estar mediados por tres neuronas:
- Neurona sentorial o neurona aferente, es activada por un estímulo ambiental y

transmite el mensaje sensorial a la médula espinal.
- Neurona motora o neurona eferente, trasmite el impulso desde la médula espinal que
activa el musculo involuntario en la repuesta refleja.
- Interneural el impulso que comunica las dos neuronas anteriores.
Organización neuronal de los reflejos simples. Los estímulos del entorno activan una neurona sensorial,
que trasmite el mensaje sensorial a la médula espinal. En este lugar, el impulso neuronal pasa a una
interneurona, que a su vez dirige el impulso hacia una neurona motora. La neurona motora activa al musculo
involucrado en el movimiento.
Los circuitos neuronales están dispuestos de tal modo que determinadas neuronas
sensoriales se conectan al conjunto correspondiente de neurnas motoras, por lo que una
19

determinada respuesta refleja está elicitada únicamente por un conjunto limitado de

estímulos. El conjunto formado por neurona aferente, la interneuraona y la neurona
eferente constituyen el arco reflejo.
El arco reflejo representa el número

Arco reflejo
mínimo de conexiones neuronales El estímulo provoca una reacción automática.
Componentes: Neurona sensorial, interneural, neurona motora.
necesarias para que tenga lugar el acto
reflejo, pero pueden verse involucradas esctructuras neuronales adicionales. Por ejemplo, la
información sensorial puede transmitirse al cerebro, que a su vez puede modificar la
reacción refleja de diversas formas.
La mayor parte de los reflejos contribuyen al bienestar del

organismo, constituyen una parte importante del repertorio
conductual de los niños recien nacidos y en ocasiones esencial para la
supervivencia, como el reflejo de oclusión respiratoria.
Pautas de acción modal.
Hay respuetas simples comunes en muchas especies, por el contrario, existen otras
especificas de la propia especie. Por ejemplo, la respuesta de succión provocada por objetos
situados cerca de la boca es un rasgo característico de los mamíferos.
A las secuencias de respuestas típicas de especies particulares, tales como las que aparecen
en la alimentación de crías, se las denomina pautas de acción modal o PAMs.
Estímulos elicitantes de las pautas de acción modal.
Los rasgos especificos que se requieren para elicitar la conducta reciben colectivamente el
nombre de estímulo señal o estímulo desencadenante.
Un estímulo señal o desencadenante es

Son secuencias de conducta específicas de algunas especies
suficiente para elicitar una pauta de
que se desencadenan ante un estímulo determinado
(estímulo señal o estímulo desencadenante). acción modal. Sin embargo, una
Ej: "Bailes de cortejo".
determinada pauta de acción puede
estar controlada por varios rasgos del estímulo de forma aditiva. Además, el estímulo que
elicita con mayor efectividad la pauta de acción no tiene por qué ser el que ocurra con
mayor probabilidad en condiciones naturales.
De hecho experimentos realizados con la gaviota arenquera, demostraron que el color, la

textura y el tamaño parecían controlar la conducta de recuperación del huevo de forma
aditiva. El atractivo del huevo podía resaltarse haciéndolo más verde, más moteado o más
20

grande. Al optimizar cada una de estas

Imaginemos que el parámetro más importante es el color azul.
dimensiones se obtenía un objeto que Así puede suceder que el huevo artificial más efectivo para
era más efectivo que el natural como iniciar la Pauta de acción modal (PAM) resulta ser muy diferente
del huevo real. Un huevo muy azul que no existe en la
elicitador de la pauta de acción. Estos naturaleza, pero que elicita la PAM con más fuerza que los de
estímulos inusualmente efectivos verdad, lo llamamos estímulo supranormal.
reciben el nombre de estímulos

supranormales.
La organización secuencial de la conducta.
Las conductas nunca aparecen aisladas sino que forman secuencias. Distinguimos dos tipos:
1.- Conducta apetitiva a los primeros componentes de la secuencia de

comportamiento. Sirve para poner al animal en contacto con el estímulo. Por ejemplo,
olfatear la comida antes de comerla.
2.- Conductas consumatoria a los últimos componentes de la secuencia de
comportamiento. Por ejemplo, tragar la comida. Son normalmente más estereotipadas
(menos variables) que las conductas apetitivas.
En secuencias de busqueda de comida:
1.- Modo de búsqueda general. Son conductas apetitivas. El sujeto no sabe dónde
buscar comida. Por ejemplo, la ardilla busca un nogal.
2.- Modo de búsqueda focalizada. Tambien conductas apetitiva. El sujeto ya ha

localizado espacialmente la fuente de comida, la búsqueda es ahora más restringida.
Por ejemplo, la ardillaha encontrado el nogal y comienza a buscar nueces.
3.- Modo de manipulación del alimento. Es la conducta consumatoria. Por ejemplo, la

ardilla ha obtenido la nuez.
Efectos De La Estimulación Repetida. (pág. 35 del libro)
Descartes pensaba que una respuesta simple elicitada ocurre automáticamente de la misma
forma que se presenta el estímulo elicitada. Cada aparición del estímulo elicitante producirá
la misma acción refleja. Esto no es así, dado que a menudo aparecen alteraciones en la
naturaleza de la conducta elicitada simplemente como resultado de la presentación repetida
del estímulo elicitante.
21

Atención visual en los bebés humanos.
Los bebés humanos tienen que aprender muchas cosas sobre el mundo, y una forma es
observar el entorno. Las claves visuales elicitan una respuesta de observación, que puede
medirse por el tiempo que los bebés mantienen sus ojos en un objeto antes de mirar a otra
parte.
En un estudio sobre atención visual se tomaron dos grupos de bebés de cuatro meses y se
les presentaron diferentes estímulos visuales. Los dos patrones similares a tableros de
ajedrez; uno de 4x4 y el otro de 12x12. Se presentaron durante 10s., ocho veces en
intervalos de 10s.
Patrón de tablero 4 x 4 Patrón de tablero 12 x 12
Los resultados muestran que la atención visual provocada por un estímulo novedoso cambia a
medida que el bebé se familiariza con el estímulo. Con el patron 4x4 relativamente sencillo,
la atención visual se reduce progresivamente. Con el patrón 12x12 más complejo, la atención
se incrementó en el segundo ensayo, pero después se redujo también.
Salivación y evaluación del sabor en humanos.
El sabor de la comida elicita la salivación como respuesta refleja. Esto puede observarse
tan claramene en las personas como en los perros de Pavlov.
Las personas encuentran el sabor de una comida específica menos placentera cuanto más
comen. Sin embargo, el sabor de una comida distinta es suficiente para restablecer la
valoración hedónica de una comida familiar. Estos hallazgos , del experimento realizado por
Epstein, Rodefer, Wisniewski y Caggiula, 1992, suguieren que sobrealimentación puede
reducirse no variando la alimentación disponible para su consumo.
22

Respuesta de sobresalto en ratas.
La respuesta de sobresalto es una respuesta defensiva que aparece en muchas especies.

Consiste en un salto repentino y una contracción de los músculos de la parte superior del
cuerpo, con frecuencia acompañado de una elevación de los hombros.
Davis (1974) estudió la respuesta de sobresalto en dos grupos de ratas. A cada grupo, en un
ambiente con un sonido suave de 60dB y al otro, algo más fuerte, con 80dB. Ambos grupos
recibieron 100 presentaciones de un tono de 4000 cps en intervalos de 30 segundos. Los
resultados fueron una reacción de sobresalto cada vez más débil para el grupo expuesto a
ambiente 60dB y reacciones de sobresalto cada vez más vigorosas para el grupo expuesto a
ambiente 80dB.
Los Conceptos De Habituación y Sensibilización. (pág. 39 del libro)

Los estudios descritos anteriormente
Habituación: La respuesta desciende debido a la estimulación
muestran que la presentación repetida de repetida. Ej: Acostumbrarse a vivir cerca de un aeropuerto,
un estímulo elicitante puede provocar cuando los primeros días es una tortura, por el ruido.
tanto disminuciones como incrementos en Sensibilización: La respuesta aumenta debido a la

estimulación repetida. Ej: La primera vez que escuché una
la respuesta. Las disminuciones de la ópera no había distinguido el sonido de los clarinetes, ahora
tendencia a responder producidas por la que ya la he oído muchas veces puedo diferenciar ese sonido
claramente.
estimulación repetida recibe el nombre
técnico de efecto de habituación. Los
incrementos de la tendencia a responder se llaman efecto de sensibilización.
Adaptabilidad y generalidad de la habituación y la sensibilización.
Estamos continuamente bombardeados

Habituación y sensibilización son útiles y necesarias porque
ayudan a hacer caso a ciertos estímulos relevantes y a ignorar
por estimulos. Si tuviesemos que
los estímulos irrelevantes. De lo contrario, nos moveríamos en
un maremágnum estimular poco informativo. responder a todos nuestra conducta sería
desorganizada y caótica. Los fenómenos
de habituación y sensibilización son el producto final de procesos que ayudan a organizar y
focalizar la conducta en el caótico mundo de estímulos en el que los organismos viven.
23

Diferencias entre habituación y adaptación sensorial y fatiga.
La habituación no es el único efecto

que da lugar a una disminución en la
respuesta. La adaptación sensorial
ocurre en los órganos sensoriales (una
cegera temporal al pasar de la
oscuridad a una luz) y la fatiga de la
respuesta tiene lugar en los músculos
efectores. Por el contrario, la
habituación y la sensibilización
ocurren en el sistema nervioso.
En la habituación, el órganismo deja de responder a un estímulo aunque mantiene la

capacidad de percibirlo y de realizar los movimientos musculares requeridos por la
respuesta. La respuesta no tiene lugar debido a los cambios en el sistema nervioso bloquean
la transmisión del impulso nervioso de la neuronas motoras.
En los estudios sobre habituación, la adaptación sensorial puede descartarse ya que existe
evidencia de que la habituación es específica de la respuesta.
La fatiga también puede descartarse como causa de la habituación por medio de evidencias
que muestra que la habituación es específica del estímulo.
Adaptación sensorial: pérdida de sensibilidad de ls Fatiga: Reducción de la respuesta producida por el

organos sensoriales ( ej: deslumbrarse por una luz muy cansancio de los músculos involucrados en ella.
fuerte).
¿En qué se parece y en qué se distingue de la
¿Cómo distinguirla de la Habituación? Habituación?
La adaptación sensorial...
1. La fatiga sí puede ser consecuencia de una estimulación
1. No se debe a una estimulación repetida, como la repetida, como la Habituación. Ejecutar una misma
Habituación, sino a una estimulación demasiado potente. respuesta continuamente produce fatiga.
2. No sucede en el sistema nervioso central, como la 2. Sin embargo, la fatiga no sucede en el sistema nervioso,
habituación, sino en los órganos sensoriales. No es por no es aprendizaje, sino en los músculos que ejecutarían
tanto una forma de aprendizaje. la respuesta. Un brazo cansado no puede ejecutar la
respuesta.
3. No es específica de la respuesta. Si los órganos
sensoriales están afectados, todas las respuestas 3. La fatiga no es específica del estimulo, como sí lo es
disminuirán porque los estímulos no son bien captados por la Habituación. En el caso de la Habituación, un cambio en
los sentidos. Por el contrario, en la habituación, sólo el estímulo devuelve la respuesta normal. Sin embargo, un
desciende una respuesta, otras respuestas diferentes músculo fatigado no puede volver a ejecutar la respuesta
pueden ser ejecutadas con normalidad. por haber cambiado el estímulo presentado.
4. Es un tipo de efecto muy transitorio. 4. Igualmente es un cambio muy transitorio: sólo hace
falta descansar un rato.
24

Teoría de proceso dual de la habituación y la sensibilidad.
La teoría del proceso dual presupone que los incrementos y disminuciones en la tendencia a
responder a un estímulo son producto de procesos neuronales diferentes: Proceso de
habituación, rovoca una disminución de la tendencia a responder y proceso de
sensibilización, produce un incremento en la tendencia a responder. Estos procesos no son
exlcuyentes y ambos pueden estar activos al mismo tiempo. El resultado conductual depende
de qué proceso sea más fuerte.
En base investigaciones neuropsicológica, los

procesos de habituación y sensibilización
tienen lugar en diferentes partes de sistema
nervioso. La habituación tiene lugar en el
sistema E-R, que consiste en el camino
neural más corto que conecta los órganos
sensoriales activos por el estímulo elicitante
y los músculos involucrados en la producción
La teoría del proceso dual integra los dos procesos de
de la respuesta elicitada ( como el arco habituación y sensibilización.
reflejo). Cada presentación de un estímulo
Los dos procesos suceden al mismo tiempo: la conducta
elicitante activa el sistema E-R y causa un observada es el resultado neto de los dos. ¿Quién es más
incremento en la habituación. fuerte?
Los procesos de sensibilización tienen lugar en el sistema de estado. Este determina la

tendencia general de un organismo a responder, mientras el sistema E-R permite al animal
dar la respuesta específica al estímulo relevante. Los cambios de conducta que tienen lugar
por la repetición de un estímulo refleja la acción combinada de los sistemas E-R y de
estado.
Los dos procesos (habituación y sensibilización) tienen lugar en distintas partes del SN.
El proceso de habituación tiene lugar en el sistema E-R (similar al arco reflejo). Cada presentación de un estímulo activa
el sistema E-R aumentando la habituación.
El proceso de sensibilización tiene lugar en el sistema de estado (determina la tendencia a responder). Sólo se activa ante
la presentación repetida de estímulos excitadores (por tanto, no está activo todo el tiempo). Se puede modificar esa
tendencia mediante drogas o estados emocionales ( ej: el miedo).
La conducta observada será el resultado de la combinación de los dos procesos, por lo tanto depende de cuál de los dos sea
más fuerte en un momento dado.
Aplicaciones de la teoría del proceso dual. En los ejemplos de habituación y

sensibilización, la exposición repentida al patrón ajedrez 4x4 produjo una disminución de
respuesta visual de los bebés, posiblemente no provocó mucha activación del sistema E-R,
proceso de habituación. El patrón ajedréz 12x12, más complejo, produjo mayor activación y
25

activó, no sólo el sistema E-R, sino también el sistema estado. Produjo un incremento en la
atención visual después del primera presentación. Sin embargo, el proceso de sensibilización
no fue lo suficientemente fuerte para contrarestar completamente los efectos de la
habituación. Como resultado, despues de varios ensayos, la atención visual tambien declino
en respuesta al estimulo 12x12.
La respuesta de sobresalto de las ratas anteriormente comentadas requieren una aplicación

diferente de la teoría del proceso dual. Cuando se sometió a prueba con ruido ambiental
relativamente suave (60 dB), no había nada que las activara. Por tanto, podemos asumir que
los procedimientos experimentales no produjeron cambios en el sistema estado. La
presentación repetida de tono elicitador activaba tan sólo el sistema E-R, lo que dio lugar a
la habituación de la respuesta de sobresalto.
El resultado contrario tubo lugar cuando fueron puestos en presencia de los 80 dB.
Sucesivas presentaciones del tono aparecieron reacciones de sobresalto más enérgicas.
Dado que en ambos grupos se utilizó el mismo tono, la diferencia en los resultados no puede
ser atribuida al mismo. Debemos asumir que en el segundo grupo, el ruido ambiente intenso
incrementó el nivel de activación o la tendencia a respuesta. Esta sensibilización del sistema
de estado fue la causa del incremento en la reacción de sobresalto al tono en el segundo
grupo.
Implicaciones de la teoría del proceso dual. El sistema E-R se activa siempre que un
estímulo elicita una respuesta, mientras que el sistema de estado sólo interviene en
circunstancias especiales.
Características de la habituación y la sensibilización. (pág. 45 del libro)
Curso temporal.
Por lo general duran poco tiempo, lo suficiente para ser considerarlos formas de
aprendizaje.
Curso temporal de la sensibilización por lo general tienen efectos temporales y su

duración depende de la intensidad de los estímulos. Los estímulos más intensos producen
mayores incrementos en la tendencia a responder y una sensibilización más persistentes.
Curso temporal de la habituación. La persistencia es variable. En la habituación se

distingue entre habituación a corto plazo (se disipa en segundos o minutos) y habituación a
26

largo plazo (persiste durante muchos días). La recuperación espontánea es la principal

característica del efecto de habituación a corto plazo.
Especificidad del estímulo.
Especificidad del estímulo en la habituación. La habituación es específica del estímulo que

ha sido presentado repetidamente. Una respuesta a un estímulo previamente habituada
puede manifestarse plenamente alterando alguna característica importante del estímulo.
Ejemplo, después de habituarse al sabor del limón, la presentación de la lima recupera la
respuesta totalmente.
Aunque la habituación es específica de un estímulo, puede darse cierta generalización. Si

nos hemos habituado a un determinado sonido del reloj, es posible que tampoco
respondamos al sonido de otro reloj que es similar al original. Este fenómeno recibe el
nombre de generalización del estímulo de la habituación. A medida que los estímulos se
hacen progresivamente diferente, el organismo mostrará una menor habituación o supresión
de la respuesta ante dicho estímulo.
Especificidad del estímulo en la sensibilización.
La sensibilización no es específica del estímulo.Si una animal se sensibiliza por alguna razón,
su reactividad se incrementá para toda una variedad de estímulos.
Especialidad del estímulo:
- Habituación: Muy específica del estímulo (cambiamos el estímulo y la respuesta).
- Sensibilización: No específica del estímulo. Cuando el animal se sensibiliza (por estados de alerta, miedo, ingestión de
drogas), está hipersensible para casi cualquier estímulo que vaya a presentarse.
Efecto de un estímulo externo intenso.
La respuesta habituada también puede

restablecerse sensibilizando al organismo con Un estímulo intenso puede producir en el animal un estado
de sensibilización que recupera la respuesta anteriormente
la exposición de un estímulo externo. Este habituadas: Deshabituación.
fenómeno recibe el nombre de
deshabituación.
27

Aplicación a las emociones y la conducta motivada. (pág. 49 del libro)
La exposición de los cambios producidos por la repetición de un estímulo se ha limitado

hasta ahora a respuestas relativamente sencillas. Los estímulos también pueden provocar
emociones complejas, tales como amor, miedo, euforia, terror o satisfacción.
Reacciones emocionales y sus efectos posteriores.
Solomon y Corbit (1.074) destacaron dos rasgos llamativos.
• Las reacciones emocionales intensas a menudo constas de dos

fase:
- Primero, tiene lugar durante la presentación del estímulo
elicitante, y
- Segundo, la opuesta se observa cuando el estímulo
desaparece.
R.L. Solomon
Por ejemplo, el efecto psicoactivo del alcohol. Una persona se
vuelve alegre y relajada, y experiementa sensaciones de cáracter generalmente agradable
cuando toma una un vaso de vino. Estas reacciones reflejan el efecto sedante inicial del
alcohol. Por el contrario, tras tomar varias bebidas ocurre algo bastante distino. Una vez
que el efecto sedante del alcohol se ha disipado, es probable que la persona se vuelva
irritable y que experimente dolor de cabeza y náuseas. El efecto sedante y placentero del
alcohol da paso a la sensaciones molestas de la resaca.
Cuanto más bebemos más

alegres o sedados quedamos y
más intensa es la resaca Reacción emocional
Reacción emocional
posteriormente. "positiva": Euforia y
"negativa": Irritabilidad,
agresividad.
relajación.
• Las reacciones emocionales cambian con la experiencia. La reacción primaria se hace más
débil y su postefecto se hace más fuerte. La habituación de la
Tolerancia a las drogas: primera reacción a la droga se llama tolerancia a la droga, lo que
habituación a la emoción
primaria que producen. hace referencia a la disminución en la efectividad a una droga con
las exposiciones repetidas.
Solomon y Corbit (1974) destacaron que se producen patrones de reacción emocional

similares con otros estímulos emocionales. El amor y el apego, por ejemplo, la habituación
primaria va acompañada de un fortalecimiento del postefecto afectivo.
28

La teoría del proceso oponente.
La teoría del proceso oponente de la motivación se diseño para explicar estos tres rasgos
característicos de las reacciones emocionales:
1. Las reacciones emocinales son bifásicas; a una reacción primaria sigue un postefecto
opuesto.
2. La reacción primaria se debilita con la estimulación repetida.
3. El debilitamiento de la reaccion primaria va acompañado por un fortalecimiento del
postefecto.
Esta teoría asume que hay que mantener el equilibro (homeostasis) emocional. Toda emoción primaria, activa un proceso
oponente de signo contrario para compensarla.
El porceso oponente empieza siendo más débil que el proceso primario (ejemplo, felicidad) pero también aumenta de
fuerza más rápido que el proceso primario. Por lo tanto, con la estimulación repetida, el proceso oponente se va haciendo
más fuerte que el proceso primario ( la tristeza gana a la felicidad). Esto sería Habituación..
Mecanismos oponentes durante la exposición inicial al estímulo.
La figura 2.16 muestra cómo los procesos primario

y oponente determinan la respuesta iniciales de un
organismo ante un estímulo emocional activador.
Cuando el estímulo se presenta por primera vez
(panel inferior) el proceso a tiene lugar sin la
oposición del proceso b. Esto permite que la
reacción emocional primaria alcance su nivel más
alto. Después se activa el proceso b y comienza a
oponerse al proceso a. Sin embargo, en la primera
presentación del estímulo el proceso b no es lo
suficientemente fuerte para compensar por
completo la respuesta emocional primaria, que
persiste mientras está presente el estímulo
elicitante. Cuando el estímulo se retira, el proceso
a se detiene rápidamente, pero el proceso b
Figura 2.16 permanece por algún tiempo. En ese momento, no
hay nada que se oponga al proceso b, y la respuesta emocional característica del proceso
oponente se hace evidente por primera vez. Estas emociones son por lo general opuestas a
las que se observan durante la presentación del estímulo.
29

Mecanismos oponentes tras la exposición prolongada al estímulo.
La figura 2.17 muestra cómo funcionan los

procesos primarios y oponentes tras la exposición
prolongada al estímulo. Un estímulo familiar no
elicita reacciones emocionales fuertes, pero el
postefecto afectivo tiende a ser más fuerte
cuendo termina un estímulo familiar. La teoría del
proceso oponente explica este resultado
asumiendo que el proceso b fortalece con la
exposición prolongada al estímulo. El
fortalecimiento del proceso b se refleja en varias
de sus características: se activa antes tras la
aprición del estímulo, su intensidad máxima se
hace mayor y tarda más tiempo en decaer tras la
desaparición del estímulo. Por el contrario, se
Figura 2.17 asume que el proceso a pertenece inalterado. Por
tanto, tras la presentación repetida de un
estímulo, la respuesta emocional primaria queda compensada de forma más efectiva por el
proceso oponente. Este fortalecimiento del proceso oponente reduce la intensidad de las
respuestas emocionales primarias observadas durante la presentación del estímulo
emocional activador. También da lugar a un postefecto emocional intenso cuando el estímulo
se retira.
Motivación y postefecto oponente. Si los efectos placenteros iniciales de una droga

psicoactiva desaparecen en los consumidores habituales ¿por qué continúan tomando la
droga? ¿Por qué se hacen adictos?. La teoría del proceso oponente suguiere que la adicción
a las drogas es principalmente un intento de reducir la aversión producida por el postefecto
afectivo de las drogas. Hay dos formas de reducir los postefectos oponetes aversivos.
Esperar a que se disipen ( "pasar el mono" , puede tardad mucho tiempo y puede ser muy
duro) o tomando de nuevo la droga para reducir más rápidamente los postefectos
oponentes. Quedan atrapados, no por el placer directo que obtienen de la droga, sino de la
necesidad de reducir los efectos de la retirada.
Valoración general de la teoría del proceso oponente. La teoría del proceso oponente
resultó muy atractiva cuando se presentó, ya que abarca un amplio rango de situaciones y
proporciona una interesante explicación de la tolerancia a las drogas, así como la
dependencia y la adicción. Aún está pendiente de probar de forma empírica muchas de sus
predicciones en varias situaciones.
30

Adicción a las drogas y proceso oponente
Las drogas ( en general, toda sustancia psicoactiva) activan un proceso primario positivo (euforía, "colocón") y también un
proceso oponente negativo ("bajón", resaca, "mono") que le sigue después.
1 . Nada más tomar la droga, el proceso primario gana ("colocón").
2. Al retirar la droga, el proceso oponente permanece un tiempo ("bajón").
Con la estimulación repetida, se va haciendo más fuerte el proceso oponente (habituación=tolerancia a la droga). El
usuario de la droga que ha desarrollado tolerancia siente los efectos positivos cada vez menos, y los efectos negativos
cada vez más.
A veces, el bajon (proceso oponente) puede durar mucho tiempo y ser inaguantable (eso es "pasar el mono"). Una manera de
reducir su duración es volver a tomar la droga para reiniciar el proceso primario. Así se explica la adicción. El adicto
no acude a la droga por sus efectos positivos, sino para detener los efectos negativos... por un tiempo.
Variaciones en la conducta dirigida a metas.
Responder para escapar de la molestia producida por la retirada de un estímulo es sólo uno
de los tipos de conducta motivada a dirigir a metas. Un objeto meta gratificante recibe el
nombre técnico de reforzador. Las situaciones en la que los organismos responden
repetidamente para obtener un reforzador muestran muchas de las propiedades comunes
de la habituación y la sensibilización.
Ejemplo: El acto de encender un lector de disco ppara escuchar una canción particular. Es
menos problable que encedndamos el lectos si el resultado es siempre la misma canción
(habituación), pero esta pérdida de interés es especifica de esa canción repetida
(especificidad del estímulo). Además, recuperaremos nuestro interes en la canción origianl
si no la escuchamos durante unos días ( recuperación espontánea). Nuestro interés por la
canción conocida tambien puede establecerse por la exposición a estímulos novedosos, tales
como la excitación de encontrarnos con un amigo (sensibilización)
La habituación y la sensibilización son frecuentes con reforzadores sensoriales como

pueden ser las piezas musicales. También tienen lugar fenómenos similares a la habituación
y la sensibilización con objetos meta consumibles, como la comida y el agua. La exposición
repetida a la comida, por ejemplo, provocará un descenso de la conducta dirigida a la
alimentación. La disminución de la conducta dirigida a alimentos normalmente puede
atribuirse a la reducción del hambre o saciedad, pero también pueden estar involucrados los
mecanismos generales de la habituación.
31

TERMINOS CLAVE
Adaptación sensorial Reducción temporal en la Estímulo supranormal Estímulo señal artificial-mente
sensibilidad de los órganos sensoriales provocada agrandado o exagerado que elicita una respuesta
por la estimulación repetida o excesiva. inusualmente vigorosa.
Arco reflejo Estructura neural que consiste en una

neurona aferente (sensorial), una interneurona y Fatiga Disminución temporal de la conducta causada
una neurona eferente (motora) y que permite que por el uso repetido o excesivo de los músculos
un estímulo pueda elicitar una respuesta refleja. involucrados en la conducta.
Conducta apetitiva Conducta que tiene lugar al Interneural Neurona de la médula espinal situada
principio de una secuencia natual de conducta y entre la neurona aferente (sensorial) y la
que sirve para poner al organismo en contacto neurona eferente (motora) en el arco reflejo.
con un estímulo desencadenante. (Véase también
modo de búsqueda general y modo de búsqueda Modo de búsqueda focalizada Segundo componente
focalizada.) de la secuencia de conducta de alimentación, tras
la búsqueda general, en el que el organismo pone
Concucta consumatoria Conducta que lleva a en marcha una conducta centada en la
consumar o completar una secuencia natural de localización de un estímulo particular que indica
conducta. La respusta consumatorias son, por lo la presencia de alimento. La búsqueda focalizada
general, patrones de acción modal específicos de es una forma de conducta apetitiva más
la especie. (Véase también modo de manipulación directamente relacionada con el alimento que la
del alimento.) busqueda general.
Deshabituación Recuperación de una respuesta Modo de búsqueda general Primer compnente de la

habituada como resultado de la presentación de secuencia de conducta de alimentación, en la que
un estímulo externo e intenso. el organismo pone en marcaha una conducta
motora sin dirección fija. La búsqueda general es
Efecto de habituación Disminución progresiva en el una forma de conducta apetitiva.
vigor de la conducta elicitada que puede tener
lugar con la presentación repetida del estímulo Modo de manipulación del alimento Último
elicitante. componente de la secuencia de conducta de
alimentación en el que el organismo manipula y
Efecto de sensibilización Incremento en el vigor de consume el alimento. Es similar a lo que los
la conducta elicitada que puede resultar de la etólogos llaman conducta consumatoria.
presentación repetida del estímulo elicitante o
de la exposición a un estímulo externo intenso. Neurona aferente Neurona que transmite mensajes
de los órganos de los sentidos al sistema nervioso
Estímulo desencadenante Lo mismo que estímulo central. También recibe el nombre de neurona
señal. sensorial.
Estímulo señal Rasgo específico de un objeto o Neurona eferente Neurona que transmite los
animal que elicita una pauta de acción modal en impulsos a los músculos. También llamada
otros organismos. También llamado estímulo neurona motora.
desencadenante.
Neurona motora Lo mismo que neurona eferente.
Neurona sensorial Lo mismo que neurona aferente.
32

Recuperación espontánea Recuperación de una

PAM Abreviatura de pauta de acción modal. respuesta habituada o de una respuesta
exinguida tras un período de descanso.
Pauta de acción modal Patrón de respuesta exhibido
de forma similar por la mayoría de los miembros Reforzador Estímulo cuya administración
de una misma especie. Las pautas de acción modal inmediatamente posterior a una respuesa
se utilizan como unidades básicas de conducta en incrementa la probabilidad futura de dicha
las investigaciones etológicas de respuesta.
comportamiento. Abreviatura PAM.
Sistema de estado Estructuras neurales que
Proceso a Lo mismo que proceso primario en la teoría determinan el nivel general de responsividad o
de proceso oponente de la motivación. tendencia a responder del organismo.
Proceso b Lo mismo que proceso oponente en la

teoría de proceso oponente de la motivación. Sistema E-R Ruta neural más corta que conecta los
órganos sensoriales estimulados por un estímulo
Proceso de habituación Mecanismo neural activado elicitante con los músculos involucrados en la
por la repetición de un estímulo que reduce la producción de respuesta elicitada.
magnitud de las respuestas elicitadas por ese
estímulo. Tolerancia a las drogas Reducción en la efectividad
de una droga como resultado del uso repetido de
Proceso de sensibilización Mecanismo neural que la droga.
incrementa la magnitud de las respuestas
elicitadas por un estímulo.
Proceso oponente Mecanismo compensatorio que

tiene lugar en respuesta al proceso primario
elicitado por eventos biológicamente
significativos. El proceso oponente provoca
cambios fisiológicos y conductuales opuestos a
los que provova el proceso primario. También
llamado proceso b.
Proceso primario Primer proceso elicitado por un

evento biológicamente significativo. También
llamado proceso a.
33

Capítulo 3: Condicionamiento clásico: fundamentos
Juan Carlos Cabrera - 2009/2010
Los primeros años del acondicionamiento clásico

- Los descubrimientos de Vul'fson y Snarskii
- El paradigma de condicionamiento clásico
Situaciones experimentales
- Condicionamiento del miedo.
- Condicionamiento del parpadeo.
- Seguimiento del signo.
- Aprendizaje de aversión al sabor.
Procedimientos de condicionamiento pavloviano excitatorio

- Procedimientos típicos de condicionamiento pavloviano.
- Medida de las respuestas condicionadas.
- Procedimientos de control en el condicionamiento clásico.
- Eficacia de los procedimientos típicos de condicionamiento.
Condicionamiento pavloviano inhibitorio

- Procedimientos de condicionamiento inhibitorio.
- Mediación de la inhibición condicionada.
Predominio del condicionamiento clásico
35

Juan Carlos Cabrera
El condicionamiento clásico es el mecanismo más simple por el cual los organismos pueden
aprender acerca de las relaciones entre estímulos y cambiar su conducta en conformidad
con la misma. Permite a los seres humanos y a los demás animales aprovecharse de la
secuencia ordenada de eventos de su ambiente y aprender qué estímulos tienden a ir con
qué evento.
Los Primeros años del condicionamiento clásico (página 60 del libro)
Comenzaron con el trabajo del fisiólogo ruso Ivan P. Pavlov. Los descubrimientos de Edwin
B. Twitmyer sobre el condicionamiento clásico, que realizó en su tesis doctoral, en el que no
investigó sistemáticamente las implicaciones y sus hallazgos no despertaron gran atención.
Como una estensión más de los estudios que Pavlov realizó sobre la digestión, su equipo
ténico descubrió que los perro secretaban jugos gástricos en respuesta de la mera visión de
la comida o la persona que normalmente se las suministraba. Sus técnicos del laboratorio lo
llamaban "secreciones psíqicas" .
Los descubrimientos de Vul'fson y Snarskii
Los primeros estudios sistemáticos sobre el condicionamiento clásico fueron realizados por
S. G. Vul'fson y A. T. Snarskii en el laboratorio de Pavlov.
Vul'fson estudió la respuesta salival de los perros con productos naturales. Después de que
los perros hubieran experimentado la sensación provocada por estas sustancias en sus
bocas, la mera visión de la misma era suficiente para provocar salivación.
Snarskii extendió estas observaciones a sustancias artificiales.
El aprendizaje de objeto, requiere asociar diferentes características de un mismo objeto.
El paradigma de condicionamiento clásico
El procedimiento básico de Pavlov para el estudio de la salivación condicionada conlleva dos

estímulos: un tono o luz que no provoca salivación al principio y un alimento o solución ácida
situada en la boca que provoca una fuerta salivación.
EC o Estímulo condicionado sería la luz.

EI o Estímulo incondicionado sería el alimento.
RC o Respuesta condicionada sería la respuesta provocada por la Luz.
RI o Respuesta incondicionada sería la salivación provocada por el alimento.
37

Juan Carlos Cabrera
38

Juan Carlos Cabrera
Situaciones experimentales (página 63 del libro)
Condicionamiento del miedo.
Watson y Rayner (1920) condicionaron la respuesta de miedo en un

niño de 9 meses, Albert, a la presentación inofensiva de una rata
blanca de laboratorio. Albert se alarmaba cuando se hacía sonar un
fuerte sonido, así que cada vez que le presentaba la rata se
golpeaba una barra de acero. Después de cinco ensayos, Albert
mostró una reacción de miedo intenso ante la rata. Este miedo se
generalizó rápidamente a otros objetos peludos.
Desde el estudio de Albert, los experimentos se realizan sobre

todo con ratas de laboratorio. El EI aversivo (odioso o John Broadus Watson
(1878-1958)
desagradable) utilizado en estos estudios es una breve descarga
eléctrica administrada directamente en las patas del animal mediante un rejilla metálica,
con una intensidad y duración que no provoque daño tisular (de los tejidos u organos). El EC
puede ser un tono o una luz.
La respuesta de miedo de las ratas es quedarse quietas, así se utiliza una técnica popular de
medida indirecta del miedo condicionado como es el procedimiento de respuesta emocional
condicionada o supresión condicionada (REC) diseñada por Estes y Skinner (1941). Consiste
en primero enseñar al sujeto (rata) a presionar una barra varias veces para obtener
alimento como recompensa de forma regular. Después comienza la segunda fase que
consiste en presentar un EC (un tono) durante 1 o 2 minutos e inmediatamente aplicarle una
breve exposición a la descarga. Espaciando los ensayos entre 15 o 20 minutos.
La supresión condicionada puede ser completa, de modo que las ratas no presionen en
absoluto la barra, en 3 o 5 ensayo de condicionamiento. Sin embargo, la supresión es
específica de del EC y cuando desaparece, los animales vuelven rápidamente a su conducta
para obtener comida.
Para medir cuantitativamente la supreción condicionada se calcula una razón de supresión.

Respuesta durante EC
Razón de supresión =
Respuesta durante el EC + Respuesta durante el pre − EC
La razón de supresión adopta un valor 0 si la rata deja de presionar la palanca completamente durante el EC, ya que el
numerador de la fórmula es 0. En el otro extremo, si la rata no altera su ritmo de presiones en absoluto cuando se presenta el
EC, la razón tiene un valor de 0,5.
39

Juan Carlos Cabrera
Algunos investigadores prefieren el procedimiento de supresión condicionada del lameteo

porque requiere menos entrenamiento para hacer que las ratas beban del tubo que para que
presionen una palanca y obtener comida. En el procedimiento de supresión del lameteo, se
registra el tiempo que el animal tarda en completar un total de 5 segundos de lameteo como
medida de la supresión de la respuesta.
Condicionamiento del parpadeo.
El reflejo palpebal es un reflejo discreto ( moderado, sin exceso, que no destaca ). Un

soplo suave en un ojo hace que se parpadee. Si el aire está precedido de un tono breve, es
problable que la persona aprenda a parpadear cuando aparece el tono, anticipando el soplo
de aire.
En un experimento se tomó dos grupos de niños de 5 meses de edad y se realizadon dos

ensayos . A uno de estos grupos se emparejó un tono (EC) que terminaba con un ligero soplo
de aire en el ojo. Al otro el tono y el soplo nunca ocurrian juntos. En el primer ensayo la tasa
de parpadeo no influyo en ninguno de los grupos, sin embargo, en el segundo ensayo, en el
primer grupo la tasa fue significativamente superior al segundo grupo, debido en parte a la
asociación EC-EI que comenzaron a aprender en la primera sesión.
Este experimento demostro varios aspectos importantes del aprendizaje: Primero, el

condicionamiento clásico requiere del emparejamiento del EC y el EI. Segundo, el
aprendizaje inicial puede no ser directamente observable.
El interes por el condicionamiento palpebral en humanos se debe al hecho de que se han

realizado los progresos sutanciales en la compresión de los sustratos neurobiológicos de
este tipo de aprendizaje. Las investigaciones neurobiológicas sobre el condicionamiento
palpebral se ha llevado a cabo principalmente con conejos dómesticos y fue desarrollado por
Gormezano.
40

Juan Carlos Cabrera
El condicionamiento palpebral y la búsquea del engrama.

Cuando un organismo aprende algo, el resultado de este
aprendizaje debe almacenarse en el cerebro. De algún modo, la
red de neuronas que constituyen el sistema nervioso central (SNC)
es capaz de codificar la relación entre evento biológicamente
significativos y de utilizar esta información para dirigir la conducta
en curso. Esta memoria biológica se denomina engrama. Según el
punto de vista tradicional, el engrama de una respuesta
condicionada concreta se almacena en regiones localizadas del
cerebro.
Richard Thompson y sus colegas, después de casi cuatro décadas

buscando el engrama, reconoció que requeriría un sistema
conductual claramente definido en el que estuvieran precisamente
especificados tanto las condiciones para el aprendizaje como el
resultado motor. Estas consideraciones le llevaron a estudiar los
mecanismos que subyacen al condicionamiento palpebral.
La búsqueda del engrama comenzó por el hipocampo. Personas

con daños en esta región revelaron perdida de habilidad en
recordar conscientemente un evento reciente. Colocando una
serie de electrodos a animales en el hipocampo revelaron que las
células reflejaban el aprendizaje por una asociación EC-EI. La ablación del hipocampo, incluso la eliminación de todas las
estructuras cerebrales por encima del cerebro medio, no eliminaba la capacidad del animal para adquirir y retener una respuesta
condicionada de parpadeo. Esto sugirie que el circuito esencial para el condicionamiento palpebral se sitúa en las estructuras
inferiores del tronco del encéfalo y el cerebelo. Los experimentos posteriores mostraron claramente que la adquisción de una
respuesta condicionada del parpadeo bien
ajustada depende de un circuito neuronal
situado en el cerebelo.
La respuesta incondicionada elicitada por un

soplo de aire en el ojo está mediada por
neuronas que se proyectan sobre una región
del tronco del encéfalo conocida como núcleo
trigeminal. Desde allí, las neuronas siguen dos
rutas, una directa y otra a través de la
formación reticular, hasta llegar al núcleo
craneal motor, donde se organiza la salida
conductual. Para definir este recorrido, se
utilizan tres técnicas básicas. La primera
consistía en tomar registros electrofisiológicos
para verificar que las neuronas de ese circuito
intervienen el la resusta EI. La segunda
técnica consistía en desactivar el circuito
neuronal, ya fuera permanentemente
(eliminando las células) o temporalmente (por
medio de drogas o frio), para mostrar que el
circuito tiene un papel esencial en la respuesta
incondincionada. Si el circuito es necesario, la
alteración de sus funciones debería eliminar la
salida conductual. Finalmente, se estimuló el
circuito de forma artificial para mostrar que la
actividad de dicho circuito era suficiente par
producir la salida conductual.
Las mismas técnicas (registro eléctrico,

desactivación y estimulación) se utilizaron para
definir el reorrido neuronal que media en la
adquisición y ejecución de la respuesta
condicionada.La entrada EC se trasmite hasta
una región del tronco del encéfalo conocida
como núcleo pontino. Desde allí, al cerebelo
por medio de fibras musgosas. La señal del EI
llega al cerebelo a través de fibras trepadoras.
Estas dos señales se encuentran en el córtex
41

Juan Carlos Cabrera
cerebeloso donde la convergencia de actividades produce una modificación sináptica que altera la salida neuronal del cerebelo.
Básicamente, las fibras ascendentes actuan como “maestras”, seleccionando un subconjunto de conexiones para su
modificación. Este cambio definelas propiedades del estímulo (las características del EC) que serán responsables de una salida
motora concreta. Esta salida está mediada por neuronas que se proyectan desde el núcleo interpositus al núcleo rojo, y
finalmente, al núcleo craneal motor.
A medida que se va adquiriendo la respuesta condicionada, la actividad condicionada se desarrolla en el núcleo interpositus. Las
neuronas de dicho núcleo se proyectan hacia atrás hasta el circuito del EI e inhiben la señal del mismo en la oliva inferior. Esto
proporciona una retroalimentación negativa que reduce la efectividad del EI. Muchos investigadores creen que fenómeno como
el bloqueo o el ensombrecimiento tienen lugar porque un EI previsto es menos eficaz. En el paradigma del condicionamiento
palpebral esto podría suceder debido a que la entrada del EI está inhibida en la oliva inferior. Esta idea se ve apoyada por un
experimento de Kim y colaboradores (1998), que mostró que la eliminación de esta fuente de inhibición eliminaba el efecto de
bloqueo.
Previamente hemos dicho que el hipocampo no es ncesario para el condicionamiento de demora simple. Sin embargo, sí
interviene en formas más complejas de aprendizaje. Un ejemplo lo proporciona el condicionamiento de huella, en el que se
inserta una demora temporal entre el final del EC y el principio de EI. Un animal normal puede adquirir fácilmente un parpadeo
condicionado a un EC que termina 0,5 segundos antes del comienzo del EI. Sin embargo, no puede alvar este espacio si se
retira el hipocampo. Se observa un patrón de resultados similar en los pacientes amnésicos que han sufrido daño en el
hipocampo. Estos pacientes no pueden recordar concientemente la relación EC-EI. En ausncia de esta memoria esplícita, son
incapaces de aprender con un procedimiento de huella. El aprendizaje con un procedimento de demora no se ve alterado,
incluso si los pacientes no pueden recordar conscientemente la relación EC-EI de una sesión a la siguiente. Curiosamente, la
alteración de conciencia en un individuo normal debilita la apreciación de la relación EC-EI con un procedimiento de huella. De
nuevo, los sujetos que no pueden dar información explícita sobre la relación, son incapaces de aprender.
-J.W.Grau
Seguimiento del signo.
Uno de los paradigmas experimentales que ha contribuido significativamente a la concepción

actual del condicionamiento pavloviano es el paradigma de seguimiento del signo o
automoldeamiento que consiste en el movimiento hacia un estímulo que señala la
disponibilidad de un reforzador, como comida, y posible contacto con el mismo.
Experimentos con palomas en un laboratorio mediante la presentación de un estimulo visual

discreto y bien localizado (una tecla luminosa) justo antes de cada administración
automática de alimentos, las palomas en vez de utilizar el estímulo visual para predecir
cuando dirigirse al comedero, picoteaban la tecla aunque no era necesario para tener acceso
a la comida. Demostrando que el seguimiento del signo es una herramienta útil para el
estudio del aprendizaje asociativo.
El aprendizaje tiene lugar de forma rápida cuando EC se presenta justo antes del EI. Las
palomas no se aproximan a EC si el EC y el EI se presentan de forma aleatoria uno del otro.
El segimiento del signo sólo es posible en situaciones en las que el EC tiene una localización
precisa y puede ser "seguido". Cuando el EC es un sonido no provoca la aproximación a la
fuente y sí el acercamiento al comedero. El EC tiene que ser de una modalidad y
configuración apropiada.
42

Juan Carlos Cabrera
Otro factor importante es la relación entre la cantidad de tiempo que el sujeto pasa en el
contexto experimental y la duración de cada presentación del EC. Se obtienen mayores
niveles de seguimiento del signo con mayores exposiciones al contexto experimental en
relación a la duración EC.
Aprendizaje de aversión al sabor.
El simple acto de comer proporciona numerosas oportunidades de aprendizaje de la

asociación. La experiencia de aprendizaje de aversión típica consiste en ingerir una comida
con un sabor muy distinto y posteriormente enfermar. Este emparejamiento, sabor-
enfermedad, puede dar lugar a una aversión condicionada al alimento en un único ensayo, y el
aprendizaje puede tener lugar incluso si la enfermedad se manifiesta con varias horas de
retraso con respecto a la ingestión de la comida. Otro hallazgo interesante es que el 20%
de las personas que enfermaron estaban seguras de que no lo provocó la comida. Lo que
indica que el aprendizaje de aversión al sabor puede ser independiente de los procesos de
pensamiento racional y que puede ser contrario a las conclusiones de una persona sobre la
causa de su enfermedad.
Personas con malestar gástrico producidos por tratamientos médicos, como en

quimioterapia del cáncer que suele producir náuseas, pueden adquieren aversiones a los
alimentos ingeridos justo antes de las sesiones, contribuyendo a la falta de apetito, a la
supresión de la ingesta de alimento o anorexia.
El desarrollo de tumores, depresiones severas y la anorexia nerviosa, entre otras, pueden

contribuir a incrementar la probabilidad de aprender aversión al sabor.
La aversión al sabor es el resultado del emparejamiento de un EC (un sabor) con un EI (malestar: una droga o exposición a
radiación) similar a otros ejemplos de condicionamiento clásico, y sigue las mismas leyes de aprendizaje en muchos aspectos.
También tiene caracteristicas especiales:
• Primero, puede aprenderse con un solo ensayo aversión al sabor por el emparejamiento del sabor y la enfermedad.
• Segundo, puede darse después de varias horas de la exposición al nuevo sabor. Probablemente sea un aprendizaje
demorado de la aversión al sabor que ha evolucionado para permitir a os animales evitar alimentos venenosos con
efecto retardado.
43

Juan Carlos Cabrera
Procedimientos de Condicionamiento Pavloviano Excitatorio(página 74 del libro)
Procedimientos típicos de condicionamiento pavloviano.
Uno de los factores críticos que determinan el curso del condicionamiento clásico es la
ordenación temporal del EC y el EI. Pequeñas variaciones en la forma de emparejarlos
pueden tener importantes efectos en la intensidad de la RC.
A continuación se muestran cinco procedimientos comunes de condicionamiento clásico.
La distancia horizontal representa el paso del tiempo; el desplazamiento vertical el momento en ue cada estímulo aparece y
desaparece. Cada configuración EC y EI representa un único ensayo de condicionamiento.
Tiempo
Inicio Final Procedimiento de condicionamiento
clásico en el que el estímulo
EC condicionado aparece poco antes
del estímulo incondicionado en
Condicionamiento cada ensayo de condicionamiento.
de demora corta EI
Procedimiento de condicionamiento
EC incondicionado se presenta poco
después de que haya terminado el
Condicionamiento estímulo condicionado.
de huella EI
Similar al procedimiento de
condicionamiento de demora corta,
EC en que el EC comienza antes que el
EI, sin embargo, EI se demora más
Condicionamiento tiempo (5-10 minutos).
de demora larga EI
EC condicionado y el incondicionado
se presenta simultáneamente en
Condicionamiento cada ensayo condicionado.
simultaneo EI
EC condicionado se presenta en todos
los ensayos después del estímulo
Condicionamiento incondicionado.
hacia atrás EI
44

Juan Carlos Cabrera
Un experimento típico de condicionamiento clásico, los episodios EC-EI se repiten varias

veces a lo largo de la sesión de entrenamiento. El tiempo entre el final de un ensayo y el
comienzo del siguiente se llama intervalo entre ensayos. El tiempo entre el comienzo del EC
y el comienzo del EI en un mismo ensayo se llama intervalo entre estímulos o intervalo
EC-EI.
Medida de las respuestas condicionadas.
Para poder medir el condicionamiento, en cualquiera de los procedimientos anteriores, hay

que realizar un ensayo de prueba, consistente en la presentación del EC aislado (sin el EI) y
observar la respuesta del EC sin la contaminación procedente de la respuesta provocada por
el EI. Estos ensayos pueden introducirse periodicamente a lo largo del curso del
entrenamiento para hacer un seguimiento del proceso de aprendizaje.
La conducta EC puede cuantificarse:

• Por la magnitud de la respuesta condicionada (Pavlov midió en número de gotas de
saliva elicitada por un EC).
• Por la probabilidad de la respuesta (en estudios de condicionamiento palpebral, el
porcentaje de ensayos en los que el EC provoca una respuesta condicionada).
• Por latencia de la respuesta (es la cantidad de tiempo que pasa entre el principio del EC
y la aparición de la respuesta condicionada).
En procedimientos de demora y huella, el EC aparece de forma aislada al principio de cada

ensayo, por lo que puede utilizarse como medida del aprendizaje al no estar contaminada
por el EI. Por el contrario, ensayos de condicionamiento simultáneo y hacia atrás la
respuesta durante el EC puede reflejar presencia del EI o su presentación reciente. Por
tanto, los ensayos de prueba resultan cruciales para evaluar el aprendizaje en estas dos.
Procedimientos de control en el condicionamiento clásico.
Un ensayo de prueba válido no es suficiente para tener evidencias concluyentes de

condicionamiento clásico. En los estudios de habituación y sensibilización tan sólo eran de
interés los efectos de exposición previa al un estímulo. El procedimiento de comparación o
control consistía en la ausencia de exposición al estímulo. Cuando el estudio es la forma en
la que se asocian los EC y EI, los procedimientos de control son más complicados.
Una asociación EC-EI implica que dos eventos se han conectado de alguna forma. Después
EC adquiere la capacidad de activar procesos relacionados con el EI. Requiere algo más que
una familiaridad. Para concluir que se ha establecido asociación, debemos asegurarnos de
45

Juan Carlos Cabrera
que el cambio conductual observado no podría haberse producido por la mera presentación
de EC o del EI por separado.
El incremento en la respuesta podría resultar de la sensibilización y no por un proceso

asociativo. La presentación de un estímulo activador, como la comida a un animal
hambriento, puede incrementar la conducta provocada por un estímulo menos efectivo, tal
como un tono, sin que se haya establecido ninguna asociación entre los dos estímulos. Por
tanto, el incremento de la respueta que se observa con el emparejamiento repetido del EC y
el EI podría ser, en realidad, el resultado de una mera exposición al EI. Los casos en los que
la mera exposición al EI da lugar a respuestas similares a la respuesta condicionada reciben
el nombre de pseudocondicionamiento. Para determinar si la respuesta que se dan ante el
EC representa una asociación entre EC-EI, en lugar de sensibilización debido a la exposición
a los EC y EI, se requieren procedimientos de control.
Uno de los procedimientos discutidos por los investigadores es el de control aleatorio, en el

que los estímulos condicionado e incondicionado se pesentan en momentos aleatorios uno
respecto al otro. Desafortunadamente hay evidencias de que puede dar lugar a aprendizaje
asociado.
Un procedimiento más útil es el denominado control desemparejado explícito, que consiste

en la presentación de los estímulos condicionados e incondicionado en diferentes ensayos,
pero con el suficiente espacio temporal para evitar que se asocien.
Eficacia de los procedimientos típicos de condicionamiento.
En general, se ha observado poco condicionamiento en los procedimientos de

condicionamiento simultáneo, en los que el intervalo EC-EI es cero. Una ligera demora de la
presentación EI tras el EC a menudo facilitaba la Respuesta Condicionada. Sin embargo, si
el intervalo se incrementaba más, la RC disminuía. Incluso en el procedimiento de aversión al
sabor, donde el aprendizaje es posible con intervalos de 1 ó 2 horas, la RC disminuye a
medida que se aumente el intervalo.
Se consolida la idea de que el condicionamiento es más efectivo cuando el EC es una buena

señal de que EI aparecerá pronto. El valor de la señal es mejor en el procedimiento de
demora corta, en el que el EI tiene lugar poco después de la aparición del EC. El valor de la
señal EC disminuye a medida que se incrementa el intervalo EC-EI. También el EC es mal
predictor del EI en los procedimientos simultáneo y de huella. El procedimiento simultáneo
se presenta el EC junto con EI y por tanto EC no señala la parición del EI. En el intervalo de
huella el EC va seguido por el intervalo de huella en lugar del EI.
46

Juan Carlos Cabrera
El condicionamiento hacia atrás produce resultadoa ambiguos. Algunos han observado

condicionamientos excitatorio y otros de tipo inhibitorio, mientras que otros encontraron
excitatorios e inhibitorio.
Nuevas tendencias emergentes sobre los procedimientos de demora, simultáneo, de huella y

hacia atrás, conceptualizan que todos ellos producen un aprendizaje sólido y una respuesta
condicionada vigorosa, pero lo que los sujetos aprenden es direrente en cada caso. En vez
de aprender una mera asociación EC-EI, se asume que también se aprende cuándo aparece
el EI en relación al EC, denominadose tal fenómeno hipótesis de la codificación temporal.
La idea es que puede obtenerse diferentes tipos de RC dependiendo de la información
temporal acerca del EI que proporciona el EC.
Condicionamiento Pavloviano Inhibitorio (página 79 del libro)
La exposición a estímulos aversivos impredecibles es muy perturbador y produce úlceras de

estómago y otros sintomas fisiológicos del estrés.
Otra fuente de estrés es el ataque de

pánico (sensación repentina de miedo o
incomodidad, acompañada de síntomas
físicos -por ejemplo, taquicardia- y una
sensación de desastre inminente).
Cuando son frecuentes se dice que el
individuo sufre de un trastorno de
pánico y a veces estas personas pueden
predecirlos. En un estudio con estos
individuos se midieron la ansiedad
general de los sujetos antes y después
de cada tipo de ataque (predecibles e
impredecibles). Antes de los ataques los Niveles de ansiedad general de individuos con trastorno de pánico
niveles de ansiedad eran similares, antes y después de ataques de pánico previstos e imprevistos.
después del ataque de pánico la ansiedad
se incrementaba si este era imprevisto y disminuía tras un ataque previsto. Demostrando
que son preferibles los ataque cuando son predecibles.
Las señales que predicen la ausencia de un estímulo aversivo son estímulos condicionados
inhibitorios.
47

Juan Carlos Cabrera
Procedimientos de condicionamiento inhibitorio
La inhibición condicionada tiene un requisito importante, y es que, para que la ausencia de

EI sea significativa, este debe ocurrir periódicamente en la situación.
Procedimiento estandar de
inhibición condicionada.
Se requiere dos estimulos

condicionados y dos tipos de
ensayo de condicionamiento, uno
Procedimiento estándar de inhibición condicionada. En algunos ensayos (Tipo A) para el condicionamiento
el EC+ se empareja con el EI. En otros ensayos (tipo B) el EC+ se presenta excitatorio y otro para el
junto con el EC- y se omite el EI. El procedimiento resulta efectivo para
condicionar propiedades inhibitorias al EC-. condicionamiento inhibitorio.
Ensayo Tipo A (condicionamiento exitatorio): Siempre que aparece el EI va anunciado por el

estimulo condicionado EC+, conviertiendose así por asociación en una señal del EI y sirve
para proporcionar el contexto excitatorio necesario para el desarrollo de la inhibición
condicionada.
Ensayo B (condicionamiento inhibitorio): El EC- se presenta en el contexto excitatorio

proporcionado por el EC+, pero no se empareja con el EI. Esto convierte al EC- en un
inhibidor condicionado.
A lo largo del tratamiento, los ensayos se alternan de forma aleatoria. A medida que el
animal recibe ensayos repetidos del EC+ seguido del EI y ensayos del EC+ y el EC- seguidos
de la ausencia de EI, el EC- adquiere gradualmente propiedades inhibitorais.
Ejemplo: Un semáforo rojo en un cruce transitado es una señal (EC+) de un peligro potencial
(EI). Sin embargo, si un agente de policía indica con su silbato (EC-) que debemos cruzar, a
pesar de la luz roja, es poco probable que tengamos un accidente y el peligro señalado por el
semáforo queda bloqueado o inhibido por silbato.
Contingencia o correlación
negativa entre el EC y el EI.
Otro procedimiento para

producir inhibición condicio-
nada que no requiere un estímulo excitatorio EC+ explícito; en lugar de eso, se utiliza un
único EC- que está negativamente correlacionado con el EI. Una correlación o contingencia
negativa indica que el EI es menos probable tras el EC que en otro momento.
48

Juan Carlos Cabrera
El EC señala una reducción en la probabilidad de que aparezca el EI. Como por ejemplo, Los
niños que se meten con un compañero en clase y dejan de hacerlo en presencia del profesor.
El profesor funciona como EC- que señala un período libre de acoso, o ausencia EI.
En el procedimiento de contigencia negativa EC-EI, el EI aversivo puede aparecer de vez en

cuando tras el EC, pero con una probabilidad pequeña. Es mucho más probable que el EI
aversivo aparezca en ausencia del EC, dando lugar a una contingencia negativa entre el EC y
el EI. Sin embargo, incluso en ausencia del EC, el momento exacto de presentación del EI no
puede predecirse. El EI tiene lugar de forma probabilística, a diferencia del procedimiento
estándar, en el que el EI siempre aparece al final del EC+ y no aparece cuando se presenta
el EC- junto con el EC+. Así podemos predecir el momento preciso de la aparición del EI, y
también permite predecir cuándo no va a aparecer, posibilitando la codificación temporal de
la ausencia del EI.
Medición de la inhibición.
Los estímulos inhibitorios elicitan reacciones opuestas a los estímulos condicionados

excitatorios. Si los estímulos condicionados excitatorios provocan salivación, los estímulos
inhibitorios provocan la supresión de la salivación.
Sistema de respuesta bidireccionales. La identificación de tendencias de respuesta

opuesta es sencilla en aquellos sistemas de respuesta que pueden variar en direcciones
opuestas con respecto a una línea base de ejecución normal. Por ejemplo, una paloma puede
acercarse a una tecla luminosa asociada con la presentación subsiguiente de comida o
cuando se utiliza un procedimiento inhibitorio, alejarse de la luz.
Una limitación es que este método funciona sólo con respuestas que pueden ir en
direcciones opuestas. Otra es que esta técnica puede mostrar sólo el efecto neto de la
excitación y la inhibición. El sujeto se aproxima a EC si excitación es mayor a la inhibición
y se aleja en caso contrario. La paloma no puede acercarse y alejarse al mismo tiempo. Esto
invalida el procedimiento para los casos en que EC adquiere ambas propiedades (exitatorias
e inhibitorias)
La prueba del estímulo compuesto o sumación. Cuando la conducta no es bidireccional el

procedimiento más aceptado por los investigadores para la medición de la inhibición
condicionada es la prueba de sumación o del estímulo compuesto. La prueba requiere
observar los efectos de un EC inhibitorio en compuesto con un EC+ exitatorio.
49

Juan Carlos Cabrera
Experimento de lameteo con ratas de laboratorio:
Prueba del estímulo compuesto de la inhibición en un experimento de supresión del lameteo. Los estímulos A y B se
condicionaron como estímulos excitatorios mediante la presentación de cada uno de ellos por separado junto con la descarga
(A+ y B+). El estímulo X se condicionó como inhibidor presentándolo junto con el estímulo A sin la descarga (AX-). El
estímulo Y era un estímulo de control que no había intervenido en ningún condicionamiento excitatorio o inhibitorio. A era una
luz brillante. B, X e Y eran claves auditivas ( un clic, un ruido blanco y un zumbador, contrabalanceados). A y AX se pusieron a
prueba con el contexto original de condicionamiento. B, BX y BY se pusieron a prueba en un contexto diferente. (Para detalles
adicionales, vease Cole, Barnet y Miller, 1997, Experimento 1.
El procedimiento de prueba del estímulo compuesto para la inhibición condicionada sugiere

que la presentación de un inhibidor condicionado o de una señal de seguridad puede reducir
los efectos estresantes de una experiencia aversiva.
La prueba de retraso en la adquisición. Si un estímulo inhibe de forma activa una

respuesta particular, entonces debería ser especialmente difícil de condicionar ese
estímulo para que provoque la conducta.
50

Juan Carlos Cabrera
Retomando el experimento anterior, en una cámara experimental diferente a las utilizadas

anteriormente para realizar el entrenamiento inhibitorio, Cole y sus colegas tomaron el
estímulo X (que había sido condicionado como inhibidor) y el estímulo Y ( que no había
utilizado con anterioridad en el procedimiento de condicionamiento ) y realizadon una
prueba de retraso en la adquisición emparejando tres veces cada uno de estos estímulos con
una descarga. Tras los tres ensayos sometierón a prueba para ver cuál provocaba una mayor
supresión de la conducta de beber. El tiempo empleado en completar un total de 5 segundos
de ingestión de agua fue mayor en presencia del estímulo de control Y que en presencia del
estímulo X. El entrenamiento inhibitorio inicial de X retrasó la adquisición de propiedades
excitatorias de miedo condicionado.
La inhibición condicionada puede ser difícil de distinguir de otros procesos conductuales. La

mejor estrategia es utilizar más de una prueba y asegurarse de que las diferentes pruebas
señalan la misma conclusión. La estrategia dual ( utilización tanto la prueba de estímulo
compuesto como de la del retraso en la adquisición) ha gozado de popularidad desde que lo
propuso Rescorla (1969).
PREDOMINIO DEL CONDICIONAMIENTO CLÁSICO (página 86 del libro)
El condicionamiento clásico se estudia normalmente en situaciones de laboratorio, aunque

también ocurre en una gran variedad de situaciones fuera de este. Aparece con mayor
probabiliad cuando un evento predice a otro regularmente y con una demora corta entre el
EC y el EI.
Un área de investigación particularmente interesante es cómo las personas llegan a

considerar que un evento es la causa de otro, denominado juicios de causalidad humanos. Los
estudios sobre causalidad se parecen a los estudios sobre condicionamiento pavloviano en
que ambos conllevan experiencias repetidas con dos eventos y respuestas basadas en el
grado en que esos dos eventos están relacionados. Los mecanismos asociativos pavlovianos
no se limitan a los perros de Pavlov, sino que pueden tener un importante papel en los juicios
de causalidad informales que realizamos en el curso de nuestra vida cotidiana.
El condicionamiento pavloviano puede dar lugar al condicionamiento de preferencias y

aversiones alimenticias, adquisición de miedo (ansiedad, fobias y trastornos del pánico),
tolerancia y adición a las drogas ...
El condicionamiento pavloviano también interviene en las respuestas de los niños y de las

madres durante la lactancia. Para que el amamantamiento sea satisfactorio, la madre debe
mantener al bebé en una postura determinada, que proporcione estímulos táctiles especiales
tanto para la madre como para el niño. Los estímulos táctiles que percibe el niño pueden
condicionarse y elicitar respuestas de orientación y succión. Los estímulos táctiles
51

Juan Carlos Cabrera
experimentados por la madre que amamanta a sus hijos suelen experimentar el reflejo de
secreción de lecha cuando el niño llora o cuando llega lahora habitual de amamantamiento.
Todos estos estímulos preceden de forma regular a la succión del bebé y por tanto pueden
condicionarse a la estimulación propia de la succión y adquirir la capacidad de provocar la
secreción de lecha como respuesta condicionada. Las respuestas anticipatorias de
orientación y succión y la respuesta anticipatoriade secreción de leche hace que la lactancia
sea más satisfactoria tanto para la madre como para el niño.
El condicionamiento pavloviano también es importante en el aprendizaje acerca de

situaciones sexuales. Estudios realizados con animales machos y como estímulo condicionado
la visión de una hembra sexualmente receptiva o el acceso a una hembra, los sujetos acaban
aproximandose a los estímulos que señalan la disponibilidad de un compañero sexual. La
exposición a un EC sexual realizan la respuesta copulatoria más rápidamente, compiten
mejor con otros machos por el acceso a una hembra, muestran más conducta de cortejo,
liberan una mayor cantidad de esperma y muestran un incremento en los niveles de
testosterona y hormona luteinizante. Incluso incrementan el número de crías en algunas
especies de peces y codornices estudiadas.
COMENTARIOS FINALES
En este Capítulo se ha continuado el estudio sobre la conducta elicitada desplazando la

atención de la habituación y la sensibilización al condicionamiento clásico, más complejo, ya
que está mediada por mecanismos asociativos. El condicionamiento clásico es una de las
principales técnicas para investigar cómo se aprenden las asociaciones y pueden intervenir
en muchos aspectos importantes de la conducta. Dependiendo del procedimiento empleado,
el aprendizaje puede tener lugar de manera rápida o lenta. Con algunos procedimientos, se
aprenden tendencias de respuesta excitatorias y con otros, el organismo aprende a inhibir
una respuesta particular en presencia del estímulo condicionado. El condicionamiento
exitatorio e inhibitorio tiene lugar en muchos aspectos de la experiencia cotidiana y sirve
para mejorar la efectifidad con la que nos enfrentamos a eventos biológicamente
significativos.
52

Juan Carlos Cabrera
Ensayo de condicionamiento Episodio de entre-

TÉRMINOS CLAVE
namiento compuesto por la presentación de un
estímulo condicionado con ( o sin) un estímulo
Aprendizaje de objeto Aprendizaje de asocia-
incondicionado.
ciones entre diferente elementos de un objeto.
Ensayo de prueba Ensayo en el que se presenta el

Automoldeamiento Lo mismo que seguimiento del
estímulo condicionado sin el estímulo incondicio-
signo.
nado. Esto permite medir la respuesta condiciona-
da en ausencia de la respuesta incondicionada.
Condicionamiento de demora corta Procedimiento
de condicionamiento clásico en el que el estímulo
Estímulo condicional o condicionado Estímulo que
condicionado aparece poco antes del estímulo
inicialmente no provoca una respuesta particular,
incondicionado en cada ensayo de condiciona-
pero que adquiere la capacidad de hacerlo como
miento.
resultado del desarrollo de una asociación con un
estímulo incondicionado. Abreviatura EC.
Condicionamiento de huella Procedimiento de
condicionamiento clásico en el que el estímulo
Estimulo incondicional o incondicionado Estímulo
incondicionado se presenta poco después de que
que elicita una respuesta particular sin necesidad
haya terminado el estímulo condicionado.
de entrenamiento. Abreviatura EI.
Condicionamiento hacia atrás Procedimiento de

Hipótesis de la codificación temporal Idea según
condicionamiento clásico en el que el estímulo
la cual el condicionamiento pavloviano lleva, no
condicionado se presente en todos los ensayos
sólo al aprendizaje de que el EI ocurre, sino
después del estímulo incondicionado.
también de cuándo ocurre en relación al EC. El EC
representa ( o codifica) la disposición temporal
Condicionamiento simultáneo Procedimiento de
del EI.
condicionamiento clásico en elque el estímulo
condicionado y el incondicionado se presentan
Intervalo de huella Intervalo entre el final del
simultáneamente en cada ensayo de condiciona-
estímulo condicionado y el principio del estímulo
miento.
incondicionado en los ensayos de condiciona-
miento de huella.
Control aleatorio Procedimiento en el que los
estímulos condicionado e incondicionado se
Intervalo EC-EI Lo mismo que intervalo entre
rpresentan en momentos aleatorios uno con res-
estímulos.
pecto a otro.
Intervalo entre ensayos Cantidad de tiempo que

Control desemparejado explícito Procedimiento en
pasa entre dos ensayos consecutivos.
el que se presentan tanto el estímulo
condicionado como el incondicionado, pero con el
Intervalo entre estímulos Cantidad de tiempo que
suficiente tiempo entre ellos como para que no se
pasa entre el comienzo del estímulo condicionado
asocien el uno del otro.
(EC) y el comienzo del estímulo incondicionado
(EI) durante un ensayo de condicionamiento
EC Abreviatura de estímulo condicionado.
clásico. También llamado intervalo EC-EI.
EI Abreviatura de estímulo incondicionado.

Latencia Tiempo transcurrido entreel comienzo de
un estímulo (o el comienzo de un ensayo) y la
respuesta que se da a ese etímulo.
53

Juan Carlos Cabrera
Magnitud de la respuesta Medida del tamaño, Respuesta emocional condicionada Supresión de

vigor o extensión de una respuesta. una conducta instrumental positivamente reforzada
(por ejemplo, presión de una palanca para obtener
Probabiliad de una respuesta Probabilidad de que alimento) provacada por la presentación de un
se realice una respuesta, normalmente represen- estímulo que se ha asociado con un estímulo
tada en términos de porcentaje de ensayos en los aversivo. Abreviatura REC. También llamada
que tiene lugar la respuesta. supresión condicionada.
Prueba de retraso en la adquisición Procedimien- Respuesta incondicional o incondicionada Res-

to de prueba que identifica un inhibidor condicio- puesta que provoca un estímulo sin necesidad de
nado si ese estímulo tarda más tiempo en adquirir entrenamiento previo.
propiedades exitatorias que un estímulo de compa-
ración. RI Abreviatura de respuesta incondicionada.
Prueba de sumación Lo mismo que prueba del estí- Seguimiento del signo Movimiento hacia un
mulo compuesto. estímulo que señala la disponibilidad de un reforza-
dor positivo, como comida, y posible contacto con el
Prueba del estímulo compuesto Procedimoento de mismo. Tambien llamada automoldeamiento.
prueba que sirve para identiricar un inhibidor
condiconado si dicho estímulo reduce a respuesta Supresión condicionada del lameteo Similar a la
elicitada por un estímulo condicionado excitatorio. respuesta emocional condicionada (REC) o
También llamado prueba de sumación. procedimiento de supresión condicionada. Sin
embargo, en lugar de utilizar la presión de la
Pseudocondicionamiento Incremento en la respues- palanca para obtener la comida como conducta a
ta que puede provocar un estímulo cuyas suprimir por el miedo condicionado, la línea de base
presentaciones están entremezcladas con las es el lameteo de un tubo con agua por parte de
presentaciones del estímulo condicionado (EC) sin ratas sedientas. La presentación de un EC
que se establezca una asociación entre el estímulo y condicionado al miedo ralentiza la tasa de lameteo.
el EI.
Supresión condicionada Lo mismo que respuesta
RC Abreviatura de respuesta condicionada. emocional condicionada.
REC Abreviatura de respuesta emocional condicio-

nada.
Respuesta condicional o condicionada Respuesta

que se realiza ante el estímulo condicionado como
resultado del condicionamiento clásico. Abreviatura
RC.
54

Capítulo 4: Condicionamiento clásico: mecanismos
¿A qué deben su eficacia los estímulos condicionados e incondicionados?

- Respuestas iniciales a los estímulos.
- La novedad de los estímulos condicionados e incondicionados.
- Intensidad y saliencia del EC y del EI.
- Relevancia o pertinencia EC-EI.
- El conceto de fuerza biológica.
¿Qué determina la naturaleza de la respuesta condicionada?

- El modelo de sustitución del estímulo.
- Aprendizaje y homeostasis: Un caso especial de sustitución del estímulo.
- El EC como determinante de la forma de la RC.
- Conducta condicionada y sistemas de conducta.
- Aprendizaje E-R frente a aprendizaje E-E.
¿Cómo se asocian los estímulos condicionado e incondicionado?

- El efecto de bloqueo.
- El modelo de Rescola y Wagner.
- Otros modelos de condicionamiento clásicos.
Comentarios finales
55

Juan Carlos Cabrera
¿A qué deben su eficiacia los estímulos condicionados e

incondicionados? (página 91 del libro)
Esta es quizá la pregunta más importante en relación al condicionamiento clásico. Planteada

originalmente por Pavlov y también en la actualidad está recabando cada vez más la atención
de los investigadores.
Respuestas iniciales a los estímulos.
Según definió Pavlov los términos condicionado e incondicionado: un estímulo condicionado

(EC) inicialmente no provoca la respuesta condicionada, pero adquiere la capacidad de
hacerlo como resultado del desarrollo de una asociación con el estímulo incondicionado (EI).
Por el contrario, el EI elicita eficazmente la respuesta en custión desde el principio, sin
ningún entrenamiento previo.
La comparación de los ECs y de los EIs son relativas, pues en un evento particular puede
servir de EC respecto a un estímulo y de EI respecto a otro. Una exposición salina en un
experimento de aversión al sabor actua como EC y la droga que produce el malestar como
EI; mientras que en un experimento de seguimiento del signo la exposición salina se podría
considerar como EI y la luz el EC. Por tanto, el que la sacarina se considere un EC o un EI
depende de su relación con otros estímulos de la situación.
La novedad de los estímulos condicionados e incondicionados.
Tanto si el estímulo condicionado como el incondicionado es familiar, el aprendizaje se

desarrolla con mayor lentitud que si el EC y el EI son novedosos.
Los estudios sobre el papel de la novedad de los estímulos en el condicionamiento clásico

suelen realizarse en dos fases. Primero se expone repetidamente y de forma aislada al
sujeto al estímulo que posteriormente va a utilizarse como EC y después se empareja con un
EI según el condicionamiento clásico. La familiarización que se produce por la exposición
incial retrasa el condicionamiento posterior de dicho estímulo. Este fenómeno se denomina
efecto de preexposición al EC o efecto de inhibición latente.
La habituación y efecto de preexposición al EC sirven para limitar la cantidad de

procesamiento y atención a los estímulos que se sabe carecen de consecuencias.
El mismo proceso realizado con EI han dado similares resultados. Los sujetos familiarizados
con un EI antes de su emparejamiento con EC desarrollan la respuesta condicionada al EC
57
Juan Carlos Cabrera
más lentamente que los participantes para los cuales el EI es novedoso. Este resultado se
denomina efecto de preexposicion al EI.
Dos son las explicaciones por parte de los investigadores de los efectos de preexposicioón
al EC y al EI. La interferencia asociativa como mecanismo que disminuye la capacidad de los
estímulos para participar en nuevas asociaciones; y otra, la interferencia de memoria en la
que los participantes recuerdan lo sucedido en fase de experimento alterando la respuesta
condicionada. Los mecanismos que reduzcan el recuerdo de preexposición en el momento de
la prueba fortalecen la respuesta condicionada.
Intensidad y saliencia del EC y del EI.
Otra variable importante para el

condicionamiento clásico es la intensidad de
los estímulos condicionados e incondicionados.
La respuesta es más fuerte cuanto más
intenso sean estos.
Objeto utilizados como EC en los estudios sobre

Un estímulo puede adquirir saliencia o condicionamiento sexual con codornices macho para
significación aumentando su intensidad, lo que señalar la oportunidad de copula. El objeto de la izda. es
"arbitrario" está hecho de un material lanudo. El objeto
hace que despierte mayor atención. Por de la derecha inlcuye una cabeza y algunas plumas del
cuello de un ejemplar de hembra disecado, de modo que
ejemplo, una rata presta más atención a la sal contenga alguna de las claves que proporciona la hembra.
si sufre un deficit nutricional de sal.
Estudios sobre condicionamiento sexual de la codorniz macho doméstica, muestran que se

observa una respuesta sexual condicionada más intensa utilizando un EC que incluya algunas
de las características estimulares de la hembra de codoniz.
Relevancia o pertinencia EC-EI.
El aprendizaje depende de la relevancia o adecuación del EC con respecto al EI que se

administra. El sabor se asocia fácilmente al malestar y las claves audiovisuales se asocian al
dolor periférico.
condicionamiento
Gustativo + audiovisual Descarga
Gustativo + audiovisual Malestar
El experimento se emparejaron un estimulo audiovisual y un estímulo gustativo, presentados simultaneamente, con una descarga
o con una sensación de malestar, dependiendo del grupo. Después los sujetos se pusieron a prueba con los estímulos
gustativos y audiovisuales por separado.
Las ratas condicionadas con una sensación de malestar adquirieron una mayor aversión a las claves gustativas que las
audiovisuales. Por el contrario, las ratas condicionadas con una descarga adquirieron una mayor aversión a las claves
audiovisuales que a las gustativas.
58
Juan Carlos Cabrera
Se demostró con ratas recien nacidas que la experiencia con sabores o con la enfermedad
(o con las claves audiovisuales y el daño periférico) no es necesaria para que se dé el efecto
de relevancia del estímulo. Más bien, el fenómeno parece reflejar una predisposición
genética para la asociación selectiva de ciertas combinaciones de estímulos condicionados e
incondicionados.
Se ha documentado otras situaciones del efecto de relevancia del estímulo de aversión al

sabor en palomas que asocian la comida mejor con claves visuales que con auditivas y una
descarga más efectivas con las auditivas. En cuanto a efectos de relevancia del estímulo en
la adquisición del miedo en monos, estos parecen que tienen una predisposición para
aprender a temer a las serpientes de juguete que si lo hacen a flores de plástico. Esta
selectividad de estímulos en el aprendizaje de miedos también se muestran en las personas,
cuando participantes en estudios, han asociado fotografías de serpientes y arañas con una
descarga con mayor facilidad que fotografías de flores y casas.
Los procedimiento de condicionamiento aversivo resultan más

efectivos a la hora de eliminar el tabaquismo si se combinan
Aproximaciones conductuales al control del con otras técnicas de modificación conductual. La inhalación
tabaquismo rápida, por ejemplo, puede combinarse con un entrenamiento
en autoobservación o autoadministración.
Se han desarrollado diversos procedimientos de Primero se pide al sujeto que mantenga un egistro preciso del
condiciona-miento aversivo para que las personas dejen número de cigarrillos que fuma, así como del momento, lugar
de fumar (Hall, Hall y Ginsberg, 1990). Los primeros y circunstancia en las que lo hace. Una vez conocidas la
intentos consistieron en una terapia aversiva en la que el frecuencia y las circunstancias en las que fuma, se proponen
acto de fumar se emparejaba con el dolor producido por dos objetivos con los que se pretende reducir gradualmente el
una descarga eléctrica. Técnicas más recientes se basan consumo de tabaco: reducir el número total de cigarrillos
en los hallazgos que indican que el condicionamiento de la fumados al día y reducir el número de situaciones en las que
aversión es más efectivo si el estímulo aversivo es se permite fumar. Esta combinación de objetivos permita
“relevante” en relación a la situación. En estos restringir la conducta de fumar. El cumplimiento puede
procedimientos, suele utilizarse el propio acto de fumar alentarse utilizando un sistema de contratos. Por ejemplo, la
como fuente de la estimulación aversiva. Un procedimiento persona puede depositar una cantidad de dinero al comienzo
utilizado frecuentemente es el de inhalación rápida del tratamiento y recuperar posiciones de este depósito cada
(USDHHS, 1996), en el ue se pide al sujeto que inhale vez que logre un objetivo.
tabaco cada 6 segundos durante un periodo de tiempo
hasta que surja náuseas o mareos. Esta forma de fumar es
aversiva y permite condicionar una aversión al tabaco.
El concepto de fuerza biológica
Pavlov sugirió que para que un estímulo se condicionara debía tener una fuerza biológica
menor que la del estímulo incondicionado con el que se emparejaba. El concepto de "menor
fuerza biológica" se refería a que inicialmente el EC debía elicitar menos respuestas y más
débiles que el EI.
59
Juan Carlos Cabrera
Condicionamiento de orden superior. Un estímulo puede hacer de EI tras haber sido

fuertemente condicionado. Un tono emparejado repetidamente con la comida, elicitará la
salivación, así como seguimiento del signo. El concepto de fuerza biológica dice que este
tono debería ser efectivo para condicionar una luz.
El término orden superior, puede considerarse el condicionamiento como si operase en diferentes niveles. El emparejamiento
del tono con la comida se considera condicionamiento de primer orden; El emparejamiento de la luz con el tono
previamente condicionado sería el condicionamiento de segundo orden; y si la luz se usara para condicionar otro estímulo,
por ejemplo, un olor, se trataría de condicionamiento de tercer orden.
El condicionamiento de segundo orden es similar al procedimiento estandar para la inhibición

condicionada, sin embargo, parece ser el número de ensayos no EI es el factor crítico. Con
pocos ensayos no reforzados tiene lugar condicionamiento excitatorio de segundo orden.
Con un entrenamiento más extenso, se desarrolla inhibición condicionada.
Con el condicionamiento de orden superior, el condicionamiento clásico puede acontecer sin

un EI primario. El único requisito es que estén disponibles estímulos previamente
condicionados.
El condicionamiento de segundo orden también resulta interesante como técnica para

confirmar la aparición de condicionamiento de primer orden, que a veces no provoca
directamente una respuesta condicionada, pero que el EC de primer orden puede elicitar la
respuesta condicionada si es sometido a un condicionamiento de segundo orden.
Condicionamiento de orden superior del miedo del condicionamiento de orden superior, un estímulo
condicionado al miedo (las multitudes) había condicionado
Los miedos irracionales se desarrollan muchas veces por elmiedo a otros estímulos (cines) que previamente
medio del condicionamiento de oren superior. Por ejemplo, resultaban inocuos. El aspecto destacable de esta
Woldpe (1990) describe el caso de una mujer que experiencia es que se adquirió aversión a los estímulos del
inicialmente tenía miedo a las multitudes. Aunque se cine sin que estas claves se hubieran emparejado
desconoce cómo se condicionó este miedo, las multitudes directamente con un estímulo incondicionado aversivo.
habían adquirido la capacidad de elicitar miedo. Para evitar Después de esta terrible experiencia con el cine, la mujer
el surgimiento del miedo, la mujer iba al cine sólo en el evitaba ir al cine incluso cuando era poco probable que se
momento del día en el que había poca gente. En una de encontrara con mucha gente. Además, el miedo a los cines
tales visitas, el cine se llenó repentinamente de estudiantes. recién adquirido se generalizó a otros lugares públicos, tales
La mujer quedó muy afectada por esta experiencia y asoció como restaurantes, iglesias y edificios públicos, que también
los cines con las multitudes. Así pues, como consecuencia evitaba incluso si estaban vacíos.
60
Juan Carlos Cabrera
Contracondicionamiento. Dos estímulos pueden quedar asociados aunque ambos eliciten

inicialmente respuesta intensas. La respuesta que un animal da a un EC se invierte o
contrarresta emparejando ese estímulo con un EI que provoca una reacción opuesta. Por
ejemplo, un animal puede condicionarse para aproximarse a un estímulo que anteriormente
evitaba.
Precondicionamiento sensorial. También pueden aprenderse asociaciones entre dos

estímulos que tan sólo elicitan una débil respuesta de orientación antes de
condicionamiento. Por ejemplo, el emparejamiento del sabor de vainilla y canela quedan
asociados el uno del otro en los pasteles. Una aversión a la canela por medio de
envenenamiento, nos llevará a rechazar también pasteles con sabor a vainilla.
¿Qué determina la naturaleza de la respuesta condicionada?

(pág. 100 del libro)
El modelo de sustitución del estímulo
Según el modelo de sustitución del estímulo de Pavlov, el EC adquiere la capacidad de

funcionar de forma similar a como el EI lo hacía previamente, asumiendo, que el EC activa
los circuitos neuronales que previamente activaba sólo el EI y elicita respuetas similares a
EI.
Pavlov sugirió que el condicionamiento da lugar al establecimiento de nuevos enlaces

neuronales durante los emparejamientos reptidos de EC y EI, desarrollando una nueva
conexión entre los circuitos que previamente activaba el EC y los que previamente activaba
el EI. Establecida la conexión EC se convierte en un sustituto del EI
El EI como factor determinante de la RC. EC diferentes elicitan respuetan condicionadas

diferentes. La comida elicita salivación y aproximación; las descargas elicitan aversión y
alejamiento. Si el condicionamiento convierte al EC en un sustituto del EI, entonces los Ecs
condicionados con diferentes EIs deberían provocar diferentes tipos de RC.
El experimento con palomas de Jenkins y Moore (1973) compararon el condicionamiento

pavloviano utilizando como EI comida y agua . Para comer las palomas picotean rápido y
bruco hacia el grano y abren el pico justo antes de tomar contacto con él. Para el beber
introducen el pico casi cerrado en el agua y bajo ella abren periodicamente para succionar.
Las respuestas incondicionadas de comer y beber son diferentes.
61
Juan Carlos Cabrera
El EC fue la iluminación de una tecla durante 8 segundos y se emparejó tanto para la

presentación del grano de cereal como con la disposibilidad de agua. La forma de RC se
parecía a la forma de la respuesta incondicionada: El EC condicionado con la comida
provocaba el picoteo relacionado con la comida y el EC condicionado con agua provocaba los
picoteos relacionados con la bebida.
Aprendizaje y homeostasis: Un caso especial de sustitución del estímulo.
Walter Cannon introdujo el concepto homeostasis para referirse a los mecanismos

fisiológicos que mantienen los aspectos críticos del cuerpo dentro de los límites aceptables,
Estos mecanismo funcionaban por procesos de retroalimentación negativa que servían para
contrarestar las alteraciones una vez que estas ya habían provocado una desviación de los
niveles optimos. Esto puede resultar ineficiente, especialmente si el proceso de
compensación o corrección tarda en activarse. Dworking (1993) señalo que las alteraciones
en la homeosteasis pueden compensarse más activamente si pueden anticiparse. El
condicionamiento pavloviano proporciona los medio necesarios para tal anticipación.
Las respuetas homeostáticas condicionadas se han examinado más extensamente en

relación a la forma en que los organismos respondem a la administración de drogas
psicoactivas. Suelen provocar alteraciones fisiológicas que afectan a la homeostasis que
activan reacciones compensatorias condicionadas. Las claves que se asocian con la alteración
fisiológica inducida por la droga pueden llegar a elicitar estas reacciones compensatorias
como respuestas condicionadas anticipatorias.
El modelo de condicionamiento de tolerancia a las drogas: Se considera que se ha

desarrollado tolerancia a las drogas cuando las administraciones repetidas de las mismas
tiene un efecto cada vez menor. Tradicionalmente se ha considerado esta tolerancia como
debida a procesos farmacológicos. Shepard Siegel, en contraste ha propuesto un modelo
basado en el condicionamiento clásico, utilizando el concepto de homeostasis aprendida.
El modelo de condicionamiento de la tolerancia a las drogas atribuye la tolerancia a las

respuestas compensatorias condicionadas a los estímulos del entorno que se emparejan con
la administración de la droga. Una importante predicción del modelo es que la tolerancia a la
droga se verá atenuada si los sujetos reciben la droga en condiciones novedosas o en
ausencia de las claves que normalmente predicen su consumo. También predice que varios
factores que atenúan el desarrollo de las respuestas condicionadas (como la preexposición
al EC) también deberían atenuar el desarrollo de la tolerancia a la droga
62
Juan Carlos Cabrera
El EC como determinante de la forma de la RC
La forma de la RC también esta influenciada por la naturaleza del EC. Timberlake y Grant
(1975) utilizaron comida como EI, el EC fue la presentación de otra rata justo antes de la
administración de comida, el EC no porvoco conductas de roer y morder, elicito respuestas
de orientación, aproximación y olfateo, asi como contactos de tipo social.
Conducta condicionada y sistemas de conducta
Los diversos sistemas de conductas han evolucionado para permitir al animal llevar a cabo
tareas criticas, tales como obtener y comer el alimento, defender su territorio, evitar a los
depredadores, reproducirse y cuidad sus crías. Cada sistema consiste en una serie de modos
de respuesta, cada uno de ellos con sus propios estimulos y respuestas relevantes,
dispuestos con determinado orden espacial y secuencial.
La teoría de los sistemas de conducta asume que la presentación del EI en un porcedimiento

de condicionamiento pavloviano activa el sistema de conducta relevante para ese EI. Los
estímulos condicionados con comida elictan componentes del sistema de alimentación y los
estímulos condicionados sexuales elicitan componentes del sistema de conducta sexual.
Una predicción de la teoría de los sitemas de conducta es que la forma de la RC dependerá

del intervalo EC-EI que se utilice. Este intervalo determina el lugar en que se incorporara el
EC dentro de la secuencia de respuestas del sistema de conducta.
La teoría es claramente compatible con el hecho de que la forma de la RC está determinada

por: La naturaleza del (EI) estímulo incondicionado y la naturaleza del (EC) estímulo
condicionado.
Aprendizaje E-R frente a aprendizaje E-E
Historicamente la conducta condicionada se veía como una conducta elicitada directamente

por el EC. De acuerdo con la teoría del aprendizaje E-R, establece una nueva conexión
estímulo-respueta entre el EC y la RC. La teoría del aprendizaje E-E los sujetos aprenden
una asociación estimulo-estimulo entre el EC y el EI. Los sujetos responden al EC, no porque
este elicite directamente una RC, sino porque el EC activa una representación del EI. La
presentación del EC hace que el sujeto piense en el EI y esta es la causa de la conducta
condicionada.
Un método de investigación importante para decidir entre aprendizaje E-R y E-E es la de la

devaluación del EI.
63
Juan Carlos Cabrera
¿ Cómo se asocian los estímulos condicionados e incondicionados ?

(pág. 109 del libro)
El efecto de bloqueo
Conlleva una secuencia de suscesos

similar. Primero se asocia EC (estímulo
A) y el EI. Una vez que el ECA esta bien
condicionado, se añade el segundo
estímulo (estímulo B) al estímulo A y se
presentan los dos juntos en los ensayos Figura 4.13. Esquema del procedimiento de bloqueo.
de condicionamiento. El hallazgo básico
En la fase 1, el estímulo A se condiciona con el EI para el grupo
es que el condicionamiento previo de A, experimental, mientras que el grupo de control recibe
bloquea el desarrollo de la RC al presentaciones desemparejadas de A y el EI.
estímulo B. En la fase 2, ambos grupos reciben ensayos de condicionamiento

en los que el estímulo A se presenta a la vez que el estímulo B y
se empareja con el EI.
Este efecto se ha convertido en un
Una prueba posterior con el estímulo B aislado muestra que el
fenómeno clave del condicionamiento grupo experimental produce una respuesta condicionada menor
clásico porque puso en duda el ante el estímulo B que el grupo de control.
presupuesto de que la contigüidad

temporal fuese suficiente para el aprendizaje.
Kamin, su descubridor, explico el efecto proponiendo que para que se produzca aprendizaje
de forma efectiva el EI debía ser inesperado o sorprendente.
El modelo de Rescorla y Wagner
Rescola Wagner asumieron que la sorpresividad, y por tanto le efectividad, de un EI

depende de lo diferente que el EI sea en comparación con lo que el sujeto espera. Asumen
que la expectativa del EI está relacionada con las propiedades condicionadas o asociativas
del estímulo que precede al EI. Una RC intensa indica una fuerta expectativa de que el EI
aprecerá (condicionamiento excitatorio o incremento de la fuerza asociativa); una RC débil
indica una baja expectativa del EI (condicionamiento inhibitorio o disminución de la fuerza
asociativa).
Ecuación básica : ΔV = k ( λ − V )
λ : asítona de aprendizaje
V : valor asociativo de los estímulos
k : constante relacionada con la saliencia del EC y del EI.
64
Juan Carlos Cabrera
Aplicación del efecto de bloqueo. El modelo de Rescorla y Wagner predicen claramente el

efecto bloqueo. Como se muestra en la Figura 4.13, el grupo experimental de diseño de
bloqueo recibe primero un condicionamiento extenso del estímulo A, de forma que adquiere
una expectativa de que el EI ocurrirá siempre que se presente el estímulo A. Cuando
finaliza la fase 1, VA es igual a la asíntota de aprendizaje o λ (V A = λ ) . En la fase 2, el
estímulo B se presenta junto con el estímulo A, y ambos van seguido del EI. De acuerdo con
el modelo Rescorla-Wagner, no habrá condicinamiento del estímulo B en la Fase 2, ya que el
EI es perfectamente predecible por la presencia del estímulo A: (λ − V A+B ) = 0
El grupo de control recibe un tratamiento idéntico en la Fase 2, pero para ellos la presencia
del estímulo A no lleva a unaexpectativa del EI y por tanto es sorprendente para el grupo
de control y produce nuevo aprendizaje.
Perdida de valor asociativo a pesar de los emparejamientos con el EI. Gran parte de la
importancia del modelo se debe a sus inusuales predicciones. Una de tales predicciones es
que, en ciertas circunstancias, las propiedades condicionadas de los estimulos se reduciran
a pesar de que siga habiendo emparejamientos con el EI.
Fase 1 Fase 2
A → EI
[A + B] → EI
el EI
1 B → EI
Pérdida de valor asociativo a pesar de las presentación continuada del EI. Los estímulos A y B se condicionan separadamente
hasta llegar a la asíntota en la Fase 1, de modo que cada EC sea capaz de predecir el EI perfectamente. En la Fase 2, los
estímulos A y B se presentan simultáneamente y se emparejan con el mismo EI utilizando en la Fase 1. Esto produce una
expectativa excesiva del EI. Dado que el EI es sorprendentemente pequeño al principio de la Fase 2, las propiedades
condicinadas de los estímulos A y B se reducen hasta que la presentación simultánea de los dos ECs deja de producir un
exceso de expectativas.
Inhibición condicionada. La aplicación del modelo de Rescorla y Wagner a este

procedimiento requiere que se consideren separadamente los ensayos reforzados y los no
reforzados. Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirir
propiedades excitatorias. El condicionamiento excitatorio conlleva la adquisición de una
valor asociado positivo, y cesa una vez que el organismo predice el EI perfectamente en
cada ensayo.
En cada ensayo aparecen tanto el EC+ como el EC-. Una vez que el EC+ ha adquirido cierto
grado de excitación condicionada (debido a su presentación en los ensayos reforzados), el
organismo esperará que se presente el EI siempre que aparezca el EC+, incluyendo los
ensayos no reforzados. Sin embargo, el EI no ocurre en los ensayos no reforzados, por lo
que se trata de un caso de expectativa excesiva. Para predecir con exactitud la ausencia del
EI en los ensayos reforzados, los valores asociativos del EC+ y del EC- tienen que sumar
65
Juan Carlos Cabrera
cero (valor que representa la ausencia de EI). Para lograrlo, como el EC+ tiene un valor
asociativo positivo, la única forma es hacer que el valor asociativo del EC- sea negativo. El
modelo Rescola-Wagner explica la inhibición condicionada asumiento que el EC- adquiere un
valor asociativo negativo.
Extinción de la excitación y de la inhibición. En un procedimiento de extinción, el

estímulo condicionado se presenta repetidamente sin el EI. Si un EC ha adquirido
propiedades excitatorias (EC+) habrá un exceso de expectativa del EI la primera vez que el
EC se presente sin el EI en la fase de extinción. Al continuar con los ensayos del EC solo, la
expectativa elicitada por el EC se va acercando a la línea que representa la ausencia del EI
por medio de una reducción gradual del valor asociativo del EC+ hasta llegar a cero.
El modelo de Rescola y Wagner prdice un situación similar para la extinción de la inhibición

condicionada. Al principio de la extinción, el EC- tiene valor asociativo negativo, esto puede
considerarse una predicción excesivamente baja del EI; el organismo predice un EI con un
valor menor del valor cero con el que de hecho aparece le EI. Para ajustar las expectativas
a la ausencia del EI, el valor asociativo negativo del Ec- se va perdiendo gradualmente y el
EC- termina con una fuerza asociativa igual a cero.
Problemas del modelo Rescorla Wagner.
1º- Su análisis de la extinción de la inhibición es incorrecto. Algunos investigadores

han encontrado que no reforzar un EC- de forma repetida puede potenciar sus propiedades
inhibitorias.
2º- El modelo considera la extinción como lo opuesto a la excitación, o a la vuelta a un

valor asociativo cero, pero la extinción no debería verse como una mera inversión de la
adquisición. La extinción parece involucrar el aprendizaje de una nueva relación entre el EC
y el EI.
3º- En ciertas condiciones el mismo EC puede tener tanto propiedades excitatorias

como inhibitorias, en el modelo no pueden ser ambos.
4º- El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los
paradigmas de avesion al sabor y olor. En experimentos similares al de efecto de bloqueo,
cabria esperar que la presencia del EC previamente condicionado interfiriera en el
condicionamiento del EC añadido en la fase 2. Se encontró el resultado opuesto: un efecto
de aumento o de contrabloqueo.
66
Juan Carlos Cabrera
Otro modelos de condicionamiento clásico
Modelos atencionales de condicionamiento. Las teorías atencionales difieren en sus

supuestos sobre que es lo que determina la saliencia del EC en un ensayo. Pearce y Hall
(1980) asumen que el grado de atención que un animal presta al EC en un ensayo
determinado depende del grado en el que el EI haya sido sorprendente en el ensayo
anterior, y por tanto aún tiene mucho que aprender y prestarán más atención al EC en el
siguiente ensayo. Por el contario, si un EC iba seguido de un EI esperado en el ensayo
anterior, el sujeto prestará menos atención a ese EC en el siguiente ensayo, asumiendo que
un EI esperado reduce la saliencia o la atención dedicada al EC.
Una caracteristica importante de la teorías atencionales es que asumen que la sorpresividad

del EI en un ensao determinado altera el grado de atención dedicado al EC en los ensayos
siguientes. Esta es una diferencia importante con Rescorla Wagner que asumen que la
sorpresividad del EI en un ensayo determina lo que se aprende en ese ensayo.
El supuesto de que el EI presentado en un ensayo sólo afecta a lo que se aprende en el

siguiente ensayo ha permitido explicar ciertos hallazgos, pero también tienen dificultades
con otros, como los del experimento de bloqueo en el primer ensayo de la Fase 2 del
experimento de bloqueo.
Factores temporales y respuesta condicionada. Ni el modelo de Rescola y Wagner ni los

modelos modificación del EC fueron diseñados para explicar los efectos del tiempo sobre el
condicionamiento, pese a que el tiempo es un factor crítico. Una variable temporal
importante es el intervalo EC-EI. La respuesta condicionada es inversamente proporcional al
intervalo EC-EI o duración del EC. Por encima de un punto óptimo los procedimientos con
intervalos EC-EI más largos producen menos respuestas.
Otra variable temporal importante es el intervalo entre ensayos. En general en ensayos más
separados entre si, mayor respuesta condicionada. Mas interesante resulta que el intervalo
entre ensayos y la duración del EC interactuan a la hora de determinar la respuesta.
Numerosos ensayos han mostrado que el factor crítico es la duración relativa de estas dos
variables temporales, más que el valor absoluto de las mismas.
Se han ofrecido varias interpretaciones sobre por qué la respuesta condicionada esta tan
fuertemente determinada por la razón IEE/DE (intervalo entre ensayos/duración del
ensayo). Una de las primeras explicaciones fue la hipótesis de espera relativo, que supone
que un EC proporciona información acerca de la aparición del EI sólo si el sujeto tiene que
pasar menos tiempo esperando al EI que cuando esta simplemente expuesto al contexto
experimental.
67
Juan Carlos Cabrera
Cuando la Razón IEE/ED es baja, el tiempo de espera ante el EC es similar al tiempo de

espera en el contexto. En este caso, el EC proporciona poca información adicional sobre el
momento de aparición del EI y no se desarrollara mucha respuesta condicionada. Por el
contrario, cuando la razón IEE/ED es alta, el tiempo de espera ante el EC es mucho menor
que el tiempo de espera en el contexto. Esto hace que el EC aporte información sobre el
momento que aparece el EI, y la respuesta condicionada será mas fuerte.
La hipótesis del comparador. R.Miller. Se parece a la hipótesis del tiempo de espera

relativo, en que asume que la respuestas condicionadas depende no sólo de la asociación
entre el EC y EI, sino también de todas las posibles asociaciones que puedan establecerse
en claves contextuales y el EI. La fuerza asociativa de otras claves presentes durante el
entrenamiento con el EC crítico es especialmente importante. Otra restricción del modelo
del comparador es que sólo permite asociaciones excitatorias con el EI. El modelo asume
que el que la RC refleje excitación o inhibición está determinado por la fuerza relativa de la
excitación condicionada al EC en comparación con la excitación condicionada a las claves
contextuales presentes durante el entrenamiento del EC.
La hipótesis hace más hincapié en las asociaciones que en el tiempo. Asume que los sujetos
aprenden tres asociaciones en el curso del condicionamiento:
1º Une el EC crítico con el EI.
2º Une el EC crítico con las claves contextuales de comparación .
3º Une los estímulos de comparación y el EI.
Cuando se presenta el EC este activa la representación del EI tanto directamente (asoc 1)

como indirectamente (asoc 2 y3). La comparación de las activaciones directa y indirecta del
EI determina el grado de respuesta excitatoria o inhibitoria que tendrá lugar.
Esta hipótesis no indica cómo se establecen las asociaciones, es una teoría de la ejecución.
Un importante corolario es que la comparación entre asociaciones EC-EI y el contexto-EI se

realiza en el momento de la prueba. Predice que la extinción de la asociación contexto EI
después del entrenamiento del EC potenciara la respuesta al EC crítico.
Principal contribución ha sido su énfasis en que las diferencias en la respuesta condicionada

pueden reflejar diferencias en la ejecución más que en el aprendizaje, considera el efecto
bloqueo como un fallo en la ejecución, Predice que la extinción del estimulo bloqueador
elevara la RC al EC bloqueado
También se ha puesto a prueba en estudios sobre inhibición condicionada. El modelo le

atribuye la inhibición condicionada a situaciones en las que se asocia el EC crítico con el EI
es más débil que la asociación de las claves contextuales con el EI. En este caso, las claves
68
Juan Carlos Cabrera
contextuales son estímulos que proporcionan el contexto excitatorio necesario para el

condicionamiento inhibitorio. Curiosamente predice que la extinción de estos estímulos
condicionados excitatorios tras el condicionamiento inhibitorio reduciría la respuesta
inhibitoria. Por tanto, la hipotesis del comparador es la única que predice que la extinción de
la inhibición condicionada se logra de forma óptima, no presentando el EC- aislado, sino
extinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para el
condicionamiento inhibitorio del EC-.
El modelo predice también que incrementar el valor excitatorio de las claves contextuales
tras el tratamiento (Asoc. 3) reducirá la respuesta condicionada del EC crítico. No se ha
conseguido confirmar esta predicción.
Una de sus principales contribuciones ha sido su énfasis en que la diferencias en la

respuesta condicionada puede reflejar diferencias en la ejecución más que en el
aprendizaje. El bloqueo lo considera como un mero fallo en la ejecución más que en el
aprendizaje. Predice que la extinción del estímulo bloqueador tras el entrenamiento elevará
la respuesta condicionada al EC bloqueado.
Visión general de las alternativas teóricas. Cada uno de los modelos que se han descrito
hace hincapié en un aspecto diferente del condicionamiento clásico. La hipótesis del tiempo
de espera relativo se centre en un pequeño conjunto de fenómenos relacionados con la
distribución temporal de los estímulos condicionados e incondicionados, a pesar de que su
antecesora (la teoría de la expectativa escalar) tiene un alcance mucho mayor.
La hipótesis del comparador también es ambiciosa, pero es una teoría de la ejecución más
que del aprendizaje y, por toanto, no explica como se adquieren las asociaciones.
Los modelos atencionaes hacen referencia al mismo tipo de fenómeno que el modelo
Rescorla-Wagner, pero comparten algunas de sus limitaciones.
Todos estos modelos han sido importantes en tanto que han dirigido nuestra atención a
aspectos previamente ignorados del condicionamiento clásico. Ninguno de ellos ha llegado a
dominar el estudio del condicionamiento clásico e la misma forma que el modelo Rescorla-
Wagner lo hizo en los setenta.
69
Juan Carlos Cabrera
Comentarios finales (pág. 122 del libro)
Inicialmente, algunos psicólogos consideraron el condicionamiento clásico como un tipo de

aprendizaje relativamente simple y primitivo que intervenía sólo en la regulación de
respustas glandulares y vecerales como la salivación. Se asumía que el establecimiento de
las asociaciones EC-EI tenía lugar automáticamente con los emparejamientos del EC y el EI.
Debido a la naturaleza simple y automática del condicionamiento y a que se creía que estaba
limitado a las respustas glandulares y vicerales, no se consideraba que fuera importante a la
hora de explicar la complejidad y riqueza de la experiencia humana. Claramente, esta visión
del condicionamiento clásico resulta insotenible en la actualidad.
La investigación revisada de los Capítulos 3 y 4 muestra que el condicionamiento clásico

involucra numerosos procesos complejos y está implicado en el control de una gran variedad
de respuestas, desde la conducta emocional hasta las respuestas de aproximación y
evitación. Además, el aprendizaje no ocurre de forma automática por el mero
emparejamiento de un EC con un EI. Depende de la experiencia previa del organismo con
cada uno de estos estímulos, de la presencia de otros estímuos durante los ensayos de
condicionamiento y del grado con que el EC y el EI sean mutuamente relevantes. Además, los
procesos de condicionamiento clásico no se limitan a emparejamientos EC-EI. También
pueden desarrollarse asociaciones entre dos eventos sin significación biológica
(precondicionamiento ensorial), en ausencia de un estímulo incondicionado (condicionamiento
de orden superior) o en ausencia de un estímulo condicionado convencional
(contracondiconamiento).
Debido a estas y otras complejidades de los procesos de condicionamiento clásico, es un

error ignorar el condiconamiento clásico al tratar de explicar formas complejas de
comportamiento. La riqueza de los mecanismos del condicionamiento clásico los convierte en
relevantes en relaicón a la riqueza y complejidad de la experiencia humana.
70
Juan Carlos Cabrera
Términos clave
Aprendizaje E-E Aprendizaje de una asociación Efecto de inhibición latente Lo mismo que efecto
entre dos estímulos, con el resultado de que la de preexposicioón al EC.
exposición a uno de los estímulos adquiere la Efecto de preexposición al EC Interferencia con
capacidad de activar una representación o el proceso de condicionamiento producida por la
“imagen mental” del otro estímulo. También exposición repetida al estímulo condicionado
llamado aprendizaje estímulo-estímulo. antes de los ensayos de condicionamiento.
También llamado efecto de inhibición latente.
Aprendizaje E-R Aprendizaje de una asociación
entre un estímulo y una respuesta, con el Efecto de preexposición al EI Interferencia con
resultado de que el estímulo adquiere la el proceso de condicionamiento producida por la
capacidad de provocar la respuesta. Lo mismo exposición repetida al estímulo incondicionado
que aprendizaje estímulo-respuesta. antes de los ensayos de condicionamiento.
Aprendizaje estímulo-estímulo Lo mismo que Hipótesis del comparador Idea según la cual la
aprendizaje E-E. respuesta condicionada depende de una
comparación entre la fuerza asociativa del
Aprendizaje estímulo-respuesta Lo mismo que estímulo condicionado crítico (EC) y la fuerza
aprendizaje E-R. asociativa de otras claves presentes durante el
condicionamiento del EC crítico.
Condicionamiento de orden superior Procedimien-
to en el que se utiliza un estímulo previamente Hipotesis del tiempo de espera relativo Idea
condicionado (EC1) para condicionar un nuevo según la cual la respuesta condicionada depende
estímulo (EC2) de cuánto tiempo tenga que esperar el
organismo para el estímulo incondicionado (EI)
Contracondicionamiento Procedimiento de condi- en presencia del estímulo condicionado (EC), en
cionamiento que invierte la respuesta comparación con el tiempo que tenga que
condicionada con anterioridad a un estímulo. Por esperar para el EI en la situación experimental
ejemplo, un animal puede condicionarse para independientemente del EC.
aproximarse aun estímulo que anteriormente
evitaba. Homeostasis Concepto introducido por Walter
Cannon para referirse a los mecanismos
Devaluación del EI Reducción el atractivo de un fisiológicos que permiten mantener los aspectos
es-tímulo incondicionado, normalmente obtenida corporales críticos (tales como los niveles e
mediante la aversión o la saciedad. azúcar en sangre o la temperatura) dentro de
ciertos límites. El nivel homeostático suele
Efecto de aumento Facilitación en el condiciona- lograrse mediante la acción de mecanismos de
miento el un estímulo novedoso debido a su retroalimentación negativa que permiten
condicionamiento junto a un estímulo previa- contrarrestar el efecto de los cambios en el
mente condicionado. También llamado efecto de nivel homeostático.
contrabloqueo.
Precondicionamiento sensorial Procedimiento en el
Efecto bloqueo Interferencia en el que un estímulo biológicamente débil (EC2) se
condicionamien-to de un nuevo estímulo debida a empareja repetidamente con un estímulo
la presencia de un estímulo previamente biológicamente débil (EC1). Después, el EC1 se
condicionado. condiciona con un estímulo incondicionado. En un
ensayo de prueba posterior, el EC2 también
Efecto de contrabloqueo Lo mismo que nunca se había emparejado directamente con el
aumentación. estímulo incondicionado.
71
Juan Carlos Cabrera
Respuesta homeostática condicionada Respuesta

condicionada que se parece a las reacciones
homeostáticas incondicionadas que elicita un
estímulo incondicionado.
Saliencia del estímulo Significación o percep-

tibilidad de un estímulo para el organismo. En
general, el aprendizaje avanza más rápido con
estímulos condicionados e incondicionados más
salientes.
Sustitución del estímulo Idea teórica según la

cual el resultado del condicionamiento clásico es
que el organismo responde al estímulo
condicionado de la misma manera que respondía
previamente al estímulo incondicionado.
Tolerancia a las drogas Reducción en la

efectividad de una droga como resultado del
consumo repetido de la misma.
72
Capítulo 5: Condicionamiento instrumental: Fundamentos
Primeras investigaciones sobre el condicionamiento instrumental
Aproximaciones modernas al estudio del condicionamiento instrumental

- Procedimientos de ensayo discreto
- Procedimientos de operante libre
Procediminetos de condicionamiento instrumental
Elementos fundamentales del condicionamiento instrumental

- La respuesta instrumental
- El reforzador instrumental
- La relación respuesta-reforzador
Contigüidad y contingencia: Comentarios finales
73

Juan Carlos Cabrera
En este capítulo se vuelve la vista al análisis de las situaciones de aprendizaje en las cuales
los estímulos a los que un organismo se enfrenta son el resultado directo de su conducta,
descrita como “dirigida a una meta”.
La conducta que sucede debido a que ha servido previamente como instrumento para
producir ciertas consecuencias se denomina conducta instrumental.
Primeras investigaciones sobre el condicionamiento instrumental.

(página 125 del libro)
Los análisis teóricos y de laboratorio del condicionamiento instrumental comenzaron

formalmentecon el trabajo de thorndike. Su intención original era estudiar la inteligencia
animal. Estudio la cuestión planteada por Darwin sobre que capacidades intelectuales
humanas estaban presentes en los animales mediante investigación empírica, para ello
invento una serie de cajas problema donde introducía un gato hambriento con algo de
comida fuera de la vista del animal. Su tarea era aprender a salir de la caja y obtener la
comida.
La cuidadosa aproximación empirica de Thorndike fue un avance significativo en el estudio

de la “inteligencia animal”. Otra contribución importante fue la estricta evitación de
interpretaciones antropomórficas de la conducta observada. En lugar de ello, interpreto los
resultados de sus estudios como el reflejo del aprendizaje de una asociación E-R. A medida
que la asociación o conexión entre las claves de la caja y la respuesta con éxito se hacia mas
fuerte, el gato llegaba a realizar esta de forma más rápida. La consecuencia de la respuesta
exitosa fortalecía la asociación entre los estimulos de la caja y esa respuesta.
Sobre la base de eta investigación, Thorndike formulo la ley del efecto: si una respuesta
en presencia de un estimulo es seguida por un suceso satisfactorio, la asociación E-R se
fortalece, si es seguida por un suceso molesto, se debilita. Esta ley implica un aprendizaje
E-R.
75

Juan Carlos Cabrera
Aproximaciones modernas al estudio (página 125 del libro)
del condicionamiento instrumental.
Thorndike utilizó 15 cajas problemas diferentes en sus investigaciones que requerían

diferentes manipulaciones para que el gato saliese. Algunas llegaron a ser “estándar”.
Procedimientos de ensayo discreto
El método es similar al de Thorndike, en el que cada ensayo de entrenamiento acaba con la

retirada del animal del aparato, y la respuesta instrumental se realiza sólo una vez durante
cada ensayo.
Similares al método de Thorndike, W.S.Small (1899,1900), introdujo el laberinto en las

investigaciones sobre aprendizaje inspirado en las madrigueras bajo tierra.
Un laberinto muy utilizado es el de forma de T, diseñado para estudiar la conducta de

elección. La conducta en el laberinto puede cuantificarse midiendo la velocidad de
carrera, que normalmente aumenta con ensayos de entrenamiento repetidos. Otra medida
común es la latencia, tiempo que tarda el animal en abandonar la caja salida y empezar a
desplazarse por el pasadizo, las latencias se hacen mas cortas a medida que progresa el
entrenamiento.
Procedimientos de operante libre
Ideado por B.F. Skinner, los procedimientos de operante libre permiten al animal que repita
la respuesta instrumental una y otra vez sin restricciones.
Skiner estaba interesado en analizar en el laboratorio una forma de conducta que fuese
representativa de toda la actividad en curso que ocurria de forma natural. La conducta no
se divide como si fueran moléculas, por eso propuso el concepto de operante como la forma
de dividir la conducta en unidades medibles con significado.
La típica caja básica de Skinner que utilizada para estudiar la conducta opeante libre,
consistia en una pequeña cámara que contiene una palanca y un mecanismo que proporciona
un reforzador.
Una respuesta operante, como presionar una palanca, se defina a partir del efecto que
produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se
consideran ejemplos de la misma operante.
76

Juan Carlos Cabrera
Entrenamiento y moldeamiento al comedero. Hay algunos pasos preliminares para

establecer la conducta de presión de la palanca. En primer lugar, los animales tienen que
aprender cuándo esta disponible la comida en el comedero. Esto comprende un
condicionamiento clásico. Tras suficientes emparejamientos del sonido del dispensador con
la entrega de comida, el sonido llega a elicitar una respuesta de seguimiento del signo: el
animal se dirige al comedero y recoge la bolita de comida. Esta fase preliminar se llama
entrenamiento al comedero.
Después, el organismo esta preparado para aprender la respuesta instrumental requerida.

Si la respuesta no es algo que el animal ya realiza, nunca sucederá por si mima, para facilitar
la adquisición de una nueva respueta operante, al principio, la comida se entrega si el animal
hace cualquier cosa remotamente relacionada con la respuesta deseada. Una vez que la
respuesta de alzamiento ha sido establecida la comida solo entrega si la rata realiza la
respuesta de alzamiento sobre la palanca de respuesta. Una vez que el alzamiento sobre la
palanca ha sido establecido, la bolita de comida puede entregarse solo si realmente la rata
presiona la palanca. Esta secuencia de pasos se denomina moldeamiento. Este incluye dos
tácticas complementarias: reforzamiento de aproximaciones sucesivas a la respuesta
requerida y no reforzamiento de las formas de respuesta más tempranas.
Moldeamiento y nueva conducta: El condicionamiento instrumental incluye a menudo la

construcción o síntesis de una nueva unidad conductual a partir de componentes de
respuesta preexistentes que ya se encuentran en el repertorio del sujeto. El
condicionamiento instrumental puede también utilizarse para producir respuestas que no se
parecen en nada a lo que el individuo es probable que haga sin entrenamiento. El
moldeamiento aprovecha la variabilidad inherente de la conducta. Sin esta variabilidad, los
procedimientos de moldeamiento no tendrían éxito. El moldeamiento puede producir nuevas
formas de respuesta nunca antes realizadas por el organismo.
La tasa de respuesta como medida de la conducta operante. Los métodos de operante

libre permiten una observación continua durante largos periodos, proporcionan una ocasión
especial para obsevar cambios en la probabilidad de la conducta a lo largo del tiempo.
Las medidas de la latencia de la respuesta y de la velocidad que se emplea normalmente en
procedimientos de ensayo discreto no permiten que se repita la respuesta. Skinner propuso
que la tasa de ocurrencia de una conducta operante (frecuencia por minuto, por ej.) se
utilizase como medida de la probabilidad de respuesta.
77

Juan Carlos Cabrera
Procedimientos de condicionamiento instrumental (página 133 del libro)
Una consecuencia placentera se denomina técnicamente estimulo apetitivo. Una

consecuencia molesta estimulo aversivo. La respuesta instrumental puede proporcionar el
estimulo, en este caso se dice que surte efecto una contingencia positiva entre la respuesta
y su estimulo consecuente. De forma alternativa, la respuesta instrumental puede retirar o
eliminar un estimulo, en este caso se dice que existe un efecto de contingencia negativo
entre la respuesta y su consecuencia: Que el resultado de un procedimiento de
condicionamiento sea un aumento o una disminución de la tasa de respuesta depende tanto
de la contingencia respuesta-consecuencia como de la naturaleza de la consecuencia.
Reforzamiento positivo: es un procedimiento en el que la respuesta instrumental produce un

estimulo apetitivo. Si se da la respuesta el estimulo apetitivo se presenta, si no se da la
respuesta el estimulo apetitivo no se presenta: existe una contingencia positiva entre la
espuesta instrumental y el estimulo positivo. El reforzamiento positivo produce incremento
en la tasa de respuesta.
Castigo: En un procedimiento de castigo, la respuesta instrumental produce o aproxima un

estimulo molesto o aversivo. Produce disminución en la respuesta instrumental.
Reforzamiento negativo: En una contingencia negativa, la respuesta retira o previene la

presentacion de un suceso ambiental. Un procedimiento en el que la respuesta instrumental
finaliza o previene la entrega de un estimulo aversivo se denomina reforzamiento negativo.
Hay dos tipos, escape y evitación.:
En el escape, el estimulo aversivo se presenta pero puede ser eliminado por la

respuesta instrumental.La presencia de un estimulo aversivo establece la ocasión para la
ocurrencia de la respuesta instrumental, entonces es reforzada por la terminación del
estimulo aversivo.
La evitación implica la programación de un estimulo aversivo para ser presentado en

algún momento del futuro. En este caso la respuesta instrumental previene la entrega del
estimulo aversivo.
Entrenamiento de omisión: Incluye una contingencia negativa entre la respuesta

instrumental y un suceso ambiental. En este caso la respuesta instrumental previene la
presentación de un estimulo apetitivo o placentero. A menudo es el preferido para disuadir
la conducta humana (niño a su habitación).
78

Juan Carlos Cabrera
Los procedimientos de entrenamiento de omisión se denominan en ocasiones reforzamiento

diferencial de otras conductas o RDO. Este termino refleja el hecho de que el individuo
recibe un estímulo apetitivo periódicamente a condición de que se dedique a realizar otra
conducta diferente de la respuesta especificada por el procedimiento. Implica el
reforzamiento de “otras” conductas.
La respuesta instrumental disminuye por el castigo y aumenta por el reforzamiento negativo
Elementos fundamentales del condicionamiento instrumental

La esencia de la condcuta instrumental es que esta controlada por sus consecuencias. El

condicionamiento instrumental consta de tres elementos claves; una respuesta, una
consecuencia (el reforzador) y una relación o contingencia, entre la respuesta y la
consecuencia.
La respuesta instrumental
El resultado de los procedimientos del condicionamiento instrumental depende en parte de

la naturaleza de la respuesta que se este condicionando.Algunas respuestas son mas
fácilmente condicionables que otras.
Variabilidad conductual versus estereotipia. Thorndike y Skinner enfatizaron que el

reforzamiento incrementa la probabilidad de que la respuesta se repita en el futuro. Este
énfasis alentó la creencia de que los procedimientos de condicionamiento instrumental
producían repeticiones de la misma respuesta - que producían uniformidad o estereotipia en
la conducta - . Sin embargo, esto no significa que el condicionamiento instrumental no pueda
verse también involucrado en la producción de respuestas creativas o variables. Los
organismos pueden aprender a obtener refuerzo en situaciones donde se requiera hacer
algo nuevo. La variabiliad de la respuesta puede ser la base para el reforzamiento
instrumental. (ver ejemplo. Pag 137).
Relevancia o pertinencia en el condicionamiento instrumental: Thorndike propuso el

termino de pertinencia para explicar los fallos en el entrenamiento del rascado y del
bostezo, ciertas respuestas se corresponden de forma natural con el reforzador debido a la
historia evolutiva del animal. Los Breland denominaron deriva instintiva al desarrollo de
respuestas como la de hozar en los cerdos y frotar monedas en los mapaches. Estas
respuestas naturales relacionadas con la comida eran aparentemente muy fuertes y
competían con las respuestas que requería el investigador.
79

Juan Carlos Cabrera
Sistemas de conducta y limitaciones en el condicionamiento instrumental. De acuerdo

con la teroría de los sistemas de conducta, cuando un animal está privado de comida y se
encuentra en una situación donde podría encontrarla, su sistema de alimentación se activa, y
se dedica al forrajeo y otras actividades relacionadas con la comida. Sobre este sistema de
conducta se superpone un procedimiento de condicionamiento instrumental. La efectividad
del procedimiento para el incremento de una respuesta instrumental dependerá de la
compatibilidad de esa respuesta con la organización preexistente del sistema de
alimentación.
Podemos predecir qué respuestas se incrementarán con un reforzamiento de comida

mediante el estudio de lo que los animales hacen cuando su sistema de alimentación está
activado en ausencia de condicionamiento instrumental.
Otra forma de diagnosticar si una respuesta es parte de un sistema de conducta es realizar

un experimento de condicionamiento clásico. Un EC llega a elicitar componentes del sistema
de conducta activado por el EI. Si la deriva instintiva refleja las respuestas del sistema de
conducta, las respuestas análogas a la deriva instintiva deberías ser evidentes en un
experimento de condicionamiento clásico. Timberlake y colaboradores comprobaron esta
predicción en ratas utilizando una modificación de los estudios de manipulacion de monedas
llevados a cabo por los Brelands.
El reforzador instrumental
Cantidad y naturaleza del reforzador: En un estudio sistemático, Hutt(1954) intento

aislar los efectos de la cantidad y naturaleza del reforzador alimenticio líquido mediante la
variación sistematica de ambos rasgos. Los incrementos en el calidad y cantidad produjeron
mayor tasa de respuesta.
Cambios en la naturaleza y la cantidad de reforzador: Se plantea la posibilidad de que la

efectividad de un reforzador dependa no sólo de sus propiedades sino también de cómo ese
reforzador se compara con otros que el individuo haya experimentado. La efectividad de un
EI en el condicionamiento clásica depende de cómo se compare el EI con las expectativas
del individuo basándose en la experiencia previa. Esta es la idea fundamental del modelo
Rescorla-Wagner, si el EI es mayor de lo esperado, producirá condicionamiento excitatorio,
si el EI es menor producirá condicionamiento inhibitorio. Los efectos de una cantidad o tipo
de reforzador dependen de la cantidad y la naturaleza de los reforzadores que el individuo
ha experimentado previamente.
Mellgren (1972) Los resultados que obtuvo ilustran el fenómeno de contraste positivo: se
refiere a una elevada respuesta por una recompensa favorable, resultado de una
experiencia anterior con una consecuencia menos atractiva y contraste negativo: se refiere
80

Juan Carlos Cabrera
a una respuesta disminuida por una recompensa desfavorable debido a una experiencia
anterior con una consecuencia mejor. Los efectos de contraste también se dan si las
condiciones de recompensa se modifican una y otra vez con una clave diferente sañalando
cada condición de recompensa, estos efectos son ejemplo de contraste conductual
simultaneo.
Todos los efectos de contraste ilustran que la efectividad de un reforzador en una

situación esta determinada en parte por las experiencias del organismo con reforzadores en
otras situaciones. Por razones que no están totalmente claras, el contraste negativo se ha
obtenido de forma más clara que el contraste positivo.
La relación respuesta-reforzador
Unas veces existe una fuerte relación entre la conducta y sus consecuencias (introducir una
moneda en una maquina y obtener un refresco), en otras no (llevar una camiseta roja al
examen y sacar buena nota) y también puede ser probabilistica (hacer llamadas de telefono
y encontrar a alguien que te ayude).
Existen dos tipos de relaciones entre una respuesta y un reforzador:

1.- La relación temporal , que se refiere al tiempo que transcurre entre la respuesta
y el reforzador. Un tipo especial es la contigüidad temporal, la cual se refiere a la entrega
del reforzador inmediatamente después de la respuesta.
2.- La relación causal o contingencia respuesta-reforzador, se refiere al hecho de
que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador.
Los factores temporales y causales son independientes unos de otros.
Ambas son independientes unos de otros .
Hay una relación causal fuerte entre presentar una solicitud de admisión y ser aceptado, pues si no lo solicitas es seguro que
no será aceptado; sin embargo, la relación temporal entre solicitar y ser admitido es débil porque puede pasar semanas o
meses sin conocer la respuesta a la solicitud despues de haberla presentado.
Efectos de contigüidad temporal. El reforzamiento inmediato es preferible al

reforzamiento demorado. Los psicólogos del aprendizaje han resaltado que el
condicionamiento instrumental requiere porporcionar el reforzador inmediatamente
después de la ocurrencia de la respuesta instrumental. Grice informo que el aprendizaje
instrumental puede deteriorarse con demoras tan cortas como 0.5 seg.
Hay varios factores que pueden contribuir a este deterioro. Cuando el reforzamiento es
demorado tras la realización de una respuesta, R1, el organismo no deja de hacer cosas, R2
R3 R4 etc. Si el reforzador se establece en R1 pero no se entrega hasta algún tiempo
81

Juan Carlos Cabrera
después, el reforzador puede ocurrir después de alguna otra respuesta por ej. R5. Para
asociar R1 con el reforzador, el organiso tiene que poder distinguir R1 de otras respuestas
que realiza durante el intervalo de demora.
Hay dos formas de resolver este problema.

La primera técnica, es proporcionar un reforzador secundario o condicionado
inmediatamente después de la respuesta instrumental. Un reforzador condicionado o
secundario es un estímulo condicionado que previamente ha sido asociado con el reforzador.
Otra técnica es marcar la respuesta instrumental criterio de alguna manera para
hacerla distinguible de otras actividades del organismo.La efectividad del procedimiento de
marcado se demostró por primera vez por Lieberman, Mcintosh y Thomas (1979)
La contingencia respuesta-reforzador. Los estudios de demora del reforzamiento

muestran que no es suficiente una relación causal perfecta entre la respuesta y el
reforzador para producir una respuesta instrumental vigorosa. Incluso con una relación
causal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durante
demasiado tiempo. Se concluyó que la contigüidad respuesta-reforzador más que la
contingencia era el factor critico que producía el aprendizaje instrumental. No obstante,
esta visión ha resultado injustificada por la investigación posterior. La contingencia
respuesta-reforzador es también importante.
El experimento de superstición Skinner. Fue un hito en el debate acerca del papel de la

contigüidad frente a la contingencia en el aprendizaje instrumental. Skinner situó palomas
en cámaras experimentales independientes y montó el equipo para entregar una cantidad de
de comida cada 15 segundos independientemente de lo que las palomas estuvieran haciendo.
Las palomas parecían estar respondiendo como si la conducta controlara la entrega del
reforzador. Skinner denominó a esto conducta supersticiosa.
La conducta supersticiosa descansa en la idea de reforzamiento accidental o adventicio.

Se refiere al emparejamiento accidental de una respuesta con la entrega de un reforzador,
un segundo emparejamiento accidental aumenta aún más la probabilidad de la respuesta, de
esta forma cada emparejamientno ayuda a estampar una respuesta particular.
1º- Reinterpretación del experimento de superstición: la afirmacion de Skinner ha sido

puesta en duda por la evidencia empirica posterior. Stadon y Simmelhag (1971) realizaron
observaciones más extensas, definieron y midieron la ocurrencia de muchas respuestas,
algunas respuesta ocurrían de modo predominante hacia el final del intervalo entre
reforzadores, las llamaron respuestas terminales. Otras aumentaron tras la entrega del
reforzador y disminuían a medida que se acercaba el tiempo de la siguiente comida;
respuestas de interin.
82

Juan Carlos Cabrera
Las acciones que eran respuestas terminales y las que eran respuestas de interin no
variaban mucho de una paloma a otra. No encontraron evidencia de reforzamiento
accidental. La investigacion posterior ha proporcionado mucha evidencia adicional de que las
presentaciones periodicas de un reforzador producen regularidades en la conducta.
2º-Explicación de la periodicidad de las respuestas de interin y terminales. Staddon y

Simmelhag sugirieron que las respuestas terminales son respuestas típicas de la especie que
reflejan la anticipación de la comida a medida que el tiempo se encuentra más cerca de la
próxima presentación de comida. En contraste, entendieron las respuestas de interin como
una manifestación de otras fuentes de motivación que eran mas importantes al comienzo del
intervalo entre comidas, cuando la presentación de comida era improbable. Los
investigadores posteriores, sin embargo han favorecido aproximaciones en las cuales las
respuestas terminales y de interin se consideran diferentes manifestaciones del mismo
sistema motivacional.
La teoría de sistema de conducta, el sistema de alimentación está activado en animales

privados de comida a los que se les proporciona periódicamente pequeñas cantidades de
comida. Justo después de la entrega de comida se asume que el organismo realiza respuetas
de búsqueda focalizada poscomida, que involucra actividades cercana a la comida. En medio
del intervalo entre entregas ocurren respuestas de búsqueda general, que aleja al suejto de
la comida. En el momento de la próxima entrega de comida ocurre la respuesta de búsqueda
focalizada.
Congruente con la teoría de los sistemas de conducta, la distribución de las actividades se

desarrollan con la entrega periodica de un reforzador depende de la naturaleza de ese
reforzador. Por ejemplo, se desarrollan diferentes patrones de conductas con
presentaciones de comida o agua, debido a que activan diferentes patrones de forrajeo.
Efectos de la controlabilidad de los reforzadores. Una contingencia fuerte entre una

respuesta instrumental y un reforzador esencialmente significa que la respuesta controla el
reforzador, esto es, que el reforzador suceda depende de si ha ocurrido la respuesta
instrumental. Los estudio acerca de los efectos de control sobre reforzadores han
proporcionado la evidencia mas amplia de la sensibilidad de la conducta a las contingencias
respuesta-reforzador. La mayoría de la investigación se ha centrado en los efectos de
control sobre la estimulación aversiva, esa se origino con los estudios pioneros de Seligman,
Overmier y Maier, quienes investigaron los efectos de la exposición a una descarga
incontrolable en el aprendizaje posterior de escape-evitación en perros. El hallazgo más
importante fue que la exposición a una descarga incontrolable dificultaba el aprendizaje
posterior: Efecto de indefensión aprendida.
83

Juan Carlos Cabrera
1º - Diseño tríadico: los experimentos sobre indefensión aprendida se realizan normalmente

utilizando este diseño, incluye dos fases: exposición, un grupo de ratas (E escape) es
expuesto a descargas periodicas que puede fianlizar mediante la realización de un respuesta
de escape. Cada sujeto del segundo grupo (A, acoplado) es acoplado a un animal del grupo E
y recibe las mismas descargas, pero el grupo A no puede hacer nada por evitarlas. El tercer
grupo (C confinado), no recibe descargas durante la fase de exposición pero esta confinado
en el aparato tanto tiempo como los otros grupos. Durante la fase de condicionamiento, los
tres grupos reciben entrenamiento escape-evitacion. El hallazgo destacable es que los
efectos de la estimulación aversiva durante la fase de exposición dependen de si la
descarga es o no es escapable. La exposición a una descarga incontrolable (grupo A) produce
una severa interrupción del aprendizaje posterior de escape-evitacion, esto indica que los
animales son sensibles a las diferencias procedimentales entre la descarga escapable y la
descarga inescapable. La principal diferencia procedimental entre los grupos E y A es la
presencia de una contingencia respuesta-reforzador para el grupo E pero no para el grupo
A.
EL DISEÑO TRIÁDICO UTILIZADO EN LOS ESTUDIOS DEL EFECTO DE INDEFENSIÓN APRENDIDA
FASE DE
GRUPO FASE DE EXPOSICIÓN CONDICIONAMIENTO PRUEBA .
Grupo E Descarga escapable Escape-evitación Aprendizaje rápido de evitación
Grupo A Descarga acoplada inescapable Escape-evitación Aprendizaje lento de evitación
Grupo C Confinado al aparato Escape-evitación Aprendizaje rápido de evitación
2º- La hipótesis de la indefensión aprendida: la primera explicación importante estaba

basada en la conclusión de que los animales pueden percibir la contingencia entre su
conducta y la entrega de un reforzador. La hipótesis de la indefensión aprendida asume
que durante la exposición a descargas incontrolables, los animales aprenden que las
descargas son independientes de su conducta. Es más, llegan a esperar que los reforzadores
continuaran siendo independientes de su conducta . Esta expectativa de ausencia de
control debilita su habilidad para aprender una nueva respuesta instrumental. Esto ocurre
por dos razones , primero, la expectativa de falta de control reduce la motivación de los
sujetos para realizar una respuesta instrumental; segundo, incluso si realizan la respuesta y
son reforzados en la fase de condicionamiento, la expectativa previamente aprendida de
falta de control hace mas difícil para los sujetos aprender que su conducta es ahora
efectiva para producir reforzamiento.
Es importante distinguir la hipótesis de indefensión aprendida del efecto de indefensión

aprendida . El efecto de indefensión aprendida es el patrón de resultados obtenido con el
diseño tríadico, este ha sido reproducido en numerosos estudios y es un hallazgo bien
84

Juan Carlos Cabrera
establecido. En contraste, desde que se propuso, la hipótesis de indefensión aprendida ha

sido una explicación sugestiva y controvertida del efecto de indefensión aprendida.
3º- Déficit de actividad: El déficit de aprendizaje observado en el grupo A era resultado de

que aprendían a ser inactivos durante la fase de exposición. Congruente con esta hipótesis,
en algunas situaciones la descarga inescapable produce una disminución en el movimiento
motor, y a esto se deberían los posteriores déficits de actuación. Hay también situaciones
en las cuales los efectos del aprendizaje probablemente no son debidos a la supresión del
movimiento causada por la descarga inescapable. Por tanto, la hipótesis de la inactividad
aprendida no puede explicar todos los ejemplos de efectos de indefensión aprendida.
4º- Déficit atencional: Que la descarga provoque que los animales presten menos atención a
sus acciones. Si un animal no presta atención a su conducta, tendrá dificultad para asociar
sus acciones con los reforzadores en el escape.-evitacion o en otras formas de
condicionamiento instrumental.
Maier, Jackson y Tomie (1987) probaron esta hipótesis de déficit atencional con ratas,
razonaron que la atencion reducida a la conducta instrumental también podía ser aliviada
mediante la introducción de una clave externa de retroalimentación de la respuesta o
estímulo de marcado.
5º- Relaciones estimulares en el condicionamiento de escape: Resulta evidente que el

condicionamiento de escape resulta mas complejo de lo que se pensaba anteriormente. El
rasgo definitorio de la conducta de escape es que la respuesta instrumental tiene como
consecuencia la terminación de un estimulo aversivo. Realizar la respuesta de escape tiene
como resultado claves internas de retroalimentación de la respuesta. Algunos de estos
estimulos producidos por la respuesta son experimentados al comienzo de la respuesta de
escape, justo antes de que la descarga se retire, y se denominan claves de retroalimen-
tacion de la terminación de la descarga. Otros estimulos producidos por la respuesta son
experimentados cuando el animal completa la respuesta, justo después de que la descarga
se haya retirado al comienzo del intervalo entre ensayos, estos se denominan claves de
retroalimentación de la señal de seguridad. Estas son seguidas de forma fiable por el
intervalo entre ensayos, y por tanto por la ausencia de descarga. En consecuencia, estas
claves contextuales pueden llegar a convertirse en inhibidores condicionados del miedo y
limitan o inhiben el miedo elicitado por las claves contextuales de la cámara experimental.
Estas señales de seguridad no existen para los animales que están acoplados a la descarga
inescapable porque, para ellos, los periodos de descarga no descarga no son predecibles.
Centrarse en los factores estimulares del condicionamiento de escape en lugar de las

contingencias respuesta-reforzador no ha permitido todavía el desarrollo de una explicación
comprensiva de todos los resultados con el diseño tríadico.
85

Juan Carlos Cabrera
Contiguidad y contingencia: comentarios finales (pagina 156 del libro)
Como se ha descrito, los organismos son sensibles a la contigüidad tanto como a la

contingencia entre una respuesta instrumental y un reforzador. Normalmente, estos dos
aspectos de la relación entre la respuesta y el reforzador actúan en conjunto para producir
el aprendizaje. Ambos factores sirven para entender los efectos del reforzamiento en la
respuesta instrumental. La relación causal, o contingencia, asegura que el reforzador es
entregado sólo tras la ocurrencia de la respuesta instrumental especificada. La relación de
congigüidad asegura que otras actividades no se interpongan entre la respuesta
especificada y el reforzador para interferir en el condicionamiento de la respuesta crítica.
Términos clave (pagina 160 del libro)
Castigo Procedimiento de condicionamiento Contraste conductual simultáneo Efectos de

instrumental en el cual hay una contingencia contraste conductual (contraste positivo y
positiva entre la respuesta instrumental y un negativo) que están producidos por frecuentes
estímulo aversivo. Si el sujeto realiza la respues- cambios entre una condición de recompensa
ta instrumental, recibe el estímulo aversivo; si el favorable y una desfavorable, con cada condición
sujeto no realiza la respuesta instrumental, no de recompensa asociada a su propio estímulo
recibe el estímulo aversivo. distintivo.
Conducta instrumental Actividad que ocurre debido Contraste negativo Respuesta menor a un
a su efectividad para producir una consecuencia reforzador desfavorable tras una experiencia
particular o reforzador. previa con un reforzador más deseado que en
ausencia de esa experiencia previa.
Conducta supersticiosa Conducta que se incrementa
en frecuencia debido a emparejamientos acciden- Contraste negativo Respuesta mayor a un estímulo
tales de la entrega de un reforzador con ocurre- favorable tras una experiencia previa con un
ncia de la conducta. reforzador menos deseado que en ausencia de esa
experiencia previa.
Contigüidad Ocurrencia simultánea ( o casi simultá-
nea) de dos eventos, como una respuesta y un Deriva instintiva Deriva gradual de la conducta
reforzador. También denominada contigüidad instrumental que se aleja de las respuestas
temporal. requeridas para el reforzamiento hacia
respuestas típicas de la especie o “instintivas”
Contigüidad temporal Lo mismo que contigüidad. relacionadas con el reforzador y con otros
estímulos de la situación experimental.
Contingencia respuesta-reforzador Relación causal
entre una respuesta y un reforzador, medida en Efecto de indefensión aprendida Interferencia en
términos de la probabilidad de ser reforzado por el aprendizaje de nuevas respuestas instrumen-
realizar la respuesta en comparación con la tales como resultado de la exposición a estimula-
probabilidad de ser reforzado en ausencia de la ción aversiva inescapable e inevitable.
respuesta.
86

Juan Carlos Cabrera
Entrenamiento al comedero Estadio preliminar del

condicionamiento instrumental en el cual un Método de ensayo discreto Método de
estímulo es repetidamente emparejado con el condicionamiento instrumental en el cual el sujeto
reforzador a fin de capacitar al sujeto para puede realizar la respuesta instrumental sólo
aprender a ir a recoger el reforzador cuando se durante períodos específicos normalmente
presenta. El sonido del mecanismo de la entrega determinados bien por el emplazamiento del
de comida, por ejemplo, puede ser repetidamente sujeto en una cámara experimental o por
emparejado con la comida, por lo que el animal lapresentación de un estímulo.
aprenderá a ir al cuenco de comida cuando ésta se
entregue. Método de operante libre Método de
condicionamiento instrumental que permite la
Entrenamiento de omisión Procedimiento de ejecución repetida de la respuesta instrumental
conicionamiento instrumental en el cual la sin que el sujeto sea retirado de la cámara
respuesta instrumental previene la presentación experimental. (Compárese con el método de
de un estímulo refonzante. ( Véase también ensayo discreto).
reforzamiento diferencial de otras conductas)
Moldeamiento Reforzamiento de aproximaciones
Escape Procedimiento de condicionamiento instru- sucesivas a la respuesta instrumental deseada.
mental en el cual la respuesta intrumental finaliza
un estímulo aversivo ( Véase tambien reforza- Pertinencia La idea teórica, originalmente propuesta
miento negativo.) por Thorndike, de que la historia evolutiva de un
organismo hace que ciertas respuestas encajen o
Estímulo apetitivo Estímulo placentero o se correspondan con ciertos reforzadores. La
satisfactorio que puede utilizarse para reforzar pertinencia facilita el aprendizaje.
positivamente una respuesta instrumental.
Procedimiento de marcado Procedimiento en el cual
Estímulo aversivo Estímulo displacentero o molesto la respuesta instrumental es inmediatamente
que puede ser utilizado para castigar una seguida por un evento distintivo (el sujeto es
respuesta instrumental. recogido, o se presenta un destello de una luz)
que hace que la respuesta instrumental sea más
Evitación Procedimiento de condicionamiento instru- fácil de memorizar y ayuda a superar los efectos
mental en el cual la respuesta instrumental pre- perjudiciales del reforzamiento demorado.
viene la administración de un estímulo aversivo.
Reforzador condicionado Estímulo que se convierte
Hipótesis de la indefensión aprendida Idea teórica en un reforzador efectivo debido a su asociación
que asume que durante la exposición a con un reforzador primario o incondicionado.
estimulación aversiva inescapable e inevitable, los También denominado reforzador secundario.
sujetos aprenden que su conducta no controla los
eventos ambientales. Reforzador secundario Lo mismo que reforzador
condicionado.
Latencia Tiempo entre el inicio de un ensayo (o el
inicio de un estímulo) y la respuesta instrumental. Reforzamiento accidental Caso en cual la entrega
de un reforzador coincide con una respuesta
Ley del efecto Regla de la conducta instrumental, particular incluso si esta respuesta no es
propueta por Thorndike, que establece que si una responsable de la presentación del reforzador.
respuesta en presencia de un estímulo es seguida También denominado reforzamiento adventicio.
por un evento satisfactorio, la asociación entre el
estímulo y la respuesta se fortalecerá; si la Reforzamiento adventicio Lo mismo que
respuesta es seguida por un evento molesto, la reforzamiento accidental.
asociación se debilitará.
87

Juan Carlos Cabrera
Reforzamiento diferencial de otras conductas Respuesta de ínterin Respuesta que aumenta en

Procedimiento de condicionamiento instrumental frecuencia después de la entrega de un
en el cual un reforzador positivo es reforzador periódico y que disminuye a medida
periódicamente entregado sólo si el sujeto no que se aproxima el siguiente reforzador.
realiza una respuesta particular. Abreviado RDO.
Respuesta operante Respuesta que se define por el
RDO Abreviación de reforzamiento diferencial de efecto que produce en el ambiente. Los ejemplos
otras conductas. incluyen presionar una palanca y abrir una puerta.
Cualquier secuencia de movimientos que emuje la
Reforzamiento negativo Procedimiento de palanca hasta abajo o abra la puerta constituye un
condicionamiento instrumental en el cual hay una ejemplo de esa operante particular.
contingencia negativa entre la respuesta
instrumental y un estímulo aversivo. Si la Respuesta terminal Respuesta que es más probable
respuesta intrumental es realizada, el estímulo al final del intervalo entre sucesivos
aversivo finaliza o se previene; si la respuesta reforzadores que están presentes a intervalos
instrumental no se realiza, se presenta el fijos.
estímulo aversivo.
Velocidad de la carrera Rapidez (en metros por
Reforzamiento positivo Procedimiento de segundo, por ejemplo) con que se mueve un animal
condicionamiento instrumental en el cual hay una por un corredor.
contingencia positiva entre la respuesta
intrumental y un estímulo reforzante. Si el sujeto
realiza la respuesta, recibe el estímulo
reforzante; si el sujeto no realiza la respuesta, no
recibe elestímulo reforzante.
88

Capítulo 6: Programas de Reforzamiento y Conducta de Elección
Programas simples de reforzamiento intermitente

- Programa de razón
- Programas de intervalo
- Comparación de los programas de razón y de intervalo
- Programas de reforzamiento de tasas de respuesta
Conducta de elección: programas concurrentes

- Medidas de la conducta de elección
- La ley de la igualación
- Mecanismos de la ley de la igualación
Elección con compromiso

- Programas concurrentes encadenados
- Estudios de "autocontrol"
Comentarios finales
89

Juan Carlos Cabrera
Un programa de reforzamiento es un programa, o regla, que En la vida real, no siempre que

determina cómo y cuándo la ocurrencia de una respuesta ira damos una respuesta, aparecerá un
reforzador.
seguida de un reforzador. Este puede establecerse de
El programa de reforzamiento
infinidad de formas. Los programas de reforzamiento que determina cuándo la ocurrencia
incluyen relaciones similares entre los estímulos, las de la respuesta va a ir seguida
de un reforzador
respuestas y los reforzadores, normalmente producen
patrones de conducta similares. Los programas de reforzamiento influyen tanto en la
forma de aprender una respuesta instrumental como en la forma en que se mantiene el
reforzamiento.
Zeiler (1984) denominó a los programas de reforzamiento el gigante durmiente del análisis
de la conducta.
PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE

Los programas que organizan y dirigen la ejecución instrumental se activan de diferentes

formas por los distintos programas de reforzamiento. En los programas "simples", un sólo
factor determina qué ocurrencia de la respuesta instrumental se refuerza.
Programas de razón
La característica definitoria de un programa de razón es que el reforzamiento depende

sólo del número de respuestas que el organismo realiza. Un programa de razón sólo requiere
contar el número de respuestas que ha ocurrido y entregar el reforzador cad vez que se
alcance el número requerido. Si este número es uno, cada ocurrencia e la respuesta
instrumental provacará la entrega de reforzador. Este tipo de programa se denomina
técnicamente reforzamiento continuo (abreviado RFC).
Las situaciones en las que la respuesta se refuerza sólo alguna vez, reforzamiento parcial o
intermitente.
Razón fija. Por ejemplo, la entrega de un reforzador después de cada décima respuesta de
presión de palanca en un estudio con ratas de laboratorio. En un programa como éste, hay
una razón fija entre el número de respuestas que la rata realiza y el número de
reforzadores que consigue. Esto convierte al procedimiento en un programa de razón fija.
El procedimiento podría denominarse programa de reforzamiento de razón fija (RF 10).
91

Juan Carlos Cabrera
Un programa de reforzamiento continuo

constituye también un programa de razón fija. Es Programa de reforzamiento continuo:
Cada respuesta correcta es reforzada.
una razón fija de una respuesta por reforzador,
Programa de reforzamento parcial o intermitente:
en la que los organismos suelen responder con una No todas las respuestas correctas son reforzadas y
tasa de respuesta constante pero moderada. pueden ser de varios tipos.
Se da un patrón de respuesta diferente cuando se trata de un programa de razón

intermitente de razón fija.
El patrón típico de los programas de razón fija es que se da una tasa constante y alta una
vez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar el
número requerido de respuestas. Estas se muestran con claridad en un registro acumulativo
de la conducta.
Un registro acumulativo es una forma especial de representar la forma de repetirse una

respuesta a lo largo del tiempo. Muestra el número total (o acumulativo ) de respuestas que
han ocurrido hasta un momento determinado en el tiempo.
El registro acumulativo propor-

ciona una representación visual
completa de cuando y con que
frecuencia responde el sujeto
durante la sesión.
La tasa cero de respuesta que

se observa justo después del
reforzamiento se llama pausa
posreforzamiento. La tasa alta
y estable que completa cada
requerimiento de la razón se
llama carrera de la razón.
Si el requerimiento de la razón se incrementa un poco ( de una RF 120 a un RF 150), la tasa

de respuesta puede permanecer igual durante la carrera de razón. Con mayores
requerimientos de tasa, tienden a ocurrir pausas posreforzamiento más largas. Si el
requerimiento de la razón sufre un aumento súbito y significativo (de RF 120 a RF 500) es
probable que el animal realice una pausa periodica cada vez que complete la razón requerida,
este efecto se llama tensión de la razón. En casos exremos, la tensión de la razón puede
ser tan grande que el animal deje de responder. La longitud de la pausa posreforzamiento
esta controlada por el requerimiento de la razón subsiguiente, por tanto podría recibir el
nombre de pausa pre-razón.
92

Juan Carlos Cabrera
Razón variable. Es un procedimiento en el que se necesita un número de respuestas distinto

para la entrega de cada recompensa. El valor numérico del programa de razón variable (RV)
indica el número medio de respuestas requerido para conseguir el reforzador.
Debido a que el número de respuestas necesario para conseguir el reforzamiento no es

predecible, las pausas predecibles en la tasa de respuesta son menos probables con estos
programas RV que con los programas de RF. Los organismos suelen responder con una tasa
claramente estable en los programa RV.
Aunque pueden darse pausas posreforzamiento en los programas de razón variable, estas
son mas largas y prominentes en los programas de razón fija. La tasa global de respuesta en
los programas de RF y RV es similar siempre y cuando, como promedio, se requieran números
similares de respuestas. Sin embargo, la tasa global de respuesta tiende a distribuirse en
un patrón de pausa-carrera con los programa de RF, mientras que se observa un patrón más
estable con los de RV.
Programa de RAZÓN:
El reforzador se otorga en función del número de respuestas.
• Razón Fija (RF): El número de respuestas necesarias para obtener un reforzador es siempre el mismo.
Ejemplo: RF5 = Cada 5 respuestas, me dan un premio.
El programa de RF1 es un programa de reforzamiento continuo.
Produce pausas post-reforzamiento.
• Razón variable (RV): El número de respuestas necesarias para obtener un reforzador va variando.
Ejemplo: RV5 = Cada 5 respuestas de media, me dan un premio.
Programas de intervalo
Las respuestas son reforzadas sólo si ocurren cuando ha transcurrido una cierta cantidad
de tiempo.
Intervalo fijo: el tiempo no varia de una ocasión a la siguiente. Se dan en situaciones donde
se requiere una cantidad fija de tiempo para dispensar el reforzador. A medida que el
tiempo para la disponibilidad del próximo reforzador se acerca, la tasa de respuesta
aumenta, este aumento de la tasa de respuesta se manifiesta como una aceleración del
registro acumulativo al final del IF, este se denomina por consenso festón de intervalo
fijo. La pusa posreforzamiento y el aceleron posterior hacia el final del intervalo reflejan
una habilidad rudimentaria para contar el tiempo, En un estudio se uso como reloj un punto
de luz que crecia a medida que el tiempo pasaba. L introducción de este estimulo reloj
incremento la pausa posreforzamiento y provoco que la respuesta se desplazase mas cerca
del final del ciclo IF.
93

Juan Carlos Cabrera
Un programa IF no garantiza que el reforzador se proporcionara en algún momento a lo

largo del intervalo, el intervalo sólo determina cuándo el reforzador esta disponible, no
cuando se entrega.
Intervalo variable: (IV), las respuestas se refuerzan si se dan tras haber transcurrido un
intervalo variable desde la administración del reforzador previo. Se hallan en situaciones
donde se requiere una cantidad de tiempo impredecible para preparar o dispensar el
reforzador.
El sujeto en los programas IV tiene que realizar la respuesta instrumental para obtener el
reforzador., no se dan gratis, se dan solo si el organismo responde tras un intervalo
variable. Los programa IV mantienen tasa de respuesta constantes y estables sin pausas
regulares.
Programas de intervalo y espera

limitada: Con los programas fuera de
laboratorio, es mas común que los
reforzadores estén disponibles durante
tiempo limitado. Este tipo de
restricción en cuanto al tiempo que
permanece el reforzador disponible se
llama espera limitada. Las restricciones
de la espera limitada pueden añadirse
tanto a los programas de intervalo fijo
como a los de intervalo variable
Programa de INTERVALO:
El reforzador se otorga en función del tiempo que ha transcurrido desde el último reforzador (Pero todavía hay que
responder al menos 1 vez para obtener el reforzador
• Intervalo Fijo (IF): El tiempo que pasa entre dos reforzamientos es siempre el mismo.
Ejemplo: IF5 = Cada 5 segundos, el reforzador está disponible (cada cinco segundos, si respondo me dan un premio.
Produce pausas post-reforzamiento y aceleración pre-reforzamiento (Patrón “festoneado”)
• Intervalo variable (IV): El tiempo que pasa entre dos reforzadores va variando.
Ejemplo: IV5 = Cada 5 respuestas de media, el reforzador está disponible.
94

Juan Carlos Cabrera
Comparacion de los programas de razón e intervalo
Hay similitudes entre los patrones de respuesta, tanto los programas RF como los IF
producen una pausa posreforzamiento después de la administración del reforzador.
Producen altas tasas de respuesta
justo antes de la administración del
siguiente reforzador. Por el
contrario, los programas de RV y de
IV mantienen tasas estables de
respuesta, sin pausas predecibles.
Los programas de intervalo y de
razón activan diferentes cambios
neuroquímicos en el cerebro.
La conducta mantenida por
programas de intervalo esta
mediada por el sentido temporal del
organismo, en los programas de razón no.
La primera evidencia sobre las diferencias entre programas de intervalo y de razón fue
proporcionada por un importante experimento de Reynolds (1975), ver pag 169-170 libro.
¿Cuál produce más respuesta? Reforzamiento diferencial del tiempo interres-

puesta. ¿Por qué los programas de razón son
Los programas que más respuestas producen
son los de RAZÓN, porque en los de intervalo el capaces de producir tasas más altas de respuesta
reforzador se obtiene por esperar al momento
idóneo, no por dar un número determinado de
que los programas de intervalo? El factor critico es
respuestas. el espaciamiento entre respuestas que se da justo
¿Cuál produce más respuestas? antes del reforzamiento. El intervalo entre una
respuesta y la siguiente se denomina tiempo
Los programas fijos producen menos
respuestas que los variables porque son más interrespuesta o TIR. Si se refuerzan TIRs cortos,
predecibles. Además son más faciles de extinguir
(tema 9).
será mas probable que el sujeto realice TIRs
cortos, si se refuerzan TIRs largos será mas
De modo que el programa más efectivo
para crear respuestas es el de razón probable que el sujeto realice TIRs largos. En un
variable ( Ejemplo: máquina tragaperras, por eso programa de razón , no hay restricciones acerca de
son tan “adictivas” y peligrosas)
cuando cuentan las respuestas para conseguir el
reforzador, esto es no se espera mucho entre las
respuestas. Los programas de intervalo favorecen TIRs largos.
95

Juan Carlos Cabrera
Programas de reforzamiento de tasas de respuesta.
Requieren específicamente que el organismo

responda a una tasa particular de respuesta. El Además de las respuestas independientes,
también podemos reforzar la tasa de respuesta (la
reforzamiento de una respuesta particular depende velocidad a la que se dan las respuestas).
de cuan pronto ocurra tras la respuesta
Ejemplo: quiero que un animal dé cómo mínimo
precedente. Reforzamiento diferencial de tasa 12 respuestas por minuto. Entonces le doy el
reforzador sólo si produce una respuesta en los 5
altas (RDA): una respuesta se refuerza sólo si segundos siguientes a la anterior respuesta. Si
ocurren antes de que haya transcurrido cierta responde cada 5 segundos o menos, tiene una
tasa de 12 respuestas por minuto, lo que yo
cantidad de tiempo tras la respuesta precedente. quería. Si tarda más de 5 segundos en responder,
Reforzamiento diferencial de tasas bajas (RDB): no es reforzado aunque responda. Eso hará que
se vuelva más rápido en el futuro.
una respuesta se refuerza sólo si ocurre después
de que haya transcurrido cierta cantidad de tiempo
desde la respuesta previa.
CONDUCTA DE ELECCIÓN: PROGRAMAS RECURRENTES

Históricamente se estudio con laberintos en

forma de T. Las aproximaciones recientes al Si te dejan elegir, ¿qué prefieres hacer?
estudio de la conducta de elección utilizan En los programas concurrentes se deja elegir al animal
cajas de Skinner equipadas con dos entre dos programas de reforzamiento
manipulandos (dos botones). En el

experimento típico, responder en cada tecla
es reforzado según algún programa de
reforzamiento. Los dos programas funcionan
al mismo tiempo (o concurrentemente) y el
sujeto es libre de cambiar de una tecla a otra, este tipo de procedimiento se llama
programa concurrente, permite una medicion continua de la elección porque el organismo es
libre para cambiar de una tecla a otra en cualquier momento.
96

Juan Carlos Cabrera
Medidas de la conducta de elección

La conducta de elección de un organismo en un
programa concurrente se refleja en la
distribución de su conducta entre dos
respuestas alternativas. Una técnica común de
medición es calcular la tasa relativa de
Para saber qué programa prefiere seguir la paloma, respuestas de cada alternativa.
recurriremos a la tasa relativa de respuestas.
RA
RA / (RA+RB)
Tasa relativa de respuestas de tecla A =
R A + RB
Si la paloma no tiene ninguna preferencia en especial, la La forma en que un individuo distribuye su
tasa relativa se queda en 0,5. conducta entre dos alternativas esta muy
influida por el programa de reforzamiento que
Para saber que programa administra más reforzadores a la
paloma, recurriremos a la tasa relativa de reforzamiento.
funciona para cada respuesta. La tasa relativa
rA de reforzamiento para cada alternativa de
Tasa relativa de reforzamiento de tecla A =
rA + rB respuesta puede calcularse de una manera
Si la paloma recibe reforzadores con la misma frecuncia en semejante a la tasa relativa de respuesta.
cada lado, la tasa relativa se queda en 0,5.
rA/(rA+rB)
La ley de la igualación
Herrnstein (1961) estudio la distribución de

las respuestas en varios programas Ley de la igualación (Herrnstein)
concurrentes IV-IV en los cuales la tasa total La tasa de respuesta = tasa de reforzamiento
máxima de reforzamiento que las palomas
podían obtener estaba fijada en 40 por hora. RA rA
=
Dependiendo del valor exacto de cada R A + R B r A + rB
programa de IV, se podían obtener diferentes
O sea, que la paloma responde más en el programa
proporciones de los 40 reforzadores y no que más reforzadores le proporciona.
había restricciones acerca de cual tecla
Si te dejan escoger entre pasar una tarde en el cine o
podían picotear. Los sujetos distribuyeron sus paseando con un amigo, escogerás probablemente la
actividad más reforzante.
respuestas de una manera altamente
predecible, la tasa relativa de respuesta en
una alternativa dada, estaba siempre muy cercana a igualar la tasa relativa de
reforzamiento en esa alternativa, por tanto la tasa de respuesta en una alternativa se
iguala con la tasa relativa de reforzamiento en esa alternativa: ley de la igualación.
RA/(RA+RB)=rA/(rA+rB) o RA/RB=rA/rB; las tasas relativas de respuesta se igualan con las
tasas relativas de reforzamiento.
RA/RB= rA/rB
97

Juan Carlos Cabrera
Infraigualacion, supraigualacion y sesgo de respuesta.
La tasa relativas de respuesta

Infraigualación, supraigualación y sesgo de respuesta
no siempre se igualan con las
A veces la ley de igualación no se cumple, y en esos casos se cumple esta
tasas relativas de reforza- norma:
miento. Para acomodarlo añadie- s EL parámetro s es la sensibilidad de la
ron dos parametros, b y s a la RA ⎛ rA ⎞ conducta de eleción a las tasas de

= b⎜⎜ ⎟⎟ reforzamiento (“Cuáto me afecta la tasa
ecuación: RA/RB=b(rA/rB)S , RB ⎝ rB ⎠ de reforzamiento de este programa”).
donde s representa la sensibili- Una buena comida es reforzante, pero

si no me gusta el pescado a lo mejor no
dad de la conducta de elección a eligiría ese menú (sensibilidad).
las tasas relativas de reforza-
miento para las alternativas de El parámetro b es el sesgo (bias) de respuesta. Es una preferencia
respuesta. Cuando ocurre una por uno de los dos programas en particular, incluso aunque
proporcione la misma tasa de reforzamiento que el otro (por ejemplo,
igualacion perfecta s=1.0. la respuesta en sí puede ser más cómoda).
Ir al ginmasio podría ser más reforzante que ver la televisión, porque

Un tipo de desviación de la produce un bneficio a largo plazo, pero como la respuesta es costosa,
puede que prefiramos quedarnos en casa (sesgo de respuesta)
iguala-ción perfecta incluye una
sensi-bilidad reducida de la
conducta de elección a las tasas relativas de reforzamiento: infraigualación y pueden
acomodarse mediante la ecuación de arriba dotando al exponente s de un valor menor que
1.0, indicando la sensibilidad reducida a la tasa relativa de reforzamiento.
En otros ejemplos, la tasa relativa de respuesta es mas sensible a la tasa relativa de

reforzamiento de lo que se predice para una igualación perfecta: supraigualación, dotando
al exponente s un valor mayor que uno, indicando el aumento de la sensibilidad de este
factor.
Es más probable que las elecciones muestren sensibilidad reducida a las tasas relativas de
reforzamiento que sensibilidad reducida a las mismas. El parámetro de sensibilidad puede
estar influido por númerosas variables, le especie, esfuerzo dificultad, etc.
El parámetro b de la ecuación representa el sesgo de respuesta, estos influyen en la

elección cuando las alternativas de respuesta son diferentes, también es importante cuando
el reforzador proporcionado para las dos respuestas es diferente. En ausencia de sesgos
b=1.0.
Infraigualación: El animal tiene una tasa de respuesta menor que la tasa de reforzamiento (recibe muchos reforzadores,
pero no responde mucho), es como si los reforzadores obtenidos no produjeran mucha efecto en su elección.
El parámetro sensibilidad (s) es <1.
Supraigualación: El animal responde más de lo que le correspondería en función de su tasa de reforzamiento.

El parámetro sensibilidad (s) es >1.
En realizad, en estas relaciones influyen tanto la cantidad como la calidad del reforzador: si es un reforzador valioso, unos
poquitos bastaran para que el animal prefiera ese programa a otro.
98

Juan Carlos Cabrera
La ley de la igualación y el valor del reforzador: Se ha encontrado que la tasa relativa de

respuesta es una función de la cantidad relativa de reforzador, asi como de la demora
relativa del reforzamiento. También están determinadas por la palatabilidad de los
reforzadores.
La ley de la igualación y los programas simples de reforzamiento

La ley de la igualación también puede aplicarse a Herrnstein (1970) apuntó que incluso las
programas sencillos de reforzamiento (no a la elección situaciones de respuesta única pueden
en programas concurrentes)
involucrar elección, entre realizar la respuesta
Realizar cualquier conducta supone una elección especificada (presión de palanca) y ocuparse en
(elegimos realizar esa conducta en vez de hacer
cualquier otra cosa). Si una conducta no me “refuerza” otras posibles actividades (acicalarse). En un
más que cualquier otra alternativa, si no es atractiva, es
poco probable que la realice.
programa simple, el sujeto recibe no sólo
reforzamiento explícito por realizar una
respuesta operante específica, sino también recompenss intrínsecas de las otras
actividades que puede realizar. Por tanto, el reforzamiento total incluye las recompensas
extrínsecas programadas tanto como las fuentes del reforzamiento no programadas. Este
tipo de análisis permite la aplicacion de la ley de la igualación.
Si sustituimos los valores de la ecuación de la ley de igualación, podemos adaptarla as

situaciones de respuesta única:
• RA representa la tasa de respuesta operante especificada por el programa.
• RO representa la tasa de otras actividades del animal.
• rA es la tasa de reforzamiento explicito programado.
• rO es la tasa de reforzamiento intrínseco por las otras actividades.
• k es una constante que el investigador utiliza cuando presupone que (RA+RO) es una
constante que no guarda relación con el reforzador utilizado.
krA
RA =
rA + rO
Esta ecuación predice que la tasa de respuesta (RA) estará directamente relacionada con la
tasas de reforzamiento para esa respuesta de una forma negativamente acelerada. Otra
implicación, de particular interés clínico, es que la tasa de respuesta disminuirá a medida
que aumente la tasa de las otras fuentes de reforzamiento (rO). Por tanto, esta ecuación
proporcionara dos maneras de modificar la tasa de una respuesta, mediante el cambio de su
tasa de reforzamiento o mediante el cambio en la tasa de las otras fuentes de
reforzamiento.
La presuposición de que (RA+RO) es constante para unas situación instrumental esta puesto
en cuestión con estudios recientes que varian el reforzador pero no la respuesta
instrumental.
99

Juan Carlos Cabrera
Mecanismos de la ley de la igualación
La ley de la igualación describe como los organismos distribuyen sus respuestas en una
situacion de elección pero no explica que mecanismos son responsables de esta distribución
de respuestas. Está establecida en funcion de las tasas de respuestas y de reforzamiento
promediada sobre la duración total de las sesiones experimentales. Ignora cuando se
realizan las respuestas individuales. Igualmente las teorías molares de la igualación ignoran
que podría ocurrir al nivel de las respuestas individuales. Las terorías molares explican
agregados de respuestas y se relacionan con la distribución total de respuestas y
reforzadores en las situaciones de elección. Las teorías moleculares se centran en lo que
ocurre al nivel de las respuestas individuales y consideran la relación de igualación como el
resultado neto de estas elecciones individuales. Otras teorías proporcionan.
caracterizaciones de la conducta que no son ni molares ni moleculares, sino algo intermedio
entre ellas ; el mejoramiento.
Igualación y maximización de las tasas de reforzamiento: las explicaciones más

investigadas de la conducta de eleccion están basadas en la idea de que los organismos
distribuyen sus acciones entre las alternativas de respuesta para recibir la mayor cantidad
posible de reforzamiento.
1º Maximizacion molecular: los organismos siempre eligen cualquier alternativa de respuesta

con mejores probabilidades de que sea reforzada en ese momento. Shimp (1966.1969)
propuso una primera versión de la ley de igualación molecular. Cuando dos programas A y B,
funcionando simultáneamente, el sujeto cambia del programa A al B a medida que la
probabilidad de reforzamiento aumenta para el programa B. Supuso que la relación de
igualación es un subproducto de una alternancia prudente cuando la probabilidad de
reforzamiento en la tecla de respuesta alternativa es mayor que la probabilidad de
reforzamiento en la tecla de respuesta actual.
Estudios detallados de las pautas de alternancia entre respuestas no siempre apoyaron la

teoría de maximización molecular propuesta por Shimp. Algunos estudios han mostrado que
la igualación es posible en ausencia de una maximización momentánea. Sin embargo,
aproximaciones más recientes a los análisis moleculares de la conducta de elección han
tenido mas éxito.
2º maximización molar: presuponen que el organismo distribuye sus respuestas entre las
varias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a la
larga. Se centran en agregados de conducta sobre algún período más que en las respuestas
de elección individual.
100

Juan Carlos Cabrera
Fue originalmente formulada para explicar la eleccion en programas concurrentes

construidos con programas de razón, en estos programas, los animales raramente cambian
de una alternativa a otra, en su lugar, responden exclusivamente en el componente de razón
que requiere el menor número de respuestas, de esta forma maximiza su tasa de
reforzamiento con el mínimo esfuerzo.
La maximización molar predice de forma precisa los resultados de los procedimientos de

elección, pero ciertos hallazgos presentan dificultades; como en los resultados de los
programas concurrentes de reforzamiento IV-IV, en los cuales los organismos pueden
conseguir casi todas las recompensas disponibles en ambos programas, siempre y cuadno
prueben de forma ocasional cada alternativa. La teoría no puede explicar por qué la
conducta de elección se distribuye de forma tan cercana a la relación de igualación.
Otro desafio son los programas de IV-RV, dadas las diferencias entre estos dos programas,
para el máximo beneficio en un programa concurrente RV-IV, los sujetos deberían
concentrara sus respuestas en la alternativa de razón variable y responder solo
ocasionalmente en el componente de intervalo variable, esto no sucede, los animales
favorecen el componente RV pero no de forma tan fuerte como predice la teoría
3ª Mejoramiento: Los mecanismos de mejoramiento operan en una escala temporal que esta
entre la escala temporal de las teorías molar y molecular.
El termino mejoramiento se refiere a hacer algo mejor. No se refiere a elegir la mejor

alternativa en ese momento (maximización molecular), o hacer que a largo plazo algo sea tan
bueno como pueda (maximización molar), sino a hacer que la situacion sea mejor a cómo esa
situación ha sido en el pasado reciente. Los beneficios están circunscritos a una situación
limitada - no en su totalidad o a largo plazo.
La teoría asume que los organismos cambian de una alternativa a otra para mejorar la tasa
local de reforzamiento. Puede demostrarse matemáticamente que cuando los sujetos
distribuyen sus respuestas para obtener la misma tasa local de reforzamiento en cada
alternativa, se están comportando de acuerdo con la ley de igualación. Por tanto, el
mecanismo de mejoramiento da como resultado la igualación. De acuerdo con esta teoría, la
paloma cambiara su preferencia a favor de la alternativa de respuesta que arroje la tasa
local más alta. Estos cambios de un lado a otro continuaran hasta que sea igual la tasa local
de reforzamiento conseguida en las dos alternativas.
¿Qué determina los cambios de un programa a otro?
• Teorías de la maximización molecular: El animal hace un cambio de programa para obtener un reforzador determinado.
• Teoría de la maximización molar: El animal hace los cambios precisos para obtener el máximo de reforzadores a la larga.
• Teoría del mejoramiento: El animal cambia para obtener una tasa local de reforzamiento mejor que la actual. La tasa
local de reforzamiento en el programa A: Número de reforzadores obtenidos durante el tiempo que se ha dedicado al
programa A.
La alternancia de programas continúa hasta que las tasas locales se igualan.
101

Juan Carlos Cabrera
ELECCION CON COMPROMISO

Una vez que se tome una decisión, no se puede cambiar.
Programas concurrentes encadenados
La técnica básica en este area de

investigación es el programa concurrente
encadenado de reforzamiento, este consta
de dos fases; eslabón de elección; se
permite al participante elegir entre dos
programas alternativos de respuesta. La
oportunidad para el reforzamiento sucede
sólo después de que la elección inicial haya
sido realizada y la paloma se encuentra en
el eslabón terminal; otra característica
importante de este programa es que una
vez que el participante ha realizado la
elección, esta comprometido con esta hasta el final del programa. Por tanto los programas
concurrentes encadenados implican elección con compromiso.
Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de RV,
esta está guiada por el hecho de que ocasionalmente un programa de RV proporciona
reforzamiento por un número relativamente pequeño de respuestas.
La consecuencia de responder durante

el eslabon inicial de un programa
concurrente no es el reforzador
primario (comido), es pasar a uno de los
eslabones terminales, la consecuencia
inmediata de una respuesta en un
eslabon inicial es un estímulo que esta
asociado con el eslabón terminal
elegido. Como este estimulo esta
presente cuando se proporciona el
reforzador primario, el estimulo del
eslabón terminal se convierte en
reforzador condicionado . Por tanto, se puede caracterizar un programa concurrente como
aquel en que las respuestas al eslabón inicial se refuerzan por la presentación de un
reforzador condicionado. Las diferencias en el valor de reforzador condicionado
determinaran entonces la tasa relativa de cada respuesta de elección en el eslabon inicial.
102

Juan Carlos Cabrera
Estudios de “autocontrol”
El autocontrol es a menudo cuestión de elegir una recompensa
grande demorada sobre una recompensa pequeña inmediata.
Explicaciones del autocontrol: El valor de un reforzador se reduce en función de cuanto

tiempo se tiene que esperar para obtenerlo, funcion descontadora de valor. El consenso
actual es que el valor (V) de un reforzador esta directamente relacionado con la magnitud
de la recompensa (M) e inversamente relacionado con la demora de la recompensa (D), de
acuerdo con la formula: V=M/(1+KD) donde K es el parámetro de la tasa descontadora, esta
ecuación se llama función del decaimiento hiperbólico, de acuerdo con esta ecuación, si el
reforzadro es entregado sin demora (D=0), el valor del reforzador está directamente
relacionado con su magnitud. Cuanto más se demora el reforzador, menor es su valor.
Las funciones descontadoras y los problemas de autocontrol en la adicción a las

drogas. Madden, Petry, Badger y bickel (1997) advirtieron que el abuso de sustancias
frecuentemente revela una serie de elecciones impulsivas. Los adictos elegirán la
recompensa relativamente pequeña y rápida de la intoxicación de la droga a riesgo de
consecuencias negativas más demoradas de problemas interpersonales. Este tipo de
elecciones sugieren que se descuenta el valor (o amenaza) de las consecuencias a largo
plazo. Si esto es cierto, entonces los adictos deberían mostrar funciones de descuento de
la recompensa mas acusadas que otros individuos. Madden y colaboradores (1997)
comprobaron esta predicción con un grupo de pacientes dependientes de la heroína
apuntados aun programa de desintoxicacion y otro grupo de no dependientes igualados en
edad, genero, educación y CI. Ver ej libro pag 187. Un hallazgo significativo fue que la
funciones descontadoras de la recompensa eran mucho más acusadas para los adictos a la
heroína. Esto indica una falta de control.
103

Juan Carlos Cabrera
¿Puede entrenarse el autocontrol? Una persona que no puede tolerar esperar el tiempo
necesario para obtener recompensas grandes tiene que olvidarse de obtener esos
reforzadores. El autocontrol, o la preferencia pr una recompensa grande demorada frente a
una recompensa pequeña inmediata, es a menudo una estrategia sensible. De hecho, algunos
han sugerido que el autocontrol es un componente crítico de la socialización y del ajuste
emocional.
Entrenar a las personas con recompensas demoradas parace tener efectos generalizados en
incrementar su tolerancia a la recompensa demorada. En un estudio de elección, realizados
con niños de una escuela elemental, a los que se les preguntó si querían conseguir 2 céntimos
inmediatamente o 3 al final del día, se les realizadon tres sesiones de entrenamiento con
una recompensa imediata o demorada.
Durante cada sesión de entrenamiento, se presentaron varios roblemas: uno incluía contar
objetos en una carta, otro era una rarea pictórica, y el tercero era una tarea de
emparejamiento de formas. Para la mitad de los estudiantes, la respuesta correcta era
reforzada inmediatamente con 2 centimos. Para el resto, las respuestas correctas tenian
como resultado 3 céntimos que se situaban en un cuanco y serían entregados al final de día.
Se midió la preferencia por la recompensa pequeña inmediata frente a la más grande
demorada. Siempre y cuando las tareas de entrenamiento implicasen bajo esfuerzo, el
entrenamiento con la recompensa demorada incrementó la preferencia por la recompensa
más grande demorada durante el postest. Por tanto, el entrenamiento con reforzamiento
demorado producía autocontrol generalizado.
Comentarios finales
El principio básico del condicionamiento instrumental es muy simplie: el reforzamiento

aumenta (y el castigo disminuye) la probabilidad futura de una respuesta instrumental. Sin
embargo, como se ha descrito, el análisis experimental de la conducta instrumental puede
ser bastante intrincado. Muchos aspectos importantes de la conducta instrumental está
determinados por el programa de reforzamiento. Hay numerosos programas por los cuales
las respuestas pueden ser reforzadas. El reforzamiento puede depender de cuántas
respuestas han ocurrido, el paso del tiempo, o la tasa de respuesta. Es más, puede estar
disponible más de un programa de reforzamiento al mismo tiempo. El patrón de conducta
instrumental, así como las elecciones entre varias alternativas de respuestas, están
fuertemente determinados por el programa de reforzamiento en curso. Estos hallazgos han
permitido conocer bastante sobre cómo el reforzamiento controla la conducta en diversas
circunstancias y han alentado muchas aplicaciones importantes de los principios del
reforzamiento a la conducta humana.
104

Juan Carlos Cabrera
TÉRMINOS CLAVE
Carrera de razón Tasa de respuesta alta y estable Programa concurrente Procedimiento de
que se observa tras la pausa posreforzamiento en reforzamiento complejo en el cual el participante
los programas de reforzamiento de razón fija. La puede elegir cualquiera de dos o más programas de
carrera de la razón finaliza cuando se ha llevado a reforzamiento simples que están disponibles
cabo el número necesario de respuestas y el sujeto simultáneamente. Los programas concurrentes
es reforzado. permiten la medida de la elección entre
alternativas de programas simples.
Espera limitada Restricción en cuánto tiempo
permanece disponible el reforzamiento. Para que Programa concurrente encadenado Procedimiento
una respuesta sea reforzada, debe ocurrir durante de reforzamiento complejo en el que se permite al
el periodo de espera limitada. participante elegir cuál de varios programas
simples de reforzamiento funcionará. Una vez
Festón del intervalo fijo Incremento gradual de la realizada la elección, las alternativas rechazadas
tasa de respuesta que ocurre entre no están disponibles durante algún tiempo.
reforzamientos sucesivos en un programa de
intervalo fijo. Programa de intervalo Programa de reforzamiento
por el que una respuesta es reforzada sólo si
Función descontadora del valor Función matemática ocurre después de una cantidad de tiempo
que describe cómo disminuye el valor del establecida desde el último reforzamiento.
reforzador en función del tiempo que el sujeto
tiene que esperar para la administración del Programa de intervalo fijo Programa de
reforzador. reforzamiento en el cual el reforzador se entrega
por la primera respuesta que ocurre después de
Infraigualación Sensibilidad menor de la predicha una cantidad fija de tiempo desde el último
por una igualación perfecta a la tasa relativa de reforzador. Abreviado IF.
reforzamiento.
Programa de intervalo variable Programa de
Ley de la igualación Regla de la conducta reforzamiento en el que el reforzamiento se
instrumental, propuesta por R.J.Herrnstein, que proporciona por la primera respuesta que ocurre
establece que la tasa relativa de respuesta en una tras una cantidad de tiempo variable desde el
alternativa de respuesta particular es igual a la último reforzador. Abreviado IV.
tasa relativa de reforzamiento para esa alternativa
de respuesta. Programa de razón Programa de reforzamiento en
el que el reforzamiento depende sólo del número
Mejoramiento Mecanismo para alcanzar la de respuestas que realiza el sujeto,
igualación respondiendo para mejorar las tasas independientemente de cuándo sucedan.
locales de reforzamiento en las alternativas de
respuesta. Programa de razón fija Programa de reforzamiento
en el cual debe ocurrir un número fijo de
Pausa posreforzamiento Pausa en el responder que respuestas para que la próxima respuesta sea
sucede normalmente tras la administración del reforzada. Abreviado RF.
reforzador en los programas de reforzamiento de
razón fija e intervalo fijo.
105

Juan Carlos Cabrera
Programa de razón variable Programa de Reforzamiento intermitente Programa de

reforzamiento en el que el número de respuestas reforzamiento por el que sólo algunas de las
necesarias para producir reforzamiento varía de ocurrencias de la respuesta instrumental son
ensayo a ensayo. El valor del programa se refiere al reforzadas. La respuesta instrumental es reforzada
número medio de respuestas necesarias para el ocasionalmente, o de forma intermitente. También
reforzamiento. Abreviado RV. denominado reforzamiento parcial.
Programa de reforzamiento Programa, o regla, que Reforzamiento parcial Lo mismo que reforzamiento
determina cómo y cuándo la ocurrencia de una intermitente.
respuesta irá seguida por la adaministración de un
reforzador. Registro acumulativo Una representación gráfica de
cómo se repite una respuesta a lo largo del tiempo,
Programa de tasa de respuesta Programa de con el paso del tiempo representado por la distancia
reforzamiento en el que la respuesta se refuerz horizontal (o eje x) y el total o número acumulativo
dependiendo de lo pronto que ésta se realiza tras la de respuestas que ha ocurrido hasta un momento
ocurrencia previa de la conducta. determinado representado por la distancia vertical (o
Reforzamiento continuo Programa de reforzamiento eje y).
en el cual cada ocurrencia de la respuesta
instrumental produce el reforzador. Abreviado RFC. Supraigualación Sensibilidad mayor de la predicha
por una igualación perfecta a la tasa relativa de
Reforzamiento diferencial de tasas altas Programa reforzamiento.
de reforzamiento en el cual una respuesta es
reforzada sólo si ocurre antes de que haya Tensión de la razón Deterioro en la respuesta que
transcurrido una cantidad especifica de tiempo sucede cuando el requerimiento de respuesta de una
después de la respuesta precedente. Abreviado RDA. razón fija se incrementa demasiado rápido.
Reforzamiento diferencial de tasas bajas Tiempo interrespuesta o TIR Intervalo entre una
Programa de reforzamiento en el cual una respuesta respuesta y la siguiente. Los TIRs pueden ser
es reforzada sólo si ocurre despues de que haya diferencialmente reforzados de la misma manera que
transcurrido una cantidad especificada de tiempo otros aspectos de la conducta, como la fuerza dela
despues de la respuesta precedente. Abreviado RDB. respuesta o la variabilidad.
106

Capítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales
La estructura asociativa del condicionamiento instrumental

- La asociación E-R y la ley del efecto.
- Expectativa de recompensa y la asociación E-C
- Relaciones R-C y E(R-C) en el condicionamiento instrumental
Regulación conductual
- Antecedentes de la regulación conductual
- Regulación conductual y el punto de deleite conductual
- Conceptos económicos y distribución de respuesta
- Problemas con las aproximaciones de regulación conductual
- Contribuciones de la regulación conductual
Comentarios finales

107
Juan Carlos Cabrera
Se han propuesto dos aproximaciones muy diferentes a intentar explicar por que ocurre la
respuesta instrumental. Una de estas se inicio con el trabajo de Pavlov y se centra en
explicar la estructura asociativa del condicionamiento instrumental. La otra se origino con
el trabajo de Skinner y se centra en como la conducta esta regulada en vista de las
limitaciones o restricciones creadas por los procedimientos de condicionamiento
instrumental. Las teorías de la regulación conductual describen los efectos del
reforzamiento dentro del amplio contexto del repertorio conductual de un organismo
utilizando conceptos de varias áreas de investigación, incluyendo la economía conductual y
la ecología conductual. La aproximación asociacionista se centra en los mecanismos
moleculares y no se preocupa de la meta a largo plazo o la función de la conducta
instrumental. Por el contrario, la aproximación de la regulación conductual se centra n los
aspectos molares de la conducta y considera los efectos del condicionamiento instrumental
como manifestaciones de procesos de maximización u optimización.
La motivación de la respuesta instrumental ha sido considerada desde dos perspectivas

radicalmente distintas. La primera se origino con Thorndike e incluye el análisis de la
estructura asociativa del condicionamiento instrumental , radica en el concepto de
asociaciones y es compatible con la tradición teórica del condicionamiento pavloviano. Toma
una perspectiva molecular: se centra en las respuestas individuales y sus antecedentes
estimulares y consecuencia especificas. Para alcanzar este nivel de detalles, la
aproximación asociativa examina el aprendizaje instrumental en preparaciones conductuales
aisladas. Debido a que las asociaciones pueden encontrar sustento en el sistema nerviosos,
la aproximación asociativa proporciona un marco conveniente para estudiar los mecanismos
neurales del condicionamiento instrumental.
La aproximación alternativa a los procesos motivacionales en el aprendizaje instrumental es

la regulación conductual. Se desarrolla dentro de la tradición skinneriana e incluye la
consideración del condicionamiento instrumental en el contexto más amplio de las múltiples
cosas que el organismo esta haciendo. Esta interesada en como un procedimiento de
condicionamiento instrumental establece los limites al flujo de actividades de un organismo
y las consecuencias conductuales de estas restricciones: considera la motivación de la
conducta instrumental desde un punto de vista más molar, las metas y como los organismos
sacan provecho de la complejidad de su ambiente y de sus múltiples opciones conductuales
para alcanzar sus metas.
Dos perspectivas de motivación de la respuesta instrumental:
• Estructura asociativa del condicionamiento instrumental

Concepto de asociación pavloviano → (perspectiva molecular→respuestas especificas)
• Regulación conductual: influencia Skinneriana. Contexto más amplio que la conducta aislada. Se centra en cómo un
procedimiento instrumental establece límites a las actividades naturales de un organismo y las consecuencias de
dichas restricciones (perspectiva molar)

109
Juan Carlos Cabrera
La estructura asociativa del condicionamiento instrumental

Eduard Thorndike fue el primer en reconocer que el condicionamiento instrumental incluye

algo más que una respuesta y un reforzador. La respuesta instrumental ocurre en presencia
de estímulos particulares. Deben considerarse tres sucesos en el análisis del
condicionamiento instrumental: el contexto estimular (E), la respuesta instrumental (R) y la
consecuencia de la respuesta instrumental o reforzador (C). Skinner también suscribió la
noción de tres sucesos y describió el condicionamiento instrumental en términos de una
contingencia de tres términos que incluía E R y C .
La asociación E-R ya la Ley del efecto

Thorndike → La respuesta ocurre en presencia de
ciertos estímulos particulares.
La asociación E-R fue postulada por Thorndike Recordemos la ley del efecto: La presencia de señales o
como la clave del aprendizaje instrumental en estímulos que señalan acontecimientos significativos
(por ejemplo, la disponibilidad de recompensa si
su ley del efecto; el papel del reforzador o de llevamos a cabo una respuesta determinada) controla
nuestra expectativa de recompensa.
la consecuencia de la respuesta es establecer o
"estampar" una asociación entre las claves contextuales E y la respuesta instrumental.
Pensó que una vez establecida esta asociación E-R sería, de forma única, responsable de la
ocurrencia de la respuesta instrumental. Por tanto, el ímpetu básico o motivación para la
respuesta instrumental era la activación de la asociación E-R mediante la exposición del
sujeto a los estímulos en presencia de los cuales la respuesta instrumental fue previamente
reforzada.
La ley del efecto asume que el único papel del reforzador es crear una asociación E-R, que
el reforzador en si mismo no es una parte o no participa en esta asociación. Esta presunción
es bastante contraintuitiva.
Expectativa de recompensa y la asociación E-C Clark Hull
Cualesquiera que sean los estímulos, el reforzamiento de la

respuesta instrumental produciría inevitablemente un
emparejamiento entre E y el reforzador o consecuencia de la
respuesta (C). Estos emparejamientos proporcionan el Dos tipos distintos de aprendizaje:
potencial para el condicionamiento clásico y el 1. Aprendizaje pavloviano E-C
(expectativa de recompensa)
establecimiento de una asociación entre E y C. Activa un estado emocional
2. Aprendizaje instrumental E-R.
Una de las explicaciones más tempranas e influyentes del papel del condicionamiento clásico
en la conducta instrumental fue propuesta por Clark Hull (1930,1931) y más tarde
elaborada por Kenneth Spence (1956) , durante el curso del condicionamiento instrumental.
La respuesta instrumental llega a ser instigada o motivada por dos factores. En primer
lugar, la presencia de E llega a evoca la respuesta instrumental directamente por asociación
con E-R. En segundo lugar, la actividad instrumental también llega a realizarse en respuesta

110
Juan Carlos Cabrera
a la expectativa de recompensa debido al establecimiento de una asociación R-C: la forma

concreta en que la asociación R-C llega a motivar la conducta instrumental ha sido tema de
considerable debate e investigación experimental. Una formulación especialmente
influyente fue la teoría moderna de los dos procesos /Rescorla y Salomon,1967)
La teoría moderna de los dos procesos. Asume que hay dos tipos distintos de
aprendizaje, el condicionamiento pavloviano y el instrumental, además, estos dos procesos
están relacionados de una forma especial. Durante el curso de un condicionamiento
instrumental, los estímulos (E) -en presencia de los cuales de refuerza la respuesta
instrumental- se presume que llegan a asociarse con la consecuencia de la respuesta (C) a
través de condicionamiento pavloviano para establecer una asociación E-C. A través de la
asociación E-C, el estímulo E llega a motivar la conducta instrumental mediante la
activación de un estado emocional central. La naturaleza de ese estado emocional o
motivación dependerá de la naturaleza del reforzador. Por ejemplo, en un procedimiento de
condicionamiento instrumental en el que la respuesta sea reforzada por la presentación de
comida ( u otro reforzadores apetitivos), la asociación E-C activa la expectativa de comida
(Mowrer la llamo "esperanza").
Recorla y Salomon (1967) apuntaron que si la expectativa pavloviana motiva la conducta

instrumental, entonces la presentación de un estímulo condicionado pavloviano debería
alterar el curso de la respuesta instrumentalmente reforzada. La implicación básica de la
teoría moderna de los dos procesos es que la tasa de una respuesta instrumental será
modificada por la presentación de un estímulo clásicamente condicionado. la presentación
de un EC+ clásicamente condicionado con comida durante la ejecución de una respuesta
reforzada con comida debería aumentar la esperanza que fue creada por la contingencia
instrumental e incrementar la respuesta.
Resultados consecuentes con la teoría moderna de los dos procesos. Utiliza

normalmente un diseño experimental llamado experimento de transferencia de control,
consta de tres fases:
Fase 1: Condicionamiento instrumental de una respuesta operante utilizando algún

programa de reforzamiento positivo o negativo.
Fase 2: Condicionamiento clásico, en el cual se asocia un EC explícito con la presencia o
ausencia de un EI. Es necesario durante esta fase no esté presente el condicionamiento
instrumental.
Fase 3: Fase de transferencia crítica. Los participantes pueden realizar la respuesta
instrumental y se presenta periodicamente el EC de la fase 2 para observar su efecto
en la tasa de conducta instrumental.

111
Juan Carlos Cabrera
Interacciones de respuesta en los experimentos de transferencia de control. Los

estímulos condicionados clásicamente elicitan no sólo estados emocionales, sino también
respuestas concretas que puede influir sobre la conducta que habíamos condicionado. Por
ejemplo, si el estímulo condicionado provoca una conducta de quedarse quieto y la conducta
instrumental que se ha aprendido y reforzado es dar saltos, la presencia del EC disminuirá,
interferirá. Esto hace ver que no es sólo el estado emocional lo que influye en la conducta
reforzada.
¿Estados emocionales centrales condicionados o expectativas especificas de

recompensa? La teoría moderna de los dos procesos asume que el condicionamiento clásico
media la conducta instrumental a través del condicionamiento de estados emocionales
centrales como la esperanza (en el caso de reforzamiento positivo) o el miedo (en el caso
del reforzamiento negativo). En ciertas circunstancias los animales adquieren expectativas
especificas del reforzador en lugar de un estado emocional más general de esperanza
durante el condicionamiento instrumental y clásico. El aprendizaje de expectativa
especifica de recompensa es una alternativa importante a la teoría de los dos procesos
para explicar ciertos tipos de resultados. Esta basada en la asunción de que el
condicionamiento instrumental incluye aprendizaje de una asociación E-C.
Las asociaciones E-C parecen ser fundamentales para la motivación de la conducta

instrumental, Berridge (2001) apunto que la asociación E-C, E llega a ser un estímulo de
incentivo; E en si mismo llega a ser atractivo. Esta motivación adquirida de incentivo
contribuye significativamente a la motivación de la respuesta instrumental.
Como resumen: la teoría de los dos procesos asume que el condicionamiento clásico media de conducta instrumental a
través del condicionamiento de estados emocionales centrales como la esperanza o el miedo.
Relaciones R-C y E(R-C) en el condicionamiento instrumental
La intuición sugiere que la conducta instrumental involucra asociaciones R-C, estas no

existen en el modelo de los dos procesos.
Otra peculiaridad de la estructura asociativa del condicionamiento instrumental asumida

por las teorías de los dos procesos es que E supone que llega a estar asociado directamente
con C en la idea de que el emparejamiento de E con C es suficiente para la ocurrencia de
condicionamiento clásico. Los emparejamientos EC-EI no son suficientes para el desarrollo
de asociaciones pavlovianas. El EC debe también proporcionar información acerca del EI, o
estar de alguna manera relacionado con el EI. Esta condicionalidad en la relación de E con C
es desestimada en la teoría de los dos procesos.
Parece difícil creer que toda la motivación depende de las asociaciones E-C y E-R teniendo en cuenta que ninguna de ellas
establece una relación directa entre la respuesta y el reforzador. En la vida diaria hacemos las cosas porque conllevan
una consecuencia determinada, cosa que no refleja la teoría de los dos procesos.

112
Juan Carlos Cabrera
Evidencia de asociaciones R-C; Algunas investigaciones han sugerido que el

condicionamiento instrumental lleva el aprendizaje de asociaciones respuesta-consecuencia.
La devaluación del reforzador
La importancia de la asociación R-C se ve con la devaluación del reforzador.
ha sido utilizada para
DEVALUACIÓN DEL REFORZADOR
• Fase 1: Entrenamiento de dos conductas con IV1 con reforzadores distintos.
determinar si la repuesta
• Fase 2: Devaluación del reforzador: Reforzador + LiC1 (condicionamiento de instrumental esta mediada
aversión)
• Fase 3: Posibilidad de realizar las dos conductas aprendidas → La conducta por una asociación entre la
cuyo reforzador ha sido condicionado aversivamente disminuye. respuesta y la consecuencia
reforzante. La supresión
selectiva de respuesta que se obtuvo es difícil de explicar a partir de las asociaciones E-C
o E-R que se supone que son aprendidas de acuerdo con la teoría de los dos procesos, la
devaluación de un reforzador debilita selectivamente la respuesta particular que ha sido
entrenada con ese reforzador. Este hallazgo indica que cada respuesta estaba asociada
separadamente con su propio reforzador.
Evidencia del aprendizaje de una relación jerárquica E-(R-C); los organismos aprenden
a asociar la respuesta instrumental con su consecuencia. Sin embargo, las asociaciones R-C
no pueden actuar aisladamente para producir la repuesta instrumental. E no activa R
directamente , sino que activa la asociación R-C. El sujeto llega a pensar en la asociación R-
C cuando se encuentra con E, y eso motiva que realice la respuesta instrumental.
Skinner (1938) sugirió que E, R y C en el condicionamiento instrumental están conectados a

través de una relación condicional E-(R-C).
Regulación Conductual (página 199 del libro)
La regulación conductual se centran en cómo las contingencias instrumentales ponen

limitaciones a las actividades de un organismo.
Antecedentes de la regulación conductual

Los teóricos están de acuerdo en que los reforzadores son un tipo especial de estímulos.
Las respuestas consumatorias típicas de la
La teoría de la respuesta consumatoria especia (comer, beber...) son en sí mismas el
rasgo crítico de los reforzadores.
El primer reto a esta idea vino de Fred Sheffield
que formularon la teoría de respuesta Esta teoría considera que las respuestas
reforzadoras son especiales porque involucran la
consumatoria, esta atribuye el reforzamiento a consumación o el completamiento de una
estas conductas típicas de la especie. Se establece secuencia instintiva de conducta. La teoría
asume que las respuestas consumatorias
que las respuestas consumatorias típicas de la (masticar y tragar, por ejemplo) son
fundamentalmente diferentes de varias
especie son en si mismas el rasgo critico de los respuestas instrumentales potenciales (correr,
reforzadores. Fue una innovación radical debido a saltar...)
que traslado la investigación de los reforzadores

desde tipos especiales de estímulos a tipos especiales de respuestas. Se considero que las
respuestas reforzadoras eran especiales porque involucraban la consumación o el

113
Juan Carlos Cabrera
completamiento de una secuencia instintiva de conducta. David Premack retomo el tema con
su teoría y sugirió que las respuestas reforzadoras son especiales sólo debido a que es más
probable que ocurran que las respuestas instrumentales a las que siguen.
El principio de Premack: Apuntó que

Principio de Premack
las respuestas incluidas en los
Las respuestas incluidas en los reforzadores comúnmente
reforzadores comúnmente utilizados utilizados son actividades que es altamente probable que
eran actividades que es altamente realicen los animales.
probable que realicen los animales. Las Principio de Premack o "Principio de la probabilidad diferencial"
respuestas instrumentales son activi-
"Dadas dos respuestas de diferente probabilidad, A y B, la
dades que normalmente ocurren a una oportunidad para realizar la respuesta de alta probabilidad A
baja probabilidad. Propuso que esta después de la respuesta de baja probabilidad B tendrá como
resultado el reforzamiento de la respuesta B. (B→A refuerza B). La
diferencia en las probabilidades de oportunidad para realizar la respuesta B de baja probabilidad
después de la respuesta A de alta probabilidad no dará como
respuesta es critica para el reforza- resultado el reforzamiento de la respuesta (A→ no refuerza A)"
miento.
Se centra en la diferencia de la probabilidad de las respuestas instrumental y reforzadora.
En consecuencia también es denominado el principio de la probabilidad diferencial.
El principio de Premack significó un avance importante en el pensamiento científico sobre el

reforzamiento. Estimuló la consideración de los reforzadores como respuestas más que
como estímulos, y amplió mucho el rango de cosas que los investigadores empezaron a
utilizar como reforzadores. Cualquier actividad podía servir como reforzador siempre y
cuando fuera más probable que la respuesta instrumental.
Principio de Premack Principio de Premack
También sirve para el castigo...
Una conducta muy probable es una conducta muy preferida.
Las conductas probables (preferidas) sirven para reforzar las Las conductas poco probables (no preferidas)
menos probables y hacer que se repitan más en el futuro. sirven para castigar la más probables y hacer que
Respuesta reforzadora: La que se usa para reforzar otra. no se repitan tanto en el futuro.
Respuesta instrumental: La que es reforzada con otra. La conducta instrumental es la castigada.

114
Juan Carlos Cabrera
La hipótesis de la privación de respuesta: En la mayoría de los procedimientos de

condicionamiento instrumental, la probabilidad momentanea de una respuesta reforzada se
mantiene a un nivel alto mediante la restricción al acceso a la respuesta reforzante.
Premack (1965) reconoció la importancia de restringir el acceso a respuesta reforzadora

para el condicionamiento instrumental. Caracterizo la privación de respuesta no sólo como
una condición necesaria para el reforzamiento sino como algo adjunto al principio de
probabilidad diferencial. La respuesta reforzadora todavía tiene que ser una conducta más
probable que la respuesta instrumental. Por el contrario, Timberlake y Allison (1974)
abandonaron totalmente el principio de probabilidad diferencial y argumentaron que la
restricción de la respuesta reforzadora era el factor critico para el reforzamiento
instrumental, esta propuesta es denominada Hipótesis de privación de respuesta, hace
explícita la idea radicalmente diferente de que un reforzador es producido por la
contingencia instrumental en si misma. Posteriores desarrollos de las teorías de regulación
conductual han establecido como las contingencias instrumentales crean los reforzadores y
los efectos del reforzamiento.
Hipótesis de la privación de la respuesta: Lo importante no es la probabilidad diferencial de las conductas (cuáles

se repitan más y cuáles menos), sino el estado de privación de una determinada conducta. Puede que en el estado
natural correr sea una conducta de baja probabilidad, pero si yo privo el acceso a esta conducta, entonces la puedo usar
como respuesta reforzadora.
Regulación conductual y el punto de deleite conductual
Las teorías de la regulación conductual asumen que existen mecanismos homeostáticos

análogos respecto a la conducta. Se propone que los organismos tienen una distribución de
actividades preferida u optima que luchan por mantener frente a los cambios o
interrupciones. Se centran en el grado en que la contingencia instrumental respuesta-
reforzador rompe la estabilidad conductual y empuja al individuo fuera de su distribución
de actividades preferida u optima.
El punto de deleite conductual. La teoría

de la regulación conductual asume que si los
organismos son libres para distribuir sus
respuestas entre las alternativas
disponibles, lo harán de la forma en que
sea más cómodo o en algún sentido optimo
para ellos. Esta distribución de respuestas
define el punto de deleite conductual.
El punto de deleite conductual puede

identificarse mediante la frecuencia
relativa de ocurrencia de todas las
respuestas de un organismo en una situación sin restricciones.

115
Juan Carlos Cabrera
Imposición de una contingencia instrumental. La teoría de regulación conductual establece

que los organismos defenderán el punto de deleite conductual contra los cambios. Lo
interesante es que la línea de base libre del
Imposición de una contingencia instrumental:
punto de deleite conductual no siempre puede Si dejamos al sujeto a su aire, se quedará en el
ser restablecida después de que se haya punto de deleite. Eso puede ser malo ( ejemplo:
estudiar poco, fumar mucho...)
introducido una contingencia instrumental. Este El terapeuta quiere modificar esa distribución de
conductas haciendo que se apartasen del punto de
es a menudo el dilema que impone una deleite. ¿Cómo? Mediante reforzamientos y castigos.
contingencia instrumental. No permite volver al
punto de deleite.
El punto de deleite proporciona la

motivación para la conducta
instrumental. La teoría de
regulación conductual asume que
para volver al punto conductual
establecido continua siendo una
meta en la distribución de
respuestas. Cuando este meta no
puede alcanzarse, la redistribución
de las respuestas entre las
conductas instrumental y
contingente llega a ser una cuestión
de ajuste. La tasa de una respuesta
se mantiene lo mas cerca posible
del nivel preferido sin cambiar la otra respuesta demasiado de su nivel preferido.
Staddon propuso un modelo de desviación mínima de regulación conductual para resolver

el dilema de las restricciones del programa, la introducción de una contingencia respuesta-
reforzador provoca que los organismos redistribuyan sus conductas entre las respuestas
instrumentales y contingentes de manera que se minimice la desviación total de las dos
respuestas con respecto al punto optimo o de deleite.
Explicación los efectos de reforzamiento. La regulación conductual incluye la defensa de

un punto de deleite conductual frente a restricciones de respuesta impuestas por una
contingencia respuesta-reforzador. Esta defensa puede requerir establecerse en algún
punto cercano peno no exactamente en el punto de deleite de la línea base. El aumento en la
respuesta instrumental (un efecto de reforzamiento ) es el resultado de mecanismos
reguladores de la conducta que funcionan para minimizar las desviaciones del punto de
deleite conductual.
Una visión sobre las contingencias de reforzamiento en un contexto conductual mas

amplio: Las contingencias instrumentales no suceden en un vacío conductual ocurren en el
contexto de una variedad de respuestas y reforzadores que puede obtener el sujeto.

116
Juan Carlos Cabrera
Centrarse solo en la respuesta instrumental y sus estímulos antecedentes y consecuentes

(esto es, la estructura asociativa de la conducta instrumental) desatiende el contexto
conductual mas amplio ya que puede influir de forma significativa en el resultado de los
procedimientos particulares de condicionamiento instrumental.
Conceptos económicos y distribución de respuesta
En las situaciones de condicionamiento instrumental, las restricciones están proporcionadas

por el número de respuestas que un organismo es capaz de realizar y el número de
respuestas requerido para obtener cada reforzador.
Demanda del consumidor. La relación entre el precio de una comodidad y cuanto se obtiene
se denomina curva de la demanda.
El grado en el cual el precio influye en el

consumo se denomina elasticidad de la
demanda.
El concepto de demanda del consumidor

puede utilizarse para analizar el refor-
zamiento instrumental considerando el
numero de respuestas realizadas como
análogo al dinero. EL precio de un
reforzador es el tiempo o numero de
respuestas requeridas para obtener un
reforzador. Por tanto, el precio del
reforzador esta determinado por el
programa de reforzamiento.
Determinantes en la elasticidad de la demanda.

Los conceptos económicos han ayudado a identificar tres factores principales que influyen
en como las restricciones de un programa moldean la redistribución de la conducta.
1º Disponibilidad de sustitutos: Es el factor que mas influye en la elasticidad de la

demanda. La disponibilidad de sustitutos
aumenta la sensibilidad del articulo a los precios
altos.
Una fuente de reforzadores sustituible es la disponibilidad de un reforzador fuera de la

sesión experimental. La parte de comida que no comen durante la sesión experimental se
les da luego en la jaula hogar, esta situación se denomina una economía abierta, Esto se
contrapone con una economía cerrada, en la cual los sujetos no reciben alimentación

117
Juan Carlos Cabrera
suplementaria. En general la elasticidad de la demanda es mayor en situaciones de economía

abierta que en economías cerradas.
2º Rango de precios: Un aumento en el

precio tiene menos efecto en precios
bajos que en precios altos.
3º Nivel de ingresos: En estudios de

condicionamiento instrumental, el
número de respuestas o la cantidad de
tiempo disponible para responder
corresponde a los ingresos. Cuantas más
respuestas o tiempo tengan disponibles
los animales, menos estará su conducta
influida por los aumentos en el coste del
reforzador.
Problemas con las aproximaciones de regulación conductual
El punto de deleite es una característica

molar de la conducta. Se basa en una medida 1. El punto de deleite se formula desde un punto de vista
molar (como un conjunto, y a lo largo de un periodo
de cada respuesta acumulada a lo largo del amplio). Sin embargo, está demostrado que es
importante cómo se alcanza ese punto de deleite
bloque temporal amplio. Un punto de deleite (pausas de elección en los cambios de conducta a
molar dado puede alcanzarse de varias otra) desde un punto de vista más molecular.
formas, de acuerdo con esta aproximación , 2. El "valor reforzante· de una conducta puede cambiar
las diferencias en las pautas de respuesta no según si es obligada o no. Por ejemplo, al principio
una conducta A puede ser agradable, pero cuando la
deberían tener importancia. Pero la evidencia utilizo para reforzar otra conducta B, estoy
imponiendo la conducta A. ¿Cómo sé si sigue siendo
experimental indica que es importante como tan agradable como al principio?
se alcanza el punto de deleite molar. En
consecuencia una adecuada caracterización del deleite conductual requiere información
sobre las pautas de elección moleculares.
Otra dificultad, tal vez más seria es que las respuestas durante un periodo de línea base
libre no siempre tiene el mismo valor como respuestas que ocurren como parte de una
contingencia instrumental impuesta, Hacer algo cuando no hay requerimientos impuestos
externamente (correr por placer ) parece ser diferente a hacer lo mismo cuando se
requiere por una contingencia instrumental impuesta.
Finalmente, debido a que las aproximaciones no comprenden procesos conductuales

moleculares, no dicen nada de cómo los organismos defienden una combinación favorita de
bienes o actividades.

118
Juan Carlos Cabrera
Contribuciones de la regulación conductual
1º Nos alejó de la consideración de los

1. Antes se pensaba en los reforzadores como tipos
reforzadores como tipos especiales de especiales de estímulos. Desde la aproximación de la
respuestas. Los efectos del reforzamiento se regulación conductual, la causa del reforzamiento está
en la forma en que el flujo libre, natural, de la conducta
ven como producidos por las restricciones del se ve alterado por las contingencias instrumentales. Una
conducta puede ser reforzante.
programa en el devenir de las actividades de
un organismo.
2. Ahora, el entrenamiento instrumental ya no sirve sólo
para "fijar" o "eliminar" una conducta, sino que crea una
2º Los procedimientos de condicionamiento nueva distribución de conductas en general.
instrumental ya no se considera que estampan

o fortalecen la conducta instrumental: en su
lugar el condicionamiento instrumental es
visto como la creación de una nueva 3. Una respuesta reforzadora no tiene nada inherente
distribución o asignación de respuestas, la distinto de una respuesta instrumental: no proporciona
ningún beneficio especial, por ejemplo fisiológico (hacer
reasignación de la conducta incluye un ejercicio vs. Comer caramelos). Simplemente, el que una
aumento en la respuesta instrumental y una conducta sea reforzadora o instrumental va a depender
de los papeles que les asigne el terapeuta o
disminución de la respuesta reforzadora. experimentador.
3º No existe una distinción fundamental entre 4. Ha contribuido a ver el condicionamiento instrumental

como un sistema, en vez de cómo elementos aislados.
las respuestas instrumentales y las Al cambiar un solo elemento, el sistema entero se ve
reforzadoras, se distinguen solo por los afectado.
papeles asignados a ellas mediante un

procedimiento de condicionamiento instrumental.
4º Aceptan la idea de que los organismos responden para maximizar sus beneficios.
5º Han proporcionado caminos nuevos y precisos para describir las restricciones que
imponen varios procedimientos de condicionamiento instrumental en el repertorio de
conducta de un organismo. Mas importante, han enfatizado que la conducta instrumental no
puede ser estudiada en un vacío o en un tubo de ensayo conductual. Todas las opciones de
respuesta del organismo que se dan en un momento dado deben ser consideradas como un
sistema.
Comentarios finales
Los procesos motivacionales en la conducta instrumental se ha enfocado desde dos

perspectivas radicalmente diferentes y dos tradicionales intelectuales: la perspectiva
asociacionista tiene sus raices en la ley del efecto de Thorndike y el condicionamiento
pavloviano, y la perspectiva de la regulación conductual tiene su origen en el análisis
conductual skinneriano. Estas dos aproximaciones difieren más que se asemejan, haciendo
difícil imaginar cómo podrían integrarse. Por ejemplo, el concepto fundamental en la

119
Juan Carlos Cabrera
aproximación asociacionista (el concepto de una asociación) es enteramente soslayado por

la regulación conductual. Igualmente, los conceptos críticos de la regulación
conductual(puntos de deleite y restricciones del programa) no tienen correspondencia en la
aproximación asociacionista. La aproximación asociacionista por sí misma lleva un inmediato
a la exploración de los circuitos neurales de condicionamiento instrumental. Por otra parte,
es difícil ver cómo la aproximación de la regulación conductual podría utilizarse para guiar
la investigación neurofisiológica.
Las dos aproximaciones parecen centrarse en asuntos completamente distintos, pero ambas
han contribuido de forma significativa a la compresión de la motivación de la conducta
instrumental. Es evidente que una aproximación no puede ignorarse a favor de la otra, pero
¿cómo contribuye cada una a la compresión completa de la motivación instrumental?.
Una forma de pensar sobre las dos aproximaciones es que incluyen diferentes niveles de
análisis. La asociacionista involucra un nivel molecular donde el objetivo son los estímulos
específicos, las respuestas, y sus conexiones. En contraste, como se ha descrito, la
regulación conductual opera a un nivel molar de agregados de conducta y de contextos
conductuales más amplio en el que operan las contingencias instrumentales. Por tanto, la
aproximación de la regulación conductual contacta mejor con las complejidades de la
ecología de un organismo.
Otra forma de pensar en la relación entre las dos aproximaciones es que una se relaciona
con procesos y la otra está más relacionada con funciones o metas a largo plazo. La
aproximación asociacionista describe procesos específicos [asociaciones E-R, E-C, R-C y E-
(R-C)] que sirven para generar y dirigir la conducta instrumental, pero no tienen en cuenta
el “propósito” o función a largo plazo del aprendizaje instrumental. Éste es el punto de vista
de la regulación conductual y la economía conductual, que asumen que los organismos
trabajan para defender una distribución óptima de actividades. La defensa del punto de
deleite conductual se alcanza mediante los procesos moleculares de las asociaciones.
Los desarrollos conceptuales en el estudio de la motivación de la conducta instrumental

proporcionan un ejemplo representativo del curso de la investigación científica. Ésta se ha
desarrollado desde formulaciones simples estímulo-respuesta hasta consideraciones más
comprensivas de la forma en que el repertorio del organismo se restringe mediante las
contingencias instrumentales y cómo los organismos resuelven problemas ecológicos
complejos. En ese aspecto del estudio del condicionamiento y el aprendizaje, tal vez más
que en ningún otro, los investigadores se han movido con atrevimiento para explorar nuevas
concepciones cuando las viejas ideas no afrontaban con éxito los desafíos propuestos por
los hallazgos empíricos.

120
Juan Carlos Cabrera
TERMINOS CLAVE (página 216 del libro)
Curva de la demanda Relación entre la cantidad Punto de deleite conductual Distribución preferida
que se obtiene de una comodidad y su precio. de las actividades de un organismo antes de que
se introduzca un procedimiento de
Elasticidad de la demanda Grado en el que el precio condicionamiento instrumental que disponga
influye sobre el consumo u obtención de una limitaciones en la distribución de respuesta.
comodidad. Si el precio tiene un efecto
importante en el consumo, la elasticidad de la Principio de Premack Lo mismo que principio de
demanda es alta. Si el precio tiene poco efecto probabilidad diferencial.
sobre el consumo, la elasticidad de la demanda es
baja. Principio de probabilidad diferencial Principio que
asume que el reforzamiento depende la
Experimento de transferencia de control probabilidad relativa del organismo de ejecutar la
Experimento que evalúa los efectos de un respuesta reforzadora frente a la respuesta
estímulo condicionado clásicamente (EC) en la instrumental antes de que se introduzca el
ejecución de la conducta instrumental. El EC y la procedimiento de condicionamiento instrumental.
respuesta instrumental se condicionan en primer Cuanta más diferencia exista entre la
lugar en fases independientes del experimento. probabilidad de la respuesta reforzadora y la
Los efectos del EC sobre la respuesta instrumental durante las condiciones de línea de
instrumental se determinan entonces en la fase base, mayor será el efecto reforzante de
de transferencia. proporcionar la oportunidad de ejecutar la
respuesta reforzadora tras realizar la
Hipótesis de la privación de respuesta Explicación instrumental. También conocido como principio de
del reforzamiento que defiende que la restricción Premack.
el acceso a una respuesta por debajo de su tasa
de línea base de ocurrencia (privación de Teoría de la respuesta consumatoria Teoría que
respuesta) es suficiente para hacer que la asume que las respuestas consumatorias típicas
oportunidad de ejecutar esa respuesta actúe de la especia (comer, beber y cosas así) son las
como un reforzador positivo efectivo. características fundamentales de los
reforzadores.
Modelo de desviación mínima Modelo de conducta
instrumental, según el cual los participantes
responden a la contingencia respuesta-
reforzador de manera que los acerque lo máximo
posible a su punto de deleite conductual.

121
Capítulo 8:El control de la conducta por el estímulo
Identificación y medida del control por el estímulo

- Respuesta diferencial y discriminación de estímulos
- Generalización de estímulos
- Los gradientes de generalización del estímulo como medida de control por el estímulo.
Factores del estímulo y la respuesta en el control por el estímulo

- Capacidad sensorial y orientación.
- Facilidad relativa del condicionamiento de varios estímulos.
- Tipo de reforzamiento.
- Tipo de respuesta instrumental.
- Elementos del estímulo frente a claves configuracionales en los estímulos compuestos.
Factores de aprendizaje en el control por el estímulo

- Entrenamiento en discriminación de estímulos.
- Efectos del entrenamiento en discriminación sobre el control por el estímulo.
- Rango de posibles estímulos discriminativos.
- ¿Qué se aprende en el entrenamiento de discriminación?
- Interacciones entre el E+ y el E-: desplazamiento del máximo
- Entrenamiento de equivalencia de estímulos
Claves contextuales y relaciones condicionales

- Control por claves contextuales.
- Control por las relaciones condicionales.
Comentarios finales

123
Es tan importante la adecuación de una respuesta instrumental al contexto estimular en el
que se realiza, que la falta de un apropiado control por el estímulo se considera a menudo
anormal, desvestirse en privado es aceptable en publico motivo de arresto.
El control de la conducta por el estímulo es un aspecto importante de la forma en que los

organismos se adaptan al ambiente. Para acomodarse de forma efectiva y evitar el peligro
los animales tienen que comportarse de forma congruente con las circunstancias
cambiantes.
Identificación y medida del control por el estímulo

¿Cómo se puede afirmar que una respuesta instrumental esta bajo el control de ciertos
estímulos?.
Respuesta diferencial y discriminación de estímulos
El control por el estímulo de la conducta Reynolds (1961)

instrumental se demuestra mediante variaciones
Entrenamiento:
en la respuesta (respuesta diferencial) rela-
cionadas con las variaciones en los estímulos. Si
un organismo responde de una manera en
presencia de un estímulo, y de forma diferente
en presencia de otro, se puede decir que su Prueba:
conducta esta bajo el control de esos estímulos.
Estas respuestas diferenciales resultan eviden- Resultados: una paloma picoteaba más el circulo
rojo y para la otra fue el triángulo blanco.
tes en el comportamiento de las dos palomas del
experimento de Reynolds. Conclusiones:
Si un cambio en el estímulo conlleva un cambio

en la conducta, es que ese estímulo controla
La respuesta diferencial a dos estímulos también en cierta medida esa conducta.
indica que las palomas estaban tratando cada
Para que un estímulo controle una conducta, el
estímulo de forma diferente. Esto se denomina organismo tiene que poder distinguir ese estí-
discriminación de estímulos. Se dice que un mulo de otros (diferenciar al estímulo com-
puesto del círculo por un lado y del triángulo
organismo muestra discriminación de estímulos si por el otro).
responde de forma diferente a dos o más
En esta situación es difícil predecir qué compo-
estímulos. La discriminación de estímulos y el nente del estímulo original va a tener el con-
trol. Unas palomas responden más al círculo,
control por el estímulo constituyen dos maneras otras al triángulo.
de considerar el mismo fenómeno: una no existe
sin la otra. Si un organismo no discrimina entre dos estímulos, su conducta no esta bajo el
control de esas claves.

Juan Carlos Cabrera
Otro aspecto interesante del experimento de Reynolds es que la conducta de cada pájaro
estaba controlada por un estímulo diferente. En ausencia de procedimientos especiales, los
investigadores no siempre pueden predecir cual de varios estímulos de aquellos que un
organismo experimenta adquirirá control sobre su conducta instrumental
Generalización de estímulos
Identificar y diferenciar varios estímulos no es algo tan simple. Los estímulos pueden
definirse de formas muy diversas. En ocasiones, objetos o eventos muy diferentes se
consideran ejemplos del mismo estímulo debido a que comparten la misma función. En otros
casos, los estímulos se identifican y distinguen partiendo de rasgos físicos precisos, como
la longitud de onda.
Los análisis experimentales del problema han dependido en su mayoría del fenómeno de la
generalización de estímulos, que es lo opuesto a la respuesta diferencial, o discriminación
de estímulos. Se dice que un organismo muestra generalización de estímulos si responde
manera similar a dos o mas estímulos. Este fenómeno fue observado en primer lugar por
Pavlov.
En un experimento clásico Guttman y Kalish palomas programa IV picotear con luz

amarillenta con longitud de onda 580 anómetros, después se observa que palomas también
responde a 570 y590. Estos resultados mostraron un gradiente de respuesta en función de
la semejanza entre cada estímulo de prueba y el estímulo original de entrenamiento. Este
resultado es un ejemplo de lo que se denomina gradiente de generalización de estímulo.
Los gradientes de generalización del estímulo como medidas del control por el
estímulo
Se utilizan a menudo para medir el control por el estímulo porque facilitan información
acerca del grado de sensibilidad de la conducta de un organismo ante la variación de un
aspecto particular del ambiente.
Guttman y Kalish (1956) y el experimento hipotético con las palomas ciegas a los colores
indica que lo acusado del gradiente de generalización de un estímulo proporciona una
medida precisa del grado de control del estímulo. Se obtiene un gradiente de
generalización plano si el organismo responde de forma similar a todos los estímulos de la
prueba. Esta falta de respuesta diferencial demuestra que el rasgo del estímulo que se
varia en la prueba de generalización no controla la conducta instrumental. Por el contrario,
se obtiene un gradiente de generalización acusado si el organismo responde en mayor
medida a algunos de los estímulos de prueba que a otros. Esta respuesta diferencial

125
Juan Carlos Cabrera
evidencia el hecho de que la conducta instrumental esta bajo el control del rasgo del
estímulo que varia entre los estímulos de prueba.
Si se da una gran cantidad de generalización, se dará poca respuesta diferencial. Si la

respuesta es altamente diferencial ante los estímulos, se obtendrá una mínima
generalización.
Factores del estímulo y la respuesta en el control por el estímulo.

La cuestión principal es la siguiente ¿Qué es lo que determina que una de las muchas
características de una situación estimular adquiera control sobre la conducta
instrumental?.
Capacidad sensorial y orientación
El factor que determina de forma mas evidente si una característica particular del
estímulo llega a controlar la respuesta es la capacidad sensorial y de orientación del
individuo. La presentación de estímulos con ciertas características de interés para un
organismo no garantiza que otro organismo responderá a las mismas características.
Los sucesos fuera del rango de lo que un organismo puede detectar con sus órganos
sensoriales simplemente no existen para ese organismo a menos que se amplifiquen o sean
traducidos a algo que el organismo pueda detectar. Las limitaciones en los estímulos que
pueden llegar a controlar la conducta dependen también de si el individuo llega a tomar
contacto con el estímulo.

126
Juan Carlos Cabrera
Facilidad relativa del condicionamiento de varios estímulos
La intensidad con que los organismos aprenden

Factores del estímulo y la respuesta.
sobre un estímulo depende de la facilidad relativa
de condicionamiento de otras claves presentes en la 1. Capacidad sensorial del individuo.
situación. Este fenómeno se llama

ensombrecimiento. Pavlov fue el primero en
observar que si dos estímulos se presentan al mismo
tiempo, la presencia del estímulo que se puede
entrenar mas fácilmente puede ocultar el
2. Facilidad de condicionamiento del estimulo.
aprendizaje del otro. En general cuanto más intenso
sea el estímulo , más rápido se condicionara y Unos estímulos se
condicionan mejor que
ensombrecerá el aprendizaje del estímulo mas otros, por su
débil. Pavlov encontró que el estímulo débil podía intensidad,
naturaleza...
llegar a condicionarse (algo más lentamente ) si se
presentaba solo.
Tipo de reforzamiento
Es más probable que ciertos tipos de

estímulos adquieran control sobre la
conducta instrumental con reforzamiento
positivo que con reforzamiento negativo.
Ciertos hallazgos indican que el control por

el estímulo de la conducta instrumental
esta determinado en parte por el tipo de
reforzamiento utilizado. Es más probable
que los estímulos visuales adquieran control
sobre la conducta en situaciones apetitivas
Efectos del tipo de reforzamiento en el control por el estímulo. Se
que las claves auditivas, mientras que es reforzó una respuesta de presión de un pedal en palomas en
presencia de un estímulo compuesto consistente en un tono y
mas probable que estas adquieran control una luz. Con un reforzamiento con comida, la luz obtuvo mucho
en situaciones aversivas. más control sobre la conducta que el tono. Con un
reforzamiento de evitación de una descarga, el tono adquirió
mucho más control sobre la conducta que la luz (Adaptado de
Esto está probablemente relacionado con Foree y Lolordo, 1973.)
los sistemas de conducta que se activan en

los dos casos, la activación del sistema de alimentación puede involucrar una sensibilidad
incrementada a los estímulos visuales. En contraste los procedimientos de evitación de la
descarga activan el sistema de conducta defensiva. Responder a claves auditivas puede ser
particularmente adaptativo para evitar el peligro.

127
Juan Carlos Cabrera
Tipo de respuesta instrumental
Otro factor que puede determinar que rasgos de un estímulo compuesto obtendrán control
sobre la conducta es la naturaleza de la respuesta requerida por el reforzamiento.
Las respuestas que se diferencian por la localización es mas probable que lleguen a estar
bajo el control de la característica espacial de las claves auditivas. Por el contrario las
respuestas que se diferencian por la naturaleza (hacer/no hacer) es mas probable que
lleguen a estar bajo el control de la naturaleza de las claves auditivas. Este fenómeno se
denomina efecto de la naturaleza-localizacion. Este efecto es una forma de asociación
selectiva.
El efecto de naturaleza-localización no significa que los sujetos no puedan nunca aprender

sobre la naturaleza de los sonidos cuando están involucradas respuestas que se diferencias
espacialmente o que nunca puedan aprender acerca de la localización de los sonidos en una
tarea de hacer/no hacer. Con un emplazamiento oportuno de las fuentes de sonido (uno
mucho más cerca de la respuesta que el otro), los sujetos pueden llegar a responder a las
características de localización de sonidos en una tarea de hacer/no hacer.
Elementos del estímulo frente a claves configuracionales en los estímulos

compuestos.
En el análisis anterior sobre el control de la conducta por varios elementos del estímulo, se
asumió que los organismos tratan a estos elementos del estímulo como rasgos distintivos y
separados del ambiente. Esto se denomina aproximación elemental del estímulo. Por tanto,
en el efecto de naturaleza-localización, la naturaleza y la localización de un estímulo
auditivo se consideran características separables de las claves auditivas. Se suponía que
una característica particular del estímulo (la naturaleza del sonido) se percibía de la misma
manera independientemente del estatus de la otra característica (la localización del
sonido). Una alternativa teórica importante presuma que los organismos tratan los
estímulos complejos como un todo integral que no se divide en partes o elementos. Esto se
denomina aproximación de la clave configuracional.
De acuerdo con la aproximación de la clave configuracional, los individuos responden a un

estímulo compuesto en función de la configuración única de sus elementos. Se asume que los
elementos no se tratan como entidades separadas. Pueden incluso no ser identificables
cuando se presenta el estímulo compuesto, los elementos del estímulo son importantes no
en cuanto a su individualidad sino en función de cómo contribuyen a la configuración total
de la estimulación proporcionada por el compuesto.
El ensombrecimiento , según esta teoría, refleja diferentes grados de decremento de la

generalización desde la fase de entrenamiento a la de prueba para los grupos de
ensombrecimiento y de control, (John Pearce, 1987): No hay decremento de la
generalización para el grupo de control cuando se prueba el estímulo débil a porque es el
mismo estímulo que recibió durante el condicionamiento. Por el contrario, se da un
128
Juan Carlos Cabrera
considerable decremento de la generalización cuando se prueba el estímulo a en el grupo de

ensombrecimiento tras el condicionamiento con el compuesto aB. Para el grupo de
ensombrecimiento, la respuesta se condiciona al compuesto aB, que es muy diferente de
presentar sólo a durante la generalización, este mayor decremento de la generalización es
la causa del efecto de ensombrecimiento.
En ciertas condiciones, los organismos claramente responden a los estímulos compuestos

principalmente en términos de la configuración de los elementos que forman el compuesto.
Esta teoría es incompatible con varios ejemplos de asociaciones selectivas que se han
descrito con anterioridad, no explica por que el control por el, estímulo esta en función del
tipo de reforzamiento utilizado o del tipo de respuesta requerida. La conclusión mas
prudente es que los organismos responden a los compuestos estimulares tanto a partir de
los elementos del estímulo que forman el compuesto como en función de configuraciones
estimulares únicas creadas por los elementos del estímulo. En ciertas circunstancias
predomina el control elemental, mientras que en otras condiciones predomina el control de
las características configuracionales de los compuestos estimulares.
La estructura de una teoría unificada de este tipo ha sido descrita recientemente por
Wagner y Brandon (2001), estímulos como el sonido de un tono contienen rasgos distintivos
(tono, intensidad, localización ). Cuando un estímulo se combina con otro se crean nuevos
elementos estimulares configuracionales que son únicos para este nueva combinación
estimular. Además, algunos de los rasgos individuales de los estímulos originales se pierden
en la combinación. Esto sesga el control por el estímulo a favor de los elementos
configuracionales y produce resultados congruentes con la aproximación de la clave
configuracional.
FACTORES DE APRENDIZAJE EN EL CONTROL POR EL

ESTÍMULO (página 230 del libro)
Los factores del estímulo y la respuesta son los puntos de arranque del control por el
estímulo. El que ciertos estímulos lleguen a controlar la conducta a menudo depende de lo
que el organismo ha aprendido acerca de esos estímulos.
La sugerencia de que la experiencia con los estímulos puede determinar hasta que punto
estos llegan a controlar la conducta tuvo su origen en los esfuerzos por explicar el
fenómeno de la generalización de estímulos. Pavlov sugirió que la generalización del estímulo
se da porque el aprendizaje sobre el EC llega a transferirse a otros estímulos en función de
la semejanza física de esos estímulos de prueba con el EC original.
Lashley y Wade (1946) adoptaron una postura contraria a la de Pavlov. Rechazaron la idea
de que la generalización del estímulo reflejase la transferencia del aprendizaje y
argumentaron que reflejaba la ausencia de aprendizaje. En particular propusieron que la
generalización del estímulo ocurre si los organismos no han aprendido a distinguir las
diferencias entre los estímulos. Defendían que los animales tenían que aprender a tratar
los estímulos como diferentes uno de otro. Consideraban la forma del gradiente de
129
Juan Carlos Cabrera
generalización del estímulo como determinada principalmente por las experiencias previas
de aprendizaje del organismo mas que por las propiedades físicas de los estímulos.
Entrenamiento en discriminación de estímulos.
Numerosos estudios han demostrado que el control por el estímulo puede alterarse de
forma notable por las experiencias de aprendizaje. El procedimiento más poderoso para
situar la conducta bajo el control de un estímulo es el entrenamiento en discriminación de
estímulos. En un procedimiento de discriminación de estímulos los participantes se
exponen al menos a dos estímulos diferentes, pero el reforzamiento por realizar la
respuesta instrumental esta disponible solo en presencia de uno de los colores. El estímulo
que señala la disponibilidad de reforzamiento se denomina E+ o ED (pronunciado “e de”). En
contraste, el estímulo que señala la falta de reforzamiento se denomina E- o EΔ
(pronunciado “e delta”). Los
procedimientos de discriminación de
estímulos establecen un control por
los estímulos que señalan cuando
esta o no disponible el
reforzamiento. Cuando E+ y E- han
adquirido control sobre la conducta
del organismo, se denominan
estímulos discriminativos . El E+ es
un estímulo discriminativo para la
realización de la respuesta
instrumental, y el E- es un estímulo
discriminativo para la supresión de
la respuesta.
Los procedimientos instrumentales de discriminación de estímulos se diferencian de los

procedimientos de condicionamiento clásico sólo en que el reforzador se presenta de forma
contingente a la respuesta durante el E+. No es necesario responder para que se den los
emparejamientos del EC+ con el EI en el condicionamiento clásico. A diferencia de un EC+,
un E+ no señala de que el reforzador ocurrirá inevitablemente. Más bien, el E+ indica que la
respuesta instrumental será reforzada.
En un programa múltiple de reforzamiento funcionan diferentes programas de

reforzamiento en presencia de diferentes estímulo.
Efectos del entrenamiento en discriminación sobre el control por el estímulo
El entrenamiento en discriminación sitúa la conducta instrumental bajo el control del E+ y

el E-. Los investigadores deben también determinar lo acusado del gradiente de
generalización cuando los participantes responden en presencia de estímulos que varían
sistemáticamente a partir del E+: Es mas debe determinarse que aspecto del procedimiento

130
Juan Carlos Cabrera
del entrenamiento en discriminación es responsable del tipo de gradiente de generalización

del estímulo que se obtiene.
Jenkins y Harrison (1960,1962) examinaron como los estímulos auditivos que diferían en el
tono llegaban a controlar la conducta de picoteo de las palomas reforzada con comida. Un
grupo de pájaros fue reforzado por picotear en presencia de un tono de 1000 hertzios y no
recibía reforzamiento cuando el tono no se presentaba. El tono de 1000 hz servía como E+
y la ausencia de tono como E-.
Para el segundo grupo, el tono de 1000 hz sirvió de nuevo como E+ , pero el E- fue un tono
de 950 hz. El tercer grupo de palomas sirvió como grupo de control y no recibió
entrenamiento, el tono de 1000 hz sonaba constantemente y siempre podían recibir
reforzamiento por picotear cuando estaban en la cámara experimental.
Después de acabar el entrenamiento, en cada grupo se puso a prueba la conducta de picoteo

en presencia de tonos de varia frecuencias para ver con que precisión controlaba el tono
dicha conducta. El grupo control respondió de forma casi idéntica en presencia de todos los
estímulos de prueba; el tono de los sonidos no controlaba su conducta: Cada uno de los
otros procedimientos de entrenamiento produjo un mayor nivel de control estimular por el
tono. El gradiente de generalización mas acusado y por tanto el control por el estímulo mas
fuerte se observo en los pájaros que habían sido entrenados con el tono de 1000 hz como
E+ y el tono de 950 como E-. Las otras (1000 hz y ausencia de tono ) mostraron un grado
intermedio de control.
Este experimento aporto dos conclusiones importantes (1) el entrenamiento en

discriminación aumenta el control por el estímulo de la conducta instrumental, y (2) una
dimensión particular del estímulo (como la frecuencia tonal ) es mas probable que adquiera
control sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensión del estímulo.
Rango de posibles estímulos discriminativos
Los procedimientos de entrenamiento en discriminación se emplean a menudo para evaluar

la capacidad sensorial de los animales. Schsterman y colaboradores lo han utilizado para
determinar los umbrales visuales y auditivos .Los investigadores también se han interesado
por el estudio de si los animales son capaces de detectar las sensaciones internas creadas
por una droga. Esta investigación ha mostrado que los mecanismos de control por el
estímulo con drogas son asombrosamente parecidos a los mecanismos identificados por
Jenkins y Harrison para el control del picoteo de una tecla por claves visuales en las
palomas. El gradiente de generalización fue mucho mas acusado, lo que indica un control por
las drogas mucho mas fuerte.

131
Juan Carlos Cabrera
¿Qué se aprende en el entrenamiento de discriminación?
Se aprende a responder al E+ como a suprimir la respuesta ante el E-.
Teoría de Spence del aprendizaje de discriminación: Esta basada en la idea de que lo que
se aprende tanto el significado del E+ como del E-, o sea aprender tanto a responder al E+
como a suprimir la respuesta ante el E-. El reforzamiento de una respuesta en presencia del
E+ condiciona tendencias excitatorias de respuesta al E+. Por el contrario, el no
reforzamiento de la respuesta durante el E- condiciona propiedades inhibitorias al E-, lo
que sirve para suprimir la conducta instrumental. Se asume que la respuesta diferencial al
E+ y al E- refleja tanto la excitación por responder ante el E+ como la inhibición por
responder ante el E-.
Comprobar esto requiere pruebas sofisticadas. Una posibilidad es utilizar los gradientes de
generalización del estímulo.
Si se ha condicionado una tendencia exitatoria al E+, entonces los estímulos que difieran de
forma progresiva del E+ deberían ser cada vez menos efectivos en evocar la respuesta
instrumental. En otras palabras, debe observarse un gradiente de generalización acusado,
con la mayor cantidad de respuesta ante el E+. Un resultado como este se llama gradiente
de generalización del estímulo excitatorio. Por el contrario, si se ha condicionado una
tendencia inhibitoria al E-, entonces los estímulos que difieran progresivamente del E-
deberían ser cada vez menos efectivos en inhibir la respuesta instrumental, este resultado
se llama gradiente de generalización del estímulo inhibitorio.
Las pruebas conductuales llevadas a

cabo décadas después omprobaron
que las ideas de Spence eran
sustancialmente correctas. En un
experimento clásico Honig, Boneau,
Burstein y Pennypacker, 1963. Un
grupo de palomas es reforzado
cuando la tecla estaba iluminada con
luz blanca y una línea vertical negra
(E+) sin la línea vertical no refuerzo
(E-). 2º Grupo el E+ y E-
intercambiados, después de que los
dos grupos aprenden a responder al
E+, se llevaron a cabo las pruebas de
generalización del estímulo para
Gradientes de generalización del estímulo para estímulos
averiguar el grado de control de la consistentes en la inclinación de una línea en dos grupos de palomas
barra vertical negra sobre la tras un entrenamiento en discriminación. Para el Grupo 1, sirvió como
E+ una barra vertical negra sobre un fondo blanco, y la luz blanca sin
conducta; en el grupo 1, mayor tasa barra sirvió como E-. Para el Grupo 2, las funciones de los estímulos
de respuesta ante la raya vertical y se invirtieron.
progresivamente descendiendo, esto

132
Juan Carlos Cabrera
ilustra un gradiente de generalización del estímulo excitatorio. En el grupo 2los estímulos

que eran cada vez mas diferentes del original E- producían progesivamente menos inhibición
en la conducta, ilustrando un gradiente de generalización del estímulo inhibitorio.
Este experimento muestra que el entrenamiento en discriminación puede producir tanto

condicionamiento excitatorio al E+ como condicionamiento inhibitorio al E-. El hecho de que
los gradientes de excitación e inhibición puedan ocurrir alrededor del E+ y del E-
proporcionan un fuerte apoyo a la teoría de Spence del aprendizaje de discriminación.
Se obtienen diferentes resultados si los estímulos E+ y E- difieren cuantitativamente en

una caraterística en lugar de cualitativamente ( incluyendo muchas características.)
Interacciones entre el E+ y el E-: desplazamiento del máximo
Lo que los sujetos aprenden sobre el E+ es independiente de lo que aprenden sobre el E-.
Esta suposición es demasiado simplista. Lo que se aprende sobre el E+ puede influir en la
respuesta al E- y viceversa. Estas interacciones son particularmente probables si el E+ y el
E- se relacionan de alguna manera.
Una de las maneras en que el E+ y el E- puede estar relacionados es siendo semejantes

excepto por un rasgo o atributo. Un procedimiento de entrenamiento en que sólo difieren
por el valor de una característica del estímulo se llama discriminación intradimensional.
Las discriminaciones intradimensionales son de particular interés debido a que están

relacionadas con el problema de la ejecución experta, esta implica normalmente realizar
distinciones sutiles. Distinguir los estímulos que difieren en un única característica es mas
difícil que distinguir entre estímulos que difieren en muchos aspectos. La discriminación
intradimensional requiere la detección de un único rasgo diferenciador entre el E+ y el E-
y, en consecuencia, es una forma de ejecución experta.
Una característica importante de la discriminación intradimensional es que a veces dan

como resultado una interesante interacción entre las respuestas al E+ y al E-, en un
experimento clásico Hanson (1959) examinaba el grado en que varios colores controlaban la
conducta de picoteo en paloma. Todos los sujetos fueron reforzados con un luz de 550nn, el
E+ era el mismo para todos los grupos, diferían en lo similar que era el E- al E+. un grupo
recibió un E- de 590nn , para otro grupo el E- era de 555nm, y u n grupo de control que no
recibió entrenamiento en discriminación pero que también fue reforzado por picotear en
presencia del estímulo de 550 nm. El grupo de control mostró un gradiente de
generalización del estímulo excitatorio normal centrado alrededor del E+, el grupo en que el
E- fue de 590nm mostró un desplazamiento del máximo del gradiente de generalización
desde el E+ llamativo porque la respuesta nunca se reforzó en 540 o 530 donde se
obtuvieron las tasas mas altas de respuesta, estos estímulos nunca habían sido presentados
durante el entrenamiento original.
El desplazamiento del máximo del gradiente de generalización alejado del E+ original se

133
Juan Carlos Cabrera
denomina efecto del desplazamiento del máximo, este puede ocurrir en cualquier
discriminación intradimensional.
Explicación de Spence del desplazamiento del máximo. El efecto de desplazamiento de

máximo es importante porque muestra que el único estímulo en cuya presencia se refuerza
la respuesta (E+) no es necesariamente es estímulo que evoca la tasa de respuesta más alta.
Spence sugirió que los gradientes
excitatorio e inhibitorio pueden producir el
fenómeno de desplazamiento del máximo,
asumió que el entrenamiento en
discriminación intradimensional produce
gradientes de generalización excitatorios e
inhibitorios centrados en el E+ y el E-, sin
embargo, debido a que el E+ y el E- son
semejantes en las tareas de discriminación
intradimensional, los gradientes de generalización de la inhibición y excitación se
superpondrán. Es mas, el grado de superposición dependerá del grado de semejanza entre
el E+ y el E-. La inhibición generalizada del E- suprimirá la respuesta al E+, dando como
resultado un efecto de desplazamiento del máximo.
Explicaciones alternativas del desplazamiento del máximo: Una cuestión importante es si

vemos los estímulos en función de sus propiedades individuales y absolutas, o en función de
su relación con otros estímulos que experimentamos, existe evidencia consistente con cada
una de estas aproximaciones, que sugiere que ambos tipos de mecanismos están implicados
en la forma de responder de los organismos.
El modelo de Spence es un modelo de aprendizaje absoluto del estímulo. Predice la

conducta basada en las propiedades excitatorias netas de los estímulos individuales. Una
aproximación alternativa asume que los organismos aprenden a responder a un estímulo
basándose en la relación de ese estímulo con otras claves de la situación. Una predicción
interesante de esta aproximación es que la forma de un gradientes de generalización
cambiara en función del rango de los estímulos de prueba que se presenten durante la
sesión de generalización. Estas y oras predicciones de la teoría relacional han sido
confirmadas.
Entrenamiento de equivalencia de estímulos
De la misma forma que el entrenamiento en discriminación potencia la respuesta

diferencial, el entrenamiento en equivalencia potencia la respuesta generalizada o
equivalencia de estímulos.
Se dispone de varias aproximaciones para promover la generalización en lugar de la

discriminación, 1º (Herrnstein, Loveland y Cable 1976, la estrategia básica de
entrenamiento es reforzar la misma respuesta en presencia de varias imágenes que

134
Juan Carlos Cabrera
contiene agua, una vez que aprenden la discriminación agua/no agua, su conducta se
generalizo a nuevas fotografía.
Los investigadores también han explorado la posibilidad de que la equivalencia funcional

entre dos estímulos diferentes podría establecerse enlazando cada una de las distintas
claves con un tercer estímulo común Ej. Honey y Hall (1989) un grupo ruido y click con
comida, grupo control ruido y click, solo el click con comida después ambos recibe ruido con
descarga-miedo al ruido. Los investigadores estaban interesados en saber si este miedo
condicionado se generalizaría al clik, se dio significativamente mas generalización en los
animales entrenados en equivalencia que en el grupo de control.
El emparejamiento de estímulos diferentes con la misma consecuencia crea equivalencia
funcional entre esos estímulos, con la consecuencia de que una respuesta condicionada a uno
de ellos se generalizara a los oros. Una definición mas formal de clase de equivalencia ha
sido propuesta por Siedman y colaboradores. Se dice que existe una clase equivalencia si
sus miembros poseen propiedades matemáticas 1 reflexividad o igualdad, 2 simetría y 3
transitividad. La reflexividad o igualdad se refiere a la relación A=A: la simetría existe si
una relación es bidireccional, la transitividad se refiere a la integración de dos relaciones
en una tercera.
CLAVES CONTEXTUALES Y RELACIONES CONDICIONALES

Un estímulo se dice que es discreto si se presenta durante un breve periodo y tiene un

comienzo y un final claros. Las claves contextuales pueden ser visuales, auditivas o claves
olfatoria de la habitación o lugar donde se presentan los estímulos discriminativos
discretos. La investigación reciente indica que las claves contextuales pueden proporcionar
una importante fuente adicional de control de la conducta aprendida.
Control por claves contextuales

Las claves contextuales pueden llegar a controlar la conducta instrumental. Es más fácil
concentrarse en una biblioteca del colegio que en casa durante las vacaciones, debido al
control contextual de la conducta de estudio por los estímulos experimentados en la
biblioteca. Charlar en un partido de fútbol, pero no durante misa es otro ejemplo del poder
de las claves contextuales.
El control contextual por el estímulo puede ocurrir sin que un contexto esté más
fuertemente asociado con el reforzamiento que otro. Dado que un contexto no es mejor
señal par el reforzamiento que otro, las asociaciones involucran un tipo diferente de
mecanismos. Una posibilidad es que cada contexto activa una memoria diferente. Que le
Contexto 1 active la memoria de reforzamiento con 90º y la de ausencia de reforzamiento
con 0º. Por el contrario, el Contexto 2 active la memoria de reforzamiento con 0º y la de
ausencia de reforzamiento con 90º. En lugar de estar asociado con un estímulo particular,
cada contexto podría estar asociado con una contingencia diferente E+/E-. Estas
asociaciones se denominan relaciones condicionales.

135
Juan Carlos Cabrera
Control por las relaciones condicionales
En capítulos anteriores se han destacado las relaciones que involucran sólo dos eventos, un
EC y un EI, o una respuesta y un reforzador. Las relaciones entre dos eventos se llaman
relaciones binarias. En ciertas circunstancias, la naturaleza de un relación binaria esta
determinada por un tercer suceso, llamado modulador. La relación de un modulador con la
relación binaria que señala se denomina una relación condicional.
Numerosos experimentos han

indicado que los animales pueden
aprender a utilizar moduladores para
decir cuando esta en funcionamiento
una relación binaria particular.
Un procedimiento en el que un
organismo es reforzado por
responder en presencia del E+ pero
no es reforzado en presencia del E-,
los estímulos discriminativos E+ y E-
son moduladores que señalan la relación entre la respuesta y el reforzador. Existe una
relación respuesta-reforzador durante el E+ y una relación diferente durante el E-, por
tanto los procedimientos de discriminación instrumental incluyen el control condicional de
la relación entre la respuesta y el reforzador.
Control condicional en el condicionamiento pavloviano. El concepto fundamental del

control condicional es que un evento señala la relación entre otros dos eventos.
Un modulador es un tercer elemento que indica cuándo la presentación del EC o el

reforzador aparecerá.
En los procedimientos de discriminación instrumental, los moduladores (E+ y E-) se

denominan "estímulos discriminativos". En el condicionamiento pavloviano han denominado al
control condicional de la respuesta facilitación debido a que el modulador facilita la
respuesta del EC. Mas común, el control condicional en el condicionamiento clásico se llama
establecimiento de la ocasión porque el modulador establece la ocasión para los
emparejamientos del EC con el EI. En esta terminología, el modulador se llama establecedor
de la ocasión.
Distinción entre la excitación y la modulación. El establecimiento de la ocasión es un

aspecto importante del condicionamiento clásico porque parece involucrar mecanismos de
aprendizaje diferentes . Los emparejamientos de un EC con un EI dan como resultado una
asociación entre los dos sucesos tal que la presentación del EC llega a activar una
representación del EI. Este tipo de aprendizaje se ha considerado que refleja el
condicionamiento de la excitación al EC. Las propiedades modulatorias de los estímulos son
diferentes de la excitación condicionada.
136
Juan Carlos Cabrera
En varios estudios, los intentos de obtener evidencia de las propiedades excitatorias

condicionadas de los moduladores han fracasado, estos experimentos indican que un
estímulo puede establecer la ocasión para la respuesta condicionada elicitada por otra clave
sin elicitar por si mismo una respuesta condicionada visible. Otros estudios han mostrado
que condicionar las propiedades excitatorias simples a un estímulo no hace que este
funcione como un modulador.
La evidencia adicional para mantener la distinción entre modulación y excitación

condicionada se basa en los efectos de los procedimientos de extinción. La extinción es un
procedimiento en el cual un estímulo previamente condicionado se presenta repetidamente
pero se omite el EI.
Un estímulo condicionado excitatorio señala la próxima presentación del EI. La ausencia

del EI después de la presentación del EC durante la extinción es una violación de esa
expectativa. Por tanto, el valor como señal del EC tiene que reajustarse en la extinción para
estar en consonancia con la nueva realidad. Un reajuste como este no se requiere en un
procedimiento de extinción de un establecedor de la ocasión
Un establecedor de la ocasión señala una relación entre un EC y un EI. La ausencia del EI

cuando se presenta el establecedor de la ocasión por si solo durante la extinción no
significa que la relación entre el EC y el EI haya cambiado. La información señalada por un
establecedor de la ocasión no se prueba que sea incorrecta mediante la presentación del
modulador por si mismo durante la extinción. En consecuencia, la habilidad del modulador
para promover la respuesta elicitada se reduce si se altera la relación EC-EI señalada por
el modulador.
Otra evidencia que apoya la conclusión de que el establecedor de la ocasión es distinto de la

excitación convencional se ha obtenido en las pruebas de transferencia, estas fueron
llevadas a cabo para determinar si un estímulo que había sido condicionado para establecer
la ocasión de responder a un EC critico particular también incrementaría la respuesta a
orto EC. Se ha obtenido evidencia de transferencia positiva de los efectos de un
modulador a un nuevo EC critico, los efectos de transferencia son mas probables si los
nuevos estímulos críticos han servido previamente como estímulos críticos de otros
estímulos moduladores. Las limitaciones en la transferencia proporcionan evidencia
adicional de que los moduladores tienen sus efectos mediante algún mecanismo distinto de
la excitación convencional.
Modulación frente a condicionamiento configuracional: Los efectos modulatorios
requieren la respuesta al compuesto estimular como constituido por elementos
independientes estimulares, Los investigadores han presentado los elementos uno tras otro
mas que simultáneamente, en lo que se llama compuesto serial. En los ensayos reforzados,
el establecedor de la ocasión es presentado normalmente primero, seguido por el EC crítico
y el reforzamiento. Holland y colaboradores han encontrado que los organismos responden
a las discriminaciones condicionales que incluyen compuestos seriales en términos de

137
Juan Carlos Cabrera
relaciones condicionales. En contraste, la utilización de compuestos simultáneos en la

discriminación condicional a menudo no produce efectos modulatorios.
COMENTARIOS FINALES
El control por el estímulo se refiere al grado de precisión del ajuste de la conducta de un

organismo a las características específicas del ambiente. Por tanto, los temas relacionados
con el control de la conducta por el estímulo son importantes para entender cómo un
organismo interactúan con su ambiente. El control por el estímulo se mide en términos de
apuntamiento de los gradientes de generalización. Un gradiente de generalización acusado
indica que pequeñas variaciones en un estímulo producen grandes diferencias en la
respuesta. Un control por el estímulo más débil se manifiesta en gradientes de
generalización más planos.
El grado de control por el estímulo está determinado por numerosos factores, incluyendo la
capacidad y orientación sensorial del organismo, la prominencia relativa de otras claves en
las situaciones, el tipo de reforzamiento utilizado, y el tipo de respuesta requerida para el
reforzamiento. El control por el estímulo está también en función del aprendizaje. El
entrenamiento en discriminación aumenta el control de la conducta por el estímulo tanto si
incluye estímulos que difieren en varios aspectos como en uno solo. El entrenamiento en
discriminación con estímulos que difieren sólo en una dimensión produce un control por el
estímulo más preciso y puede llevar al resultado contraintuitivo de que el nivel máximo de
respuesta se desplace del estímulo reforzado. Lo opuesto del entrenamiento en
discriminación es el entrenamiento en equivalencia, el cual aumenta la generalización de la
conducta.
No sólo los estímulos discretos sino también las claves contextuales de fondo pueden llegar
a controlar la conducta. El control del estímulo por claves contextuales pueden
desarrollarse aun cuando no se requiera atención a las claves contextuales para optimizar
el reforzamiento. Las claves contextuales pueden llegar a asociarse directamente con el EI
o servir para modular la relación entre un EC discreto y un EI.

138
Juan Carlos Cabrera
TÉRMINOS CLAVE
Facilitación Procedimiento en el que una clave
Aproximación de la clave configuracional Aproxi- designa cuándo otra clave será reforzada.
mación al análisis del control por estímulos También llamado establecimiento de la ocasión.
compuestos que asume que los organismos
responden a un estímulo compuesto como un todo Generalización del estímulo Ocurrencia de una
integral más que a una colección de elementos conducta aprendida a través de habituación o
estimulares separados e independiente. (Compa- condicionamiento en presencia de estímulos que
rése con la aproximación elemental del estímulo) son diferentes de los estímulos utilizados
durante el entrenamiento.
Aproximación elemental del estímulo Aproximación
al análisis del control por los estímulos Gradiente de generalización del estímulo
compuestos que asume que los participantes Gradiente de respuesta que se observa si los
responden a un estímulo compuesto en términos participantes se prueban con estímulos que
de los elementos del estímulo que forman el difieren cada vez más del estímulo que estaba
compuesto. (Compárese con aproximación de la presente durante el entrenamiento. (Véase
clave configuracional.) también gradiente de generalización del estímulo
excitatorio y gradiente de generalización del
Desplazamiento del máximo Desplazamiento de la estímulo inhibitorio.)
tasa más alta de respuesta en un gradiente de
generalización del estímulo desde el E+ en Gradiente de generalización del estímulo
dirección opuesta al E- después del entrenamien- excitatorio Gradiente de respuesta que se
to en discriminación intradimensional. observa cuando se prueba a los organismos con el
E+ de un procedimiento de discriminación y con
Discriminación del estímulo Respuesta diferencial estímulos que difieren cada vez más del E+. El
en presencia de dos o más estímulos. nivel más alto de respuesta sucede con los
estímulos similares al E+; se da progresivamente
Discriminación intradimensional Discriminación menos respuestas a los estímulos que difieren
entre estímulos que difieren sólo en cuanto al cada vez más del E+. Por tanto, el gradiente tiene
valor de una característica del estímulo, como el forma de U invertida.
color, el brillo o el tono.
Gradiente de generalización del estímulo
Equivalencia de estímulos Responder a estímulos inhibitorio Gradiente de respuesta que se
físicamente distintos como si fuesen iguales observa cuando se prueba a loa organismos con el
debido a experiencias comunes previas con los E- de un procedimiento de discriminación y con
estímulos. estímulos que difieren cada vez más del E-. El
nivel más bajo de respuesta sucede con los
Ensombrecimiento Interferencia en el estímulos similares al E-; se da progresivamente
condicionamiento de un estímulo debido a la más respuestas a los estímulos que difieren cada
presencia simultánea de otro estímulo que es más vez más del E-. Por tanto, el gradiente tiene
fácil de condicionar. forma de U.
Establecimiento de la ocasión Lo mismo que Modulador Estimulo que señala la relación entre
facilitación. otros dos sucesos. La naturaleza de una relación
binaria está determinada por el modulador.
Estímulo discriminativo Estímulo que controla la
ejecución de la conducta instrumental porque
señala la disponibilidad (o no disponibilidad) de
reforzamiento.

139
Juan Carlos Cabrera
Procedimiento de discriminación del estímulo (en

condicionamiento clásico) Procedimiento de
condicionamiento clásico en el cual un estímulo (el
EC+) es emparejado con el estímulo incondi-
cionado en algunos ensayos y otros estímulos (el
EC-) se presenta sin el estímulo incondicionado en
otros ensayos. Como resultado de este procedi-
miento, el EC+ llega a elicitar una respuesta
condicionada, y el EC- llega a inhibir esta res-
puestas. (También denominado inhibición diferen-
cial.)
Procedimiento de discriminación del estímulo (en

condicionamiento instrumental) Procedimiento en
el cual el reforzamiento por responder está
disponible siempre y cuando se presente un
estímulo (el E+, o ED) y no está disponible siempre
y cuando se presente otro estímulo (el E- o E∆).
Programa múltiple de reforzamiento Procedimiento

en el cual funcionan diferentes programas de
reforzamiento en presencia de diferentes
estímulos presentados en sucesión. General-
mente, cada estímulo llega a evocar un patrón de
respuesta que se corresponde con el programa
de reforzamiento.
Relación condicional Relación en la que la

significación de un estímulo o suceso depende del
estatus del otro estímulo.

140
Capítulo 9: Extinción de la conducta condicionada
Juan Carlos Cabrera 2009-2010
Efectos de los procedimientos de extinción
Extinción y aprendizaje originales

- Recuperación espontánea
- Renovación del condicionaiento excitatorio original
- Restauración de la ejecución de la extinción.
- Restablecimiento de la excitación condicionada.
- Sensibilidad a a devaluación del reforzador.
¿Qué se pretende en la extinción?

- Asociación E-R inhibitorias
- Efectos “paradójicos”
- Mecanismos del reforzamiento parcial de la extinción
Resistencia a la extinción y momento conductual
Comentarios finales
143

La extinción puede llevarse a cabo sólo después de que haya sido establecida una
respuesta o una asociación utilizando condicionamiento pavloviano o instrumental. El
objetivo es revertir los efectos de la adquisición, pero raramente se alcanza y en la mayoría
resultan imposible. Fenómenos como la recuperación espontánea, la renovación y el
restablecimiento muestran que la extinción no elimina lo que se aprendió de forma original.
Los estudios sobre devaluación del reforzador sugieren que la extinción no tiene
virtualmente ningún impacto sobre las asociaciones E-C o R-C. Parece implicar el nuevo
aprendizaje de una asociación E-R inhibitoria que se superpone a lo que se aprendió con
anterioridad.
La inhibición surge de los efectos de la frustación y esta falta inesperada de

recompensa es responsable de una serie de efectos “paradójicos” de la recompensa,
incluyendo el efecto del reforzamiento parcial en la extinción.
El reforzamiento parcial o intermitente permite a los organismos aprender sobre la

falta de recompensa de manera que les sirva para inmunizarse frente a los efectos de la
extinción, como demuestra los estudios acerca del momento conductual.
La extinción implica la omisión del EI o reforzador. Por tanto, la extinción en el

condicionamiento clásico incluye presentaciones repetidas del estimulo condicionado por sí
solo; la extinción en el condicionamiento instrumental implica no volver a presentar el
reforzador como una consecuencia de la respuesta instrumental. El resultado es que la
respuesta condicionada disminuye. La extinción no es lo contrario de la adquisición.
La extinción se produce por la omisión del EI que sigue a las presentaciones del EC o
la omisión del reforzador que sigue a la respuesta instrumental. El olvido, por el contrario,
es una disminución de la respuesta condicionada que se da por la ausencia prolongada de
experiencia con el estimulo condicionado o con la respuesta instrumental.
La extinción no siempre funciona en la terapia de conducta, los avances sugieren que

los fallos en la extinción reflejan las limitaciones normales de la misma. La extinción no
revierte los efectos de la adquisición, en lugar de ello, implica el aprendizaje de algo nuevo
que se superpone sobre lo que se aprendió antes (sin la perdida de lo que se aprendió
anteriormente).
145

EFECTOS DE LOS PROCEDIMIENTOS DE EXTINCION.(página 253 del libro)
La extinción disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, pero

no altera de otro modo la estructura de la conducta.
Si un organismo está acostumbrado a recibir reforzamiento por una respuesta particular,

puede trastornarse cuando no vuelve a entregar los reforzadores. Las reacción emocional
inducida por la falta de un reforzador esperado se denomina frustación. La ausencia
frustrante de recompensa proporciona energía a la conducta que en ocasiones puede ser lo
suficietemente severa como para implicar reacciones agresivas.
EXTINCION Y APRENDIZAJE ORIGINAL (página 255 del libro)
Aunque la extinción produce importantes efectos conductuales y emocionales, no revierte

los efectos de la adquisición. La evidencia de que la extinción no elimina lo que se aprendió
originalmente se ha obtenido a través de estudios sobre la renovación espontanea, la
renovación, el restablecimiento y los efectos de la devaluación del reforzador.
Recuperación espontanea
La recuperación espontanea tras el condicionamiento pavloviano: La extinción se disipa

con el tiempo, y como consecuencia, la respuesta condicionada original vuelve a presentarse
si el sujeto se pone a prueba tras una demora que siga al procedimiento de extinción.
Recuperación espontanea tras el condicionamiento instrumental: La recuperación

espontánea es un fenómeno notable en la extinción tras el condicionamiento instrumental. La
introducción de un periodo de descanso tras la extinción produce una recuperación
sustancial en la respuesta.
Renovación del condicionamiento excitatorio original
La renovación se refiere a la recuperación de la ejecución propia de la adquisición que se da

cuando se cambian las claves contextuales que estaban presentes durante la extinción. El
cambio puede consistir en una vuelta al contexto de la adquisición original o a un cambio a un
contexto “neutral”.
El efecto de la renovación no sólo se ha observaldo en el condicionamiento pavloviano del

miedo, sino también en el condicionamiento apetitivo del miedo, la inhibición condicionada y
146

en varias situaciones de condicionamiento instrumental. El fenómeno se evidencia no sólo

con claves externas contextuales sino con claves contextuales creadas por estados
provocados por drogas. También puede darse si el sujeto se retira del contexto de
adquisición a uno alternativo que no es el de la adquisición original. Este tipo de renovación
no es tan sólido como cuando se reinstaura en el contexto original de adquisición.
La mayor parte de la evidencia indica que el efecto de renovación se produce porque la

memoria de la extinción es específica de las claves que estaban presentes durante la fase
de extinción. En consecuencia, un cambio en el contexto de la extinción dificulta la
recuperación de la memoria de extinción, con el resultado de que se pierde la ejecución
propia de la extinción.
Bouton (1993,1994) ha sugerido que las claves contextuales sirven para eliminar la
ambigüedad del significado de un estimulo condicionado. Un EC que adquiere
condicionamiento excitatorio y luego se extingue también tiene un significado ambiguo, en el
sentido de que podría indicar la cercanía del EI (adquisición) o su ausencia (extinción). Esta
ambigüedad permite al EC ponerse bajo el control contextual de manera más fácil. Tras el
entrenamiento de adquisición por sí solo, el EC no es ambiguo porque solo significa una cosa
(la proximidad de la entrega del EI). En consecuencia, este EC no es susceptible de control
contextual.
Los investigadores han explorado la forma de reducir el efecto de renovación. Un

procedimiento que se muestra prometedor es llevar a cabo la extinción en distintos
contextos. Otras técnicas para reducir el efecto de renovación implican entrenamiento en
inhibición condicionada, condicionamiento diferencial, y la presentación del EC
explícitamente emparejado con el EI.
Restauración de la ejecución propia de la extinción
El efecto de renovación representa reactivar una conducta aprendida previamente mediante

el cambio del contexto a condiciones más aproximadas a las presentes cuando la conducta
se adquirió con anterioridad. Esta estrategia puede aplicarse a la extinción, es decir, la
ejecución propia de la extinción puede restaurarse introduciendo claves contextuales que
reactiven la memoria de extinción.
La recuperación espontanea implica la recuperación de la conducta condicionada

originalmente que sigue a la extinción si transcurre un periodo suficiente de tiempo tras la
fase de extinción. La conducta propia de la extinción puede restaurarse (contrarrestando la
recuperación espontaneas) presentando las claves que estaban presentes durante la fase de
147

extinción. La recuperación expontánea se debe a un eterioro de las claves contextuales de

la extinción que se da con el paso del tiempo.
Restablecimiento de la excitación condicionada
El restablecimiento se refiere a la recuperación de la respuesta excitatoria a un estimulo

extinguido, producida por exposiciones al estimulo incondicionado. Las respuestas que se
extinguen con éxito, pueden recuperarse si el individuo se enfrenta de nuevo con el estímulo
incondicionado.
Investigaciones durante los últimos 20 años sobre el efecto del restablecimiento, han
indicado que el condicionamiento contextual es importante, pero no porque permita la suma
de la extinción sino por suprimir la ambigüedad del significado de un estimulo que tiene una
historia mezclada de condicionamiento y extinción. El contexto tiene poco efecto en los
estímuos con una historia sólo de condicionamiento.
Bouton considera el restablecimiento como una forma de renovación. Las claves

contextuales condicionadas proporcionan algunas de las claves contextuales para la
respuesta excitatoria en circunstancias normales. Estas se extinguen cuando se presenta el
EC por si solo durante la extinción.
Sensibilidad a la devaluación del reforzador
La persistencia del aprendizaje original a pesar de la extinción puede también investigarse

analizando los efectos de la devaluación del reforzador. Rescorla ha utilizado la técnica de
devaluación del EI para determinar si la asociación EC-EI establecida a través de
condicionamiento pavloviano persiste a lo largo de la extinción.
Los hallazgos han fortalecido la conclusión de que la extinción no elimina las asociaciones -
R-C y E-C que se aprende durante el condicionamiento instrumental.
148

¿QUE SE APRENDE EN LA EXTINCIÓN? (página 266 del libro)
Si como hemos visto la extinción no implica “desaprendizaje” y deja intacta las asociaciones
R-C y E-C, ¿por qué disminuye las respuestas en los procedimientos de extinción?
Asociaciones ER inhibitorias
Los investigadores han vuelto a considerar la relevancia de las asociaciones E-R. En lugar de
centrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, han
llegado a la conclusión de que la falta de reforzamiento produce una asociación E-R
inhibitoria: La falta de reforzamiento de una respuesta en presencia de un estímulo
específico, produce una asociación E-R inhibitoria que sirve para suprimir esa respuesta
siempre y cuando el E esté presente. Esta hipótesis, predice que los efectos de la extinción
serán altamente específicos del contexto en el que la respuesta fue extinguida.
La omisión de una recompensa esperada genera desilusión o frustración. Estos efectos

emocionales se presume que desempeñan un papel crítico en la disminución conductual que se
da en la extinción. La ausencia de recompensa esperada desencadena una reacción frustante
aversiva incondicionada que sirve para que se deje de responder durante el curso de la
extinción mediante el establecimiento de una asociación inhibitoria.
La afirmación de que la extinción implica el aprendizaje de una asociación inhibitoria resulta

controvertida frente a las teorías convencionales que consideraban la inhibición
condicionada y la extinción como fenómenos diferentes.
Efectos paradójicos de la recompensa
Efecto de sobreentrenamiento en la extinción. Cuanto más entrenamiento con

reforzamiento se proporciona más fuerte es la expectativa de recompensa, y más fuerte la
frustración cuando se introduce la extinción. La disminución en la respuesta se debe a los
efectos frustrantes de la ausencia de recompensa, el entrenamiento de reforzamiento más
extenso produce una extinción más rápida. Especialmente evidente cuando el entrenamiento
incluye reforzamiento continuo.
Ejemplo: Podriamos pensar que un entrenamiento más extenso crearía una respuesta “más fuerte”,
que sería más resistente a la extinción, pero sucede lo contrario.
149

Efecto de magnitud del reforzamiento en la extinción: se refiere al hecho de que la

respuesta disminuye más rápido durante la extinción que sigue a un reforzamiento con un
reforzador mayor. Es más evidente cuando el entrenamiento incluye reforzamiento
continuo.
Ejemplo: Si consideramos dos posibiliades: en una, que se recibe 100€ al mes; en la otra, 20€ al mes.
Si se deja de percibir la cantidad, es más aversiva si nos hemos acostumbramos a 100 que a 20.
Efecto del reforzamiento parcial en la extinción: Es el efecto paradójico más estudiado.

Un factor crítico que determina la magnitud de los efectos tanto conductuales como
emocionales de un procedimiento de extinción es el programa de reforzamiento que opera
antes de que se introduzca el procedimiento de extinción. Pero la característica dominante
del programa que determina los efectos de la extinción es si la respuesta instrumental se
reforzó cada vez que ocurría (reforzamiento continuo) o sólo algunas veces (reforzamiento
intermitente o parcial). La extinción es mucho más lenta y produce menos reacciones de
frustración si estaba en activo un programa de reforzamiento parcial antes de la
introducción del procedimiento de extinción. Este fenómeno se denomina el efecto de
reforzamiento parcial en la extinción o ERPE,
Mecanismos del efecto del reforzamiento parcial en la extinción
La explicación más evidente del ERPE es que la introducción de la extinción es más fácil de
detectar tras el reforzamiento continuo que tras el reforzamiento parcial. La ausencia de
reforzamiento es presumiblemente mucho más fácil de detectar tras el reforzamiento
continuo. Esta explicación del efecto del reforzamiento parcial en la extinción se llama
hipótesis de la discriminación.
El reforzamiento parcial parece enseñar a los sujetos a no rendirse ante la ausencia de

reforzador. El reforzamiento parcial favorece la persistencia de dos formas diferentes.
Una explicación seria la teoría de la frustración, basada en que los sujetos aprenden sobre
los efectos emocionales de la ausencia de recompensa durante el entrenamiento en
reforzamiento parcial. La otra explicación, la teoría secuencial, está basada en lo que los
sujetos aprenden sobre la memoria de la ausencia de recompensa.
Teoría de la frustración: Desarrollada por Abram Amsel, la persistencia en la extinción es

resultado del aprendizaje de algo paradójico, es decir, continuar respondiendo cuando se
espera no ser reforzado o ser frustrado. Asume que el reforzamiento intermitente da como
resultado aprender a responder a pesar de esperar la ausencia de reforzamiento. Sin
embargo, este aprendizaje requiere considerable experiencia con reforzamiento
intermitente.
150

El reforzamiento intermitente incluye ensayos reforzados y no reforzados. Lo

recompensados animan a los sujetos a esperar reforzamiento y los no recompensados les
llevan a espera la ausencia de recompensa. Por tanto el reforzamiento intermitente produce
el aprendizaje de expectativas tanto de recompensa como de no recompensa. La
expectativa de recompensa alienta a los sujetos a responder, y la anticipación de la ausencia
de reforzamiento desalienta la respuesta, al principio del entrenamiento los sujetos entran
en conflicto con lo que se ha de hacer. Sus expectativas motivan tendencias de respuesta
opuestas. Sin embargo a medida que el entrenamiento continua, el conflicto se resuelva a
favor de responder.
La resolución del conflicto ocurre debido a que el reforzamiento no es predecible en el

típico programa de reforzamiento parcial. Debido a estas experiencias, la respuesta
instrumental se condiciona a la expectativa de la ausencia de recompensa. De acuerdo con la
teoría de la frustración, esta es la clave de la persistencia en responder durante la
extinción. Con suficiente entrenamiento, el reforzamiento intermitente da como resultado
el aprendizaje de realizar la respuesta instrumental como reacción a la expectativa de
ausencia de recompensa. Por el contrario no existe nada en la experiencia del reforzamiento
continuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. El
reforzamiento continuo no produce persistencia en la extinción.
Teoría secuencial; Capaldi, está formulada en términos de memoria. Asume que los sujetos
pueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasado
reciente. Recuerdan los ensayos recientes tanto recompensados como no recompensados.
Se asume además que durante el entrenamiento en reforzamiento intermitente, la memoria
de la ausencia de recompensa llega a ser una clave para la realización de la respuesta
instrumental, esto produce persistencia en le extinción.
Considerese un ensayo: RNNRRNR. El sujeto es recompensado en el primer ensayo, no

recompensado en los dos siguientes, recompensado dos veces, luego no reforzado y
finalmente recompensado de nuevo. Con suficientes experiencias de este tipo, el sujeto
aprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayo
precedentes. Este aprendizaje provoca la persistencia de la respuesta instrumental en la
extinción.
Desde que la dos teorías fueron propuestas se ha obtenido gran evidencia en apoyo de cada
teoría. Ambas representan dos formas diferentes en las que el reforzamiento parcial puede
influir sobre la respuesta durante la extinción. Los mecanismos de memoria pueden
contribuir en mayor medida cuando los ensayos de entrenamiento no estén separados por
largos intervalos entre ensayos. El aprendizaje emocional descrito por la teoría de la
frustración es menos sensible a los intervalos entre ensayos y, por tanto, proporciona una
mejor explicación del ERPE cuando se utilizan ensayos ampliamente espaciados.
151

RESISTENCIA AL CAMBIO Y MOMENTO CONDUCTUAL

Otra forma de considerar la persistencia de la respuesta en la extinción es que representa

la resistencia al cambio en las contingencias de reforzamiento que sucede cuando se
introduce la extinción. Nevin y colaboradores han estudiado la resistencia al cambio de
forma más general y han propuesto el concepto de momentos conductual para caracterizar
la susceptibilidad de la conducta a las interrupciones. Está basada en el concepto de
momento de la física newtoniana. Predice que la conducta que posee un momento elevado
también será difícil de “parar” o interrumpir por las manipulaciones. Ver ej. Pag 274 libro.
Un experimento en el que participó HCB, una chica de 17 años y una edad mental de 3. Los
resultados obtenidos con HCB ilustran dos conclusiones normales de los estudios de
momento conductual. La primera es que el momento conductual está directamente
relacionado con la tasa de reforzamiento. Una tasa más alta de reforzamiento produce una
conducta que tiene un mayor momento y que es menos susceptible a la interrupción; otro
hallazgo es que el momento conductual no está relacionado con la tasa de respuesta. Dos
conductas que se dan a tasas semejantes no es preciso que tengan grados similares de
momento conductual. Nevin ha destacado la tasa de reforzamiento en lugar de la tasa de
respuesta como el determinante fundamental del momento conductual. Esta conclusión está
confirmada por otros estudios que demuestran que los programas que proporcionan tasas
similares de reforzamiento pero tasa diferentes de respuesta tienen similares momentos o
resistencias al cambio.
La primacía de la tasa de reforzamiento sobre la tasa de respuesta como determinante del

momento conductual ha llevado a Nevin y Grace (2000) a atribuir el momento conductual
principalmente al condicionamiento pavloviano o de asociaciones E-C, aunque la forma exacta
en que estas asociaciones promueven el momento conductual no se han averiguado todavía.
El reto principal a la proposición básica de que el momento conductual está directamente

relacionado con la tasa de reforzamiento es el efecto ERPE, este es un caso en que la
resistencia a la extinción es mayor después de una baja tasa o probabilidad de
reforzamiento. Nevin y Grace han sugerido que el ERPE puede explicarse asumiendo que la
extinción es menos discriminable tras el reforzamiento intermitente que tras el continuo
152

Comentarios finales (página 276 del libro)
Los estudios sobre extinción ilustran la naturaleza duradera de ciertos temas en la teoría
de la conducta. Los primeros estudios sobre la extinción se centraron en los efectos del
reforzamiento parcial enla extinción y otros efectos “paradójicos” de la recompensa, y se
llevaron a cabo dentro de la tradición hulliana que daba preeminencia al aprendizaje E-R.
Los mecanismos E-R cayeron en desuso con la creciente evidencia de que el
condicionamiento pavloviano y el intrumental involucraban asociaciones E-C y R-C, que
estaban controladas o moduladas por claves contextuales. Estas evidencias fueron parte de
la “revolución cognitiva” que se introdujo en la psicología en el último cuarto de siglo XX.
Ésta proporcionó una mejor compresión de la recuperación espontánea y llevó al
descubrimiento de nuevos fenómenos como la renovación y el restablecimiento. Sin
embargo, estos fenómenos representas los fallos de la extinción más que la exticnión en sí
misma. Como se ha descrito, la compresión de la extinción en sí misma ha requerido la
vuelta a los conceptos E-R, esta vez en forma de asociaciones E-R inhibitorias. Los
investigadores sigun interesados en qué es lo que hace que conducta sea resistente al
cambio. Esta resistencia o momento conductual plantea especiales desafíos para la terapia
de conducta.
153

Terminos Clave (página 277 del libro)
Efecto de la magnitud del reforzamiento en la Momento conductual Susceptibilidad de la respues-

extinción Persistencia menor de la conducta ta a la interrupción mediante manipulaciones como
instrumental en la extinción que sigue al la alimentación presión, la disponibilidad libre de
entrenamiento con un reforzador de gran comida, o el cambio en el programa de
magnitud que en la que sigue al entrenamiento con reforzamiento.
un reforzador pequeño o moderado.
Olvido Reducción de la respuesta aprendida que
Efecto de reforzamiento parcial en la extinción ocurre por el paso del tiempo, no debido a
Término utilizado para describir una persistencia experiencias particulares.
mayor de la respuesta instrumental en la
extinción posterior a un entrenamiento de Reforzamiento continuo Programa de reforzamiento
reforzamiento parcial (intermitente) que en la en el que cada ocurrencia de la respuesta intru-
extinción posterior a un entrenamiento de mental produce el reforzador. Abreviado RFC.
reforzamiento continuo. Abreviado ERPE.
Reforzamiento intermitenta Un programa de
Efecto de sobreentrenamieno en la extición reforzamiento en el que sólo algunas de las
Persistencia menor de la conducta instrumental ocurrencias de la respuesta instrumental se
en la que la extinción que sigue a un refuerzan. La respuesta intrumental se refuerza
entrenamiento extenso con reforzamiento ocasionalmente, o intermitentemente. También
(sobrentrenamiento) que en la que sigue a un denominado reforzamiento parcial.
entrenamiento con niveles de reforzamiento
moderados. Restablecimiento Recuperación de la respuesta
excitatoria a un estímulo extinguido producida
Extinción (en el condicionamiento clásico) Reducción por la exposiciones al estímulo incondicionado.
de la respuesta aprendida que ocurre debido a
que el estímulo condicionado no se vulve a Renovación Recuperación de la respuesta
emparejar con el estímulo condicionado. También, excitatoria a un estímulo extinguido producida
el procedimiento de presentar repetidamente un por la retirada de las claves contextuales que
estímulo condicionado sin el estímulo incondi- estaban presentes durante la extinción.
cionado.
Teoría de la frustración Teoría del efecto del
Extinción (en el condicionamiento intrumental) reforzamiento parcial en la extinción, de acuerdo
Reducción de la respuesta instrumental que con la cual la extinción se retarda tras le
ocurre porque la respuesta no vuelve a ir seguida reforzamiento parcial porque la resuesta instru-
de un reforzador. También, el procedimiento de mental se condiciona a la anticipación de la ausen-
no volver a reforzar la respuesta instrumental. cia frustante de recompensa.
Frustración Respuesta emocional aversiva que es Teoría secuencial Teoría del efecto de reforza-
resultado de la ausencia inesperada de reforzamiento parcial en la extinción, de acuerdo con la
miento. que la extinción se retarda tras el reforzamiento
parcial porque la respuesta intrumental se condi-
Hipótesis de la discriminación Explicación del ciona a la memoria de ausencia de rescompensa.
efecto de reforzamiento parcial en la extinción,
de acuerdo con la que la extinción es más lenta
tras el reforzamiento parcial que tras el reforza-
miento continuo, porque el principio de la extin-
ción es más difícil de detectar cuando sigue el
reforzamiento parcial.
154

Principios de Aprendizaje y Conducta PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Principios de Aprendizaje y Conducta PDF

Uploaded by

Copyright:

Available Formats

PSICOLOGIA

Juan Carlos Cabrera Valderrama

Descargado del campus, http://campus.felizmente.info

El amanecer de la nueva era

Aspectos metodológicos del estudio del aprendizaje

Uso de animales no humanos en la investigación sobre aprendizaje

Descargado del campus, http://campus.felizmente.info

Las aproximaciones teóricas al estudio del aprendizaje tienen

Mundo físico (causa Órganos

Descargado del campus, http://campus.felizmente.info

El dualismo mente-cuerpo introducido por Descartes dio lugar a dos tradiciones

Desarrollo histórico del estudio de la mente.

En cuanto al contenido de la mente.

Descartes creía que la mente contenía ideas innatas independientemente de la experiencia

Otros filósofos posteriores a Descartes se enfrentaron a la postura nativista, como John

En cuanto a cómo funciona.

Descargado del campus, http://campus.felizmente.info

• Primarias: formuladas por Aristoteles que propuso tres principios,

• Secundarias: varios filósofos formularon leyes de asociación secundarias, entre

La investigación empírica de los mecanismos de asociación no comenzaría hasta el siglo XIX,

- la fuerza de las asociaciones mejoraba con el entrenamiento.

Descargado del campus, http://campus.felizmente.info

Desarrollo histórico del estudio de los reflejos.

Al formular el concepto de reflejo, Descartes hizo una gran contribución a la compresión de

Hasta el s.XIX I.M. Sechenov (1829-1905) propuso que

Sechenov no tomó en consideración que la conducta de

Descargado del campus, http://campus.felizmente.info

Pavlov demostró experimentalmente que no todos los reflejos

El análisis de tipo asociativo continua jugando un importante

El Amanecer De Una Nueva Era

Los estudios experimentales sobre los principios básicos de aprendizaje se realizan

La cognición comparada y la evolución de la inteligencia.

Surge como consecuencia de los escritos de Charles Darwin

Descargado del campus, http://campus.felizmente.info

Darwin recopiló evidencias anecdóticas de formas de comportamiento inteligente en

El psicólogo del comportamiento es como un conductor que trata de descubrir el

Descargado del campus, http://campus.felizmente.info

Modelos animales de la conducta humana.

La realización de inferencias sobre el comportamiento humano partiendo de investigaciones

La utilización de animales como modelo es una herramienta cientifica básica y potente.

Modelos animales y robótica.

Los modelos animales de aprendizaje y conducta también revisten cierta importancia en

Descargado del campus, http://campus.felizmente.info

No hay una definición de aprendizaje universalmente aceptada. Sien embargo, muchos

El aprendizaje es un cambio duradero en los mecanismos de conducta que implica

La distinción entre aprendizaje y ejecución.

Siempre que contemplamos evidencia de aprendizaje, observamos la aparición de un cambio

La ejecución se refiere a las acciones de un organismo en un momento concreto. La

El aprendizaje y otras fuentes de cambio conductual.

La fatiga o cansancio , entre otros, es un mecanismo que da lugar a cambios de conducta

Un cambio en las condiciones estimulares también puede alterar la conducta temporalmente

En algunos casos, pueden aparecer cambios persistentes en la conducta sin necesidad de la

Descargado del campus, http://campus.felizmente.info

Diferentes tipos de mecanismos causales.

Las causas pueden ser conceptualizadas de diversas formas o a diferentes niveles de

Primero , causa eficiente, hace referencia a las condiciones necesarias y suficientes

Aspectos Metodológicos Del Estudio del Aprendizaje.

La investigación sobre los procesos de aprendizaje se caracteriza por dos rasgos

El aprendizaje como ciencia experimental.

En el estudio del aprendizaje, lo que nos interesa es la conducta de organismos vivos, en

Descargado del campus, http://campus.felizmente.info

estudiado es manipular experimentalmente la presencia y la ausencia de dicha exposición.

La perspectiva de proceso general en el estudio del aprendizaje.