Professional Documents
Culture Documents
PRINCIPIOS DE
APRENDIZAJE Y CONDUCTA
Antecedentes históricos
- Desarrollo histórico del estudio de la mente.
- Desarrollo histórico del estudio de los reflejos.
Definición de aprendizaje:
- La distinción entre aprendizaje y ejecución.
- El aprendizaje y otras fuentes de cambion conductual.
- Diferentes tipos de mecanismos causales.
Antecedentes Históricos
Glándula
Cerebro pineal Mente
(causa de la
Acción acción
voluntaria Músculos
voluntaria)
o involuntaria
Diagrama de dualismo cartesiano. Los órganos sensoriales detectan los eventos del mundo físico. Desde aquí la
información se trasmite al cerebro. El cerebro está conectado a la mente por medio de la Glándula pineal. La acción
involuntaria se realiza por un arco reflejo que envía mensajes en primer lugar a los órganos sensoriales al cerebro y
después del cerebro a los músculos. La acción voluntaria se inicia en la mente, que envía mensajes al cerebro y después a
los músculos.
Descartes asume que los estímulos del ambiente externo son la causa de toda conducta
involuntaria. Estos estimulos producen respuestas involuntarias por medio de un circuito
neuronal que incluye al cerebro. Sin embargo, creía que los mismos nervios transmitían la
información de los órganos de los sentidos al cerebro y del cerebro a los músculos. Este
circuito permitía reacciones rápidas a estímulos exteros ( ejemplo: retirar rápidamente un
dedo del fogón caliente).
Descartes creía que los animales carecían del libre albedrío y eran incapaces de acciones
voluntarias y conscientes, frente a los seres humanos que se les atribuía una mente o alma.
La mente como una entidad inmaterial, se conectaba al cuerpo a traves de la glándula pineal,
cerca del cerebro, por lo que podía tener conciencia de la conducta involuntaria e iniciar las
acciones voluntarias. Dado que la conducta voluntaria se iniciaba en la mente, ésta podía
tener lugar independientemente de la estimulación externa.
Los filósofos preocupados por la mente estaban interesados en descubrir qué era la mente
y cómo funcionaba. Preguntas similares se plantean los psicólogos cognitivos actuales.
Descartes creia en una mente impredecible y desordenada sin ninguna regla estricta o leyes
que pudieran identificar. Mientras que el filósofo Thomas Hobbes ( 1588-1679) fue pionero
en proponer que al igual que los reflejos, la mente operaba de forma predecible y conforme
a leyes. En concreto propuso la conducta voluntaria estaba gobernada por el principio del
hedonismo (las personas tratan de lograr el placer y de evitar el dolor).
Los empiristas británicos propusieron que las sensaciones simples se combinan hasta formar
ideas complejas por medio de asociaciones. Al oir la palabra coche cuando hemos visto un
coche, se establece asociación con estos atributos de los coches, de manera que esta
palabra volverá a activar los recuerdos de los aspectos del coche que hemos experimentado
cuando vuelva a oirla. Los empiristas británicos consideraban que tales asociaciones
constituían los ladrillos de la actividad mental y dedicaran un considerable esfuerzo en
detallar las Leyes de asociación.
Leyes de asociación. Los empiristas británicos aceptaron dos conjuntos de leyes para el
establecimiento de asociaciones:
Charles Bell (1774-1842) y François Magaendie (1783-1855) mostraron que eran fibras
nerviosas distintas las encargadas de transmitir la información sensorial desde los organos
sensoriales a SNC (sistema nervioso central) y la información motora, del SNC a los
músculos.
John Swanmmerdan (1637-1680) en 1669 mostró que el influjo de espiritus animales desde
la glándula pineal resultaba innecesario y Francis Glisson (1597-1677) demostró que las
contracciones musculares no se debían a que los músculos se hincharan por un gas.
Descartes y la mayor parte de los filósofos posteriores asumieron que los reflejos eran
responsables únicamente de reacciones sencillas a estímulos externos. Se suponía que un
estimulo mayor corresponde a una respuesta más vigorosa. Por ejemplo, si tocamos un
fogón, cuanto mayor sea el calor más rápido se retira la mano.
de su vida, sino que se veia alterada por la experiencia. Desde tiempos de Descartes se
consideró las respuestas reflejas como innatas y fijadas de antemano por las conexiones del
sistema nervioso y por tanto un estímulo dado elicitaría la misma respuesta a lo largo de
toda la vida del individuo.
George Romanes en su libro inteligencia animal de 1882, sugirió que la inteligencia podría
identificarse determinando si un animal aprende "a hacer nuevos ajustes, o a modificar los
antiguos, de acuerdo con los resultados de su propia experiencia individual". La definió como
la capacidad de aprender.
Neurología Funcional.
De acuerdo con el principio del nervismo, las principales funciones fisiológicas están
gobernadas por el sistema nervioso (SN). Ivan Pavlov dedicó su vida a investigarlo y gran
parte a la identificación de los mecanismos neurales de la digestión. El descubrimiento por
parte de los britanicos Bayliss y Starling evidenciando el control parcial del páncreas por
factores hormonal y no por factores neurales, hizo que abandonara el estudio de la
fisiología del sistema digestivo para investigar los reflejos condicionados. La afirmación de
Pavlov según la cual los estudios de aprendizaje revelan cómo opera el sistema nervioso es
ampliamente aceptada por los neurocientíficos contemporaneos. Kandel, por ejemplo, ha
comentado que "el principio central de las modernas neurociencias es que todo
comportamiento es un reflejo del funcionamiento del cerebro".
Dollard y Miller fueron partidarios de una integración en la que los estudios de laboratorio
realizados con animales no humanos se usaran para aislar e identificar los fenómenos que
podrían posteriormente ser estudiados con éxito en personas. La investigación con animales
permite también aumentar nuestra confianza en los datos obtenidos con humanos mediante
métodos de investigación menos rigurosos.
Definición De Aprendizaje.
10
Los cientificos de orientación biológica a menudo establecen una distinción entre las causas
próximas o inmediatas del comportamiento y sus causas últimas. Las causas próximas se
corresponden con las causas eficientes y materiales de Aristóteles. Las causas últimas se
corresponden con las causas finales.
De los cuatro tipos de causas, los investigadores del aprendizaje han centrado su atención
en las causas eficiente, materiales y formales. Independientemente del tipo de causa, este
énfasis prescribe que las investigaciones de aprendizaje utilicen una metodología
experimental. Las causas no pueden observarse directamente. Tan sólo pueden ser inferidas
a partir de los resultados de las manipulaciones experimentales.
11
El presupuesto según el cual las leyes "universales" de la asociación son las responsables de
los fenómenos de aprendizaje no excluye que los animales puedan aprender sobre multitud
de estímulos, respuestas o que cada especie tenga un ritmo de aprendizaje diferente. Se
asume que la generalidad se sitúa en los principios o procesos de aprendizaje; no en el
contenido o en la velociad del mismo. El trabajo del psicólogo del aprendizaje es descubrir
esas leyes universales.
12
Gran parte de los experimentos se han realizado con animales no humanos por razones
tanto teóricas como metodológicas.
13
Obtener información sobre las bases evolutivas y biológicas del aprendizaje, o cómo
evoluciona la cognición y la inteligencia requieren el apoyo o la utilización de animales de
investigación.
Igualmente el conocimiento de las bases biológicas del aprendizaje necesitan el apoyo de los
animales de laboratorio para desenmarañar cómo aprende y recuerda el sistema nervioso.
Los estudios conductuales de aprendizaje realizados con animales son un requisito necesario
para cualquier intento de investigar las bases biológicas del aprendizaje con animales. La
neurociencia tiene que fundamentarse en la ciencia del comportamiento.
Parece errónea la idea de alguno cuando sugieren que la endogamia y los largos periodos de
cautiverio de los animales domesticados de laboratorio pueden influir en la conducta normal
de estos. De hecho, los animales de laboratorio (ratas) pueden ser preferibles con fines de
investigación a sus equivalentes salvajes ya que viven en un medio tan "artificial" como el del
humano.
14
Algunos experimentos conllevan alguna incomodidad, sin embargo, se realizan todos los
esfuerzos necesarios para minimizarlos.
¿Qué es un trato "humano" a los animales? Asumiendo que una especie merece el trato
que establezcan las normas oficiales. A menudo se describe como "trato humano" al
tratamiento que se considera apropiado para los animales de laboratorio.
¿Deben los seres humanos beneficiarse del uso de otros animales? La relación es
simbiótica más que unilateral y de explotación. Además, el uso de animales de laboratorio en
la investigación representa tan sólo una pequeña parte del uso que otros humanos hacen de
los animales domésticos, incluyendo su uso como fuente de alimentación.
Pollos 7.764.200.000
Gallinas ponedoras 303.604.000
Pavos 301.251.000
Ganado vacuno 59.801.000
Cerdos 104.301.000
Ovejas y corderos 6.691.000
TOTAL AVICULTURA Y GANADERÍA 8.539.848.000
Perros 75.429
Gatos 26.091
Primates 56.381
Caballos 217.079
Conejos 309.322
Animales de granja 159.742
Ratas y ratones 7.452.186
Otros 150.987
TOTAL INVESTIGACIÓN 8.452.186
*Datos de 1997 de EEUU.
Porcentaje del total empleado en investigación = 0.099%
15
TERMINOS CLAVE
Aprendizaje Cambio duradero en los mecanismos de Hedonismo Postura filosófica propuesta por Hobbes
conducta que implica estímulos y/o respuestas según la cual las acciones de un organismo están
específicos y que es resultado de la experiencia enteramente determinadas por la persecución del
previa con esos estímulos y respuestas o con otros placer y la evitación del dolor.
similares.
Maduración Cambio en la conducta causado por el
Asociación Conexión entre la representación mental desarrollo físico o fisiológico del organismo en
de dos eventos (dos estímulos o un estímulo y una ausencia de experiencia con eventos particulares
respuesta) de forma que la ocurrencia de uno de del ambiente.
los eventos activa la representación del otro.
Innatismo Postura filosófica según la cual los seres
Dualismo Visión de la conducta según la cual las humanos nacen con ideas innatas.
acciones pueden dividirse en dos categorías:
conducta voluntaria controlada por la mente y Nervismo Postura filosófica adoptada por Pavlov
conducta involuntaria controlada por mecanismos según la cual todos los procesos conductuales y
reflejos. fisiológicos están regulados por el sistema
nervioso.
Ejecución Actividades de un organismo en un
momento particular. Reflejo Mecanismo que permite que un evento
específico del ambiente elicite una respuesta
Empirismo Corriente filosófica según la cual todas las específica.
ideas de la mente tienen su origen en la
experiencia. Sílaba sin sentido Combinación de tres letras (dos
consonantes y una vocal) sin significado.
16
17
Todos los animales reaccionan a los eventos que tienen lugar en su entorno. Gran parte de la
conducta tiene lugar como respuesta a los estímulos; es decir, ocurre de forma elicitada.
El concepto de reflejo.
Organización neuronal de los reflejos simples. Los estímulos del entorno activan una neurona sensorial,
que trasmite el mensaje sensorial a la médula espinal. En este lugar, el impulso neuronal pasa a una
interneurona, que a su vez dirige el impulso hacia una neurona motora. La neurona motora activa al musculo
involucrado en el movimiento.
Los circuitos neuronales están dispuestos de tal modo que determinadas neuronas
sensoriales se conectan al conjunto correspondiente de neurnas motoras, por lo que una
19
Hay respuetas simples comunes en muchas especies, por el contrario, existen otras
especificas de la propia especie. Por ejemplo, la respuesta de succión provocada por objetos
situados cerca de la boca es un rasgo característico de los mamíferos.
A las secuencias de respuestas típicas de especies particulares, tales como las que aparecen
en la alimentación de crías, se las denomina pautas de acción modal o PAMs.
Los rasgos especificos que se requieren para elicitar la conducta reciben colectivamente el
nombre de estímulo señal o estímulo desencadenante.
20
Las conductas nunca aparecen aisladas sino que forman secuencias. Distinguimos dos tipos:
1.- Modo de búsqueda general. Son conductas apetitivas. El sujeto no sabe dónde
buscar comida. Por ejemplo, la ardilla busca un nogal.
Descartes pensaba que una respuesta simple elicitada ocurre automáticamente de la misma
forma que se presenta el estímulo elicitada. Cada aparición del estímulo elicitante producirá
la misma acción refleja. Esto no es así, dado que a menudo aparecen alteraciones en la
naturaleza de la conducta elicitada simplemente como resultado de la presentación repetida
del estímulo elicitante.
21
Los bebés humanos tienen que aprender muchas cosas sobre el mundo, y una forma es
observar el entorno. Las claves visuales elicitan una respuesta de observación, que puede
medirse por el tiempo que los bebés mantienen sus ojos en un objeto antes de mirar a otra
parte.
En un estudio sobre atención visual se tomaron dos grupos de bebés de cuatro meses y se
les presentaron diferentes estímulos visuales. Los dos patrones similares a tableros de
ajedrez; uno de 4x4 y el otro de 12x12. Se presentaron durante 10s., ocho veces en
intervalos de 10s.
Los resultados muestran que la atención visual provocada por un estímulo novedoso cambia a
medida que el bebé se familiariza con el estímulo. Con el patron 4x4 relativamente sencillo,
la atención visual se reduce progresivamente. Con el patrón 12x12 más complejo, la atención
se incrementó en el segundo ensayo, pero después se redujo también.
El sabor de la comida elicita la salivación como respuesta refleja. Esto puede observarse
tan claramene en las personas como en los perros de Pavlov.
Las personas encuentran el sabor de una comida específica menos placentera cuanto más
comen. Sin embargo, el sabor de una comida distinta es suficiente para restablecer la
valoración hedónica de una comida familiar. Estos hallazgos , del experimento realizado por
Epstein, Rodefer, Wisniewski y Caggiula, 1992, suguieren que sobrealimentación puede
reducirse no variando la alimentación disponible para su consumo.
22
Davis (1974) estudió la respuesta de sobresalto en dos grupos de ratas. A cada grupo, en un
ambiente con un sonido suave de 60dB y al otro, algo más fuerte, con 80dB. Ambos grupos
recibieron 100 presentaciones de un tono de 4000 cps en intervalos de 30 segundos. Los
resultados fueron una reacción de sobresalto cada vez más débil para el grupo expuesto a
ambiente 60dB y reacciones de sobresalto cada vez más vigorosas para el grupo expuesto a
ambiente 80dB.
23
En los estudios sobre habituación, la adaptación sensorial puede descartarse ya que existe
evidencia de que la habituación es específica de la respuesta.
La fatiga también puede descartarse como causa de la habituación por medio de evidencias
que muestra que la habituación es específica del estímulo.
2. No sucede en el sistema nervioso central, como la 2. Sin embargo, la fatiga no sucede en el sistema nervioso,
habituación, sino en los órganos sensoriales. No es por no es aprendizaje, sino en los músculos que ejecutarían
tanto una forma de aprendizaje. la respuesta. Un brazo cansado no puede ejecutar la
respuesta.
3. No es específica de la respuesta. Si los órganos
sensoriales están afectados, todas las respuestas 3. La fatiga no es específica del estimulo, como sí lo es
disminuirán porque los estímulos no son bien captados por la Habituación. En el caso de la Habituación, un cambio en
los sentidos. Por el contrario, en la habituación, sólo el estímulo devuelve la respuesta normal. Sin embargo, un
desciende una respuesta, otras respuestas diferentes músculo fatigado no puede volver a ejecutar la respuesta
pueden ser ejecutadas con normalidad. por haber cambiado el estímulo presentado.
4. Es un tipo de efecto muy transitorio. 4. Igualmente es un cambio muy transitorio: sólo hace
falta descansar un rato.
24
La teoría del proceso dual presupone que los incrementos y disminuciones en la tendencia a
responder a un estímulo son producto de procesos neuronales diferentes: Proceso de
habituación, rovoca una disminución de la tendencia a responder y proceso de
sensibilización, produce un incremento en la tendencia a responder. Estos procesos no son
exlcuyentes y ambos pueden estar activos al mismo tiempo. El resultado conductual depende
de qué proceso sea más fuerte.
Los dos procesos (habituación y sensibilización) tienen lugar en distintas partes del SN.
El proceso de habituación tiene lugar en el sistema E-R (similar al arco reflejo). Cada presentación de un estímulo activa
el sistema E-R aumentando la habituación.
El proceso de sensibilización tiene lugar en el sistema de estado (determina la tendencia a responder). Sólo se activa ante
la presentación repetida de estímulos excitadores (por tanto, no está activo todo el tiempo). Se puede modificar esa
tendencia mediante drogas o estados emocionales ( ej: el miedo).
La conducta observada será el resultado de la combinación de los dos procesos, por lo tanto depende de cuál de los dos sea
más fuerte en un momento dado.
25
activó, no sólo el sistema E-R, sino también el sistema estado. Produjo un incremento en la
atención visual después del primera presentación. Sin embargo, el proceso de sensibilización
no fue lo suficientemente fuerte para contrarestar completamente los efectos de la
habituación. Como resultado, despues de varios ensayos, la atención visual tambien declino
en respuesta al estimulo 12x12.
El resultado contrario tubo lugar cuando fueron puestos en presencia de los 80 dB.
Sucesivas presentaciones del tono aparecieron reacciones de sobresalto más enérgicas.
Dado que en ambos grupos se utilizó el mismo tono, la diferencia en los resultados no puede
ser atribuida al mismo. Debemos asumir que en el segundo grupo, el ruido ambiente intenso
incrementó el nivel de activación o la tendencia a respuesta. Esta sensibilización del sistema
de estado fue la causa del incremento en la reacción de sobresalto al tono en el segundo
grupo.
Implicaciones de la teoría del proceso dual. El sistema E-R se activa siempre que un
estímulo elicita una respuesta, mientras que el sistema de estado sólo interviene en
circunstancias especiales.
Curso temporal.
Por lo general duran poco tiempo, lo suficiente para ser considerarlos formas de
aprendizaje.
26
La sensibilización no es específica del estímulo.Si una animal se sensibiliza por alguna razón,
su reactividad se incrementá para toda una variedad de estímulos.
- Sensibilización: No específica del estímulo. Cuando el animal se sensibiliza (por estados de alerta, miedo, ingestión de
drogas), está hipersensible para casi cualquier estímulo que vaya a presentarse.
27
• Las reacciones emocionales cambian con la experiencia. La reacción primaria se hace más
débil y su postefecto se hace más fuerte. La habituación de la
Tolerancia a las drogas: primera reacción a la droga se llama tolerancia a la droga, lo que
habituación a la emoción
primaria que producen. hace referencia a la disminución en la efectividad a una droga con
las exposiciones repetidas.
28
La teoría del proceso oponente de la motivación se diseño para explicar estos tres rasgos
característicos de las reacciones emocionales:
1. Las reacciones emocinales son bifásicas; a una reacción primaria sigue un postefecto
opuesto.
2. La reacción primaria se debilita con la estimulación repetida.
3. El debilitamiento de la reaccion primaria va acompañado por un fortalecimiento del
postefecto.
Esta teoría asume que hay que mantener el equilibro (homeostasis) emocional. Toda emoción primaria, activa un proceso
oponente de signo contrario para compensarla.
El porceso oponente empieza siendo más débil que el proceso primario (ejemplo, felicidad) pero también aumenta de
fuerza más rápido que el proceso primario. Por lo tanto, con la estimulación repetida, el proceso oponente se va haciendo
más fuerte que el proceso primario ( la tristeza gana a la felicidad). Esto sería Habituación..
29
Valoración general de la teoría del proceso oponente. La teoría del proceso oponente
resultó muy atractiva cuando se presentó, ya que abarca un amplio rango de situaciones y
proporciona una interesante explicación de la tolerancia a las drogas, así como la
dependencia y la adicción. Aún está pendiente de probar de forma empírica muchas de sus
predicciones en varias situaciones.
30
Las drogas ( en general, toda sustancia psicoactiva) activan un proceso primario positivo (euforía, "colocón") y también un
proceso oponente negativo ("bajón", resaca, "mono") que le sigue después.
Con la estimulación repetida, se va haciendo más fuerte el proceso oponente (habituación=tolerancia a la droga). El
usuario de la droga que ha desarrollado tolerancia siente los efectos positivos cada vez menos, y los efectos negativos
cada vez más.
A veces, el bajon (proceso oponente) puede durar mucho tiempo y ser inaguantable (eso es "pasar el mono"). Una manera de
reducir su duración es volver a tomar la droga para reiniciar el proceso primario. Así se explica la adicción. El adicto
no acude a la droga por sus efectos positivos, sino para detener los efectos negativos... por un tiempo.
Responder para escapar de la molestia producida por la retirada de un estímulo es sólo uno
de los tipos de conducta motivada a dirigir a metas. Un objeto meta gratificante recibe el
nombre técnico de reforzador. Las situaciones en la que los organismos responden
repetidamente para obtener un reforzador muestran muchas de las propiedades comunes
de la habituación y la sensibilización.
Ejemplo: El acto de encender un lector de disco ppara escuchar una canción particular. Es
menos problable que encedndamos el lectos si el resultado es siempre la misma canción
(habituación), pero esta pérdida de interés es especifica de esa canción repetida
(especificidad del estímulo). Además, recuperaremos nuestro interes en la canción origianl
si no la escuchamos durante unos días ( recuperación espontánea). Nuestro interés por la
canción conocida tambien puede establecerse por la exposición a estímulos novedosos, tales
como la excitación de encontrarnos con un amigo (sensibilización)
31
TERMINOS CLAVE
Adaptación sensorial Reducción temporal en la Estímulo supranormal Estímulo señal artificial-mente
sensibilidad de los órganos sensoriales provocada agrandado o exagerado que elicita una respuesta
por la estimulación repetida o excesiva. inusualmente vigorosa.
Conducta apetitiva Conducta que tiene lugar al Interneural Neurona de la médula espinal situada
principio de una secuencia natual de conducta y entre la neurona aferente (sensorial) y la
que sirve para poner al organismo en contacto neurona eferente (motora) en el arco reflejo.
con un estímulo desencadenante. (Véase también
modo de búsqueda general y modo de búsqueda Modo de búsqueda focalizada Segundo componente
focalizada.) de la secuencia de conducta de alimentación, tras
la búsqueda general, en el que el organismo pone
Concucta consumatoria Conducta que lleva a en marcha una conducta centada en la
consumar o completar una secuencia natural de localización de un estímulo particular que indica
conducta. La respusta consumatorias son, por lo la presencia de alimento. La búsqueda focalizada
general, patrones de acción modal específicos de es una forma de conducta apetitiva más
la especie. (Véase también modo de manipulación directamente relacionada con el alimento que la
del alimento.) busqueda general.
Estímulo señal Rasgo específico de un objeto o Neurona eferente Neurona que transmite los
animal que elicita una pauta de acción modal en impulsos a los músculos. También llamada
otros organismos. También llamado estímulo neurona motora.
desencadenante.
Neurona motora Lo mismo que neurona eferente.
32
33
Situaciones experimentales
- Condicionamiento del miedo.
- Condicionamiento del parpadeo.
- Seguimiento del signo.
- Aprendizaje de aversión al sabor.
35
El condicionamiento clásico es el mecanismo más simple por el cual los organismos pueden
aprender acerca de las relaciones entre estímulos y cambiar su conducta en conformidad
con la misma. Permite a los seres humanos y a los demás animales aprovecharse de la
secuencia ordenada de eventos de su ambiente y aprender qué estímulos tienden a ir con
qué evento.
Comenzaron con el trabajo del fisiólogo ruso Ivan P. Pavlov. Los descubrimientos de Edwin
B. Twitmyer sobre el condicionamiento clásico, que realizó en su tesis doctoral, en el que no
investigó sistemáticamente las implicaciones y sus hallazgos no despertaron gran atención.
Como una estensión más de los estudios que Pavlov realizó sobre la digestión, su equipo
ténico descubrió que los perro secretaban jugos gástricos en respuesta de la mera visión de
la comida o la persona que normalmente se las suministraba. Sus técnicos del laboratorio lo
llamaban "secreciones psíqicas" .
Los primeros estudios sistemáticos sobre el condicionamiento clásico fueron realizados por
S. G. Vul'fson y A. T. Snarskii en el laboratorio de Pavlov.
Vul'fson estudió la respuesta salival de los perros con productos naturales. Después de que
los perros hubieran experimentado la sensación provocada por estas sustancias en sus
bocas, la mera visión de la misma era suficiente para provocar salivación.
37
38
La respuesta de miedo de las ratas es quedarse quietas, así se utiliza una técnica popular de
medida indirecta del miedo condicionado como es el procedimiento de respuesta emocional
condicionada o supresión condicionada (REC) diseñada por Estes y Skinner (1941). Consiste
en primero enseñar al sujeto (rata) a presionar una barra varias veces para obtener
alimento como recompensa de forma regular. Después comienza la segunda fase que
consiste en presentar un EC (un tono) durante 1 o 2 minutos e inmediatamente aplicarle una
breve exposición a la descarga. Espaciando los ensayos entre 15 o 20 minutos.
La supresión condicionada puede ser completa, de modo que las ratas no presionen en
absoluto la barra, en 3 o 5 ensayo de condicionamiento. Sin embargo, la supresión es
específica de del EC y cuando desaparece, los animales vuelven rápidamente a su conducta
para obtener comida.
La razón de supresión adopta un valor 0 si la rata deja de presionar la palanca completamente durante el EC, ya que el
numerador de la fórmula es 0. En el otro extremo, si la rata no altera su ritmo de presiones en absoluto cuando se presenta el
EC, la razón tiene un valor de 0,5.
39
40
41
cerebeloso donde la convergencia de actividades produce una modificación sináptica que altera la salida neuronal del cerebelo.
Básicamente, las fibras ascendentes actuan como “maestras”, seleccionando un subconjunto de conexiones para su
modificación. Este cambio definelas propiedades del estímulo (las características del EC) que serán responsables de una salida
motora concreta. Esta salida está mediada por neuronas que se proyectan desde el núcleo interpositus al núcleo rojo, y
finalmente, al núcleo craneal motor.
A medida que se va adquiriendo la respuesta condicionada, la actividad condicionada se desarrolla en el núcleo interpositus. Las
neuronas de dicho núcleo se proyectan hacia atrás hasta el circuito del EI e inhiben la señal del mismo en la oliva inferior. Esto
proporciona una retroalimentación negativa que reduce la efectividad del EI. Muchos investigadores creen que fenómeno como
el bloqueo o el ensombrecimiento tienen lugar porque un EI previsto es menos eficaz. En el paradigma del condicionamiento
palpebral esto podría suceder debido a que la entrada del EI está inhibida en la oliva inferior. Esta idea se ve apoyada por un
experimento de Kim y colaboradores (1998), que mostró que la eliminación de esta fuente de inhibición eliminaba el efecto de
bloqueo.
Previamente hemos dicho que el hipocampo no es ncesario para el condicionamiento de demora simple. Sin embargo, sí
interviene en formas más complejas de aprendizaje. Un ejemplo lo proporciona el condicionamiento de huella, en el que se
inserta una demora temporal entre el final del EC y el principio de EI. Un animal normal puede adquirir fácilmente un parpadeo
condicionado a un EC que termina 0,5 segundos antes del comienzo del EI. Sin embargo, no puede alvar este espacio si se
retira el hipocampo. Se observa un patrón de resultados similar en los pacientes amnésicos que han sufrido daño en el
hipocampo. Estos pacientes no pueden recordar concientemente la relación EC-EI. En ausncia de esta memoria esplícita, son
incapaces de aprender con un procedimiento de huella. El aprendizaje con un procedimento de demora no se ve alterado,
incluso si los pacientes no pueden recordar conscientemente la relación EC-EI de una sesión a la siguiente. Curiosamente, la
alteración de conciencia en un individuo normal debilita la apreciación de la relación EC-EI con un procedimiento de huella. De
nuevo, los sujetos que no pueden dar información explícita sobre la relación, son incapaces de aprender.
-J.W.Grau
El aprendizaje tiene lugar de forma rápida cuando EC se presenta justo antes del EI. Las
palomas no se aproximan a EC si el EC y el EI se presentan de forma aleatoria uno del otro.
El segimiento del signo sólo es posible en situaciones en las que el EC tiene una localización
precisa y puede ser "seguido". Cuando el EC es un sonido no provoca la aproximación a la
fuente y sí el acercamiento al comedero. El EC tiene que ser de una modalidad y
configuración apropiada.
42
Otro factor importante es la relación entre la cantidad de tiempo que el sujeto pasa en el
contexto experimental y la duración de cada presentación del EC. Se obtienen mayores
niveles de seguimiento del signo con mayores exposiciones al contexto experimental en
relación a la duración EC.
La aversión al sabor es el resultado del emparejamiento de un EC (un sabor) con un EI (malestar: una droga o exposición a
radiación) similar a otros ejemplos de condicionamiento clásico, y sigue las mismas leyes de aprendizaje en muchos aspectos.
También tiene caracteristicas especiales:
• Primero, puede aprenderse con un solo ensayo aversión al sabor por el emparejamiento del sabor y la enfermedad.
• Segundo, puede darse después de varias horas de la exposición al nuevo sabor. Probablemente sea un aprendizaje
demorado de la aversión al sabor que ha evolucionado para permitir a os animales evitar alimentos venenosos con
efecto retardado.
43
Uno de los factores críticos que determinan el curso del condicionamiento clásico es la
ordenación temporal del EC y el EI. Pequeñas variaciones en la forma de emparejarlos
pueden tener importantes efectos en la intensidad de la RC.
La distancia horizontal representa el paso del tiempo; el desplazamiento vertical el momento en ue cada estímulo aparece y
desaparece. Cada configuración EC y EI representa un único ensayo de condicionamiento.
Tiempo
Inicio Final Procedimiento de condicionamiento
clásico en el que el estímulo
EC condicionado aparece poco antes
del estímulo incondicionado en
Condicionamiento cada ensayo de condicionamiento.
de demora corta EI
Procedimiento de condicionamiento
clásico en el que el estímulo
EC incondicionado se presenta poco
después de que haya terminado el
Condicionamiento estímulo condicionado.
de huella EI
Similar al procedimiento de
condicionamiento de demora corta,
EC en que el EC comienza antes que el
EI, sin embargo, EI se demora más
Condicionamiento tiempo (5-10 minutos).
de demora larga EI
Procedimiento de condicionamiento
clásico en el que el estímulo
EC condicionado y el incondicionado
se presenta simultáneamente en
Condicionamiento cada ensayo condicionado.
simultaneo EI
Procedimiento de condicionamiento
clásico en el que el estímulo
EC condicionado se presenta en todos
los ensayos después del estímulo
Condicionamiento incondicionado.
hacia atrás EI
44
Una asociación EC-EI implica que dos eventos se han conectado de alguna forma. Después
EC adquiere la capacidad de activar procesos relacionados con el EI. Requiere algo más que
una familiaridad. Para concluir que se ha establecido asociación, debemos asegurarnos de
45
que el cambio conductual observado no podría haberse producido por la mera presentación
de EC o del EI por separado.
46
Las señales que predicen la ausencia de un estímulo aversivo son estímulos condicionados
inhibitorios.
47
Procedimiento estandar de
inhibición condicionada.
A lo largo del tratamiento, los ensayos se alternan de forma aleatoria. A medida que el
animal recibe ensayos repetidos del EC+ seguido del EI y ensayos del EC+ y el EC- seguidos
de la ausencia de EI, el EC- adquiere gradualmente propiedades inhibitorais.
Ejemplo: Un semáforo rojo en un cruce transitado es una señal (EC+) de un peligro potencial
(EI). Sin embargo, si un agente de policía indica con su silbato (EC-) que debemos cruzar, a
pesar de la luz roja, es poco probable que tengamos un accidente y el peligro señalado por el
semáforo queda bloqueado o inhibido por silbato.
Contingencia o correlación
negativa entre el EC y el EI.
48
El EC señala una reducción en la probabilidad de que aparezca el EI. Como por ejemplo, Los
niños que se meten con un compañero en clase y dejan de hacerlo en presencia del profesor.
El profesor funciona como EC- que señala un período libre de acoso, o ausencia EI.
Medición de la inhibición.
Una limitación es que este método funciona sólo con respuestas que pueden ir en
direcciones opuestas. Otra es que esta técnica puede mostrar sólo el efecto neto de la
excitación y la inhibición. El sujeto se aproxima a EC si excitación es mayor a la inhibición
y se aleja en caso contrario. La paloma no puede acercarse y alejarse al mismo tiempo. Esto
invalida el procedimiento para los casos en que EC adquiere ambas propiedades (exitatorias
e inhibitorias)
49
Prueba del estímulo compuesto de la inhibición en un experimento de supresión del lameteo. Los estímulos A y B se
condicionaron como estímulos excitatorios mediante la presentación de cada uno de ellos por separado junto con la descarga
(A+ y B+). El estímulo X se condicionó como inhibidor presentándolo junto con el estímulo A sin la descarga (AX-). El
estímulo Y era un estímulo de control que no había intervenido en ningún condicionamiento excitatorio o inhibitorio. A era una
luz brillante. B, X e Y eran claves auditivas ( un clic, un ruido blanco y un zumbador, contrabalanceados). A y AX se pusieron a
prueba con el contexto original de condicionamiento. B, BX y BY se pusieron a prueba en un contexto diferente. (Para detalles
adicionales, vease Cole, Barnet y Miller, 1997, Experimento 1.
50
51
experimentados por la madre que amamanta a sus hijos suelen experimentar el reflejo de
secreción de lecha cuando el niño llora o cuando llega lahora habitual de amamantamiento.
Todos estos estímulos preceden de forma regular a la succión del bebé y por tanto pueden
condicionarse a la estimulación propia de la succión y adquirir la capacidad de provocar la
secreción de lecha como respuesta condicionada. Las respuestas anticipatorias de
orientación y succión y la respuesta anticipatoriade secreción de leche hace que la lactancia
sea más satisfactoria tanto para la madre como para el niño.
COMENTARIOS FINALES
52
53
Prueba de sumación Lo mismo que prueba del estí- Seguimiento del signo Movimiento hacia un
mulo compuesto. estímulo que señala la disponibilidad de un reforza-
dor positivo, como comida, y posible contacto con el
Prueba del estímulo compuesto Procedimoento de mismo. Tambien llamada automoldeamiento.
prueba que sirve para identiricar un inhibidor
condiconado si dicho estímulo reduce a respuesta Supresión condicionada del lameteo Similar a la
elicitada por un estímulo condicionado excitatorio. respuesta emocional condicionada (REC) o
También llamado prueba de sumación. procedimiento de supresión condicionada. Sin
embargo, en lugar de utilizar la presión de la
Pseudocondicionamiento Incremento en la respues- palanca para obtener la comida como conducta a
ta que puede provocar un estímulo cuyas suprimir por el miedo condicionado, la línea de base
presentaciones están entremezcladas con las es el lameteo de un tubo con agua por parte de
presentaciones del estímulo condicionado (EC) sin ratas sedientas. La presentación de un EC
que se establezca una asociación entre el estímulo y condicionado al miedo ralentiza la tasa de lameteo.
el EI.
Supresión condicionada Lo mismo que respuesta
RC Abreviatura de respuesta condicionada. emocional condicionada.
54
Comentarios finales
55
La comparación de los ECs y de los EIs son relativas, pues en un evento particular puede
servir de EC respecto a un estímulo y de EI respecto a otro. Una exposición salina en un
experimento de aversión al sabor actua como EC y la droga que produce el malestar como
EI; mientras que en un experimento de seguimiento del signo la exposición salina se podría
considerar como EI y la luz el EC. Por tanto, el que la sacarina se considere un EC o un EI
depende de su relación con otros estímulos de la situación.
El mismo proceso realizado con EI han dado similares resultados. Los sujetos familiarizados
con un EI antes de su emparejamiento con EC desarrollan la respuesta condicionada al EC
57
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
más lentamente que los participantes para los cuales el EI es novedoso. Este resultado se
denomina efecto de preexposicion al EI.
Dos son las explicaciones por parte de los investigadores de los efectos de preexposicioón
al EC y al EI. La interferencia asociativa como mecanismo que disminuye la capacidad de los
estímulos para participar en nuevas asociaciones; y otra, la interferencia de memoria en la
que los participantes recuerdan lo sucedido en fase de experimento alterando la respuesta
condicionada. Los mecanismos que reduzcan el recuerdo de preexposición en el momento de
la prueba fortalecen la respuesta condicionada.
condicionamiento
Gustativo + audiovisual Descarga
Gustativo + audiovisual Malestar
El experimento se emparejaron un estimulo audiovisual y un estímulo gustativo, presentados simultaneamente, con una descarga
o con una sensación de malestar, dependiendo del grupo. Después los sujetos se pusieron a prueba con los estímulos
gustativos y audiovisuales por separado.
Las ratas condicionadas con una sensación de malestar adquirieron una mayor aversión a las claves gustativas que las
audiovisuales. Por el contrario, las ratas condicionadas con una descarga adquirieron una mayor aversión a las claves
audiovisuales que a las gustativas.
58
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
Se demostró con ratas recien nacidas que la experiencia con sabores o con la enfermedad
(o con las claves audiovisuales y el daño periférico) no es necesaria para que se dé el efecto
de relevancia del estímulo. Más bien, el fenómeno parece reflejar una predisposición
genética para la asociación selectiva de ciertas combinaciones de estímulos condicionados e
incondicionados.
Se han desarrollado diversos procedimientos de Primero se pide al sujeto que mantenga un egistro preciso del
condiciona-miento aversivo para que las personas dejen número de cigarrillos que fuma, así como del momento, lugar
de fumar (Hall, Hall y Ginsberg, 1990). Los primeros y circunstancia en las que lo hace. Una vez conocidas la
intentos consistieron en una terapia aversiva en la que el frecuencia y las circunstancias en las que fuma, se proponen
acto de fumar se emparejaba con el dolor producido por dos objetivos con los que se pretende reducir gradualmente el
una descarga eléctrica. Técnicas más recientes se basan consumo de tabaco: reducir el número total de cigarrillos
en los hallazgos que indican que el condicionamiento de la fumados al día y reducir el número de situaciones en las que
aversión es más efectivo si el estímulo aversivo es se permite fumar. Esta combinación de objetivos permita
“relevante” en relación a la situación. En estos restringir la conducta de fumar. El cumplimiento puede
procedimientos, suele utilizarse el propio acto de fumar alentarse utilizando un sistema de contratos. Por ejemplo, la
como fuente de la estimulación aversiva. Un procedimiento persona puede depositar una cantidad de dinero al comienzo
utilizado frecuentemente es el de inhalación rápida del tratamiento y recuperar posiciones de este depósito cada
(USDHHS, 1996), en el ue se pide al sujeto que inhale vez que logre un objetivo.
tabaco cada 6 segundos durante un periodo de tiempo
hasta que surja náuseas o mareos. Esta forma de fumar es
aversiva y permite condicionar una aversión al tabaco.
Pavlov sugirió que para que un estímulo se condicionara debía tener una fuerza biológica
menor que la del estímulo incondicionado con el que se emparejaba. El concepto de "menor
fuerza biológica" se refería a que inicialmente el EC debía elicitar menos respuestas y más
débiles que el EI.
59
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
El término orden superior, puede considerarse el condicionamiento como si operase en diferentes niveles. El emparejamiento
del tono con la comida se considera condicionamiento de primer orden; El emparejamiento de la luz con el tono
previamente condicionado sería el condicionamiento de segundo orden; y si la luz se usara para condicionar otro estímulo,
por ejemplo, un olor, se trataría de condicionamiento de tercer orden.
Condicionamiento de orden superior del miedo del condicionamiento de orden superior, un estímulo
condicionado al miedo (las multitudes) había condicionado
Los miedos irracionales se desarrollan muchas veces por elmiedo a otros estímulos (cines) que previamente
medio del condicionamiento de oren superior. Por ejemplo, resultaban inocuos. El aspecto destacable de esta
Woldpe (1990) describe el caso de una mujer que experiencia es que se adquirió aversión a los estímulos del
inicialmente tenía miedo a las multitudes. Aunque se cine sin que estas claves se hubieran emparejado
desconoce cómo se condicionó este miedo, las multitudes directamente con un estímulo incondicionado aversivo.
habían adquirido la capacidad de elicitar miedo. Para evitar Después de esta terrible experiencia con el cine, la mujer
el surgimiento del miedo, la mujer iba al cine sólo en el evitaba ir al cine incluso cuando era poco probable que se
momento del día en el que había poca gente. En una de encontrara con mucha gente. Además, el miedo a los cines
tales visitas, el cine se llenó repentinamente de estudiantes. recién adquirido se generalizó a otros lugares públicos, tales
La mujer quedó muy afectada por esta experiencia y asoció como restaurantes, iglesias y edificios públicos, que también
los cines con las multitudes. Así pues, como consecuencia evitaba incluso si estaban vacíos.
60
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
61
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
62
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
La forma de la RC también esta influenciada por la naturaleza del EC. Timberlake y Grant
(1975) utilizaron comida como EI, el EC fue la presentación de otra rata justo antes de la
administración de comida, el EC no porvoco conductas de roer y morder, elicito respuestas
de orientación, aproximación y olfateo, asi como contactos de tipo social.
Los diversos sistemas de conductas han evolucionado para permitir al animal llevar a cabo
tareas criticas, tales como obtener y comer el alimento, defender su territorio, evitar a los
depredadores, reproducirse y cuidad sus crías. Cada sistema consiste en una serie de modos
de respuesta, cada uno de ellos con sus propios estimulos y respuestas relevantes,
dispuestos con determinado orden espacial y secuencial.
63
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
El efecto de bloqueo
Kamin, su descubridor, explico el efecto proponiendo que para que se produzca aprendizaje
de forma efectiva el EI debía ser inesperado o sorprendente.
Ecuación básica : ΔV = k ( λ − V )
λ : asítona de aprendizaje
V : valor asociativo de los estímulos
k : constante relacionada con la saliencia del EC y del EI.
64
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
El grupo de control recibe un tratamiento idéntico en la Fase 2, pero para ellos la presencia
del estímulo A no lleva a unaexpectativa del EI y por tanto es sorprendente para el grupo
de control y produce nuevo aprendizaje.
Perdida de valor asociativo a pesar de los emparejamientos con el EI. Gran parte de la
importancia del modelo se debe a sus inusuales predicciones. Una de tales predicciones es
que, en ciertas circunstancias, las propiedades condicionadas de los estimulos se reduciran
a pesar de que siga habiendo emparejamientos con el EI.
Fase 1 Fase 2
A → EI
[A + B] → EI
el EI
1 B → EI
Pérdida de valor asociativo a pesar de las presentación continuada del EI. Los estímulos A y B se condicionan separadamente
hasta llegar a la asíntota en la Fase 1, de modo que cada EC sea capaz de predecir el EI perfectamente. En la Fase 2, los
estímulos A y B se presentan simultáneamente y se emparejan con el mismo EI utilizando en la Fase 1. Esto produce una
expectativa excesiva del EI. Dado que el EI es sorprendentemente pequeño al principio de la Fase 2, las propiedades
condicinadas de los estímulos A y B se reducen hasta que la presentación simultánea de los dos ECs deja de producir un
exceso de expectativas.
En cada ensayo aparecen tanto el EC+ como el EC-. Una vez que el EC+ ha adquirido cierto
grado de excitación condicionada (debido a su presentación en los ensayos reforzados), el
organismo esperará que se presente el EI siempre que aparezca el EC+, incluyendo los
ensayos no reforzados. Sin embargo, el EI no ocurre en los ensayos no reforzados, por lo
que se trata de un caso de expectativa excesiva. Para predecir con exactitud la ausencia del
EI en los ensayos reforzados, los valores asociativos del EC+ y del EC- tienen que sumar
65
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
cero (valor que representa la ausencia de EI). Para lograrlo, como el EC+ tiene un valor
asociativo positivo, la única forma es hacer que el valor asociativo del EC- sea negativo. El
modelo Rescola-Wagner explica la inhibición condicionada asumiento que el EC- adquiere un
valor asociativo negativo.
4º- El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los
paradigmas de avesion al sabor y olor. En experimentos similares al de efecto de bloqueo,
cabria esperar que la presencia del EC previamente condicionado interfiriera en el
condicionamiento del EC añadido en la fase 2. Se encontró el resultado opuesto: un efecto
de aumento o de contrabloqueo.
66
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
Otra variable temporal importante es el intervalo entre ensayos. En general en ensayos más
separados entre si, mayor respuesta condicionada. Mas interesante resulta que el intervalo
entre ensayos y la duración del EC interactuan a la hora de determinar la respuesta.
Numerosos ensayos han mostrado que el factor crítico es la duración relativa de estas dos
variables temporales, más que el valor absoluto de las mismas.
Se han ofrecido varias interpretaciones sobre por qué la respuesta condicionada esta tan
fuertemente determinada por la razón IEE/DE (intervalo entre ensayos/duración del
ensayo). Una de las primeras explicaciones fue la hipótesis de espera relativo, que supone
que un EC proporciona información acerca de la aparición del EI sólo si el sujeto tiene que
pasar menos tiempo esperando al EI que cuando esta simplemente expuesto al contexto
experimental.
67
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
La hipótesis hace más hincapié en las asociaciones que en el tiempo. Asume que los sujetos
aprenden tres asociaciones en el curso del condicionamiento:
1º Une el EC crítico con el EI.
2º Une el EC crítico con las claves contextuales de comparación .
3º Une los estímulos de comparación y el EI.
Esta hipótesis no indica cómo se establecen las asociaciones, es una teoría de la ejecución.
68
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
El modelo predice también que incrementar el valor excitatorio de las claves contextuales
tras el tratamiento (Asoc. 3) reducirá la respuesta condicionada del EC crítico. No se ha
conseguido confirmar esta predicción.
Visión general de las alternativas teóricas. Cada uno de los modelos que se han descrito
hace hincapié en un aspecto diferente del condicionamiento clásico. La hipótesis del tiempo
de espera relativo se centre en un pequeño conjunto de fenómenos relacionados con la
distribución temporal de los estímulos condicionados e incondicionados, a pesar de que su
antecesora (la teoría de la expectativa escalar) tiene un alcance mucho mayor.
La hipótesis del comparador también es ambiciosa, pero es una teoría de la ejecución más
que del aprendizaje y, por toanto, no explica como se adquieren las asociaciones.
Los modelos atencionaes hacen referencia al mismo tipo de fenómeno que el modelo
Rescorla-Wagner, pero comparten algunas de sus limitaciones.
Todos estos modelos han sido importantes en tanto que han dirigido nuestra atención a
aspectos previamente ignorados del condicionamiento clásico. Ninguno de ellos ha llegado a
dominar el estudio del condicionamiento clásico e la misma forma que el modelo Rescorla-
Wagner lo hizo en los setenta.
69
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
70
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
Términos clave
Aprendizaje E-E Aprendizaje de una asociación Efecto de inhibición latente Lo mismo que efecto
entre dos estímulos, con el resultado de que la de preexposicioón al EC.
exposición a uno de los estímulos adquiere la Efecto de preexposición al EC Interferencia con
capacidad de activar una representación o el proceso de condicionamiento producida por la
“imagen mental” del otro estímulo. También exposición repetida al estímulo condicionado
llamado aprendizaje estímulo-estímulo. antes de los ensayos de condicionamiento.
También llamado efecto de inhibición latente.
Aprendizaje E-R Aprendizaje de una asociación
entre un estímulo y una respuesta, con el Efecto de preexposición al EI Interferencia con
resultado de que el estímulo adquiere la el proceso de condicionamiento producida por la
capacidad de provocar la respuesta. Lo mismo exposición repetida al estímulo incondicionado
que aprendizaje estímulo-respuesta. antes de los ensayos de condicionamiento.
Aprendizaje estímulo-estímulo Lo mismo que Hipótesis del comparador Idea según la cual la
aprendizaje E-E. respuesta condicionada depende de una
comparación entre la fuerza asociativa del
Aprendizaje estímulo-respuesta Lo mismo que estímulo condicionado crítico (EC) y la fuerza
aprendizaje E-R. asociativa de otras claves presentes durante el
condicionamiento del EC crítico.
Condicionamiento de orden superior Procedimien-
to en el que se utiliza un estímulo previamente Hipotesis del tiempo de espera relativo Idea
condicionado (EC1) para condicionar un nuevo según la cual la respuesta condicionada depende
estímulo (EC2) de cuánto tiempo tenga que esperar el
organismo para el estímulo incondicionado (EI)
Contracondicionamiento Procedimiento de condi- en presencia del estímulo condicionado (EC), en
cionamiento que invierte la respuesta comparación con el tiempo que tenga que
condicionada con anterioridad a un estímulo. Por esperar para el EI en la situación experimental
ejemplo, un animal puede condicionarse para independientemente del EC.
aproximarse aun estímulo que anteriormente
evitaba. Homeostasis Concepto introducido por Walter
Cannon para referirse a los mecanismos
Devaluación del EI Reducción el atractivo de un fisiológicos que permiten mantener los aspectos
es-tímulo incondicionado, normalmente obtenida corporales críticos (tales como los niveles e
mediante la aversión o la saciedad. azúcar en sangre o la temperatura) dentro de
ciertos límites. El nivel homeostático suele
Efecto de aumento Facilitación en el condiciona- lograrse mediante la acción de mecanismos de
miento el un estímulo novedoso debido a su retroalimentación negativa que permiten
condicionamiento junto a un estímulo previa- contrarrestar el efecto de los cambios en el
mente condicionado. También llamado efecto de nivel homeostático.
contrabloqueo.
Precondicionamiento sensorial Procedimiento en el
Efecto bloqueo Interferencia en el que un estímulo biológicamente débil (EC2) se
condicionamien-to de un nuevo estímulo debida a empareja repetidamente con un estímulo
la presencia de un estímulo previamente biológicamente débil (EC1). Después, el EC1 se
condicionado. condiciona con un estímulo incondicionado. En un
ensayo de prueba posterior, el EC2 también
Efecto de contrabloqueo Lo mismo que nunca se había emparejado directamente con el
aumentación. estímulo incondicionado.
71
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 4: Condicionamiento clásico: mecanismos
Juan Carlos Cabrera
72
Descargado del campus, http://campus.felizmente.info
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 5: Condicionamiento instrumental: Fundamentos
Juan Carlos Cabrera – 2009/2010
73
En este capítulo se vuelve la vista al análisis de las situaciones de aprendizaje en las cuales
los estímulos a los que un organismo se enfrenta son el resultado directo de su conducta,
descrita como “dirigida a una meta”.
La conducta que sucede debido a que ha servido previamente como instrumento para
producir ciertas consecuencias se denomina conducta instrumental.
Sobre la base de eta investigación, Thorndike formulo la ley del efecto: si una respuesta
en presencia de un estimulo es seguida por un suceso satisfactorio, la asociación E-R se
fortalece, si es seguida por un suceso molesto, se debilita. Esta ley implica un aprendizaje
E-R.
75
Ideado por B.F. Skinner, los procedimientos de operante libre permiten al animal que repita
la respuesta instrumental una y otra vez sin restricciones.
Skiner estaba interesado en analizar en el laboratorio una forma de conducta que fuese
representativa de toda la actividad en curso que ocurria de forma natural. La conducta no
se divide como si fueran moléculas, por eso propuso el concepto de operante como la forma
de dividir la conducta en unidades medibles con significado.
La típica caja básica de Skinner que utilizada para estudiar la conducta opeante libre,
consistia en una pequeña cámara que contiene una palanca y un mecanismo que proporciona
un reforzador.
Una respuesta operante, como presionar una palanca, se defina a partir del efecto que
produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se
consideran ejemplos de la misma operante.
76
77
78
La respuesta instrumental
79
El reforzador instrumental
Mellgren (1972) Los resultados que obtuvo ilustran el fenómeno de contraste positivo: se
refiere a una elevada respuesta por una recompensa favorable, resultado de una
experiencia anterior con una consecuencia menos atractiva y contraste negativo: se refiere
80
a una respuesta disminuida por una recompensa desfavorable debido a una experiencia
anterior con una consecuencia mejor. Los efectos de contraste también se dan si las
condiciones de recompensa se modifican una y otra vez con una clave diferente sañalando
cada condición de recompensa, estos efectos son ejemplo de contraste conductual
simultaneo.
La relación respuesta-reforzador
Unas veces existe una fuerte relación entre la conducta y sus consecuencias (introducir una
moneda en una maquina y obtener un refresco), en otras no (llevar una camiseta roja al
examen y sacar buena nota) y también puede ser probabilistica (hacer llamadas de telefono
y encontrar a alguien que te ayude).
Hay una relación causal fuerte entre presentar una solicitud de admisión y ser aceptado, pues si no lo solicitas es seguro que
no será aceptado; sin embargo, la relación temporal entre solicitar y ser admitido es débil porque puede pasar semanas o
meses sin conocer la respuesta a la solicitud despues de haberla presentado.
Hay varios factores que pueden contribuir a este deterioro. Cuando el reforzamiento es
demorado tras la realización de una respuesta, R1, el organismo no deja de hacer cosas, R2
R3 R4 etc. Si el reforzador se establece en R1 pero no se entrega hasta algún tiempo
81
después, el reforzador puede ocurrir después de alguna otra respuesta por ej. R5. Para
asociar R1 con el reforzador, el organiso tiene que poder distinguir R1 de otras respuestas
que realiza durante el intervalo de demora.
82
Las acciones que eran respuestas terminales y las que eran respuestas de interin no
variaban mucho de una paloma a otra. No encontraron evidencia de reforzamiento
accidental. La investigacion posterior ha proporcionado mucha evidencia adicional de que las
presentaciones periodicas de un reforzador producen regularidades en la conducta.
83
FASE DE
GRUPO FASE DE EXPOSICIÓN CONDICIONAMIENTO PRUEBA .
84
4º- Déficit atencional: Que la descarga provoque que los animales presten menos atención a
sus acciones. Si un animal no presta atención a su conducta, tendrá dificultad para asociar
sus acciones con los reforzadores en el escape.-evitacion o en otras formas de
condicionamiento instrumental.
Maier, Jackson y Tomie (1987) probaron esta hipótesis de déficit atencional con ratas,
razonaron que la atencion reducida a la conducta instrumental también podía ser aliviada
mediante la introducción de una clave externa de retroalimentación de la respuesta o
estímulo de marcado.
85
Conducta instrumental Actividad que ocurre debido Contraste negativo Respuesta menor a un
a su efectividad para producir una consecuencia reforzador desfavorable tras una experiencia
particular o reforzador. previa con un reforzador más deseado que en
ausencia de esa experiencia previa.
Conducta supersticiosa Conducta que se incrementa
en frecuencia debido a emparejamientos acciden- Contraste negativo Respuesta mayor a un estímulo
tales de la entrega de un reforzador con ocurre- favorable tras una experiencia previa con un
ncia de la conducta. reforzador menos deseado que en ausencia de esa
experiencia previa.
Contigüidad Ocurrencia simultánea ( o casi simultá-
nea) de dos eventos, como una respuesta y un Deriva instintiva Deriva gradual de la conducta
reforzador. También denominada contigüidad instrumental que se aleja de las respuestas
temporal. requeridas para el reforzamiento hacia
respuestas típicas de la especie o “instintivas”
Contigüidad temporal Lo mismo que contigüidad. relacionadas con el reforzador y con otros
estímulos de la situación experimental.
Contingencia respuesta-reforzador Relación causal
entre una respuesta y un reforzador, medida en Efecto de indefensión aprendida Interferencia en
términos de la probabilidad de ser reforzado por el aprendizaje de nuevas respuestas instrumen-
realizar la respuesta en comparación con la tales como resultado de la exposición a estimula-
probabilidad de ser reforzado en ausencia de la ción aversiva inescapable e inevitable.
respuesta.
86
87
88
Comentarios finales
89
Zeiler (1984) denominó a los programas de reforzamiento el gigante durmiente del análisis
de la conducta.
Programas de razón
Las situaciones en las que la respuesta se refuerza sólo alguna vez, reforzamiento parcial o
intermitente.
Razón fija. Por ejemplo, la entrega de un reforzador después de cada décima respuesta de
presión de palanca en un estudio con ratas de laboratorio. En un programa como éste, hay
una razón fija entre el número de respuestas que la rata realiza y el número de
reforzadores que consigue. Esto convierte al procedimiento en un programa de razón fija.
El procedimiento podría denominarse programa de reforzamiento de razón fija (RF 10).
91
El patrón típico de los programas de razón fija es que se da una tasa constante y alta una
vez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar el
número requerido de respuestas. Estas se muestran con claridad en un registro acumulativo
de la conducta.
92
Aunque pueden darse pausas posreforzamiento en los programas de razón variable, estas
son mas largas y prominentes en los programas de razón fija. La tasa global de respuesta en
los programas de RF y RV es similar siempre y cuando, como promedio, se requieran números
similares de respuestas. Sin embargo, la tasa global de respuesta tiende a distribuirse en
un patrón de pausa-carrera con los programa de RF, mientras que se observa un patrón más
estable con los de RV.
Programa de RAZÓN:
El reforzador se otorga en función del número de respuestas.
• Razón Fija (RF): El número de respuestas necesarias para obtener un reforzador es siempre el mismo.
Ejemplo: RF5 = Cada 5 respuestas, me dan un premio.
El programa de RF1 es un programa de reforzamiento continuo.
Produce pausas post-reforzamiento.
• Razón variable (RV): El número de respuestas necesarias para obtener un reforzador va variando.
Ejemplo: RV5 = Cada 5 respuestas de media, me dan un premio.
Programas de intervalo
Las respuestas son reforzadas sólo si ocurren cuando ha transcurrido una cierta cantidad
de tiempo.
Intervalo fijo: el tiempo no varia de una ocasión a la siguiente. Se dan en situaciones donde
se requiere una cantidad fija de tiempo para dispensar el reforzador. A medida que el
tiempo para la disponibilidad del próximo reforzador se acerca, la tasa de respuesta
aumenta, este aumento de la tasa de respuesta se manifiesta como una aceleración del
registro acumulativo al final del IF, este se denomina por consenso festón de intervalo
fijo. La pusa posreforzamiento y el aceleron posterior hacia el final del intervalo reflejan
una habilidad rudimentaria para contar el tiempo, En un estudio se uso como reloj un punto
de luz que crecia a medida que el tiempo pasaba. L introducción de este estimulo reloj
incremento la pausa posreforzamiento y provoco que la respuesta se desplazase mas cerca
del final del ciclo IF.
93
Intervalo variable: (IV), las respuestas se refuerzan si se dan tras haber transcurrido un
intervalo variable desde la administración del reforzador previo. Se hallan en situaciones
donde se requiere una cantidad de tiempo impredecible para preparar o dispensar el
reforzador.
El sujeto en los programas IV tiene que realizar la respuesta instrumental para obtener el
reforzador., no se dan gratis, se dan solo si el organismo responde tras un intervalo
variable. Los programa IV mantienen tasa de respuesta constantes y estables sin pausas
regulares.
Programa de INTERVALO:
El reforzador se otorga en función del tiempo que ha transcurrido desde el último reforzador (Pero todavía hay que
responder al menos 1 vez para obtener el reforzador
• Intervalo Fijo (IF): El tiempo que pasa entre dos reforzamientos es siempre el mismo.
Ejemplo: IF5 = Cada 5 segundos, el reforzador está disponible (cada cinco segundos, si respondo me dan un premio.
Produce pausas post-reforzamiento y aceleración pre-reforzamiento (Patrón “festoneado”)
• Intervalo variable (IV): El tiempo que pasa entre dos reforzadores va variando.
Ejemplo: IV5 = Cada 5 respuestas de media, el reforzador está disponible.
94
Hay similitudes entre los patrones de respuesta, tanto los programas RF como los IF
producen una pausa posreforzamiento después de la administración del reforzador.
Producen altas tasas de respuesta
justo antes de la administración del
siguiente reforzador. Por el
contrario, los programas de RV y de
IV mantienen tasas estables de
respuesta, sin pausas predecibles.
Los programas de intervalo y de
razón activan diferentes cambios
neuroquímicos en el cerebro.
La conducta mantenida por
programas de intervalo esta
mediada por el sentido temporal del
organismo, en los programas de razón no.
La primera evidencia sobre las diferencias entre programas de intervalo y de razón fue
proporcionada por un importante experimento de Reynolds (1975), ver pag 169-170 libro.
95
96
rA/(rA+rB)
La ley de la igualación
RA/RB= rA/rB
97
Es más probable que las elecciones muestren sensibilidad reducida a las tasas relativas de
reforzamiento que sensibilidad reducida a las mismas. El parámetro de sensibilidad puede
estar influido por númerosas variables, le especie, esfuerzo dificultad, etc.
En realizad, en estas relaciones influyen tanto la cantidad como la calidad del reforzador: si es un reforzador valioso, unos
poquitos bastaran para que el animal prefiera ese programa a otro.
98
krA
RA =
rA + rO
Esta ecuación predice que la tasa de respuesta (RA) estará directamente relacionada con la
tasas de reforzamiento para esa respuesta de una forma negativamente acelerada. Otra
implicación, de particular interés clínico, es que la tasa de respuesta disminuirá a medida
que aumente la tasa de las otras fuentes de reforzamiento (rO). Por tanto, esta ecuación
proporcionara dos maneras de modificar la tasa de una respuesta, mediante el cambio de su
tasa de reforzamiento o mediante el cambio en la tasa de las otras fuentes de
reforzamiento.
La presuposición de que (RA+RO) es constante para unas situación instrumental esta puesto
en cuestión con estudios recientes que varian el reforzador pero no la respuesta
instrumental.
99
La ley de la igualación describe como los organismos distribuyen sus respuestas en una
situacion de elección pero no explica que mecanismos son responsables de esta distribución
de respuestas. Está establecida en funcion de las tasas de respuestas y de reforzamiento
promediada sobre la duración total de las sesiones experimentales. Ignora cuando se
realizan las respuestas individuales. Igualmente las teorías molares de la igualación ignoran
que podría ocurrir al nivel de las respuestas individuales. Las terorías molares explican
agregados de respuestas y se relacionan con la distribución total de respuestas y
reforzadores en las situaciones de elección. Las teorías moleculares se centran en lo que
ocurre al nivel de las respuestas individuales y consideran la relación de igualación como el
resultado neto de estas elecciones individuales. Otras teorías proporcionan.
caracterizaciones de la conducta que no son ni molares ni moleculares, sino algo intermedio
entre ellas ; el mejoramiento.
2º maximización molar: presuponen que el organismo distribuye sus respuestas entre las
varias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a la
larga. Se centran en agregados de conducta sobre algún período más que en las respuestas
de elección individual.
100
Otro desafio son los programas de IV-RV, dadas las diferencias entre estos dos programas,
para el máximo beneficio en un programa concurrente RV-IV, los sujetos deberían
concentrara sus respuestas en la alternativa de razón variable y responder solo
ocasionalmente en el componente de intervalo variable, esto no sucede, los animales
favorecen el componente RV pero no de forma tan fuerte como predice la teoría
3ª Mejoramiento: Los mecanismos de mejoramiento operan en una escala temporal que esta
entre la escala temporal de las teorías molar y molecular.
La teoría asume que los organismos cambian de una alternativa a otra para mejorar la tasa
local de reforzamiento. Puede demostrarse matemáticamente que cuando los sujetos
distribuyen sus respuestas para obtener la misma tasa local de reforzamiento en cada
alternativa, se están comportando de acuerdo con la ley de igualación. Por tanto, el
mecanismo de mejoramiento da como resultado la igualación. De acuerdo con esta teoría, la
paloma cambiara su preferencia a favor de la alternativa de respuesta que arroje la tasa
local más alta. Estos cambios de un lado a otro continuaran hasta que sea igual la tasa local
de reforzamiento conseguida en las dos alternativas.
¿Qué determina los cambios de un programa a otro?
• Teorías de la maximización molecular: El animal hace un cambio de programa para obtener un reforzador determinado.
• Teoría de la maximización molar: El animal hace los cambios precisos para obtener el máximo de reforzadores a la larga.
• Teoría del mejoramiento: El animal cambia para obtener una tasa local de reforzamiento mejor que la actual. La tasa
local de reforzamiento en el programa A: Número de reforzadores obtenidos durante el tiempo que se ha dedicado al
programa A.
La alternancia de programas continúa hasta que las tasas locales se igualan.
101
Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de RV,
esta está guiada por el hecho de que ocasionalmente un programa de RV proporciona
reforzamiento por un número relativamente pequeño de respuestas.
102
Estudios de “autocontrol”
El autocontrol es a menudo cuestión de elegir una recompensa
grande demorada sobre una recompensa pequeña inmediata.
103
¿Puede entrenarse el autocontrol? Una persona que no puede tolerar esperar el tiempo
necesario para obtener recompensas grandes tiene que olvidarse de obtener esos
reforzadores. El autocontrol, o la preferencia pr una recompensa grande demorada frente a
una recompensa pequeña inmediata, es a menudo una estrategia sensible. De hecho, algunos
han sugerido que el autocontrol es un componente crítico de la socialización y del ajuste
emocional.
Entrenar a las personas con recompensas demoradas parace tener efectos generalizados en
incrementar su tolerancia a la recompensa demorada. En un estudio de elección, realizados
con niños de una escuela elemental, a los que se les preguntó si querían conseguir 2 céntimos
inmediatamente o 3 al final del día, se les realizadon tres sesiones de entrenamiento con
una recompensa imediata o demorada.
Durante cada sesión de entrenamiento, se presentaron varios roblemas: uno incluía contar
objetos en una carta, otro era una rarea pictórica, y el tercero era una tarea de
emparejamiento de formas. Para la mitad de los estudiantes, la respuesta correcta era
reforzada inmediatamente con 2 centimos. Para el resto, las respuestas correctas tenian
como resultado 3 céntimos que se situaban en un cuanco y serían entregados al final de día.
Se midió la preferencia por la recompensa pequeña inmediata frente a la más grande
demorada. Siempre y cuando las tareas de entrenamiento implicasen bajo esfuerzo, el
entrenamiento con la recompensa demorada incrementó la preferencia por la recompensa
más grande demorada durante el postest. Por tanto, el entrenamiento con reforzamiento
demorado producía autocontrol generalizado.
Comentarios finales
(página 189 del libro)
104
TÉRMINOS CLAVE
Carrera de razón Tasa de respuesta alta y estable Programa concurrente Procedimiento de
que se observa tras la pausa posreforzamiento en reforzamiento complejo en el cual el participante
los programas de reforzamiento de razón fija. La puede elegir cualquiera de dos o más programas de
carrera de la razón finaliza cuando se ha llevado a reforzamiento simples que están disponibles
cabo el número necesario de respuestas y el sujeto simultáneamente. Los programas concurrentes
es reforzado. permiten la medida de la elección entre
alternativas de programas simples.
Espera limitada Restricción en cuánto tiempo
permanece disponible el reforzamiento. Para que Programa concurrente encadenado Procedimiento
una respuesta sea reforzada, debe ocurrir durante de reforzamiento complejo en el que se permite al
el periodo de espera limitada. participante elegir cuál de varios programas
simples de reforzamiento funcionará. Una vez
Festón del intervalo fijo Incremento gradual de la realizada la elección, las alternativas rechazadas
tasa de respuesta que ocurre entre no están disponibles durante algún tiempo.
reforzamientos sucesivos en un programa de
intervalo fijo. Programa de intervalo Programa de reforzamiento
por el que una respuesta es reforzada sólo si
Función descontadora del valor Función matemática ocurre después de una cantidad de tiempo
que describe cómo disminuye el valor del establecida desde el último reforzamiento.
reforzador en función del tiempo que el sujeto
tiene que esperar para la administración del Programa de intervalo fijo Programa de
reforzador. reforzamiento en el cual el reforzador se entrega
por la primera respuesta que ocurre después de
Infraigualación Sensibilidad menor de la predicha una cantidad fija de tiempo desde el último
por una igualación perfecta a la tasa relativa de reforzador. Abreviado IF.
reforzamiento.
Programa de intervalo variable Programa de
Ley de la igualación Regla de la conducta reforzamiento en el que el reforzamiento se
instrumental, propuesta por R.J.Herrnstein, que proporciona por la primera respuesta que ocurre
establece que la tasa relativa de respuesta en una tras una cantidad de tiempo variable desde el
alternativa de respuesta particular es igual a la último reforzador. Abreviado IV.
tasa relativa de reforzamiento para esa alternativa
de respuesta. Programa de razón Programa de reforzamiento en
el que el reforzamiento depende sólo del número
Mejoramiento Mecanismo para alcanzar la de respuestas que realiza el sujeto,
igualación respondiendo para mejorar las tasas independientemente de cuándo sucedan.
locales de reforzamiento en las alternativas de
respuesta. Programa de razón fija Programa de reforzamiento
en el cual debe ocurrir un número fijo de
Pausa posreforzamiento Pausa en el responder que respuestas para que la próxima respuesta sea
sucede normalmente tras la administración del reforzada. Abreviado RF.
reforzador en los programas de reforzamiento de
razón fija e intervalo fijo.
105
Programa de reforzamiento Programa, o regla, que Reforzamiento parcial Lo mismo que reforzamiento
determina cómo y cuándo la ocurrencia de una intermitente.
respuesta irá seguida por la adaministración de un
reforzador. Registro acumulativo Una representación gráfica de
cómo se repite una respuesta a lo largo del tiempo,
Programa de tasa de respuesta Programa de con el paso del tiempo representado por la distancia
reforzamiento en el que la respuesta se refuerz horizontal (o eje x) y el total o número acumulativo
dependiendo de lo pronto que ésta se realiza tras la de respuestas que ha ocurrido hasta un momento
ocurrencia previa de la conducta. determinado representado por la distancia vertical (o
Reforzamiento continuo Programa de reforzamiento eje y).
en el cual cada ocurrencia de la respuesta
instrumental produce el reforzador. Abreviado RFC. Supraigualación Sensibilidad mayor de la predicha
por una igualación perfecta a la tasa relativa de
Reforzamiento diferencial de tasas altas Programa reforzamiento.
de reforzamiento en el cual una respuesta es
reforzada sólo si ocurre antes de que haya Tensión de la razón Deterioro en la respuesta que
transcurrido una cantidad especifica de tiempo sucede cuando el requerimiento de respuesta de una
después de la respuesta precedente. Abreviado RDA. razón fija se incrementa demasiado rápido.
Reforzamiento diferencial de tasas bajas Tiempo interrespuesta o TIR Intervalo entre una
Programa de reforzamiento en el cual una respuesta respuesta y la siguiente. Los TIRs pueden ser
es reforzada sólo si ocurre despues de que haya diferencialmente reforzados de la misma manera que
transcurrido una cantidad especificada de tiempo otros aspectos de la conducta, como la fuerza dela
despues de la respuesta precedente. Abreviado RDB. respuesta o la variabilidad.
106
Regulación conductual
- Antecedentes de la regulación conductual
- Regulación conductual y el punto de deleite conductual
- Conceptos económicos y distribución de respuesta
- Problemas con las aproximaciones de regulación conductual
- Contribuciones de la regulación conductual
Comentarios finales
Se han propuesto dos aproximaciones muy diferentes a intentar explicar por que ocurre la
respuesta instrumental. Una de estas se inicio con el trabajo de Pavlov y se centra en
explicar la estructura asociativa del condicionamiento instrumental. La otra se origino con
el trabajo de Skinner y se centra en como la conducta esta regulada en vista de las
limitaciones o restricciones creadas por los procedimientos de condicionamiento
instrumental. Las teorías de la regulación conductual describen los efectos del
reforzamiento dentro del amplio contexto del repertorio conductual de un organismo
utilizando conceptos de varias áreas de investigación, incluyendo la economía conductual y
la ecología conductual. La aproximación asociacionista se centra en los mecanismos
moleculares y no se preocupa de la meta a largo plazo o la función de la conducta
instrumental. Por el contrario, la aproximación de la regulación conductual se centra n los
aspectos molares de la conducta y considera los efectos del condicionamiento instrumental
como manifestaciones de procesos de maximización u optimización.
• Regulación conductual: influencia Skinneriana. Contexto más amplio que la conducta aislada. Se centra en cómo un
procedimiento instrumental establece límites a las actividades naturales de un organismo y las consecuencias de
dichas restricciones (perspectiva molar)
La asociación E-R fue postulada por Thorndike Recordemos la ley del efecto: La presencia de señales o
como la clave del aprendizaje instrumental en estímulos que señalan acontecimientos significativos
(por ejemplo, la disponibilidad de recompensa si
su ley del efecto; el papel del reforzador o de llevamos a cabo una respuesta determinada) controla
nuestra expectativa de recompensa.
la consecuencia de la respuesta es establecer o
"estampar" una asociación entre las claves contextuales E y la respuesta instrumental.
Pensó que una vez establecida esta asociación E-R sería, de forma única, responsable de la
ocurrencia de la respuesta instrumental. Por tanto, el ímpetu básico o motivación para la
respuesta instrumental era la activación de la asociación E-R mediante la exposición del
sujeto a los estímulos en presencia de los cuales la respuesta instrumental fue previamente
reforzada.
La ley del efecto asume que el único papel del reforzador es crear una asociación E-R, que
el reforzador en si mismo no es una parte o no participa en esta asociación. Esta presunción
es bastante contraintuitiva.
Una de las explicaciones más tempranas e influyentes del papel del condicionamiento clásico
en la conducta instrumental fue propuesta por Clark Hull (1930,1931) y más tarde
elaborada por Kenneth Spence (1956) , durante el curso del condicionamiento instrumental.
La respuesta instrumental llega a ser instigada o motivada por dos factores. En primer
lugar, la presencia de E llega a evoca la respuesta instrumental directamente por asociación
con E-R. En segundo lugar, la actividad instrumental también llega a realizarse en respuesta
La teoría moderna de los dos procesos. Asume que hay dos tipos distintos de
aprendizaje, el condicionamiento pavloviano y el instrumental, además, estos dos procesos
están relacionados de una forma especial. Durante el curso de un condicionamiento
instrumental, los estímulos (E) -en presencia de los cuales de refuerza la respuesta
instrumental- se presume que llegan a asociarse con la consecuencia de la respuesta (C) a
través de condicionamiento pavloviano para establecer una asociación E-C. A través de la
asociación E-C, el estímulo E llega a motivar la conducta instrumental mediante la
activación de un estado emocional central. La naturaleza de ese estado emocional o
motivación dependerá de la naturaleza del reforzador. Por ejemplo, en un procedimiento de
condicionamiento instrumental en el que la respuesta sea reforzada por la presentación de
comida ( u otro reforzadores apetitivos), la asociación E-C activa la expectativa de comida
(Mowrer la llamo "esperanza").
Como resumen: la teoría de los dos procesos asume que el condicionamiento clásico media de conducta instrumental a
través del condicionamiento de estados emocionales centrales como la esperanza o el miedo.
Parece difícil creer que toda la motivación depende de las asociaciones E-C y E-R teniendo en cuenta que ninguna de ellas
establece una relación directa entre la respuesta y el reforzador. En la vida diaria hacemos las cosas porque conllevan
una consecuencia determinada, cosa que no refleja la teoría de los dos procesos.
Evidencia del aprendizaje de una relación jerárquica E-(R-C); los organismos aprenden
a asociar la respuesta instrumental con su consecuencia. Sin embargo, las asociaciones R-C
no pueden actuar aisladamente para producir la repuesta instrumental. E no activa R
directamente , sino que activa la asociación R-C. El sujeto llega a pensar en la asociación R-
C cuando se encuentra con E, y eso motiva que realice la respuesta instrumental.
completamiento de una secuencia instintiva de conducta. David Premack retomo el tema con
su teoría y sugirió que las respuestas reforzadoras son especiales sólo debido a que es más
probable que ocurran que las respuestas instrumentales a las que siguen.
Demanda del consumidor. La relación entre el precio de una comodidad y cuanto se obtiene
se denomina curva de la demanda.
formas, de acuerdo con esta aproximación , 2. El "valor reforzante· de una conducta puede cambiar
las diferencias en las pautas de respuesta no según si es obligada o no. Por ejemplo, al principio
una conducta A puede ser agradable, pero cuando la
deberían tener importancia. Pero la evidencia utilizo para reforzar otra conducta B, estoy
imponiendo la conducta A. ¿Cómo sé si sigue siendo
experimental indica que es importante como tan agradable como al principio?
se alcanza el punto de deleite molar. En
consecuencia una adecuada caracterización del deleite conductual requiere información
sobre las pautas de elección moleculares.
Otra dificultad, tal vez más seria es que las respuestas durante un periodo de línea base
libre no siempre tiene el mismo valor como respuestas que ocurren como parte de una
contingencia instrumental impuesta, Hacer algo cuando no hay requerimientos impuestos
externamente (correr por placer ) parece ser diferente a hacer lo mismo cuando se
requiere por una contingencia instrumental impuesta.
4º Aceptan la idea de que los organismos responden para maximizar sus beneficios.
5º Han proporcionado caminos nuevos y precisos para describir las restricciones que
imponen varios procedimientos de condicionamiento instrumental en el repertorio de
conducta de un organismo. Mas importante, han enfatizado que la conducta instrumental no
puede ser estudiada en un vacío o en un tubo de ensayo conductual. Todas las opciones de
respuesta del organismo que se dan en un momento dado deben ser consideradas como un
sistema.
Comentarios finales
Las dos aproximaciones parecen centrarse en asuntos completamente distintos, pero ambas
han contribuido de forma significativa a la compresión de la motivación de la conducta
instrumental. Es evidente que una aproximación no puede ignorarse a favor de la otra, pero
¿cómo contribuye cada una a la compresión completa de la motivación instrumental?.
Una forma de pensar sobre las dos aproximaciones es que incluyen diferentes niveles de
análisis. La asociacionista involucra un nivel molecular donde el objetivo son los estímulos
específicos, las respuestas, y sus conexiones. En contraste, como se ha descrito, la
regulación conductual opera a un nivel molar de agregados de conducta y de contextos
conductuales más amplio en el que operan las contingencias instrumentales. Por tanto, la
aproximación de la regulación conductual contacta mejor con las complejidades de la
ecología de un organismo.
Otra forma de pensar en la relación entre las dos aproximaciones es que una se relaciona
con procesos y la otra está más relacionada con funciones o metas a largo plazo. La
aproximación asociacionista describe procesos específicos [asociaciones E-R, E-C, R-C y E-
(R-C)] que sirven para generar y dirigir la conducta instrumental, pero no tienen en cuenta
el “propósito” o función a largo plazo del aprendizaje instrumental. Éste es el punto de vista
de la regulación conductual y la economía conductual, que asumen que los organismos
trabajan para defender una distribución óptima de actividades. La defensa del punto de
deleite conductual se alcanza mediante los procesos moleculares de las asociaciones.
Curva de la demanda Relación entre la cantidad Punto de deleite conductual Distribución preferida
que se obtiene de una comodidad y su precio. de las actividades de un organismo antes de que
se introduzca un procedimiento de
Elasticidad de la demanda Grado en el que el precio condicionamiento instrumental que disponga
influye sobre el consumo u obtención de una limitaciones en la distribución de respuesta.
comodidad. Si el precio tiene un efecto
importante en el consumo, la elasticidad de la Principio de Premack Lo mismo que principio de
demanda es alta. Si el precio tiene poco efecto probabilidad diferencial.
sobre el consumo, la elasticidad de la demanda es
baja. Principio de probabilidad diferencial Principio que
asume que el reforzamiento depende la
Experimento de transferencia de control probabilidad relativa del organismo de ejecutar la
Experimento que evalúa los efectos de un respuesta reforzadora frente a la respuesta
estímulo condicionado clásicamente (EC) en la instrumental antes de que se introduzca el
ejecución de la conducta instrumental. El EC y la procedimiento de condicionamiento instrumental.
respuesta instrumental se condicionan en primer Cuanta más diferencia exista entre la
lugar en fases independientes del experimento. probabilidad de la respuesta reforzadora y la
Los efectos del EC sobre la respuesta instrumental durante las condiciones de línea de
instrumental se determinan entonces en la fase base, mayor será el efecto reforzante de
de transferencia. proporcionar la oportunidad de ejecutar la
respuesta reforzadora tras realizar la
Hipótesis de la privación de respuesta Explicación instrumental. También conocido como principio de
del reforzamiento que defiende que la restricción Premack.
el acceso a una respuesta por debajo de su tasa
de línea base de ocurrencia (privación de Teoría de la respuesta consumatoria Teoría que
respuesta) es suficiente para hacer que la asume que las respuestas consumatorias típicas
oportunidad de ejecutar esa respuesta actúe de la especia (comer, beber y cosas así) son las
como un reforzador positivo efectivo. características fundamentales de los
reforzadores.
Modelo de desviación mínima Modelo de conducta
instrumental, según el cual los participantes
responden a la contingencia respuesta-
reforzador de manera que los acerque lo máximo
posible a su punto de deleite conductual.
Comentarios finales
¿Cómo se puede afirmar que una respuesta instrumental esta bajo el control de ciertos
estímulos?.
Otro aspecto interesante del experimento de Reynolds es que la conducta de cada pájaro
estaba controlada por un estímulo diferente. En ausencia de procedimientos especiales, los
investigadores no siempre pueden predecir cual de varios estímulos de aquellos que un
organismo experimenta adquirirá control sobre su conducta instrumental
Generalización de estímulos
Identificar y diferenciar varios estímulos no es algo tan simple. Los estímulos pueden
definirse de formas muy diversas. En ocasiones, objetos o eventos muy diferentes se
consideran ejemplos del mismo estímulo debido a que comparten la misma función. En otros
casos, los estímulos se identifican y distinguen partiendo de rasgos físicos precisos, como
la longitud de onda.
Los análisis experimentales del problema han dependido en su mayoría del fenómeno de la
generalización de estímulos, que es lo opuesto a la respuesta diferencial, o discriminación
de estímulos. Se dice que un organismo muestra generalización de estímulos si responde
manera similar a dos o mas estímulos. Este fenómeno fue observado en primer lugar por
Pavlov.
Los gradientes de generalización del estímulo como medidas del control por el
estímulo
Se utilizan a menudo para medir el control por el estímulo porque facilitan información
acerca del grado de sensibilidad de la conducta de un organismo ante la variación de un
aspecto particular del ambiente.
Guttman y Kalish (1956) y el experimento hipotético con las palomas ciegas a los colores
indica que lo acusado del gradiente de generalización de un estímulo proporciona una
medida precisa del grado de control del estímulo. Se obtiene un gradiente de
generalización plano si el organismo responde de forma similar a todos los estímulos de la
prueba. Esta falta de respuesta diferencial demuestra que el rasgo del estímulo que se
varia en la prueba de generalización no controla la conducta instrumental. Por el contrario,
se obtiene un gradiente de generalización acusado si el organismo responde en mayor
medida a algunos de los estímulos de prueba que a otros. Esta respuesta diferencial
evidencia el hecho de que la conducta instrumental esta bajo el control del rasgo del
estímulo que varia entre los estímulos de prueba.
La cuestión principal es la siguiente ¿Qué es lo que determina que una de las muchas
características de una situación estimular adquiera control sobre la conducta
instrumental?.
El factor que determina de forma mas evidente si una característica particular del
estímulo llega a controlar la respuesta es la capacidad sensorial y de orientación del
individuo. La presentación de estímulos con ciertas características de interés para un
organismo no garantiza que otro organismo responderá a las mismas características.
Los sucesos fuera del rango de lo que un organismo puede detectar con sus órganos
sensoriales simplemente no existen para ese organismo a menos que se amplifiquen o sean
traducidos a algo que el organismo pueda detectar. Las limitaciones en los estímulos que
pueden llegar a controlar la conducta dependen también de si el individuo llega a tomar
contacto con el estímulo.
Tipo de reforzamiento
Otro factor que puede determinar que rasgos de un estímulo compuesto obtendrán control
sobre la conducta es la naturaleza de la respuesta requerida por el reforzamiento.
Las respuestas que se diferencian por la localización es mas probable que lleguen a estar
bajo el control de la característica espacial de las claves auditivas. Por el contrario las
respuestas que se diferencian por la naturaleza (hacer/no hacer) es mas probable que
lleguen a estar bajo el control de la naturaleza de las claves auditivas. Este fenómeno se
denomina efecto de la naturaleza-localizacion. Este efecto es una forma de asociación
selectiva.
En el análisis anterior sobre el control de la conducta por varios elementos del estímulo, se
asumió que los organismos tratan a estos elementos del estímulo como rasgos distintivos y
separados del ambiente. Esto se denomina aproximación elemental del estímulo. Por tanto,
en el efecto de naturaleza-localización, la naturaleza y la localización de un estímulo
auditivo se consideran características separables de las claves auditivas. Se suponía que
una característica particular del estímulo (la naturaleza del sonido) se percibía de la misma
manera independientemente del estatus de la otra característica (la localización del
sonido). Una alternativa teórica importante presuma que los organismos tratan los
estímulos complejos como un todo integral que no se divide en partes o elementos. Esto se
denomina aproximación de la clave configuracional.
La estructura de una teoría unificada de este tipo ha sido descrita recientemente por
Wagner y Brandon (2001), estímulos como el sonido de un tono contienen rasgos distintivos
(tono, intensidad, localización ). Cuando un estímulo se combina con otro se crean nuevos
elementos estimulares configuracionales que son únicos para este nueva combinación
estimular. Además, algunos de los rasgos individuales de los estímulos originales se pierden
en la combinación. Esto sesga el control por el estímulo a favor de los elementos
configuracionales y produce resultados congruentes con la aproximación de la clave
configuracional.
Los factores del estímulo y la respuesta son los puntos de arranque del control por el
estímulo. El que ciertos estímulos lleguen a controlar la conducta a menudo depende de lo
que el organismo ha aprendido acerca de esos estímulos.
La sugerencia de que la experiencia con los estímulos puede determinar hasta que punto
estos llegan a controlar la conducta tuvo su origen en los esfuerzos por explicar el
fenómeno de la generalización de estímulos. Pavlov sugirió que la generalización del estímulo
se da porque el aprendizaje sobre el EC llega a transferirse a otros estímulos en función de
la semejanza física de esos estímulos de prueba con el EC original.
Lashley y Wade (1946) adoptaron una postura contraria a la de Pavlov. Rechazaron la idea
de que la generalización del estímulo reflejase la transferencia del aprendizaje y
argumentaron que reflejaba la ausencia de aprendizaje. En particular propusieron que la
generalización del estímulo ocurre si los organismos no han aprendido a distinguir las
diferencias entre los estímulos. Defendían que los animales tenían que aprender a tratar
los estímulos como diferentes uno de otro. Consideraban la forma del gradiente de
Descargado del campus, http://campus.felizmente.info
129
PRINCIPIOS DE APRENDIZAJE Y CONDUCTA
Capítulo 8:El control de la conducta por el estímulo
Juan Carlos Cabrera
generalización del estímulo como determinada principalmente por las experiencias previas
de aprendizaje del organismo mas que por las propiedades físicas de los estímulos.
Numerosos estudios han demostrado que el control por el estímulo puede alterarse de
forma notable por las experiencias de aprendizaje. El procedimiento más poderoso para
situar la conducta bajo el control de un estímulo es el entrenamiento en discriminación de
estímulos. En un procedimiento de discriminación de estímulos los participantes se
exponen al menos a dos estímulos diferentes, pero el reforzamiento por realizar la
respuesta instrumental esta disponible solo en presencia de uno de los colores. El estímulo
que señala la disponibilidad de reforzamiento se denomina E+ o ED (pronunciado “e de”). En
contraste, el estímulo que señala la falta de reforzamiento se denomina E- o EΔ
(pronunciado “e delta”). Los
procedimientos de discriminación de
estímulos establecen un control por
los estímulos que señalan cuando
esta o no disponible el
reforzamiento. Cuando E+ y E- han
adquirido control sobre la conducta
del organismo, se denominan
estímulos discriminativos . El E+ es
un estímulo discriminativo para la
realización de la respuesta
instrumental, y el E- es un estímulo
discriminativo para la supresión de
la respuesta.
Jenkins y Harrison (1960,1962) examinaron como los estímulos auditivos que diferían en el
tono llegaban a controlar la conducta de picoteo de las palomas reforzada con comida. Un
grupo de pájaros fue reforzado por picotear en presencia de un tono de 1000 hertzios y no
recibía reforzamiento cuando el tono no se presentaba. El tono de 1000 hz servía como E+
y la ausencia de tono como E-.
Para el segundo grupo, el tono de 1000 hz sirvió de nuevo como E+ , pero el E- fue un tono
de 950 hz. El tercer grupo de palomas sirvió como grupo de control y no recibió
entrenamiento, el tono de 1000 hz sonaba constantemente y siempre podían recibir
reforzamiento por picotear cuando estaban en la cámara experimental.
Teoría de Spence del aprendizaje de discriminación: Esta basada en la idea de que lo que
se aprende tanto el significado del E+ como del E-, o sea aprender tanto a responder al E+
como a suprimir la respuesta ante el E-. El reforzamiento de una respuesta en presencia del
E+ condiciona tendencias excitatorias de respuesta al E+. Por el contrario, el no
reforzamiento de la respuesta durante el E- condiciona propiedades inhibitorias al E-, lo
que sirve para suprimir la conducta instrumental. Se asume que la respuesta diferencial al
E+ y al E- refleja tanto la excitación por responder ante el E+ como la inhibición por
responder ante el E-.
Comprobar esto requiere pruebas sofisticadas. Una posibilidad es utilizar los gradientes de
generalización del estímulo.
Si se ha condicionado una tendencia exitatoria al E+, entonces los estímulos que difieran de
forma progresiva del E+ deberían ser cada vez menos efectivos en evocar la respuesta
instrumental. En otras palabras, debe observarse un gradiente de generalización acusado,
con la mayor cantidad de respuesta ante el E+. Un resultado como este se llama gradiente
de generalización del estímulo excitatorio. Por el contrario, si se ha condicionado una
tendencia inhibitoria al E-, entonces los estímulos que difieran progresivamente del E-
deberían ser cada vez menos efectivos en inhibir la respuesta instrumental, este resultado
se llama gradiente de generalización del estímulo inhibitorio.
Lo que los sujetos aprenden sobre el E+ es independiente de lo que aprenden sobre el E-.
Esta suposición es demasiado simplista. Lo que se aprende sobre el E+ puede influir en la
respuesta al E- y viceversa. Estas interacciones son particularmente probables si el E+ y el
E- se relacionan de alguna manera.
denomina efecto del desplazamiento del máximo, este puede ocurrir en cualquier
discriminación intradimensional.
contiene agua, una vez que aprenden la discriminación agua/no agua, su conducta se
generalizo a nuevas fotografía.
El control contextual por el estímulo puede ocurrir sin que un contexto esté más
fuertemente asociado con el reforzamiento que otro. Dado que un contexto no es mejor
señal par el reforzamiento que otro, las asociaciones involucran un tipo diferente de
mecanismos. Una posibilidad es que cada contexto activa una memoria diferente. Que le
Contexto 1 active la memoria de reforzamiento con 90º y la de ausencia de reforzamiento
con 0º. Por el contrario, el Contexto 2 active la memoria de reforzamiento con 0º y la de
ausencia de reforzamiento con 90º. En lugar de estar asociado con un estímulo particular,
cada contexto podría estar asociado con una contingencia diferente E+/E-. Estas
asociaciones se denominan relaciones condicionales.
En capítulos anteriores se han destacado las relaciones que involucran sólo dos eventos, un
EC y un EI, o una respuesta y un reforzador. Las relaciones entre dos eventos se llaman
relaciones binarias. En ciertas circunstancias, la naturaleza de un relación binaria esta
determinada por un tercer suceso, llamado modulador. La relación de un modulador con la
relación binaria que señala se denomina una relación condicional.
Un procedimiento en el que un
organismo es reforzado por
responder en presencia del E+ pero
no es reforzado en presencia del E-,
los estímulos discriminativos E+ y E-
son moduladores que señalan la relación entre la respuesta y el reforzador. Existe una
relación respuesta-reforzador durante el E+ y una relación diferente durante el E-, por
tanto los procedimientos de discriminación instrumental incluyen el control condicional de
la relación entre la respuesta y el reforzador.
COMENTARIOS FINALES
(página 249 del libro)
El grado de control por el estímulo está determinado por numerosos factores, incluyendo la
capacidad y orientación sensorial del organismo, la prominencia relativa de otras claves en
las situaciones, el tipo de reforzamiento utilizado, y el tipo de respuesta requerida para el
reforzamiento. El control por el estímulo está también en función del aprendizaje. El
entrenamiento en discriminación aumenta el control de la conducta por el estímulo tanto si
incluye estímulos que difieren en varios aspectos como en uno solo. El entrenamiento en
discriminación con estímulos que difieren sólo en una dimensión produce un control por el
estímulo más preciso y puede llevar al resultado contraintuitivo de que el nivel máximo de
respuesta se desplace del estímulo reforzado. Lo opuesto del entrenamiento en
discriminación es el entrenamiento en equivalencia, el cual aumenta la generalización de la
conducta.
No sólo los estímulos discretos sino también las claves contextuales de fondo pueden llegar
a controlar la conducta. El control del estímulo por claves contextuales pueden
desarrollarse aun cuando no se requiera atención a las claves contextuales para optimizar
el reforzamiento. Las claves contextuales pueden llegar a asociarse directamente con el EI
o servir para modular la relación entre un EC discreto y un EI.
TÉRMINOS CLAVE
Facilitación Procedimiento en el que una clave
Aproximación de la clave configuracional Aproxi- designa cuándo otra clave será reforzada.
mación al análisis del control por estímulos También llamado establecimiento de la ocasión.
compuestos que asume que los organismos
responden a un estímulo compuesto como un todo Generalización del estímulo Ocurrencia de una
integral más que a una colección de elementos conducta aprendida a través de habituación o
estimulares separados e independiente. (Compa- condicionamiento en presencia de estímulos que
rése con la aproximación elemental del estímulo) son diferentes de los estímulos utilizados
durante el entrenamiento.
Aproximación elemental del estímulo Aproximación
al análisis del control por los estímulos Gradiente de generalización del estímulo
compuestos que asume que los participantes Gradiente de respuesta que se observa si los
responden a un estímulo compuesto en términos participantes se prueban con estímulos que
de los elementos del estímulo que forman el difieren cada vez más del estímulo que estaba
compuesto. (Compárese con aproximación de la presente durante el entrenamiento. (Véase
clave configuracional.) también gradiente de generalización del estímulo
excitatorio y gradiente de generalización del
Desplazamiento del máximo Desplazamiento de la estímulo inhibitorio.)
tasa más alta de respuesta en un gradiente de
generalización del estímulo desde el E+ en Gradiente de generalización del estímulo
dirección opuesta al E- después del entrenamien- excitatorio Gradiente de respuesta que se
to en discriminación intradimensional. observa cuando se prueba a los organismos con el
E+ de un procedimiento de discriminación y con
Discriminación del estímulo Respuesta diferencial estímulos que difieren cada vez más del E+. El
en presencia de dos o más estímulos. nivel más alto de respuesta sucede con los
estímulos similares al E+; se da progresivamente
Discriminación intradimensional Discriminación menos respuestas a los estímulos que difieren
entre estímulos que difieren sólo en cuanto al cada vez más del E+. Por tanto, el gradiente tiene
valor de una característica del estímulo, como el forma de U invertida.
color, el brillo o el tono.
Gradiente de generalización del estímulo
Equivalencia de estímulos Responder a estímulos inhibitorio Gradiente de respuesta que se
físicamente distintos como si fuesen iguales observa cuando se prueba a loa organismos con el
debido a experiencias comunes previas con los E- de un procedimiento de discriminación y con
estímulos. estímulos que difieren cada vez más del E-. El
nivel más bajo de respuesta sucede con los
Ensombrecimiento Interferencia en el estímulos similares al E-; se da progresivamente
condicionamiento de un estímulo debido a la más respuestas a los estímulos que difieren cada
presencia simultánea de otro estímulo que es más vez más del E-. Por tanto, el gradiente tiene
fácil de condicionar. forma de U.
Establecimiento de la ocasión Lo mismo que Modulador Estimulo que señala la relación entre
facilitación. otros dos sucesos. La naturaleza de una relación
binaria está determinada por el modulador.
Estímulo discriminativo Estímulo que controla la
ejecución de la conducta instrumental porque
señala la disponibilidad (o no disponibilidad) de
reforzamiento.
Comentarios finales
143
La extinción puede llevarse a cabo sólo después de que haya sido establecida una
respuesta o una asociación utilizando condicionamiento pavloviano o instrumental. El
objetivo es revertir los efectos de la adquisición, pero raramente se alcanza y en la mayoría
resultan imposible. Fenómenos como la recuperación espontánea, la renovación y el
restablecimiento muestran que la extinción no elimina lo que se aprendió de forma original.
Los estudios sobre devaluación del reforzador sugieren que la extinción no tiene
virtualmente ningún impacto sobre las asociaciones E-C o R-C. Parece implicar el nuevo
aprendizaje de una asociación E-R inhibitoria que se superpone a lo que se aprendió con
anterioridad.
La extinción se produce por la omisión del EI que sigue a las presentaciones del EC o
la omisión del reforzador que sigue a la respuesta instrumental. El olvido, por el contrario,
es una disminución de la respuesta condicionada que se da por la ausencia prolongada de
experiencia con el estimulo condicionado o con la respuesta instrumental.
145
Recuperación espontanea
146
Bouton (1993,1994) ha sugerido que las claves contextuales sirven para eliminar la
ambigüedad del significado de un estimulo condicionado. Un EC que adquiere
condicionamiento excitatorio y luego se extingue también tiene un significado ambiguo, en el
sentido de que podría indicar la cercanía del EI (adquisición) o su ausencia (extinción). Esta
ambigüedad permite al EC ponerse bajo el control contextual de manera más fácil. Tras el
entrenamiento de adquisición por sí solo, el EC no es ambiguo porque solo significa una cosa
(la proximidad de la entrega del EI). En consecuencia, este EC no es susceptible de control
contextual.
147
Investigaciones durante los últimos 20 años sobre el efecto del restablecimiento, han
indicado que el condicionamiento contextual es importante, pero no porque permita la suma
de la extinción sino por suprimir la ambigüedad del significado de un estimulo que tiene una
historia mezclada de condicionamiento y extinción. El contexto tiene poco efecto en los
estímuos con una historia sólo de condicionamiento.
Los hallazgos han fortalecido la conclusión de que la extinción no elimina las asociaciones -
R-C y E-C que se aprende durante el condicionamiento instrumental.
148
Si como hemos visto la extinción no implica “desaprendizaje” y deja intacta las asociaciones
R-C y E-C, ¿por qué disminuye las respuestas en los procedimientos de extinción?
Asociaciones ER inhibitorias
Los investigadores han vuelto a considerar la relevancia de las asociaciones E-R. En lugar de
centrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, han
llegado a la conclusión de que la falta de reforzamiento produce una asociación E-R
inhibitoria: La falta de reforzamiento de una respuesta en presencia de un estímulo
específico, produce una asociación E-R inhibitoria que sirve para suprimir esa respuesta
siempre y cuando el E esté presente. Esta hipótesis, predice que los efectos de la extinción
serán altamente específicos del contexto en el que la respuesta fue extinguida.
Ejemplo: Podriamos pensar que un entrenamiento más extenso crearía una respuesta “más fuerte”,
que sería más resistente a la extinción, pero sucede lo contrario.
149
Ejemplo: Si consideramos dos posibiliades: en una, que se recibe 100€ al mes; en la otra, 20€ al mes.
Si se deja de percibir la cantidad, es más aversiva si nos hemos acostumbramos a 100 que a 20.
La explicación más evidente del ERPE es que la introducción de la extinción es más fácil de
detectar tras el reforzamiento continuo que tras el reforzamiento parcial. La ausencia de
reforzamiento es presumiblemente mucho más fácil de detectar tras el reforzamiento
continuo. Esta explicación del efecto del reforzamiento parcial en la extinción se llama
hipótesis de la discriminación.
150
Teoría secuencial; Capaldi, está formulada en términos de memoria. Asume que los sujetos
pueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasado
reciente. Recuerdan los ensayos recientes tanto recompensados como no recompensados.
Se asume además que durante el entrenamiento en reforzamiento intermitente, la memoria
de la ausencia de recompensa llega a ser una clave para la realización de la respuesta
instrumental, esto produce persistencia en le extinción.
Desde que la dos teorías fueron propuestas se ha obtenido gran evidencia en apoyo de cada
teoría. Ambas representan dos formas diferentes en las que el reforzamiento parcial puede
influir sobre la respuesta durante la extinción. Los mecanismos de memoria pueden
contribuir en mayor medida cuando los ensayos de entrenamiento no estén separados por
largos intervalos entre ensayos. El aprendizaje emocional descrito por la teoría de la
frustración es menos sensible a los intervalos entre ensayos y, por tanto, proporciona una
mejor explicación del ERPE cuando se utilizan ensayos ampliamente espaciados.
151
Un experimento en el que participó HCB, una chica de 17 años y una edad mental de 3. Los
resultados obtenidos con HCB ilustran dos conclusiones normales de los estudios de
momento conductual. La primera es que el momento conductual está directamente
relacionado con la tasa de reforzamiento. Una tasa más alta de reforzamiento produce una
conducta que tiene un mayor momento y que es menos susceptible a la interrupción; otro
hallazgo es que el momento conductual no está relacionado con la tasa de respuesta. Dos
conductas que se dan a tasas semejantes no es preciso que tengan grados similares de
momento conductual. Nevin ha destacado la tasa de reforzamiento en lugar de la tasa de
respuesta como el determinante fundamental del momento conductual. Esta conclusión está
confirmada por otros estudios que demuestran que los programas que proporcionan tasas
similares de reforzamiento pero tasa diferentes de respuesta tienen similares momentos o
resistencias al cambio.
152
Los estudios sobre extinción ilustran la naturaleza duradera de ciertos temas en la teoría
de la conducta. Los primeros estudios sobre la extinción se centraron en los efectos del
reforzamiento parcial enla extinción y otros efectos “paradójicos” de la recompensa, y se
llevaron a cabo dentro de la tradición hulliana que daba preeminencia al aprendizaje E-R.
Los mecanismos E-R cayeron en desuso con la creciente evidencia de que el
condicionamiento pavloviano y el intrumental involucraban asociaciones E-C y R-C, que
estaban controladas o moduladas por claves contextuales. Estas evidencias fueron parte de
la “revolución cognitiva” que se introdujo en la psicología en el último cuarto de siglo XX.
Ésta proporcionó una mejor compresión de la recuperación espontánea y llevó al
descubrimiento de nuevos fenómenos como la renovación y el restablecimiento. Sin
embargo, estos fenómenos representas los fallos de la extinción más que la exticnión en sí
misma. Como se ha descrito, la compresión de la extinción en sí misma ha requerido la
vuelta a los conceptos E-R, esta vez en forma de asociaciones E-R inhibitorias. Los
investigadores sigun interesados en qué es lo que hace que conducta sea resistente al
cambio. Esta resistencia o momento conductual plantea especiales desafíos para la terapia
de conducta.
153
Frustración Respuesta emocional aversiva que es Teoría secuencial Teoría del efecto de reforza-
resultado de la ausencia inesperada de reforza- miento parcial en la extinción, de acuerdo con la
miento. que la extinción se retarda tras el reforzamiento
parcial porque la respuesta intrumental se condi-
Hipótesis de la discriminación Explicación del ciona a la memoria de ausencia de rescompensa.
efecto de reforzamiento parcial en la extinción,
de acuerdo con la que la extinción es más lenta
tras el reforzamiento parcial que tras el reforza-
miento continuo, porque el principio de la extin-
ción es más difícil de detectar cuando sigue el
reforzamiento parcial.
154