You are on page 1of 86

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN !

A) ANTECEDENTES HISTRICOS
Los inicios del aprendizaje tienen su raz en la filosofa de Ren Descartes. Dualismo Cartesiano: 2 tipos de conducta 1) Conducta Involuntaria: Respuestas automticas a los estmulos externos y est mediada por un mecanismo llamado reflejo. 2) Conducta Voluntaria: No requiere de la intervencin de estmulos externos sino que se debe a la voluntad consciente de actuar de una determinada forma. Diagrama del dualismo cartesiano
Mundo fisico (causa de la accin inv.) rganos sensoriales

Nervios

Cerebro

Glandula Pineal

Mente (causa de la accin voluntaria)

Accin voluntaria o involuntaria

Musculos

Desarrollo histrico del estudio de la mente


Innatismo: (Descartes) Nacemos con ideas innatas acerca de ciertas cosas. Es lo que se conoce como Postura nativista. Empirismo: (John Locke) Todas las ideas de las personas eran aprendidas directa o indirectamente a travs de experiencias posteriores al nacimiento. Modelo adoptado por filsofos britnicos entre XVII-XIX. A los seguidores se les conocera como Empiristas britnicos. Descartes tambin pensaba que la mente no operaba de forma predecible y ordenada. El Hedonismo surge como una alternativa a este pensamiento. Hedonismo: (Thomas Hobbes) Para los hedonistas, la mente opera de forma predecible y conforme a leyes. Las personas siempre tratarn de lograr el placer y evitar el dolor.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN ! Concepto de asociacin: Concepto importante para los empiristas britnicos para explicar el funcionamiento de la mente. Las sensaciones simples se combinan hasta formas ideas complejas por medio de asociaciones. Ejemplo - Idea simple: Oir la palabra coche - Idea simple: Recuerdo que evoca la palabra coche sobre experiencias anteriores que hemos vivido con los coches. Estas dos ideas simples se combinan y tenemos: - Idea compleja: Nos formamos una idea de su apariencia, de su utilidad y de cmo nos sentiramos sentados en el. Leyes de asociacin Leyes primarias: (Origen en Aristteles) contigidad, similitud y contraste Contigidad: La ms importante en el estudio de las asociaciones. Si dos eventos ocurren juntos en el espacio o en el tiempo de forma repetida quedarn asociados.

Ejemplo: Si nos encontramos con el olor de la salsa de tomate y los espaguetis con frecuencia, pensaremos en espaguettis con el mero olor de la salsa de tomate. Similitud y contraste: Dos ideas se asocian si son similares en algn aspecto (las dos son rojas) o si tienen alguna caracterstica contraria (diferencia de tamao).

Leyes secundarias: (Thomas Brown 1778-1820). La formacin de asociaciones entre dos sensaciones estaba influida por un nmero de factores, incluyendo la intensidad de las sensaciones y la frecuencia y recencia con que las dos sensaciones ocurran conjuntamente. Adems se consideraba que la formacin de una asociacin entre dos eventos dependa del nmero de asociaciones anteriores en las que cada uno de dichos eventos estaba involucrado, y la similitud entre estas asociaciones pasadas y la que se forma en el presente. Sin embargo los empiristas britnicos no estudiaron en profundidad las leyes de asociacinhasta que lleg el psiclogo alemn Hermann Ebbinghaus!!! (18501909) quien invent las Slabas sin sentidoy qu es esto??? Slabas sin sentido: Combinaciones de 3 letras (bap por ejemplo) despojadas de cualquier significado que pudiera influir en cmo se reaccionaba entre ellas. El alemn este, Ebbinghaus, se utiliz a si mismo para medir su capacidad de recordarlas en diferentes condiciones experimentales. Comprob que la fuerza de las asociaciones mejoraba con el entrenamiento y que las slabas que aparecan

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN ! cercanas en una lista quedaban asociadas con mayor fuerza que las que estaban distantes. Esto lo veo un poco de cajn, pero el libro tampoco da ms datos

Desarrollo histrico del estudio de los reflejos


Descartes pensaba que los mensajes que iban de los rganos de los sentidos al cerebro y los mensajes motores que iban del cerebro a los msculos viajaban por los mismos nervios. Descartes Pensaba que los nervios eran tubos huecos por los que se desplazaban unos gases llamados espritus animalesno comment. Como es obvio, siglos posteriores a la muerte de Descartes, todas estas ideas acerca de los reflejos resultaron ser errneas. Charles Bell y Franois Magendie demostraron que eran fibras nerviosas distintas las que se encargaban de transmitir la informacin sensorial desde los rganos de los sentidos hasta el sistema nervioso central y otras fibras que transmitan la informacin motora desde el sistema nervioso central hasta los msculos. Sistema nervioso central

Informacin sensorial

Informacin Motora

rganos de los sentidos

Msculos

- En 1669 John Swamerdamm mostr que la irritacin mecnica de un nervio era suficiente para producir una contraccin muscular, asi que lo de los espiritus animales desde la glandula pineal era innecesario. - Posteriormente, Francis Glisson demostr que las contracciones musculares no se deban a que los msculos fueran hinchados por un gas. Osea que toda esta gente tir por tierra las elaboradas suposiciones que siglos antes haba formulado Descartes

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN ! Y con todo esto llegamos al siglo XIX y los rusos entran en accin: I.M Sechenov (1829-1905) Propuso que los estmulos no siempre elicitan respuestas reflejas de forma directa. En algunos casos un estmulo puede liberar una respuesta que estaba inhibida y la fuerza de la respuesta no depender de la intensidad del estmulo. Ejemplo: Pequeas partculas de polvo pueden liberar un potente estornudo. Segn Sechenov, la conducta voluntaria y los pensamientos estn en realidad elicitados (generados) por estmulos dbiles y apenas visibles.

Sin embargo el trabajo de Sechenov tena un fallo: No tuvo en consideracin que a lo largo de la vida de un individuo, su respuesta ante un estmulo puede variar debido a la experiencia. Y aqu es donde lleg el padre del cordero (o mejor dicho, del perro): Ivan Pavlov Ivan Pavlov (1849 1936): Demostr experimentalmente que no todos los reflejos son innatos. Mediante mecanismos asociativos se pueden establecer nuevos reflejos para estmulos. Su papel fue similar al del alemn que hablabamos antes, Ebbinghaus, pero Pavlov realiz su trabajo desde la tradicin filosfica de la reflexologa.

B) EL AMANECER DE UNA NUEVA ERA La cognicin comparada y la evolucin de la inteligencia


Descartes pensaba que los humanos eran los nicos animales que posean mente. Y cmo no, no tardaron en surgir autores que dejaran por el suelo al pobre Descartes. Darwin critic duramente esta idea y en su libro el origen del hombre postul que el hombre desciende de algn ser ms primitivo, a pesar de que por el momento se desconozcan los eslabones intermedios. En opinin de Darwin, la mente humana es producto de la evolucin y si el ser humano tiene habilidades mentales como hacerse preguntas, memorizar, o razonar, el resto de animales posee tambin dichas habilidades. George Romanes: Defini la inteligencia a partir de la capacidad de aprender. Esta definicin fue ampliamente aceptada a finales del XIX y principios del XX.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN !

Neurologia funcional
Nervismo: (Pavlov) De acuerdo con el nervismo, las principales funciones fisiolgicas estn controladas por el sistema nervioso. Sin embargoaos ms tarde (1902) surgen dos investigadores britnicos (Bayliss y Starling) demostraron que el pncreas estaba controlado parcialmente por factores hormonales y no neurales. Este nuevo descubrimiento le llev a Pavlov a pensar que por ah no iban los tiros y abandonar su investigacin sobre la fisiologa del sistema digestivo y centrarse en los reflejos condicionados. Pavlov consider los estudios de condicionamiento como un medio para obtener informacin sobre las funciones del sistema nervioso. Ejemplo: El psiclogo del comportamiento es como un conductor que trata de descrubir el funcionamiento de un coche conducindolo en lugar de estudiando el motor.

Modelos animales de la conducta humana


Se pensaba que la investigacin con animales podra proporcionar informacin til para la comprensin del comportamiento humano. Los modelos animales permiten investigar problemas que son difciles o imposibles de estudiar directamente en personas. Un modelo permite realizar la investigacin en condiciones ms sencillas, mejor controladas y ms econmicas. Por ejemplo: La similitud entre las ratas y los humanos en la forma de evitar comidas peligrosas hace que la rata sea un modelo vlido para investigar el aprendizaje de aversin a la comida en humanos. El hecho de que las ratas tengan cola y de que caminen a 4 patas es irrelevante para el estudio de la seleccin de alimentos. Lo ms importante a la hora de construir un modelo animal til es identificar las similitudes relevantes entre el modelo animal y la conducta humana en cuestin. Dollard y Miller fueron partidarios de una integracin en la que los estudios de laboratorio realizados con animales no humanos se usaran para aislar e identificar los fenmenos que podran ser estudiados posteriormente con xito en las personas.

Modelos animales y robtica


La meta de la robtica es hacer mquinas tan inteligentes como sea posible. Los ingenieros actuales contemplan la capacidad de recordar y aprender a partir de la experiencia como un rasgo importante de los sistemas artificiales inteligentes.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN ! (esto guarda relacin con la definicin comentada anteriormente de Romanes sobre la inteligencia)

C) DEFINICIN DE APRENDIZAJE
Segn Domjan: El aprendizaje es un cambio duradero en los mecanismos de conducta que implica estmulos y/o respuestas especficas y que es resultado de la experiencia previa con esos estmulos y respuestas o con otros similares

Distincin entre aprendizaje y ejecucin


Acerca de la definicin anterior es importante puntualizar que atribuye el aprendizaje a un cambio en los mecanismos de conducta, no a un cambio directo en la conducta. Esto es importante ya que pueden haber cambios en la conducta que no sean consecuencia de un aprendizaje Ejecucin: Se refiere a las acciones de un organismo en un momento concreto. Que hagamos (o no) algo depende de muchas cosas, como la motivacin, capacidades sensoriales, etc, adems del aprendizaje. Que un nio se tire (ejecucin) a una piscina es algo que est determinado por otras cosas (lo fria que est el agua, la motivacin por tirarse, la profundidad etc.), adems del aprendizaje. No podemos afirmar que el hecho de tirarse se deba exclusivamente al aprendizaje.

El aprendizaje y otras fuentes de cambio conductual


Existen cambios en la conducta tan breves que no pueden ser considerados como ejemplos de aprendizaje: Fatiga: El esfuerzo fsico debilita gradualmente la fuerza de una respuesta. Cambio en las condiciones estimulares: Encender las luces a mitad de la pelcula en el cine provoca una respuesta en los espectadores. Estado Fisiolgico o motivacional del organismo: El hambre y la sed provocan respuestas que no se observan en otros momentos. Maduracin: Un nio crece y alcanza una estantera a la que antes no llegaba. No se considera aprendizaje ya que es un cambio debido al paso del tiempo.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN !

Diferentes tipos de mecanismos causales


Existen 4 tipos de causas descritos por Aristteles: Causa eficiente: Es la experiencia anterior con estmulos y/o respuestas especficos que produce el cambio en la conducta que seala la presencia del aprendizaje. Causa material: Hacen referencia a los cambios fsicos en el sistema nervioso que median en el aprendizaje. Causa formal: Las causas formales son las teoras o modelos de aprendizaje. Estas teroras o modelos pueden expresarse en trminos matemticos o computacionales. Causa final: La causa final de un comportamiento o de cualquier proceso biolgico es cmo ese proceso contribuye al xito reproductivo del organismo. La causa final se mide a partir del nmero de descendientes de un organismo.

D) ASPECTOS METODOLGICOS DEL ESTUDIO DEL APRENDIZAJE El aprendizaje como ciencia experimental
Los investigadores del aprendizaje han centrado su atencin en las causas eficientes, materiales y formales. Las causas no pueden observarse directamente. Tan slo pueden ser inferidas a partir de los resultados de las manipulaciones experimentales. Si una persona entra en una habitacin a oscuras, pulsa un interruptor y se enciende la luz, no podemos concluir que accionar el interruptor sea la causa de que la luz se haya encendido. Puede haber un detector de movimiento que haya detectado la presencia de la persona y haya encendido la luz. Para descartar esta posibilidad, la persona debera entrar de nuevo a la habitacin y no pulsar el interruptor para ver qu ocurre. Para identificar una causa se requiere la realizacin de una prueba en ausencia de dicha causa. Entonces podremos comparar los resultados obtenidos en presencia y en ausencia de la presunta causa. La pregunta tpica es si un procedimiento produce un efecto de aprendizaje en particular. Para responder a esta pregunta, hay que comparar las acciones de los individuos que previamente han sido expuestos al procedimiento en cuestin con las acciones de los individuos que no han sido expuestos a dicho procedimiento.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN !

La perspectiva de proceso general en el estudio del aprendizaje


Elementos de la perspectiva de proceso general La caracterstica ms obvia de la naturaleza es su diversidad. Sin embargo todos los cientficos han optado por fijarse en los aspectos comunes a la hora de estudiarla. Han tratado de formular leyes generales con las que organizar y explicar la diversidad de los eventos del universo. Los investigadores del aprendizaje animal han seguido esta tradicin. Un presupuesto fundamental en la perspectiva de proceso general es que los fenmenos estudiados son el resultado de procesos ms elementales. Adems se supone que estos procesos elementales operan de forma similar independientemente de donde se encuentren. Los investigadores del condicionamiento y el aprendizaje se han adherido a esta perspectiva de proceso general desde los comienzos de esta rea de estudio en psicologa. Darwin, Pavlov o C. Lloyd Morgan seguan esta perspectiva. Crean en la existencia de leyes universales (por ejemplo las leyes de asociacin) para todas las especies, aunque tambin afirmaban que cada especie poda tener un ritmo diferente de aprendizaje para unas mismas leyes elementales. Implicaciones metodolgicas de la perspectiva de proceso general La principal implicacin metodolgica de esta perspectiva es que se pueden descubrir los principios de aprendizaje estudiando cualquier especie o sistema de respuesta que demuestre aprendizaje. Esta implicacin ha llevado a una estandarizacin en la comunidad cientfica de los paradigmas experimentales. (pedazo frase esta ltima que no hay por dnde cogerlaviene a decir algo as como que todos los cientficos utilizan ms o menos los mismos experimentos a la hora de realizar sus estudios. El libro habla sobre la Paloma en su caja de Skinner tpica que dependiendo del botn que pulse recibir alimento o no) Demostracin de la generalidad de los fenmenos de aprendizaje Es importante tener en mente que la adopcin de la perspectiva de proceso general no prueba la generalidad de los procesos de aprendizaje. Una teora general no puede verificarse empricamente utilizando unos pocos paradigmas experimentales estandarizados. La generalidad del aprendizaje debe probarse realizando estudios en distintas especies y situaciones.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN !

E) USO DE ANIMALES NO HUMANOS EN LA INVESTIGACIN SOBRE APRENDIZAJE. Razones del uso de animales no humanos en la investigacin sobre aprendizaje
Con los animales de laboratorio los cientficos pueden estudiar cmo se aprenden las reacciones emocionales intensas. Sin embargo, con las personas, los investigadores se ven limitados a tratar de modificar las respuestas emocionales inadaptadas una vez que stas ya han sido aprendidas. Para modificar esta respuesta tienen que comprender cmo se aprendi, y es por esta razn por la que se estudian las respuestas emocionales en los animales de laboratorio y extrapolan la conclusin a los seres humanos. Una de las preguntas fundamentales acerca de la naturaleza humana es cmo evolucionaron la cognicin y la inteligencia. Por ello la investigacin sobre la evolucin de la cognicin y la inteligencia se apoya fuertemente en estudios de aprendizaje realizado con animales. Ventajas de utilizar animales de laboratorio en lugar de personas -

Los procesos de aprendizaje suelen ser ms simples El comportamiento de los animales no se ve complicado por procesos lingsticos No es necesario hacer peticiones explcitas a los sujetos El investigador no debe preocuparse sobre si los actos de los participantes no estn influidos por el deseo de complacer al investigador.

Los animales de laboratorio y la conducta normal


La tica de la investigacin con animales de laboratorio Han surgido reglas estrictas que obligan a los laboratorios a tratar bien a los animales. Sin embargo se olvida que aunque no existan estas reglas, los cientficos siempre los trataran bien, ya que la informacin extrada a partir de experimentos a animales enfermos o ansiosos no es fiable. Por lo tanto los propios cientficos son los primeros interesados en el bienestar de sus sujetos experimentales. A veces los experimentos conllevan incomodidades, como la privacin de comida o estimulos aversivos. Algunos temas importantes, como el castigo o el condicionamiento del miedo no pueden estudiarse sin alguna incomodidad por parte del sujeto. Los estudios de aprendizaje del miedo utilizan a menudo descargas elctricas, pero de baja intensidad.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN ! Qu constituye un trato humano a los animales? Asumiendo que una especie merece el trato que establezcan las normas oficiales, cules deberan ser esas normas? A menudo se describe el trato humano como el tratamiento apropiado para los animales de laboratorio. Sin embargo las ratas prefieren vivir en madrigueras oscuras hechas de basura y los humanos en habitaciones limpias e iluminadasy as es precisamente como se tiene a las ratas en los laboratorios. Quiz el trato humano que les damos no es precisamente el que las ratas preferiran Deben los seres humanos beneficiarse del uso de otros animales? Muchos animales domsticos tambin se benefician de la relacin con los humanos, de hecho algunos no existiran. Se trata de una relacin simbitica. Adems el uso de animales de laboratorio representa tan slo una pequea parte del uso que otros humanos hacen de los animales domsticos, incluyendo su uso como fuente de alimentacin. Dato curioso: En 1997 se utilizaron en EEUU 8,5 mil millones de animales en alimentacin. Sin embargo solo se utilizaron 8,5 millones en laboratorio. Esto tan slo constituye un 0,1% del nmero total de animales empleados en ganadera. Si a estos datos sumamos el impacto en su habitat que tiene la construccin de carreteras, viviendas, etc o los miles de animales muertos por insecticidas, etc. La proporcin de los utilizados en laboratorios es an ms insignificante. Alternativas a la investigacin con animales Russell y Burch (1959) formularon las 3 R de la investigacin con animales. - Reemplazamiento del uso de animales por otras tcnicas de estudio - Reduccin del nmero de animales empleados por medio de tcnicas estadsticas - Refinamiento de los procesos experimentales para causar menos sufrimiento Algunas de las alternativas propuestas son las siguientes: 1. Tcnicas observacionales: No se puede. Los estudios de aprendizaje requieren manipulaciones experimentales de la experiencia pasada. 2. Uso de plantas: No se puede estudiar el aprendizaje ya que carecen de sistema nervioso. 3. Cultivo de tejidos: El funcionamiento de estos procesos celulares en el organismo intacto solo puede estudiarse en el organismo intacto. 4. Simulaciones informticas: La preparacin de un programa informtico que simule un fenmeno natural requiere un conocimiento profundo del fenmeno en cuestin. No pueden utilizarse para generar hechos anteriormente desconocidos sobre la conducta. Eso slo puede hacerse estudiando a los organismos vivos.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!!!!CAPITULO 1: INTRODUCCIN ! Conn y parker (1998): los cientficos dependen de los ordenadores para procesar los datos que ya poseen, pero no pueden usarlos para explorar lo desconocido en busca de nueva informacin

TRMINOS CLAVE
Aprendizaje: Cambio duradero en los mecanismos de conducta que implica estmulos y/o respuestas especficos y que es resultado de la experiencia previa con esos estmulos y respuestas o con otros similares. Asociacin: Conexin entre la representacin mental de dos eventos (dos estmulos o un estmulo y una respuesta) de forma que la ocurrencia de uno de los eventos activa la representacin del otro. Dualismo: Visin de la conducta segn la cual las acciones pueden dividirse en dos categoras: conducta voluntaria controlada por la mente y conducta involuntaria controlada por mecanismos reflejos. Ejecucin: Actividades de un organismo en un momento particular. Empirismo: Corriente filosfica segn la cual todas las ideas de la mente tienen su origen en la experiencia. Fatiga: Disminucin temporal de la conducta provocada por el uso excesivo o repetido de los msculos involucrados en ella. Hedonismo: Postura filosfica propuesta por Hobbes segn la cual las acciones de un organismo estn enteramente determinadas por la persecucin del placer y la evitacin del dolor. Maduracin: Cambio en la conducta causado por el desarrollo fsico o fisiolgico del organismo en ausencia de experiencia con eventos particulares del ambiente. Innatismo: Postura filosfica segn la cual los seres humanos nacen con ideas innatas. Nervismo: Postura filosfica adoptada por Pavlov segn la cual todos los procesos conductuales y fisiolgicos estn regulados por el sistema nervioso. Reflejo: Mecanismo que permite que un evento especfico del ambiente elicite una respuesta especfica. Slaba sin sentido: Combinacin de 3 letras ( dos consonantes separadas por una vocal) sin significado.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

A) LA NATURALEZA DE LA CONDUCTA ELICITADA


Gran parte de la conducta de los animales tiene lugar como respuesta a estmulos, es decir, ocurre de forma elicitada.

El concepto de reflejo
Un soplo de aire dirigido a la crnea provoca un parpadeo. Esto es un reflejo. Un reflejo se compone de dos elementos, un estmulo elicitante y su correspondiente respuesta. Estos dos elementos se comprenden bien mediante la organizacin del sistema nervioso. En los vertebrados los reflejos simples estn mediados por 3 neuronas: Neurona sensorial (aferente): capta el estimulo ambiental y transmite el mensaje a la medula espinal. Neurona motora (eferente): Activa el msculo involucrado en la respuesta refleja. Interneurona: Neurona encargada de transmitir los impulsos entre los dos tipos de neuronas anteriores. Arco reflejo: Es el conjunto formado por la neurona sensorial, la interneurona y la neurona motora. En los vertebrados, el arco reflejo representa el numero mnimo de conexiones neuronales necesarias para que tenga lugar el acto reflejo. La mayor parte de los reflejos contribuyen al bienestar del organismo. Si pongo la mano en el fuego la quitar rpidamente, de lo contrario me quedara sin mano, algo malo para el organismo. Un reflejo importante en los recin nacidos es el reflejo de oclusin respiratoria: si algo (prendas, mucosidades) tapona la nariz del beb, su reflejo ser echar la cabeza hacia atrs buscando aire, si sigue sin encontrar aire comenzar a llorar, lo que provocar una expulsin vigorosa del aire eliminando cualquier obstruccin de las vias respiratorias. Esto es especialmente importante cuando le deis (me refiero a las mujeres) de mamar a vuestro beb, ya que al no poder respirar por la boca (ya que est ocupada por el pezn) tendr que respirar por la nariz y el resto del pecho no debe taponarla, de lo contrario empezar a llorar, no querr comer y no sabris porqu. Los consejos son gratis.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Pautas de accin modal


Las pautas de accin modal (PAMs) son respuestas tpicas de especies particulares. Como ejemplo tenemos la respuesta de succin en mamferos a la hora de buscar alimento. El libro pone ms ejemplos pero no los considero importantes y si los pusiera todos esto no sera un resumen. Con captar la idea es suficiente. Una de las caractersticas de las PAMs es que el umbral de estimulacin necesario para que stas se pongan en marcha vara en funcin de las circunstancias. El estmulo puede tener efectos diversos dependiendo del estado fisiolgico del animal y de las acciones que haya realizado recientemente. Un pez espinoso no mostrar su respuesta sexual hasta que la hembra no haya terminado de construir el nido. De la misma manera que no nos lanzamos ante una persona del sexo opuesto en una primera cita, aunque el impulso inicial sea exactamente ese. Las PAMs fueron originariamente identificadas por los etlogos, cientficos interesados en la evolucin del comportamiento. Inicialmente eran conocidas como pautas de accin fija pero posteriormente se pens que eran ms bien variables, por lo que se acept el trmino pautas de accin modal.

Estimulos elicitantes de las pautas de accin modal


Un estmulo elicitante se identifica fcilmente cuando se trata de reflejos simples, ante un ruido mostraremos una respuesta de sobresalto. En cambio los estimulos elicitantes de las PAMs son ms complejos. Como ejemplo hablaremos de la alimentacin de la gaviota. Las crias picotean un punto rojo en el pico de su progenitor, lo cual hace que regurgite la comida para ellos. Ahora bien, qu es lo que provoca que las crias hagan este picoteo?? El color?? La forma?? La longitud del pico de sus progenitores?? Para hallar la solucin a este problema hicieron experimentos y concluyeron que un objeto alargado (en forma de pico) apuntando hacia abajo y con un punto rojo, era lo que ms elicitaba la conducta de los polluelos, es decir, lo que provocaba un picoteo ms fuerte por parte de ellos. Los rasgos especficos que se requieren para elicitar la conducta de picoteo reciben colectivamente el nombre de estimulo seal o estimulo desencadenante. Un estmulo seal o desencadenante es suficiente para elicitar una pauta de accin modal, sin embargo una determinada pauta de accin puede estar controlada por varios rasgos del estmulo de forma aditiva. Adems el estmulo que elicita con mayor efectividad la pauta de accin no tiene porqu ser el que ocurra con mayor probabilidad en condiciones naturales. Me da en la nariz que este ltimo prrafo es importante.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN Estimulos supranormales: Son estmulos inusualmente efectivos. Aqu volvieron a estudiar a las gaviotas, en concreto cuales eran los huevos que ms protegan. Huevos verdes, grandes y moteados eran sus preferidos. Entonces los cientficos crearon un super huevo verde artificial y lleno de motas que era mucho ms efectivo que el natural a la hora de elicitar la respuesta de accin.

La organizacin secuencial de la conducta


Las respuestas no tienen lugar aisladas unas de otras sino que se organizan en secuencias de comportamiento funcionalmente efectivas. Para obtener comida una ardilla tiene que subir al arbol, alcanzar un fruto, romperlo, etc. Toda conducta dirigida a metas involucra secuencias de acciones sistemticamente organizadas. Los etlogos denominaron conducta apetitiva a los primeros componentes de la secuencia del comportamiento y conducta consumatoria a los ultimos. Las conductas apetitivas son menos estereotipadas y dependen del entorno(una ardilla puede buscar comida de muchas formas, puede subir desde un arbol o saltar desde otro cercano) sin embargo las conductas consumatorias son especificas de cada especie y mucho ms estereotipadas (roer, masticar, tragar). Pasando a los seres humanos, dependiendo de la etnia cocinamos la comida de forma diferente (conducta apetitiva) pero todos masticamos y tragamos de la misma forma (conducta consumatoria). Lo de masticar y tragar de la misma forma es cuestionable Secuencia de respuestas de bsqueda de comida con el ejemplo de la ardilla. Modo de bsqueda general: Antes de que la ardilla pueda identificar un nogal se mover buscando posibles fuentes de alimentacin. Modo de bsqueda focalizada: Al encontrar un nogal pasar al modo focalizado en el que slo buscar nueces en ese rbol. Modo de manipulacin de alimento (o consumatorio): Obtener la nuez y masticarla.

B) EFECTOS DE LA ESTIMULACIN REPETIDA


Descartes pensaba que una respuesta elicitada ocurre automticamente siempre que se presentara el mismo estmulo elicitante. Falso. Si esto fuera verdad un beb chupara siempre con la misma intensidad al presentarse un pezn. Por lo tanto la respuesta puede variar, y aqu es donde nos encontramos con uno de los rasgos ms caractersticos de la conducta elicitada: su plasticidad. Y aqu es donde entendemos el ttulo de este apartado: La conducta elicitada puede variar como resultado nicamente de la presentacin repetida del estmulo elicitante.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Atencin visual en los bebes humanos


Aqu se habla de un experimento en bebs que visualizaban varios tableros de ajedrez y su respuesta de atencin visual variaba dependiendo de la naturaleza del estmulo (haba tableros de 4x4 y tableros de 12x12) y de la repeticin del mismo. Conclusin: La atencin visual provocada por un estmulo novedoso cambia a medida que el beb se familiariza con el estmulo. Con un patrn 4x4 relativamente sencillo, la atencin visual se reduce progresivamente. Con un patrn 12x12 ms complejo, la atencin se incremente inicialmente y despus se reduce.

Salivacin y evaluacin del sabor en humanos


El sabor de la comida elicita la salivacin como respuesta refleja. En un estudio se midi la respuesta de salivacin de 8 mujeres ante el sabor del zumo de limn y el zumo de lima. La salivacin como respuesta al sabor disminua con cada ensayo, pero despus de 10 ensayos con limn, se introduca lima en el ensayo 11 y los sujetos volvan a salibar de nuevo. Conclusin: (atencin a esto que me parece bastante interesante) Los resultados indican que las personas encuentran el sabor de una comida especfica menos placentera cuanto ms la comen. Estos hallazgos sugieren que la sobrealimentacin puede reducirse no variando los alimentos disponibles para su consumo.

Respuesta de sobresalto en ratas


La respuesta de sobresalto se da en muchas especies, incluida la humana. Consiste en un salto repentino y una contraccin de los msculos de la parte superior del cuello. En las ratas puede medirse esta respuesta mediante la cmara estabilimtrica que mediante sensores mide la intensidad de la reaccin de sobresalto. Se meta a las ratas en la cmara y mediante sonidos y luces se les daba sustos para medir su respuesta de sobresalto. Conclusin: Las repeticiones de los sustos generaban cada vez respuestas ms dbiles de sobresalto por parte de las ratas. (quiz porque las estaban matando poco a pocoes broma, esto es cosa mia) . Por el contrario cuando el sonido era ms intenso, las repeticiones de tono provocaron reacciones de sobresalto cada vez ms vigorosas.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

C) LOS CONCEPTOS DE HABITUACIN Y SENSIBILIZACIN


Efecto de habituacin: Disminucin de la tendencia a responder producido por la estimulacin repetida. Efecto de sensibilizacin: Incremento en la tendencia a responder producido por la estimulacin repetida.

Adaptabilidad y generalidad de la habituacin y sensibilizacin


En nuestro da a da estamos bombardeados por multitud de estmulos, olores, imgenes, texturas, etc. Los efectos de habituacin y sensibilizacin nos ayudan a decidir qu estmulos ignorar y a cules responder, de lo contrario nuestra conducta sera desorganizada y catica. Ejemplo: Hace dos aos que me compr una vivienda en una urbanizacin, mi bloque en concreto da a una carretera bastante transitada. Al principio me cost acostumbrarme a dormir por las noches, hoy en da ni siquiera oigo los coches. Seguro que todos tenemos mltiples ejemplos sobre este tema. El libro pone ms ejemplos pero creo que el concepto est bastante claro.

Diferencias entre habituacin, adaptacin sensorial y fatiga


La habituacin no es el nico efecto que da lugar a una disminucin en la respuesta. Un reflejo tambin puede provocar una disminucin en la respuesta. Recordemos que el reflejo consta de 3 componentes: Un estmulo que activa los rganos sensoriales Interneuronas que transmiten los mensajes sensoriales a los rganos motores Impulsos nerviosos que activan los msculos

Sin embargo, a pesar de todo esto, puede no darse una respuesta si por alguna razn los rganos sensoriales pierden temporalmente sensibilidad a la estimulacin. Una persona puede quedar temporalmente cegada por una luz brillante (adaptacin sensorial) y una respuesta tampoco tendr lugar si los msculos involucrados quedan incapacitados por la fatiga. - La adaptacin sensorial ocurre en los rganos sensoriales - La fatiga de la respuesta tiene lugar en los msculos efectores - La habituacin y sensibilizacin tienen lugar en el sistema nervioso

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Cmo distinguimos todo esto? La habituacin se distingue de la adaptacin sensorial en que la habituacin es especfica de la respuesta. Si el profesor da un aviso en medio del examen levantamos la vista por un momento pero luego la bajamos y podemos seguir escuchando lo que dice. La habituacin se distingue de la fatiga en que la habituacin es especfica del estmulo. Esto se explica con el ejemplo de la salivacin y el limn, cuanto ms nos exponemos al limn, menos salibamos y menos notamos su sabor, pero si de repente nos introducen lima volvemos a recuperar la respuesta. La prdida de respuesta no vena condicionada por la fatiga.

Teora del proceso dual de habituacin y sensibilizacin


Y me da a mi que aqu se empieza a poner la cosa suave Esta teora fue formulada por Groves y Thompson (1970). La teora del proceso dual presupone que los incrementos y disminuciones en la tendencia a responder a un estmulo son producto de procesos neurales diferentes. El proceso de habituacin provoca una disminucin en la tendencia a responder, en cambio, el proceso de sensibilizacin produce un incremento en la tendencia a responder. Sin embargo ambos procesos estn relacionados y pueden estar activos al mismo tiempo ante un mismo estmulo.

+ Cambio en la magnitud de la respuesta 0 -

+ 0 -

Ensayos Linea Verde: Sensibilizacin Linea Roja: Habituacin Linea Negra: NETO (resultado entre la verde y la roja) Linea Azul: Ni caso, es el eje 0

Ensayos

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN Podemos observar que en el panel izquierdo una repeticin hipottica del estmulo intensifica el proceso de habituacin (la lnea roja). Decimos que lo intensifica porque el Neto est ms cerca de la lnea roja. En el panel de la derecha ocurre lo contrario, el neto est mas cerca de la lnea verde, lo cual indica que intensifica el proceso de sensibilizacin. Aqu es importante sealar que un aumento (sensibilizacin) o disminucin (habituacin) de la respuesta, viene dado por la suma resultado de los procesos de sensibilizacin y habituacin juntos. No caigamos en el error de pensar que la sensibilizacin viene dada nicamente por el proceso de sensibilizacin, ya que el proceso de habituacin tambin tiene su funcin. Groves y Thomson sugirieron que los procesos de habitacin y sensibilizacin tienen lugar en diferentes partes del sistema nervioso: Proceso de habituacin: tiene lugar en el sistema E-R (estimulo respuesta) Proceso de sensibilizacin: tiene lugar en el sistema de estado. Este sistema abarca otras partes del sistema nervioso que determinan el nivel general de disposicin a responder. Las drogas pueden alterar la tendencia a responder.

Implicaciones de la teora del proceso dual El sistema E-R se activa siempre que un estmulo elicita una respuesta ya que es el circuito neuronal que lleva los impulsos desde la entrada sensorial hasta la salida conductual. El sistema de estado slo interviene en circunstancias especiales. Algunos eventos externos (como un ruido intenso) pueden incrementar el estado de alerta del individuo y sensibilizar el sistema de estado.

La teora del proceso dual de habituacin y sensibilizacin ha tenido una gran influencia en el estudio de la plasticidad de la conducta elicitada. Pues s, tena razn, todo esto del proceso dual ha sido bastante suave

D) CARACTERSTICAS DE LA HABITUACIN Y SENSIBILIZACIN 1. Curso temporal


La mayor parte de los cambios conductuales se mantiene durante perodos largos. Curso temporal de sensibilizacin Por lo general los procesos de sensibilizacin tienen efectos temporales. En todos los sistemas de respuesta la duracin de los efectos de sensibilizacin est determinada

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN por la intensidad del estimulo. Los estmulos ms intensos producen mayores incrementos de la tendencia a responder y una sensibilizacin ms persistente. Curso temporal de la habituacin 2 tipos de efectos de habituacin cualitativamente distintos: La habituacin a corto plazo (desaparece en segundos o minutos) La habituacin a largo plazo (persiste durante muchos das)

Aqu es importante quedarnos con el concepto de: Recuperacin instantnea: Recuperacin de una respuesta habituada o de una respuesta extinguida tras un perodo de descanso. La recuperacin instantnea es la caracterstica principal del efecto de habituacin a corto plazo. La habituacin a corto plazo suele tener lugar cuando el estmulo elicitante se presenta frecuentemente. Por el contrario, la habituacin a largo plazo es ms probable cuando las presentaciones del estmulo estn ms separadas.

2. Especificidad del estimulo


Especificidad del estimulo en la habituacin La habituacin es especfica del estmulo que ha sido presentado repetidamente. Una respuesta a un estmulo previamente habituada puede manifestarse plenamente alterando alguna caracterstica importante del estmulo. (si nos acostumbramos al sonido de un reloj que tengamos por casa poco a poco dejamos de oirlo, pero si de repente notamos que se rompe y hace un ruido diferente es probable que volvamos a prestar atencin.) Generalizacin del estmulo de habituacin: Seguimos con el ejemplo del reloj. Si nos habituamos a su sonido y nos presentan otro reloj diferente pero con un sonido similar, es posible que tampoco lo oigamos. Especificidad del estimulo de sensibilizacin La sensibilizacin no es muy especfica del estmulo. Si un animal se activa o sensibiliza por alguna razn, su reactividad se incrementar para toda una variedad de estmulos, no slo para el causante de su sensibilizacin.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

3. Efecto de un estmulo externo intenso


Deshabituacin: Una respuesta habituada puede restablecerse sensibilizando al organismo con la exposicin a un estmulo externo. Es importante tener en cuenta que la deshabituacin hace referencia a la recuperacin de la respuesta al estmulo previamente habituado. Con el ejemplo del ajedrez y los nios, cuando les habian mostrado el ajedrez 8 veces y ya prcticamente no le prestaban atencin, de repente en la vez 9 se lo mostraron acompaado de un sonido. Esto les hizo recuperar parte de la atencin en la vez 10 y 11.

E) APLICACIN A LAS EMOCIONES Y LA CONDUCTA MOTIVADA


Hasta ahora se ha hablado de cambios en la conducta con respuestas sencillas, ahora veremos las ms complicadas como el miedo, euforia, terror, etc.

Reacciones emocionales y sus efectos posteriores


Solomon y Corbit destacaron que las reacciones emocionales intensas a menudo constan de dos fases. Una emocin tiene lugar durante la presentacin del estmulo elicitante y la opuesta se observa cuando el estmulo desaparece. (efecto sedante, relajante y agradable del alcohol al principio, en contraposicin al dolor de cabeza y nausea de la resaca). Otra caracterstica de las reacciones emocionales es que cambian con la experiencia. La reaccin primaria se hace ms dbil y su postefecto se hace ms fuerte. (un bebedor habitual no queda tan debilitado por pocas cervezas pero sin embargo tendr sntomas ms agudos tras beber) Puede tener resacas ms severas irritabilidad e incluso sufrir agitaciones alucinaciones o incluso delirius tremens. (Para quien le guste el cine, dos grandes pelculas de alcohlicos son Das sin Huella (Billy Wilder) y Leaving Las Vegas protagonizada por Nicholas Cage En ambas pelculas podemos observar los estragos que hace el delirius tremens) Tolerancia a la droga: Habituacin de la primera reaccin a la droga Tambin podemos encontrar esta misma analoga de dos procesos en el amor y el apego. Las parejas con el tiempo dejan de darse los signos de amor del principio e incluso dejan de sentir ese enamoramiento principal, debido a la habituacin. Sin embargo cuanto ms tiempo lleve una pareja junta, ms difcil ser la perdida de uno de ellos para el otro.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

La teora del proceso oponente


Esta teora se dise para explicar los 3 rasgos caractersticos de las emociones. (los vuelvo a poner a continuacin pero bsicamente se han explicado a lo largo del punto anterior) 1. Las reacciones emocionales son bifsicas; a una reaccin primaria sigue un postefecto opuesto. 2. La reaccin primaria de debilita con la estimulacin repetida. 3. El debilitamiento de la reaccin primaria va acompaado de un fortalecimiento del postefecto. La teora asume que los mecanismos neurofisiolgicos involucrados en la conducta emocional tratan de mantener la estabilidad emocional, se trata de minimizar las desviaciones intentando volver a la neutralidad de nuestro estado emocional. Por esta razn decimos que es una teora homeosttica. La teora asume que un estmulo emocional activador desva de la neutralidad el estado emocional de una persona. Se asume que este desplazamiento con respecto a la neutralidad emocional pone en marcha un proceso oponente (contrario) que compensa el cambio). Me pongo sper contento con el alcoholmi mecanismo neurofisiolgico detecta que esto no es normal y me provoca una resaca de cojones para volver a mi estado normal. Y segn esto y siguiendo con la teora Encontramos dos tipos de procesos: Proceso primario o proceso a: Es el responsable de la naturaleza del estado emocional que tiene lugar en presencia del estmulo (la alegra). Proceso oponente o proceso b: Es el que genera la reaccin emocional opuesta (por ejemplo tristeza). Ms que con la resaca quiz esto tenga ms relacin con el bajn emocional que algunas personas sufren al da siguiente de haber tenido una borrachera. El proceso oponente es ligeramente ineficiente ya que no logra contrarrestar del todo al proceso primario. Sin embargo con la repeticin logramos una sensibilizacin de este proceso y por lo tanto un mayor efecto. (lo que hemos hablado antes de resacas ms fuertes en bebedores habituales). Los dos mecanismos que vienen a continuacin son un cacao de narices a primera vista (por lo menos para mi) pero tras unos minutos analizando los grficos de la pgina 54 y 55 del libro no son tan difciles. En la siguiente hoja doy una pequea ayuda sobre cmo leer esos grficos.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN Mecanismos oponentes durante la exposicin inicial al estmulo En la primera presentacin del estmulo el proceso b no es lo suficientemente fuerte para compensar por completo la respuesta emocional primaria, que persiste mientras est presente el estmulo elicitante. Cuando el estmulo se retira, el proceso a se detiene rpidamente pero el proceso b permanece por algn tiempo y se hace evidente por primera vez. Mecanismos oponentes tras la exposicin prolongada al estmulo El proceso b se fortalece con la exposicin prolongada al estmulo, por el contrario se asume que el proceso a permanece inalterado. Por tanto, tras la presentacin repetida de un estmulo, la respuesta emocional primaria queda compensada de forma ms efectiva por el proceso oponente. Ayuda para comprender los grficos: La parte de arriba del grfico es la conducta observable de la persona, y la parte de bajo son los mecanismos oponentes que estn por debajo de la conducta y no se ven. Si lo viramos desde el punto de vista matemtico, la parte de arriba es el resultado (es lo que vemos) mientras que la parte de bajo es la suma y la resta (que no observamos) pero que dan lugar al resultado. Si miris las lneas, realmente parece que las dos lneas de bajo (a y b) dan como resultado la lnea superior (a-b). Espero haberos ayudadohe sido lo ms explcito posible. Motivacin y postefecto oponente Si los consumidores habituales de drogas cada vez notan menos placer al consumirlas porqu se hacen adictos? La teora del proceso oponente sugiere que la adiccin a las drogas es un intento de reducir la aversin producida por el postefecto afectivo de las drogas (bajn, irritabilidad, malestar). Hay dos formas de reducir el postefecto, una es simplemente esperar a que pase el efecto oponente (pasar el mono) pero muchas veces el mono es tan largo que la otra forma de pasarlo es volver a consumir la droga. Este mecanismo es lo que hace que la gente se haga adicta, no por el placer directo que obtienen de la droga, sino para reducir los efectos de retirada. Valoracin general de la teora del proceso oponente Esta teora no ha conseguido explicar tantas cosas como prometa. Lo ms destacable es que ha supuesto una importante contribucin al aplicar el concepto de regulacin homeosttica al anlisis de las emociones y la motivacin.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Variaciones en la conducta dirigida a metas


Responder para escapar de la molestia producida por la retirada de un estmulo es solo uno de los tipos de conducta motivada o dirigida a metas. En los siguientes temas veremos ms ejemplos de este tipo de conductas, prestando especial atencin a las situaciones en las que los individuos dan una respuesta para alcanzar un estmulo gratificante. Este objeto meta recibe el nombre de reforzador.

TRMINOS CLAVE
Adaptacin sensorial: Reduccin temporal en la sensibilidad de los rganos sensoriales provocada por la estimulacin repetida o excesiva. Arco reflejo: Estructura neural que consiste en una neurona aferente (sensorial), una interneurona y una neurona eferente (motora) y que permite que un estmulo pueda elicitar una respuesta refleja. Conducta apetitiva: Conducta que tiene lugar al principio de una secuencia natural de conducta y que sirve para poner al organismo en contacto con un estmulo desencadenante. Conducta consumatoria: Conducta que lleva a consumar o completar una secuencia natural de conducta. Las respuestas consumatorias son, por lo general, patrones de accin modal especficos de la especie. Deshabituacin: Recuperacin de una respuesta habituada como resultado de la presentacin de un estmulo externo e intenso. Efecto de habituacin: Disminucin progresiva en el vigor de la conducta elicitada que puede tener lugar con la presentacin repetida del estmulo elicitante. Efecto de sensibilizacin: Incremento en el vigor de la conducta elicitada que puede resultar de la presentacin repetida del estmulo elicitante o de la exposicin a un estmulo externo intenso. Estmulo desencadenante: Lo mismo que estmulo seal Estmulo seal: Rasgo especfico de un objeto o animal que elicita una pauta de accin modal en otros organismos. Tambin llamado estmulo desencadenante. Estmulo supranormal: Estmulo seal artificialmente agrandado o exagerado que elicita una respuesta inusualmente vigorosa. Fatiga: Disminuacin temporal de la conducta causada por el uso repetido o excesivo de los msculos involucrados en la conducta.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN Interneurona: Neurona de la mdula espinal situada entre la neurona aferente (o sensorial) y la neurona eferente (o motora) en el arco reflejo. Modo de bsqueda focalizada: Segundo componente de la secuencia de conducta de alimentacin, tras la bsqueda general, en el que el organismo pone en marcha una conducta centrada en la localizacin de un estmulo particular que indica la presencia de alimento. La bsqueda focalizada es una forma de conducta apetitiva ms directamente relacionada con el alimento que la bsqueda general. Modo de bsqueda general: Primer componente de la secuencia de conducta de alimentacin, en la que el organismo pone en marcha una conducta motora sin direccin fija. La bsqueda general es una forma de conducta apetitiva. Modo de manipulacin del alimento: ltimo componente de la secuencia de conducta de alimentacin en el que el organismo manipula y consume el alimento. Es similar a lo que los etlogos llaman conducta consumatoria Neurona aferente: Neurona que transmite mensajes de los rganos de los sentidos al sistema nervioso central. Tambin recibe el nombre de neurona sensorial. Neurona eferente: Neurona que transmite los impulsos a los msculos. Tambin llamada neurona motora. Neurona motora: Lo mismo que neurona eferente. Neurona sensorial: Lo mismo que neurona aferente. PAM: Abreviatura de pauta de accin modal. Pauta de accin modal: Patrn de la respuesta exhibido de forma similar por la mayora de los miembros de una misma especie. Las pautas de accin modales utilizan como unidades bsicas de conducta en las investigaciones etolgicas del comportamiento. Proceso a: Lo mismo que proceso primario en la teora del proceso oponente de la motivacin. Proceso b: Lo mismo que proceso oponente en la teora del proceso oponente de la motivacin. Proceso de habituacin: Mecanismo neural activado por la repeticin de un estmulo que reduce la magnitud de las respuestas elicitadas por ese estmulo. Proceso de sensibilizacin: Mecanismo neural que incrementa la magnitud de las respuestas elicitadas por un estmulo.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN Proceso oponente: Mecanismo compensatorio que tiene lugar en respuesta al proceso primario elicitado por eventos biolgicamente significativos. El proceso oponente provoca cambios fisiolgicos y conductuales opuestos a los que provoca el proceso primario. Proceso primario: Primer proceso elicitado por un evento biolgicamente significativo. Recuperacin espontnea: Recuperacin de una respuesta habituada o de una respuesta extinguida tras un perodo de descanso. Reforzador: Estmulo cuya administracin inmediatamente posterior a una respuesta incrementa la probabilidad futura de dicha respuesta. Sistema de estado: Estructuras neurales que determinan el nivel general de responsividad o tendencia a responder del organismo. Sistema E-R: Ruta neural ms corta que conecta los rganos sensoriales estimulados por un estmulo elicitante con los msculos involucrados en la produccin de la respuesta elicitada. Tolerancia a la droga: Reduccin en la efectividad de una droga como resultado del uso repetido de la droga.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

A) LOS PRIMEROS AOS DEL CONDICIONAMIENTO CLSICO


Los primeros estudios comenzaron con el trabajo de Pavlov. Otro cientfico llamado Edwin B. Twitmyer tambin lo descubri de manera independiente a Pavlov. Los estudios de Pavlov sobre el condicionamiento clsico fueron una extensin de su investigacin sobre el proceso de digestin. Experimentaba mucho con perros. Los tcnicos de su laboratorio pronto descubrieron que los perros secretaban jugos gstricos en respuesta a la mera visin de la comida o de la persona que los alimentaba. Llamaron a estos jugos secreciones psquicas Los descubrimientos de Vulfson y Snarskii Fueron los primeros en estudiar el condicionamiento clsico en el laboratorio de Pavlov. Siguieron experimentando con los perros y su salivacin. Estmulos orofaringeos: Algunas sustancias provocan en la boca sensaciones de textura y sabor caractersticas. Estas sensaciones reciben el nombre de estmulos orofaringeos. Los perros salivaban cuando se les pona arena en la boca, posteriormente la sola visin de la arena les haca salivar. Este tipo de aprendizaje se denomina aprendizaje de objeto ya que requiere asociar diferentes caractersticas de un mismo objeto. El paradigma de condicionamiento clsico El procedimiento de Pavlov constaba de dos estmulos: -Luz que no provoca salivacin al principio del experimento. Se trata del estmulo condicional ya que su efectividad depende de su emparejamiento con el cido. Provoca una respuesta condicional -Solucin cida situada en la boca. Se trata del estmulo incondicional ya que no depende de nada para producir saliva. Provoca una respuesta incondicional.

B) LOS PRIMEROS AOS DEL CONDICIONAMIENTO CLSICO


Condicionamiento del miedo Watson y Rainer (1920). Pensaban que los nios estaban muy limitados para dar respuestas emocionales distintas. Se dieron cuenta que mediante el condicionamiento clsico podan despertar este abanico de emociones. Y no tuvieron mejor cosa que hacer que condicionar la respuesta de miedo a un nio de 9 meses ante la presentacin de una rata blanca. Le ponan la rata delante y hacan sonar justo detrs de su cabeza una barra de hierro muy fuerte y se asustaba, al poco tiempo la sola presencia de la rata hacia que se asustase. Este miedo se generaliz a otros objetos peludos como un conejo, un abrigo de piel o un mascara de santa Claus.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS


Ms tarde se dieron cuenta que quiz no era tan buena idea estudiar el condicionamiento del miedo en seres humanos, probablemente por los graves trastornos psicolgicos que sufriran los pacientes. Entonces comenzaron a utilizar ratas y descargas elctricas en las patas como estmulo incondicional aversivo. Ante una descarga elctrica la rata se paraliza por el miedo. Sin embargo para medir la respuesta de miedo utilizaban la tcnica REC (respuesta emocional condicionada). Para explicar en qu consiste el REC en un experimento concreto con ratas, el libro lo hace un poco lioso desde mi punto de vista. Lo explicar por puntos porque es muy fcil: 1. Se ensea a las ratas a presionar una palanca para obtener comida 2. Se muestra un EC (estimulo condicionado) que puede ser una luz o un pitido seguido de una descarga elctrica. 3. La rata se paraliza y no puede acceder a la palanca. 4. Finalmente la sola presencia del EC (sin la descarga) hace que la rata se paralice. Para ponerle nmeros a todo esto se calcula algo llamado Razn de supresin Razn de supresin = Respuestas durante EC (Respuestas durante EC + Respuestas durante Pre EC) Entendiendo por respuestas el nmero de presiones de la palanca. Cuanto menor es la razn de supresin, menor es la respuesta del animal. Entendiendo por razn de supresin = 0 una parlisis total de su respuesta. Aparte del experimento de la palanca tambin utilizaban la supresin condicionada del lameteo en el cual ratas sedientas beban de un tubo que desprenda agua y mediante el EC se paralizaban y no beban. Condicionamiento del parpadeo Conocido como reflejo palpebral. 1. Presentacin de un estmulo condicionado Tono 2. Soplo de aire a los ojos estmulo incondicionado Se produce el parpadeo. 3. El sujeto aprende a parpadear ante la sola presencia del estmulo condicionado Ejemplo con nios de 5 meses. Se crearon 2 grupos. En un primer grupo hubo un tono seguido de un soplo de aire. En el segundo grupo hubo mayor intervalo de tiempo entre el tono y el soplo de aire, por lo tanto ambos estmulos no quedaban emparejados. Conclusiones: a) Para que se produzca condicionamiento clsico debe haber emparejamiento entre EC y EI. b) b) El aprendizaje inicial puede no ser directamente observable.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS


Recuadro 3.2 El condicionamiento palpebral y la bsqueda del engrama Aviso a navegantes: Debido al carcter explicativo y ejemplificativo de los recuadros, es realmente difcil resumir de la misma manera que el resto del texto, ya que todo parece importante y existe una cantidad de datos por m 2 abrumadora. Asi que toca leerlos con calma. De todas maneras intentar extraer los puntos esquemticos ms importantes. Cuando un organismo aprende algo, la red de neuronas que almacena esta nueva informacin se llama engrama. Dnde se encuentra el engrama? Richard Thompson ha buscado la respuesta durante casi 4 dcadas. La bsqueda del engrama comenz por el hipocampo. Sin embargo comprobaron en animales que si les extirpaban el hipocampo la capacidad de aprendizaje condicionado no se alteraba. Entonces concluyeron que el engrama se encontraba en el cerebelo Y a partir de aqu todo se complica y no queda ms remedio que echarle unos minutos para leer con tranquilidad la pgina 68 mientras que al mismo tiempo se analiza el grfico de la 69. Estmulo incondicionado La seal llega al cerebelo a travs de fibras trepadoras Estmulo condicionado La seal llega al cerebelo a travs de fibras musgosas Seguimiento del signo Pavlov pensaba que el condicionamiento solo se daba en sistemas de respuesta reflejos, sin embargo despus apareci el paradigma de seguimiento del signo o automoldeamiento que explicaba cosas diferentes. Los animales se aproximan a estmulos que sealan la disponibilidad de alimento. Un halcn predice que puede alimentarse al ver el movimiento de un ratn. Cmo comprobaban el seguimiento del signo en el laboratorio? Con Palomas dentro de una caja. Haba una tecla (EC) que se iluminaba durante 8 segundos y a continuacin se administraba comida (EI) en un pequeo comedero (no era necesario pulsar la tecla para administrar comida, ya que el procedimiento era automtico). Sin embargo con las repeticiones, cada vez que la tecla se encenda, las palomas picoteaban la tecla. En otro experimento la tecla y la comida estaban bastante alejados, y la comida se presentaba solo durante poco tiempo, por lo cual la paloma tena que ser rpida para poder comer. Sin embargo cada vez que la tecla se encenda, la paloma corra a picotear la tecla (totalmente innecesario) y luego corra hacia el comedero. Poda haberse quedado esperando todo el tiempo delante del comedero sin necesidad de moverse de un lado para otro, pero este experimento demuestra que tenan una atraccin irresistible a las seales de comida condicionadas clsicamente, es decir, a la tecla (EC).

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS


Aprendizaje de aversin al sabor El acto de comer proporciona numerosas oportunidades para el aprendizaje de asociacin. La aversin a un sabor puede aprenderse si la ingestin de un sabor nuevo va seguida de enfermedad o de otras circunstancias negativas. Por el contrario la preferencia por un sabor va acompaada de sensaciones de saciedad u otras circunstancias positivas. En el caso de aversin a un sabor por haber enfermado, lo curioso es que el 20% de los casos las personas estaban seguras que su enfermedad no tena que ver con la comida, y sin embargo le cogieron aversin. Esto demuestra que el aprendizaje de aversin al sabor es independiente de los procesos racionales. Como ejemplo se investig que pacientes con cancer desarrollaban aversin a comidas que tomaban antes de una sesin de quimioterapia (estas sesiones suelen provocar vmitos y malestar). Otros trastornos como la anorexia nerviosa o la depresin severa pueden incrementar la capacidad de desarrollar aversin a la comida. Para probar esto en animales se les daba una comida con sabor distintivo (EC) y a continuacin se les inyectaba una droga (EI) que les provocaba malestar. Caractersticas de la aversin al sabor Un nico emparejamiento entre EC y EI puede provocar la aversin (eso tambin puede suceder con el aprendizaje del miedo). Sin embargo se necesitan ms emparejamientos en el condicionamiento palpebral, el condicionamiento salival o el seguimiento del signo. Se produce aversin aunque la enfermedad se presente horas despus de haber comido. Es lo que se conoce como Aprendizaje demorado.

Ejemplo del aprendizaje demorado en ratas: Se les daba a beber agua con sacarina y luego en diferentes grupos las sometan a radiacin en intervalos de tiempo distintos. El grupo que se someti a radiacin 6 horas despus de beber desarroll mayor aversin al agua que el grupo que se le dio radiacin 12 horas despus y este a su vez mayor aversin que el grupo de las 24 horas.

C) PROCEDIMIENTOS DE CONDICIONAMIENTO PAVLOVIANO EXCITATORIO


Aqu el libro explica que todos los procedimientos de aprendizaje del punto anterior son ejemplos de condicionamiento pavloviano excitatorio. Y parece que este punto se va a centrar en analizar las caractersticas comunes de todos ellos para establecer leyes generales sobre este tipo de condicionamiento.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS


Procedimientos tpicos de condicionamiento pavloviano Es muy importante la ordenacin temporal del estmulo condicionado y el estmulo incondicionado. Intervalo entre ensayos: Tiempo entre el final de un ensayo de condicionamiento y el inicio del siguiente. Intervalo entre estmulos: Tiempo entre el EC y el IE. Para que haya respuesta de condicionamiento, el intervalo entre estmulos debe ser mucho menor que el intervalo entre ensayos. 5 procedimientos comunes de condicionamiento clsico (no sigis leyendo sin mirar el grfico de la pgina 75 porque os ser muchsimo ms fcil de entender) 1. Condicionamiento de demora corta: Se presenta el EC y al poco tiempo y sin que haya finalizado, se presenta el EI. 2. Condicionamiento de huella: Se presenta el EC y cuando ha acabado se presenta el EI. Al intervalo entre ambos se le llama intervalo de huella. 3. Condicionamiento de demora larga: Como el de demora corta pero el EC dura mucho ms tiempo. Entonces se presenta el EI antes de que EC acabe. 4. Condicionamiento simultneo: EC y EI se presentan a la vez. 5. Condicionamiento hacia atrs: Al revs que todos los anteriores. Se presenta el EI y luego el EC. Medida de las respuestas condicionadas Ensayo de prueba: Ensayo en el que se presenta el EC sin el EI. Esto permite medir la respuesta condicionada en ausencia de la respuesta incondicionada. Son fundamentales en para evaluar el aprendizaje en el condicionamiento simultneo y hacia atrs. Magnitud: Cantidad de conducta que tiene lugar (por ejemplo el nmero de gotas de saliva del perro de Pavlov) Fuerza de la respuesta: Se mide por la frecuencia con la que el EC provoca una respuesta condicionada. Muy relacionada con la probabilidad (cmo de probable es que el EC de una respuesta condicionada) Latencia: Cantidad de tiempo que pasa entre el principio del EC y la aparicin de la respuesta condicionada. Procedimientos de control en el condicionamiento clsico En los primeros captulos veamos que los procedimientos de control de la habituacin y la sensibilizacin eran muy simples ya que nicamente consistan en la ausencia de exposicin al estmulo. Sin embargo los procedimientos de control del condicionamiento clsico con ms complicados ya que se produce una asociacin entre un EC y un EI y esto es ms complejo de estudiar.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS


Pseudocondicionamiento: Casos en los que la mera exposicin al Estmulo Incondicionado da lugar a respuestas similares a la respuesta condicionada. Es algo as como un falso condicionamiento. Si a un perro hambriento se le presenta comida (EI) puede incrementar la conducta provocada por un estmulo menos efectivo como un tono (EC), sin que se haya establecido ninguna asociacin entre los dos estmulos. Para saber si se trata de un pseudocondicionamiento o realmente un condicionamiento clsico (asociacin entre EC y EI) son necesarios los procedimientos de control. Control aleatorio: Procedimiento en el que los estmulos condicionado e incondicionado se presentan en momento aleatorios uno con respecto a otro. Sin embargo este tipo de control puede dar lugar a aprendizaje asociativo. Control desemparejado explcito: EC y EI se presentan lo suficientemente separados para evitar que se asocien. Eficacia de los procedimientos tpicos de condicionamiento Trataban de averiguar cual de los 5 procedimientos de condicionamiento vistos en la hoja anterior daba ms muestras de aprendizaje. Para ello lo primero que hay que tener en cuenta es el intervalo entre estmulos o intervalo EC-EI. Simultaneo: Poco condicionamiento en el condicionamiento simultaneo en los que el intervalo EC-EI es 0. Demora corta: facilita la respuesta condicionada Demora larga: Disminuye la respuesta condicionada De huella: Se genera un intervalo de huella. Al igual que en demora larga, cuanto ms separados estn EC y EI, se produce menos condicionamiento. Hacia atrs: Ofrece resultados ambiguos. Se ha observado condicionamiento excitatorio o inhibitorio.

Todo esto es de cajn, cuanto ms separados en el tiempo estn dos estmulos, menos posibilidades hay de que yo los relacione, es decir, hay menos posibilidades de que se produzca condicionamiento. 2 ideas que debemos recordar a modo de conclusin: - El condicionamiento es ms efectivo cuando el EC es una buena seal de que el EI aparecer pronto. - Se produce mejor condicionamiento cuando el intervalo EC-EI es corto. Hiptesis de codificacin temporal: El sujeto no slo aprende a relacionar EC y EI, sino que dependiendo del procedimiento utilizado (de los 5 que hemos visto) tambin aprender cando en el tiempo va a ocurrir EI. (esto se ver en profundidad en el tema 4)

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

D) CONDICIONAMIENTO PAVLOVIANO INHIBITORIO


Este tipo de condicionamiento pretende predecir la ausencia del estmulo incondicionado. Porqu nos interesa predecir la ausencia de algo? Por ejemplo para los ataques de pnico. Est demostrado que las personas que saben cundo van a tener uno de estos ataques, su nivel de ansiedad desciende despus de tenerlo. Por el contrario los ataques imprevisibles hacen aumentar el nivel de ansiedad. Estmulos condicionados inhibitorios: Seales que predicen la ausencia de un estmulo aversivo. Procedimientos de condicionamiento inhibitorio (con calma) El condicionamiento excitatorio puede proceder sin condiciones previas especiales, sin embargo para que se d el condicionamiento inhibitorio hay un requisito importante: el EI debe ocurrir peridicamente en la situacin. Si vamos a una gasolinera esperamos encontrar gasolina (EI) sin embargo si vemos el cartel No hay gasolina nos sentiremos frustrados. En este ejemplo el cartel es una seal de condicionamiento inhibitorio. Procedimiento estndar de inhibicin condicionada (grfico pg 82) Este procedimiento consta de dos ensayos diferentes que se intercalan. Ensayo A (condicionamiento excitatorio) Tenemos un EC+ y un EI. Es un ensayo de tipo excitatorio como los que vimos al principio. El Estmulo incondicionado ocurre inmediatamente despus del estmulo condicionado y de esta manera quedan asociados. (ponemos un signo positivo al EC+ para diferenciarlo del estmulo inhibitorio (EC-) que vemos en el siguiente ensayo)

Ensayo B (condicionamiento inhibitorio) A diferencia del ensayo A, aqu no se presenta el EI. Tan slo tenemos un EC+ y un EC- que se presentar en el contexto excitatorio proporcionado por el EC+. Pero no se empareja con el EI. Por lo tanto decimos que el EC- es un inhibidor condicionado.

No nos confundamos al pensar que el procedimiento estndar de inhibicin condicionada consta de dos tipos distintos de ensayo, sino que los dos ensayos forman parte del mismo procedimiento. Es decir, el procedimiento siempre va a constar de dos fases, una fase inicial en la que creamos un condicionamiento excitatorio y una segunda fase en la que utilizamos el condicionamiento de la fase anterior para construir la inhibicin.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS


Contingencia o correlacin negativa entre el EC y el EI (grfico pg 83) Una contingencia o correlacin negativa indica que el EI es menos probable tras el EC que en otro momento. En el grfico podemos observar que la presencia de EC predice la ausencia del EI durante un tiempo. En este tipo de procedimiento, el EI aversivo puede aparecer de vez en cuando tras el EC, pero con una probabilidad pequea. Medicin de la inhibicin condicionada La inhibicin condicionada produce cambios en la conducta observable, pero Cmo podemos observar estos cambios? Hay 3 mtodos A) Sistemas de respuestas bidireccionales Se puede medir fcilmente en aquellos sistemas que tengan una lnea base. El ritmo cardiaco o la respiracin nos permite saber si sus valores suben o bajan, o un animal que se acerca o se aleja de un estmulo. En estos casos la excitacin condicionada da lugar a un cambio conductual en una direccin y la inhibicin condicionada la lugar a un cambio en la direccin opuesta. Limitaciones - Slo funciona con respuestas que pueden ir en direcciones opuestas. - Slo muestra el efecto neto (resultado) entre la excitacin y la inhibicin. B) La prueba del estmulo compuesto o sumacin Volviendo al ejemplo del conejo y el parpadeo: Si hemos condicionado un estmulo para inhibir la respuesta de parpadeo, obviamente no lo veremos parpadear, entonces cmo podemos medir la eficacia que tiene nuestro estmulo inhibidor? Mediante la Prueba de sumacin o del estmulo compuesto La prueba de sumacin implica la presentacin de dos estmulos, un EC+ y un EC- juntos. La idea es que cada estmulo produce su propia reaccin asociativa (excitacin e inhibicin) y que cada reaccin se suma de forma algebraica. Puesto que son procesos antagnicos, la asociacin inhibitoria suprime la excitatoria. Este efecto se cuantifica midiendo la fuerza del estmulo condicionado excitatorio (EC+) sin emparejar, evalundolo de nuevo en combinacin con el estmulo condicionado inhibitorio (EC-), y calculando despus la diferencia. Si un EC- carece de fuerza inhibitoria, se observa toda la fuerza de la reaccin excitatoria en ambos casos. Sin embargo, si el estmulo condicionado inhibitorio es fuerte (produce RC inhibitoria), se observa una disminucin del nivel de excitacin del EC+ al presentar los estmulos simultneamente

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS


C) La prueba del retraso en la adquisicin Si un estmulo inhibe de forma activa una respuesta particular, entonces debera ser especialmente difcil de condicionar ese estmulo para que provoque la conducta. Es decir, la velocidad de adquisicin de una respuesta excitatoria debera disminuir si el EC es un inhibidor condicionado. Sin lugar a dudas estos 3 mtodos que acabamos de ver sobre inhibicin condicionada es lo que ms me ha costado comprender desde que me he puesto a estudiar esta asignatura. Tendr que pegarle un repaso profundo de cara al examen.

E) PREDOMINIO DEL CONDICIONAMIENTO CLSICO


Aparece con mayor probabilidad cuando un evento predice a otro regularmente y con una demora corta entre el EC y el EI. Un rea de investigacin importante es cmo las personas llegan a considerar que un evento es la causa de otro. Hay una gran concordancia en los resultados de los experimentos sobre juicios de causalidad y los de condicionamiento pavloviano. Por lo tanto los mecanismos asociativos de Pavlov pueden tener un papel importante en nuestras vidas (y no solo en la de los perros) Algunos mbitos de la vida en los que se desarrolla el condicionamiento de Pavlov: - Aversiones y preferencias alimenticias - Adquisicin de miedos. - Tolerancia y adiccin a las drogas - Respuestas de los nios y de las madres durante la lactancia - Situaciones sexuales

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

A) A QU DEBEN SU EFICACIA LOS ESTMULOS CONDICIONADOS E INCONDICIONADOS?


Respuestas iniciales a los estmulos Pavlov: El EC inicialmente no provoca la respuesta condicionada pero adquiere la capacidad de hacerlo como resultado del desarrollo de una asociacin con el EI. Sin embargo la identificacin de EC y EI es relativa ya que un evento puede servir de EC respecto a un estmulo y de EI respecto a otro. En experimentos con ratas la sacarina es un EC si posteriormente se inyecta una droga que produce malestar (EI), entonces las ratas aprenden a no tomar la sacarina. Sin embargo en un experimento en el que se proyecta una luz (EC) justo antes de suministrar sacarina (EI) las ratas aprenden a acercarse a la luz cada vez que aparezca. Por lo tanto esto es un ejemplo de que un estmulo (sacarina) puede actuar como condicionado o incondicionado, dependiendo de su relacin con el otro estmulo. La novedad de los estmulos condicionados e incondicionados Cuando los estmulos son novedosos, el aprendizaje se desarrolla ms rpido. A la hora de experimentar sobre la novedad o familiaridad de los estmulos, se realiza en dos fases: a) Se expone repetidamente a los sujetos al estmulo que luego ser EC. b) EC se empareja con un EI Sin embargo se observa que la familiaridad que el sujeto tiene con EC (ya que se le ha repetido muchas veces en la fase a) hace que el emparejamiento con el estmulo incondicionado sea ms lento. Este fenmeno se denomina efecto de preexposicin al EC o efecto de Inhibicin latente. La Habituacin sirve para sesgar la conducta elicitada a favor de los estmulos novedosos. La Inhibicin latente sirve para sesgar el aprendizaje a favor de los estmulos novedosos. Es la habilidad de inconscientemente ignorar los estmulos que son percibidos como irrelevantes para lo que uno necesita. (alguien vea Prison Break? En la serie el protagonista sufre de un trastorno llamado Inhibicin latente baja, al ser baja l no ignoraba absolutamente ningn estmulo y por eso era tan mquina y tan detallista a la hora de construir cosas o trazar planes. Supongo que en la vida real este trastorno no debe ser tan beneficioso para quien lo sufra como lo pintan en la serie) Si el experimento lo hacemos con un EI, el resultado es el mismo. Quien estaba familiarizado con el estmulo incondicionado tardar ms en relacionarlo con el EC. Esto recibe el nombre de Efecto de preexposicin al EI.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS


2 Mecanismos para explicar los dos efectos de preexposicin Interferencia asociativa: Las preexposiciones a EC o EI disminuyen la capacidad de estos estmulos para participar en nuevas asociaciones. Interferencia de memoria: Los participantes recuerdan que en la fase a el estmulo se les presentada aislado y este recuerdo altera la respuesta condicionada. Intensidad y saliencia del EC y del EI La intesidad de los estmulos es una variable importante que recibe el nombre de saliencia del estmulo. El aprendizaje se llevar a cabo de manera ms rpida cuanto mayor sea la saliencia del estmulo. Ratas con deficit nutricional de sal prestan ms atencin al sabor de la sal (aqu se ha aumentado la saliencia del estmulo en relacin a las necesidades biolgicas del organismo). Relevancia o pertinencia EC EI Es otra variable que afecta a la velocidad de aprendizaje del condicionamiento clsico La relevancia es el grado en el que el EC es relevante con respecto al EI. En un ambiente natural, es normal que las ratas enfermen tras tomar un alimento en mal estado. Tambin es normal que sufran algn dao tras ser perseguidas por un animal al que pueden oir. Ambas hiptesis son trasladadas al laboratorio donde se ponen en prctica para demostrar la relevancia Hiptesis 1: Dao por animal al que pueden oir Experimento A- Ratas lamiendo agua salada + luz que acompaa al lameteo = descarga elctrica Luego se repeta el proceso pero cada estmulo por separado: B- Ratas lamiendo agua salada + ausencia de luz = descarga elctrica C- Ratas lamiendo agua sin sabor + luz que acompaa al lameteo= descarga elctrica La medicin del aprendizaje se haca midiendo la supresin de volver a beber. (es decir, cual de los dos estmulo har que la rata tenga menos tendencia a beber) Conclusin: Demostraban mayor supresin con el estmulo audiovisual. Hiptesis 2: Enfermar tras tomar un alimento en mal estado Lo mismo que antes pero en lugar de la descarga elctrica se las haca enfermar con drogas. La conclusin es que hacindolo de esta manera demostraban mayor supresin al estmulo gustativo. Todo esto de la relevancia tiene mucho que ver con la naturaleza y con la predisposicin gentica. A la hora de aprender relaciones entre estmulos, no hay que olvidar las leyes naturales, ya que pueden influir en nuestro aprendizaje. El libro pone unos cuantos ejemplos ms sobre palomas y monos.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS


Recuadro 4.1 Aproximaciones conductuales al control del tabaquismo Destacar que las tcnicas ms efectivas para dejar de fumar son aquellas en las que el estmulo aversivo es relevante en relacin a la situacin. El concepto de fuerza biolgica La fuerza biolgica es la fuerza que tiene cada estmulo (EC y EI) ante nosotros por naturaleza. Pavlov sugiri que para que un estmulo se condicionara deba tener una fuerza biolgica menor que el estmulo incondicionado. Condicionamiento de orden superior (es como un condicionamiento al cuadrado. Aqu se empieza a poner la cosa suave) Situacin: a) Un tono se empareja fuertemente con la comida. b) La sola presencia del tono produce salivacin. (condicionamiento de 1er orden) c) Empezamos a emparejar el tono (que produce salivacin) con una luz d) Al final la sola presencia de la luz producir salivacin (condicionamiento de 2 orden) Podemos seguir y volver a la rata loca y emparejar la luz por ejemplo con un olor, (emparejamiento de tercer orden) Nomenclaturas para no liarnos EC1 (tambin EC+) =Es el primer estmulo condicionado, osea, el tono EC2 (tambin EC-) = Es el segundo estmulo condicionado, osea la luz. Recuadro 4.2 Condicionamiento de orden superior del miedo Los miedos irracionales suelen desarrollarse por medio del condicionamiento de orden superior. Se explica el ejemplo de una mujer con miedo a las multitudes cuyo miedo se extendi a otros estmulos en principio inocuos, como ir al cine. Contracondicionamiento Dos estmulos pueden quedar asociados el uno con el otro aunque ambos eliciten inicialmente respuestas intensas. La respuesta que un animal da a un EC se invierte o contrarresta emparejando ese estmulo con un EI que provoca una reaccin opuesta. Precondicionamiento sensorial Se pueden aprender asociaciones entre estmulos que tan slo elicitan una breve respuesta de orientacin antes del condicionamiento. Si asociamos los sabores de canela y vainilla como algo que siempre va junto en los helados, y de repente nos sienta mal la canela, tambin rechazaremos la vainilla. Es parecido al condicionamiento de orden superior pero aqu hay cierta similitud en los estmulos (dos sabores). Por eso se llama sensorial, es decir, tus sentidos los perciben de manera similar.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

B) QU DETERMINA LA NATURALEZA DE LA RESPUESTA CONDICIONADA?


El modelo de sustitucin del estmulo A partir de ahora tanto EC como EI los voy a poner en negrita para diferenciarlos del determinante masculino el ya que la un poco cuando va en mayscula. Pavlov: Un EC adquiere la capacidad de funcionar de forma similar a como el EI lo haca previamente. El EC activa los circuitos neuronales que previamente slo activaba el EI. El EC se convierte en un sustituto del EI. eI EI como factor determinante de la RC Aqu habla de que la forma de la respuesta condicionada va a tener algo de relacin con que tipo de EI haya. Ejemplo en Palomas Las Palomas abren el pico ms cuando van a comer grano que cuando van a beber. EI = Grano EI = Agua EC= Tecla que se ilumina antes de dar agua o grano RC= Respuesta de picoteo a la tecla (este ejemplo lo vimos en un tema anterior) 2 grupos de Palomas, uno con agua y otro con grano. Se demostr que el grupo que haba relacionado el grano con la tecla, picoteaba la tecla con el pico ms abierto que el grupo que haba relacionado la tecla con el agua (este grupo haca una especie de movimiento de succin a la tecla). Por lo tanto dependiendo del EI (agua o grano) tendremos una RC (picoteo grande o succin) al EC (tecla) diferente. Aprendizaje y homeostasis: Un caso especial de sustitucin del estmulo Como hablbamos en temas anteriores, homeostasis = equilibrio. La homeostasis se refiere a los mecanismos fisiolgicos que mantiene los aspectos crticos del cuerpo dentro de los lmites aceptables. Cualquier amenaza a nivel homeosttico pone en marcha una reaccin compensatoria que neutraliza la alteracin. Esta reaccin funciona por procesos de retroalimentacin negativa (Walter Cannon). La exposicin al fro produce escalofros para incrementar la temperatura del cuerpo. Dworkin seal que las alteraciones en la homeostasis pueden compensarse ms efectivamente si pueden anticiparse. Si los sujetos pueden aprender qu claves sealan cundo van a tener fro, pueden realizar ajustes compensatorios que se anticipen al fro. Esto recibe el nombre de respuesta homeosttica condicionada. (a continuacin vamos a relacionar este tipo de respuestas con la administracin de drogas psicoactivas en sujetos. Particularmente el punto que viene a continuacin me resulta muy interesante.)

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS


Las drogas suelen provocar alteraciones fisiolgicas de la homeostasis que activan reacciones compensatorias condicionadas. Las claves que se asocian a esta alteracin pueden elicitar estas reacciones compensatorias como respuestas condicionadas anticipatorias. A) Proceso normal=Drogas - Alteracin homeostasis reacciones compensatorias condicionadas Tomo la droga, me altera la homeostasis y eso provoca una reaccin compensatoria condicionada. B) Proceso en el que pienso en la droga pero no la tomo = Claves de droga (drogasalteracin homeostasis) reacciones compensatorias condicionadas respuestas condicionadas anticipatorias. Pienso en que es un buen momento para tomar la droga pero an no la tomo. El hecho de pensar lo relaciono directamente con su efecto y con el contraefecto que da mi cuerpo y se produce la reaccin compensatoria condicionada y por lo tanto la respuesta condicionada anticipatoria. La ansiedad por consumir droga que suelen mostrar los consumidores habituales es una manifestacin de estas respuestas condicionadas anticipatorias. En un experimento con consumidores habituales de cocana y no consumidores, les presentaban imgenes relacionadas con el consumo de cocana e imgenes sin relacin con la droga. Al grupo de consumidores les aumentaba el ritmo cardiaco con las imgenes relacionadas con el consumo. El modelo de condicionamiento de tolerancia a las drogas Siempre se ha considerado que la tolerancia a las drogas se deba a procesos farmacolgicos, sin embargo Shepard Siegel encuentra otra explicacin basada en el condicionamiento clsico La explicacin se basa en el concepto de homeostasis aprendida. Tomamos droga y se producen unos cambios fisiolgicos en nuestro organismo (son el EI). Entonces se ponen en marcha unos ajustes para compensar esos cambios, son la respuesta incondicionada (RI). Entonces Mediante el condicionamiento pavloviano o clsico, los estmulos que acompaan a la administracin de droga se asocian con el EI. Estos estmulos condicionados pueden ser la hora del da, o el lugar donde se consume droga habitualmente. Por lo tanto - Droga provoca EI - EI provoca RI - EI siempre va con EC (lugar y hora) -EC provoca RI (es decir, el lugar y la hora provocan mi respuesta fisiolgica para compensar los cambios que me producir la droga, por lo tanto tomar droga en sitios habituales me colocar menos).

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS


el EC como determinante de la forma de la RC Lo que hemos visto antes de las Palomas y la tecla pero con el EC de protagonista. Ejemplo en ratas. Para variar A una rata A se le presentaba otra rata B atada que actuaba como EC, 10 segundos antes de presentarle la comida. A fuerza de presentarle la rata B (EC) antes de la comida (EI) se quera observar si la respuesta normal que dara la rata A ante la comida (morder, roer) comenzara a darla con la sola visin de la otra rata. Sin embargo esto no fue as, sino que la rata A mostraba actitudes sociales ante la rata B. Por lo tanto estas actitudes sociales estaban sin duda determinadas por la naturaleza del EC (la rata B). Conducta condicionada y sistemas de conducta Un sistema de conducta consiste en una serie de modos de respuesta, cada uno de ellos con sus propios estmulos y respuestas relevantes, dispuestos con determinado orden espacial y/o secuencial. Esta teora asume que la presentacin de un EI activa el sistema de conducta (formado por uno o varios EC) para ese EI. La presentacin de un estmulo sexual para la codorniz macho (EI) activa una secuencia de: Conducta de bsqueda general (EC), Conducta de bsqueda focal (EC) Conducta consumatoria (EI) La forma de la RC depende del intervalo EC-EI que se utilice. La razn es que el intervalo EC-EI determinar el lugar en el que se incorporar el EC dentro de la secuencia de respuestas del sistema de conducta. El EC no sustituye ni compensa al EI. En lugar de eso, sustituye a un estmulo en un punto del sistema de conducta determinado por el intervalo EC-EI. Aprendizaje E-R frente a aprendizaje E-E Aprendizaje E-R: Este aprendizaje establece una nueva conexin Entre el EC y la RC Aprendizaje E-E: Es una visin ms moderna, en la que los individuos aprenden una asociacin entre el EC y el EI. Los sujetos responden al EC, no porque ste elicite directamente la RC sino porque el EC hace que el sujeto piense en EI. Cmo pueden los investigadores decidir entre estas dos interpretaciones? Mediante la tcnica de la devaluacin del EI, que consiste en la reduccin del atractivo de un estmulo incondicionado, normalmente obtenida mediante la aversin o la saciedad.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

C) CMO SE ASOCIAN LOS ESTMULOS CONDICIONADO E INCONDICIONADO?


El efecto de bloqueo Si tenemos dos estmulo A y B y emparejamos fuertemente el estmulo A con un EI, provocando una respuesta condicionada intensa, y luego presentamos los dos estmulos (A y B) conjuntamente junto al EI, se observa que el condicionamiento de A no se extiende a B. Ejemplo con el pastel de la abuela Todos los domingos visito a mi abuela y me hace un pastel de arroz (A) que me sienta mal (EI). Aprendo a tenerle aversin al pastel de arroz. Tiempo despus me sorprende un da al acompaar el pastel de arroz de galletas (B). Me vuelve a sentar mal (EI) pero pienso que sigue siendo culpa del pastel de arroz y no de las galletas. Porqu la presencia del estmulo A previamente condicionado bloquea la adquisicin de la respuesta a B? Kamin seala que el EI debe ser sorprendente. Es decir si el EI va sealado por un estmulo previamente condicionado (A), no sorprender al sujeto y, por tanto no funcionar bien a la hora de condicionar al estmulo aadido (B). En el ejemplo anterior soy consciente de que cuando tome el pastel de arroz me sentar mal, asi que el hecho de acompaarlo con galletas no lo atribuir a mi malestar. Recuadro 4.3 El problema dibujo-palabra en la enseanza de la lectura: Una forma de bloqueo. El aprendizaje de la lectura mediante la presentacin de palabras y dibujos puede producir procesos similares al bloqueo. Por esta razn hay que utilizar estos mtodos con precaucin ya que pueden dificultar el aprendizaje en lugar de facilitarlo. El modelo de Rescorla y Wagner (esto con muuuuucha calma y leyendo el libro detenidamente ya que los siguientes puntos son casi imposibles de resumir. He extrado las ideas principales) Se trata de un modelo matemtico que explica porqu la efectividad de un EI est determinada por el grado en que resulta sorprendente. Pueden haber: - EI inesperadamente grandes: Son la base del condicionamiento excitatorio - EI inesperadamente pequeos: Son la base del condicionamiento inhibitorio Y todo esto se puede explicar mediante una frmula matemtica: !V = k( " - V ) " : Asntota de aprendizaje V: Valor asociativo de los estmulos que preceden al EI k: Constante relacionada con la saliencia del EC y del EI !V: Cambio en el valor asociativo de un estmulo

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

Al principio del aprendizaje V est cercano a 0 ya que los estmulos que preceden al EI no los relaciono para nada con EI (por eso es una sorpresa). Como V est cerca de 0, el resultado de ( " - V ) ser bastante grande. Por lo tanto ! V (la sorpresa) ser mayor al principio del aprendizaje. Sin embargo conformen vayamos haciendo ensayos, V va creciendo al incrementarse su valor de asociacin con el EI. Como V va creciendo, el resultado ( " - V ) ser menor. Por lo tanto ! V (la sorpresa) ser menor al final del aprendizaje. Aplicacin al efecto de bloqueo Final de la primera fase: VA = " Segunda fase: No hay condicionamiento del estmulo B en la fase 2, ya que el EI es predecible por la presencia del estmulo A: EI = ("-VA+B) = 0 Prdida del valor asociativo a pesar de los emparejamientos con el EI El modelo Rescola-Wagner predice que los estmulos perdern valor asociativo si se presentan juntos en un ensayo de condicionamiento despus de haber sido entrenados por separado. Fase 1 - Asociamos el estmulo A con una bolita de comida (EI) - Paralelamente asociamos el estmulo B con la misma bolita de comida (EI) Ambos estmulos se han condicionado perfectamente, de manera que predicen perfectamente el EI de una bolita de comida, es decir, VA = VB = " Fase 2 - Presentamos ambos estmulos conjuntos (A y B) con la bolita de comida (EI) Al no haber cambios en el EI, las propiedades de A y B adquiridas en la fase 1 deberan mantenerse, y sin embargo el modelo predice que se van a reducir. porqu sucede esto? Porque la expectativa basada en los estmulos individuales son 2 bolitas de comida y sin embargo se le presenta 1 nica bolita. Por lo tanto existe una discrepancia entre lo que se espera (2 bolitas) y lo que se presenta (1 bolita). Los participantes encuentran que el EI es sorprendentemente pequeo, por lo tanto para ajustar la expectativa a lo que realmente ocurre, A y B perdern valor. Inhibicin condicionada (mirar el grfico de la pgina 82 del tema 3 para recordar qu era la inhibicin condicionada) La inhibicin condicionada consta de dos tipos de ensayos: Ensayos reforzados: Se presenta el EI Ensayos no reforzados: Se omite el EI

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS


Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirir propiedades excitatorias. Por el contrario, en los ensayos no reforzados, el EI no ocurre (a pesar de que lo esperamos como consecuencia de nuestro aprendizaje en los ensayos reforzados). Se trata de un caso de expectativa excesiva. Para predecir con exactitud la ausencia de EI en los ensayos no reforzados, los valores asociativos de EC+ y EC- tienen que sumar cero. Extincin de la excitacin y la inhibicin (grfico pg 115) Excitacin: En este procedimiento, el estmulo condicionado se presenta repetidamente con el EI. Como el EC ha adquirido fuertes propiedades excitatorias, la primera vez que se presenta solo el EC habr un exceso de expectativa a que tambin se presente el EI. Conforme se siga presentado el EC solo, la expectativa de que aparezca EI se va acercando a 0. Inhibicin: Es un poco lo contrario que el caso anterior. Aqu el EC- comienza con un valor asociativo negativo que se considera una prediccin excesivamente baja del EI. Para ajustarse a las expectativas, el valor asociativo negativo del EC- se va perdiendo hasta llegar a 0. Problemas del modelo de Rescorla y Wagner 1 Problema: Su anlisis de la extincin de la inhibicin condicionada es incorrecto (no tenemos suficiente con estudiar a los que acertaron). El modelo predice que la presentacin repetida de un inhibidor condicionado (EC-) sin el EI debera dar lugar a una prdida de la inhibicin condicionada, pero esto no sucede. 2 Problema: El modelo considera la excitacin como lo opuesto a la extincin. Y no debe verse as. 3 Problema: El modelo solo permite que los EC tengan un nico valor asociativo (EC+ o EC-) sin embargo se ha descubierto que en ciertas condiciones puede tener ambos. 4 Problema: El modelo tiene dificultades para explicar hallazgos recientes obtenidos en los paradigmas de aversin al sabor y el olor. Concretamente tiene problemas para explicar el efecto de aumento o contrabloqueo. (el estmulo previamente condicionado aumenta el condicionamiento del EC aadido) Otros modelos de condicionamiento clsico Modelos atencionales de condicionamiento Para que el condicionamiento tenga lugar, los sujetos deben prestar atencin al EC. Se asume que el grado de atencin que un animal presta al EC en un ensayo determinado depende del grado en el que el EI haya sido sorprendente en el ensayo anterior.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS


La sorpresividad del EI en un ensayo determinado altera el grado de atencin dedicado al EC en los ensayos siguientes. Por lo tanto la sorpresividad del EI tiene slo un efecto prospectivo o proactivo sobre la atencin y el condicionamiento (esta es la principal diferencia con el modelo de nuestros amigos Rescorla y Wagner)

Factores temporales y respuesta condicionada Ninguno de los modelos vistos hasta ahora explica los efectos del tiempo sobre el condicionamiento. Sin embargo el intervalo EC-EI es una variable temporal importante ya que los intervalos EC-EI ms largos producen menos respuestas. (la respuesta es inversamente proporcional a la duracin del intervalo) Otra variable importante es el intervalo entre ensayos sucesivos. Se observa una mayor respuesta condicionada cuando se utilizan procedimientos en los que los ensayos estn ms separados entre s.

Experimento en ratas Se presentaba comida (EI) en un comedero y cada presentacin de la comida va precedida por un ruido blanco (EC). A medida que avanza el experimento, las ratas comienzan a ir al comedero y a explorarlo tan pronto escuchan el sonido. IEE: Intervalo entre ensayos ED: Duracin del ensayo (es decir, la duracin que tiene el sonido) La conclusin es que para cada grupo de sujetos, el tiempo dedicado a explorar el comedero durante la presentacin del EC, vara segn la duracin del EEI y el ED. Existen distintas interpretaciones sobre porqu la respuesta condicionada est tan fuertemente determinada por la razn IEE/DE. Vamos a ver dos hiptesis a continuacin. Hiptesis del tiempo de espera relativo Un EC proporciona informacin acerca de la aparicin del EI, slo si el sujeto tiene que pasar menos tiempo esperando al EI tras la presentacin del EC que cuando est simplemente expuesto al contexto experimental.
-Razn IEE/DE baja = tiempo de espera similar al contexto = EC da poca info sobre aparicin EI -Razn IEE/DE alta= tiempo de espera menor que el contexto= EC da mucha info sobre aparicin EI

Hiptesis del comparador La respuesta condicionada depende no slo de la asociacin entre el EC y el EI, sino tambin de todas las posibles asociaciones que puedan establecerse entre las claves contextuales y el EI. Ejemplo grfico de una balanza en pgina 120: Se compara el peso o valor del EC crtico frente al valor excitatorio de las claves contextuales. A diferencia de la hiptesis del tiempo de espera relativo, la hiptesis del comparador se centra ms en las asociaciones que se puedan producir.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS


Se asume que los organismos aprenden 3 asociaciones en el curso del tiempo (grfico 121: 1 asociacin: Une el EC crtico (X) con el EI. (de forma directa) 2 asociacin: Une el EC crtico con las claves contextuales de comparacin 3 asociacin: Une los estmulos de comparacin y el EI (de forma indirecta) La hiptesis del comparador no indica cmo se establecen las asociaciones, se trata de una teora de ejecucin, no de aprendizaje. La comparacin entre las asociaciones (EC-EI) y (contexto-EI) se realiza en el momento de la prueba. Tambin se ha probado esta hiptesis en estudios sobre inhibicin condicionada. Atribuye la inhibicin condicionada a situaciones en las que la asociacin del EC crtico con el EI es ms dbil que la asociacin de las claves contextuales con el EI. (esto se entiende observando la balanza de la pgina 120, en el medio tenemos un medidor apuntando al 0 y dependiendo de lo que tenga ms valor se desplazar hacia la izquierda (inhibicin) o hacia la derecha (excitacin). Es la nica hiptesis que predice que la extincin de la inhibicin condicionada se puede lograr no presentando el EC- de forma aislada, sino extinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para el condicionamiento inhibitorio del EC-. El modelo predice tambin que incrementar el valor excitatorio de las claves contextuales tras el tratamiento reducir la respuesta condicionada del EC crtico. Otra contribucin ha sido suponer que las diferencias en la respuesta condicionada pueden reflejar diferencias en la ejecucin ms que en el aprendizaje.

Visin general de las alternativas tericas (un poco resumen de lo visto) - Hiptesis del tiempo: Se centra en la distribucin temporal - Hiptesis del comparador: Es una teora de la ejecucin ms que del aprendizaje - Modelos atencionales: Se parece ms a Rescorla-Wagner pero tambin comparte sus limitaciones. Sin embargo ninguna de estas 3 tuvo tanta fama en el condicionamiento clsico como el modelo Rescorla-Wagner en los setenta.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS


A diferencia de los captulos anteriores, en este tema los estmulos a los que un organismo se enfrenta son resultado de su conducta. Es lo que se conoce como conducta dirigida a una meta. Un estudiante estudiar para obtener mejores notas. Este tipo de conducta se utiliza porque ha servido previamente como instrumento para conseguir lo mismo y recibe el nombre de conducta instrumental.

A) PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO INSTRUMENTAL


Comienzan con Thorndike. Su intencin original era estudiar la inteligencia animal. Sus experimentos se basaban en introducir animales hambrientos en cajas con comida en el exterior y a la vista del animal. El animal deba aprender cmo salir de la caja. Los resultados son obvios, con la repeticin elanimal cada vez tarda menos tiempo en repetir la accin que abre la caja. Sin embargo hay que hacer una puntualizacin, Thorndike no explicaba que los animales compredieran el funcionamiento del mecanismo que abra la caja, sino que la abran como una asociacin estmulo-respuesta. Es decir, un gato por ejemplo daba muchas respuestas al introducirlo en la caja, alguna de estas respuestas (de casualidad) abran la caja, por lo tanto el animal poco a poco ira aprendiendo esta asociacin y comenzara a dar con mayor frecuencia el tipo de respuestas encaminadas a volver a abrirla. Yo no entiendo cmo se abre la puerta de mi coche con el mando a distanciapero cada vez que quiero abrirla le doy al botn porque es lo que he aprendido. Ley del efecto: Si una respuesta en presencia de un estmulo es seguida por un suceso satisfactorio, la asociacin entre el estmulo (E) y la respuesta (R) se fortalece. Si la respuesta es seguida por un suceso molesto, la asociacin E-R se debilita. La ley del efecto implica un aprendizaje E-R.

B) APROXIMACIONES MODERNAS AL CONDICIONAMIENTO INSTRUMENTAL


Procedimientos de ensayo discreto Normalmente se llevan a cabo en laberintos

ESTUDIO

DEL

W.S. Small (1899-1900) cre laberintos para estudiar la conducta de las ratas. Uno tena forma de T (para estudiar la conducta de eleccin )y otro era simplemente alargado con forma de I (grficos pg 129). Con los laberintos se puede medir la velocidad de la carrera (desde la salida hasta la meta) y el tiempo de latencia (tiempo que tarda en abandonar la salida e iniciar la carrera).

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS


Procedimientos de operante libre Skinner (1938). Se permite que el animal repita la respuesta una y otra vez sin restricciones.(a diferencia de los laberintos en T en que el animal era sacado del laberinto al llegar a meta). Skinner quera obtener una respuesta ms natural en los experimentos. La observacin informal sugiere que la conducta en curso es un continuo, una actividad sigue a la otra. Skinner propuso el concepto de operante como la forma de dividir la conducta en unidades medibles con significado. Foto pgina 131: Rata hambrienta en una caja de Skinner. Hay una palanca conectada a un dispensador de comida. Cuando la rata aprieta la palanca cae comida. La respuesta operante (presionar la palanca) se define a partir del efecto que produce en el ambiente. El operante de presin de la palanca se define como una presin hacia abajo suficiente para que cause el cierre del microinterruptor. Da igual si la presin la hace con la pata izquierda, derecha o con la cola, se trata del mismo operante. Entrenamiento y moldeamiento al comedero Es la primera fase. Se realiza un seguimiento del signo mediante un sonido (condicionamiento clsico) para que el animal se dirija al comedero. (esto es el entrenamiento al comedero). Tras este entrenamiento el animal est preparado para aprender la respuesta instrumental. Si la respuesta NO ES ALGO que el animal ya realiza ocasionalmente NUNCA suceder por si misma la respuesta que produce el reforzador. Es decir, para empezar le daremos comida a la rata cada vez que se levanta sobre sus dos patas de forma natural (obviamente si en lugar de una rata fuera una rana, nunca podr ponerse a dos patas). Cuando hemos conseguido la respuesta de alzamiento entonces daremos un paso ms y le daremos la comida SOLO SI realiza la respuesta de alzamiento sobre la palanca. Poco a poco vamos produciendo un moldeamiento hasta conseguir la respuesta buscada. Esta dos fases que hemos visto del modeamiento son: reforzamiento de aproximaciones sucesivas y no reforzamiento de las formas de respuesta tempranas Moldeamiento y nueva conducta Toda la nueva unidad conductual de la rata est formada por un conjunto de respuestas preexistentes (alzamiento, presin, etc). Es decir, se le ensea una nueva combinacin de respuestas familiares en una nueva actividad. Es importante sealar que el moldeamiento aprovecha la variabilidad inherente de la conducta. Es decir, se puede variar la conducta en una direccin u otra. El libro habla de un experimento sobre el picoteo en palomas en el que dependiendo del reforzador conseguan que su conducta tendiera a ir cerrando ms el pico con el picoteo o lo contrario, ir abriendo ms el pico con el picoteo. Con el mismo experimento se obtenan resultados que explicaban que el moldeamiento puede producir nuevas formas de respuesta nunca antes realizadas por el organismo. Antes de los experimentos las palomas conseguan abrir el pico 10 mm, pero tras el moldeamiento llegaban hasta 20 mm. La tasa de respuesta como medida de la conducta operante Los experimentos con operante libre permiten una observacin continua durante largos periodos (a diferencia del ensayo discreto). Skinner propuso la tasa de ocurrencia (frecuencia de la respuesta por

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS


minuto) como medida de la probabilidad de una respuesta. Las respuestas ms probables ocurren con frecuencia y muestran una tasa alta.

C) PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL


Antes de empezar con los procedimientos (que son 4) vamos a explicar 4 conceptos: Estimulo apetitivo: Una consecuencia placentera. Estmulo aversivo: Una consecuencia molesta. Contingencia positiva: La respuesta instrumental proporciona el estmulo (un chico corta el csped y recibe dinero) Contingencia negativa: La respuesta instrumental evita el estmulo (cierro la ventana y no entra lluvia)

Importante la tabla de la pgina 134 Y ahora los 4 procedimientos que dan ttulo al apartado: Reforzamiento positivo: Un padre da una galleta a su hija cuando hace los deberes. La respuesta instrumental produce un estmulo apetitivo. Por lo tanto existe contingencia positiva entre la respuesta y el estmulo. Castigo: Un jefe te critica por llegar tarde a una reunin. La respuesta instrumental produce un estmulo aversivo. Y OJO: Aqu tambin se produce una contingencia positiva entre la respuesta y el estmulo. (llegar tarde produce que el jefe te ria) Reforzamiento negativo: Se trata de un procedimiento en el que la respuesta instrumental finaliza o previene la entrega de un estmulo aversivo. Hay dos tipos de reforzamiento negativo: A) Escape: Se presenta el estmulo aversivo pero puede ser eliminado por la respuesta instrumental. Se puede escapar del sonido molesto de una radio apagndola. B) Evitacin: Implica la programacin de un estmulo aversivo para ser presentado en algn momento del futuro. La gente pone a punto su coche para evitar averas. Entrenamiento de omisin: La respuesta instrumental previene la presentacin de un estmulo apetitivo. Se le dice a un nio que se vaya a su habitacin cuando ha hecho algo malo no porque la habitacin sea algo aversivo sino para evitar estmulos apetitivos como ver la televisin o que lo llamen sus amigos. El entrenamiento de omisin tambin recibe el nombre de reforzamiento diferencial de otras conductas o RDO. El RDO refleja el hecho de que el individuo recibe un estmulo apetitivo peridicamente a condicin de que se dedique a realizar otra conducta diferente a la anterior. Aunque ya lo he sealado antes, pero repito la importancia del cuado de la pgina 134 para evitar confusiones con estos trminos.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS

D) ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO INSTRUMENTAL


El condicionamiento instrumental consta de 3 elementos claves: 1. Una respuesta Una consecuencia (el reforzador) Relacin (o contingencia) entre la respuesta y la consecuencia La respuesta instrumental

Variabilidad conductual versus estereotipia Los experimentos de Thorndike y Skinner enfatizaron que el reforzamiento incrementa la probabilidad de que la respuesta instrumental se repita en el futuro. Es decir, repeticiones de la misma respuesta. Sin embargo esto no significa que el condicionamiento instrumental no pueda producir tambin respuestas creativas o variables. Los organismos pueden aprender a obtener reforzamiento en una situacin donde se requiere hacer algo nuevo. Por lo tanto la variabilidad de la respuesta puede ser la base para el reforzamiento instrumental. Y esto se demostr con un experimento en palomas: Page y Neuringer (1985) Experimento en Palomas. Las palomas tenan que picotear 2 teclas durante 8 veces para obtener comida. Podan alternar los picoteos como quisieran siempre que fuesen 8 entre dos teclas. Tras 50 ensayos solo recibiran comida si no repetian ninguna de las combinaciones de los 50 ensayos del principio. Paralelamente un grupo de control reciba comida independientemente de si repeta o no. Los resultados demostraron que el grupo que no tena que repetir las combinaciones daba mucha ms variabilidad en su respuesta que el grupo de control, creando combinaciones nuevas. Por lo tanto: La variabilidad de la respuesta puede mantenerse e incrementarse por reforzamiento. En ausencia de reforzamiento explcito de la variabilidad, la respuesta llega a ser ms estereotipada con un condicionamiento instrumental continuado.

Relevancia o pertinencia en el condicionamiento instrumental Esto es muy parecido a lo que vimos en el condicionamiento clsico cuando hablbamos de facilidad de aprendizaje cuando el EC era relevante para el EI en temas anteriores. En el condicionamiento instrumental ocurre algo parecido, Thordike estudi las respuestas de gatos atrapados en cajas. Primeramente condicion el rascado y el bostezo como respuestas instrumentales para escapar y en otros experimentos condicion manipular un picaporte o tirar de una anilla. Demostr que cuando se trataba del picaporte o la anilla, la respuesta era mucho ms vigorosa que cuando se trataba del bostezo y el rascado. La evolucin natural del gato hace que manipular un picaporte y empujar una anilla son respuestas que estn relacionadas de forma natural con escapar de la trampa. Con esto se explica el concepto de pertinencia.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS


Deriva instintiva: Breland y Breland observaron varias limitaciones y problemas a la hroa de entrenar animales para realizar exhibiciones en circos. Observaron que los animales realizaban conductas relacionadas con su forma de alimentacin en lugar de reproducir la conducta buscada por los educadores. Sistemas de conducta y limitaciones en el condicionamiento instrumental De acuerdo con la teora de los sistemas de conducta, cuando un animal est privado de comida y se encuentra en una situacin donde podra encontrarla, su sistema de alimentacin se activa y se dedica a otras actividades relacionadas con la comida. De acuerdo con la aproximacin de los sistemas de conducta, deberamos ser capaces de predecir qu respuestas se incrementarn con un reforzamiento de comida mediante el estudio de lo que los animales hacen cuando su sistema de alimentacin est activado en ausencia de condicionamiento instrumental. Esto suena un poco lioso pero se entiende con el siguiente ejemplo: Cuando un hamster tiene comida suficiente se dedica a otras actividades como el autocuidado (lavarse, etc) pero cuando est hambriento su sistema de conducta se centra en otras actividades como rascar o comer. Por lo tanto podemos concluir que el autocuidado no est relacionado con su sistema de conducta de la alimentacin y que el reforzamiento de comida podra producir incrementos en actividades como cavar y escarbar pero no en lavarse la cara y rascarse. 2. El reforzador instrumental Cantidad y naturaleza del reforzador Las dos caractersticas estn muy relacionadas. Tener un reforzador ms grande o ms sabroso (en el caso de la comida) provocar respuestas ms intensas en los sujetos. Cambios en la naturaleza y cantidad del reforzador Esto est relacionado con el modelo Rescorla-Wagner visto en el tema anterior. Si el EI es mayor de lo esperado, producir condicionamiento excitatorio. Si por el contrario el EI es menor de lo esperado, producir condicionamiento inhibitorio. Si trabajas por 9 euros/hora durante 6 meses y el septimo mes te siguen pagando lo mismo, ser menos emocionante que trabajar 6 meses a 8 euros y luego a partir del septimo mes subirte a 9 euros. Es probable que los trabajadores del segundo grupo sean ms productivos (para quien tenga psicologa de la motivacin, en la PEC 1 hay un ejercicio que trata este tema) Contraste positivo: Se refiere a una elevada respuesta por una recompensa favorable resultado de una experiencia anterior con una consecuencia menos atractiva. Contraste negativo: Se refiere a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia mejor. Contraste sucesivo (positivo o negativo): Dos condiciones de respuesta en diferentes fases del experimento y slo un cambio en la magnitud de la recompensa para los grupos de cambio.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS


Contraste conductual simultneo: Efectos de contraste conductual (contraste positivo y negativo) que estn producidos por frecuentes cambios entre una condicin de recompensa favorable y una desfavorable, con cada condicin de recompensa asociada a su propio estmulo distintivo. Todos los efectos de contraste ilustran que la efectividad de un reforzador en una situacin est determinada en parte por las experiencias del organismo con reforzadores en otras situaciones. 3. La relacin respuesta-reforzador En algunos casos hay una fuerte relacin entre lo que una persona hace y la consecuencia que sigue, en otros casos no hay ninguna relacin y en otros casos la relacin puede ser probabilstica. Un organismo debe organizar su tiempo para enfrentarse a varios retos y debe hacerlo de manera que lleve a cabo el mejor uso de su tiempo y energa. 2 tipos de relaciones entre una respuesta y un reforzador a) Relacin temporal (o contigidad temporal): Tiempo que transcurre entre la respuesta y el reforzador. En la Contigidad temporal el reforzador se entrega inmediatamente despus de la respuesta. b) Relacin causal: (o contingencia respuesta-reforzador). Se refiere al hecho de que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador. Efectos de la contigidad temporal El reforzamiento inmediato es preferible al demorado. Proporcionar el reforzador inmediatamente despus de la ocurrencia de la respuesta instrumental facilita el aprendizaje. Hay varios factores que explican porqu el condicionamiento instrumental es tan sensible a la demora del reforzamiento: Una demora larga hace que el sujeto no sepa cual de sus respuestas haya sido la que ha producido el reforzador. Es decir, la rata levanta una palanca pero pasan 30 segundos hasta que se muestra una bolita de comida, durante estos 30 segundos la rata sigue haciendo otras cosas como pueden ser saltar, morder, etc., de repente surge la bolita y la rata ya no asocia la bolita con la palanca inicial ya que despus ha seguido dando una serie de respuestas (saltar, morder, etc.) y no sabe cual de ellas ha sido la que ha propiciado la salida de la bolita. Para resolver este problema se entrega un reforzador condicionado o secundario inmediatamente despus de la respuesta instrumental y que ha sido asociado previamente con el reforzador. Por ejemplo en el adiestramiento verbal de animales se dice bueno o eso es y cuando acabe la exhibicin se le dar la comida. Otra manera de resolver el problema es mediante un procedimiento de marcado de la respuesta instrumental correcta. Experimento en ratas. Una caja con un brazo negro y otro blanco. El blanco es la respuesta correcta, el grupo de

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS


ratas que daba la respuesta correcta se dividi en 2 subgrupos, uno de estos subgrupos era extraido de la caja en el momento de entrar en el brazo blanco y llevado a otra caja a experar la comida. El otro subgrupo no era extrado de la caja, sino que esperaba a recibir la comida en ella durante 60 segundos. Se demostr que el grupo que era extrado (marcado) de la caja, tena un porcentaje de respuestas correctas superior en experimentos posteriores que el grupo que no haba sido extrado. Es decir, hay que hacer algo inmediatamente despus de la respuesta instrumental para que el animal se percate de que lo que acaba de hacer es la eleccin correcta. La contingencia respuesta-reforzador Repite lo anterior al principio del apartado pero aade que: Aunque la relacin causal sea perfecta, el condicionamiento no ocurrir si el reforzamiento es demorado durante demasiado tiempo. El experimento de supersticin de Skinner Muy interesante y gracioso: Meti a 8 palomas en 8 cajas distintas que estaban programadas para dar comida cada 15 segundos independientemente de lo que estuviesen haciendo las palomas. Al rato volvo y comprob que cada paloma estaba haciendo una cosa, unas daban vueltas otras picoteaban, etc, como si su comportamiento condicionara el hecho de que apareciese o no apareciese comida. Skinner denomin a esto conducta supersticiosa. Seguro que ms de uno hacemos cosas parecidas. Skinner explica esta conducta mediante la idea del reforzamiento accidental o adventicio que se refiere al emparejamiento accidental de una respuesta con la entrega del reforzador. Este experimento sugera que una contingencia positiva respuestareforzador no es necesaria para el condicionamiento instrumental. Reinterpretacin del experimento de supersticin: Staddon y Simmelhag profundizaron un poco ms en el experimento de Skinner y dieron nombre a las conductas de las palomas. Denominaron respuestas terminales a las que se daban al final del intervalo comidacomida y respuestas de intern a las que se daban en medio del intervalo. Las Palomas solan coincidir en el tipo de respuestas terminales y en el tipo de respuestas intern. Por lo tanto hay algo de contingencia entre el tipo de respuestas y el reforzador (al contrario de cmo sugera Skinner) Explicacin de la periodicidad de las respuestas de intern y terminales: Staddon y Simmelhag sugirieron que las respuestas terminales son respuestas tpicas de la especie que reflejan la anticipacin de comida a medida que el tiempo se encuentra ms cerca de la prxima presentacin de comida. En contraste, las respuestas intern son una manifestacin de otras fuentes de motivacin que eran ms importantes al comienzo del intervalo entre comidas, cuando la presentacin de comida era improbable.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS


El tipo de respuestas que se dan en el intervalo se agrupan en 3 subgrupos siguiendo el orden temporal tras la ltima aparicin de comida: a) Bsqueda focalizada poscomida (cerca del cuenco) b) Bsqueda general (lejos del cuenco) c) - Bsqueda focalizada (cerca del cuenco otra vez) Efectos de la controlabilidad de los reforzadores Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental. Un hallazgo importante en experimentos con perros fue que la exposicin a una descarga incontrolable dificultaba el aprendizaje posterior. Este efecto recibe el nombre de efecto de indefensin aprendida. Y ahora 6 puntos que tienen que ver con el efecto de indefensin aprendida: 1. El diseo tridico: (tabla pgina 153) Los experimentos de indefensin aprendida se realizan utilizando el diseo tridico. Contiene 2 fases: a) Exposicin Grupo de ratas E: Expuesto a descargas peridicas de las que pueden escapar. Grupo de ratas A: Cada sujeto del grupo A es acoplado a cada sujeto del grupo E y recibe las mismas descargas pero no pueden escapar de ellas. Grupo C: No recibe descargas pero est confinado en el aparato tanto tiempo como los otros. b) Condicionamiento Los 3 grupos reciben entrenamiento de escape evitacin Resultados: La exposicin a una descarga incontrolable (Grupo A) produce peores resultados en el aprendizaje escape-evitacin que el resto de los grupos. La diferencia en la tasa de aprendizaje entre los grupos muestra que los animales son sensibles a la contingencia respuesta-reforzador. 2. Hiptesis de la indefensin aprendida: Esta hiptesis asume que durante la exposicin a descargas incontrolables, los animales aprenden que las descargas son independientes de su conducta, no pueden hacer nada para controlarlas. Esto dificulta el aprendizaje ya que la falta de control sobre la situacin hace que descienda la motivacin de los sujetos para realizar una respuesta instrumental. No confundir con el efecto de indefensin aprendida que explica el patrn de resultados obtenido con el diseo tridico. 3. Deficit de actividad: Las ratas del Grupo A aprendan a ser inactivas en respuesta a la descarga durante la fase de exposicin.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta! !!CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS


4. Deficit atencional: Una descarga inescapable hace que los animales presten menos atencin a sus acciones (ya que han aprendido que van a recibir la descarga hagan lo que hagan). Sin embargo marcar la respuesta instrumental supera el dficit de indefensin aprendida. 5.Relaciones estimulares en el condicionamiento de escape: El rasgo definitorio de la conducta de escape es que la respuesta instrumental tiene como consecuencia la terminacin del estmulo aversivo. Adems, la respuesta de escape tiene como resultado claves internas de retroalimentacin de la respuesta. Hay dos: Claves de retroalimentacin de la terminacin de la descarga. (al comienzo de la respuesta de escape) Claves de retroalimentacin de la seal de seguridad. (cuando el animal completa la respuesta)

Estas claves contextuales llegan a convertirse en inhibidores condicionados del miedo y limitan el miedo elicitado por las claves contextuales de la cmara experimental. Hay mayor probabilidad que las claves contextuales de la cmara en la que se administran las descargas queden condicionadas para elicitar miedo cuando las descargas son inescapables. Para finalizar y a modo de conclusin: El diseo tridico ha sido de un valor incalculable para considerar la posible importancia de las contingencias respuesta-reforzador.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta!


!!CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN En el mundo real la contingencia perfecta entre la respuesta y el reforzamiento es rara. No siempre que pasemos muchas horas estudiando obtendremos una buena nota. Para estudiar esta relacin tan compleja se crean los programas de reforzamiento: Programa de reforzamiento: Programa o regla que determina la forma en que se relacionan las presentaciones del reforzador con las ocurrencias de la respuesta instrumental. La entrega del reforzador puede depender de varios factores, nmero de respuestas, paso del tiempo, etc. Los programas de reforzamiento se investigan normalmente en cajas de Skinner que permiten una observacin continua de la conducta, por lo que pueden observarse y analizarse los cambios en la tasa de respuesta. Proporcionan ms informacin sobre los factores que controlan el mantenimiento de la conducta.

A) PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE


Son programas en los que un solo factor determina qu ocurrencia de la respuesta instrumental se refuerza. Programas de razn El reforzamiento depende del nmero de respuestas. Reforzamiento continuo: Una sla respuesta provoca la entrega del reforzador. Reforzamiento parcial o intermitente: La respuesta se refuerza slo alguna vez. Razn fija: Entrega del reforzador cada X respuestas, (5, 10 etc). Se representa mediante RF5, RF10, etc. Otros conceptos importantes Registro acumulativo de la conducta: Es una forma especial de representar la forma de repetirse una respuesta a lo largo del tiempo. Se utilizaba sobre todo antes de la existencia de los ordenadores. (grfico pg 165). La pendiente de la lnea trazada representa la tasa de respuesta. Pausa posreforzamiento: Es la tasa de respuesta 0 que se observa justo despus del reforzamiento. Carrera de la razn: La tasa de respuesta alta y estable que completa cada requerimiento de la razn. Qu ocurre cuando el requerimiento de la razn se incrementa un poco? Es decir, pasar por ejemplo de RF 120 a RF 150 Con mayores requerimientos de la tasa, tienen a ocurrir pausas posreforzamiento ms largas.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta!


!!CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN Si el incremento es muy grande (de RF120 a RF500), es probable que el animal realice una pausa peridica cada vez que complete la razn requerida. Es lo que se conoce como tensin de razn.

Razn variable: Nmero de respuestas distinto para la entrega del reforzador. Se representa por RV y en el caso de RV10 quiere decir que su media es 10 (imaginemos que en un primer ensayo se necesitaban 13 respuestas, en un segundo ensayo 7 respuestas y en el ensayo final 10 respuestas. La media total de los 3 ensayos es RV 10. Las pausas predecibles en la tasa de respuesta son menos probables con los programas de razn variable que con los programas de razn fija. Los organismos suelen responder a una tasa claramente estable en los programas de RV. Programas de intervalo Cuando ocurre cierta cantidad de tiempo desde la ltima entrega del reforzador. Intervalo fijo (IF): El tiempo no vara de una ocasin a la siguiente. Festn del intervalo fijo: A medida que el tiempo para la disponibilidad del prximo reforzador se acerca, la tasa de respuesta aumenta. Este aumento en la tasa de respuesta se manifiesta como una aceleracin en el registro acumulativo hacia el final del IF. Esto demuestra una habilidad del sujeto para contar el tiempo. OJO!!! : Un programa de IF no garantiza que el reforzador se proporcionar a en algn momento a lo largo del tiempo, el intervalo determina slo cundo el reforzador estar disponible, no cuando se entrega. Es decir, adems del paso del tiempo, sigue siendo necesaria algn tipo de respuesta por parte del sujeto para acceder al reforzador. Por ejemplo, cada 4 minutos estar disponible comida para la paloma siempre y cuando haya dado 20 picotazos previamente. Intervalo variable (IV): El tiempo vara de una ocasin a la siguiente. Se representa por (IV 5), (IV 10), etc. Entendiendo este nmero como la media de todos los intervalos, de la misma manera que hablbamos ms arriba de la razn variable. Los programas de IV mantienen tasas de respuesta constantes y estables sin pausas regulares. (al igual que los programas de razn variable) Programas de intervalo y espera limitada: Esto tiene relacin con el OJO!! que marcaba antes. En la espera limitada el reforzador est disponible durante un tiempo X, si pasado ese tiempo el sujeto no ha dado el nmero de respuestas necesario, el reforzador deja de estar disponible. Siguiente el ejemplo anterior, cada 4 minutos estar la comida disponible durante 1 minuto. Si durante ese minuto de disponibilidad de la comida (+ los 4 minutos anteriores de cada intervalo) la paloma no ha llegado a 20 picotazos no podr acceder a ella y dejar de estar disponible, comenzando a contar de 0.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta!


!!CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN Comparacin de los programas de razn y de intervalo Similitudes Razn fija e intervalo fijo: - Producen una pausa posreforzamiento despus de la administracin de cada reforzador. - Producen altas tasas de respuesta antes de la administracin del siguiente reforzador. Razn variable e intervalo variable: - Mantienen tasas estables de respuesta, sin pausas predecibles. Diferencias Activan diferentes cambios neuroqumicos en el cerebro Los programas de intervalo estn relacionados con el sentido temporal del organismo.

En un experimento con palomas, una reforzada con RV y la otra con IV, se comprob que la paloma reforzada con el programa de RV respondi a una tasa mucho ms alta que la paloma reforzada con el programa de IV. El programa de RV motiv una conducta instrumental mucho ms vigorosa. Reforzamiento diferencial del tiempo interrespuesta: El intervalo entre una respuesta y la siguiente se denomina tiempo interrespuesta o TIR. Un sujeto que produce TIR cortos responder a una tasa alta y si produce TIR largos, su tasa ser baja. Un programa de razn favorece los TIR cortos (es la respuesta del sujeto la que determina cuando acceder a la comida, por lo tanto cuanto ms rpida se produzca esa respuesta (TIR corto), antes acceder a la comida. Por el contrario, un programa de intervalo favorece los TIR largos. Programas de reforzamiento de tasas de respuesta Los programas de tasas de respuesta requieren especficamente que el organismo responda a una tasa particular para obtener el reforzador. Es como una mezcla de los dos anteriores (tiempo y nmero). Por ejemplo un programa de reforzamiento en el que una respuesta se refuerce slo si ocurre dentro de los 5 segundos siguientes a la respuesta precedente. Si el animal realiza una respuesta cada 5 segundos, su tasa de respuesta ser de 12 por minuto. Por lo tanto habr reforzamiento si la tasa de respuesta es de 12 por minuto o mayor. Si la tasa de respuesta es menor, el organismo no ser reforzado. Esto recibe el nombre de Reforzamiento diferencial de tasas altas, o RDA. Reforzamiento diferencial de tasas altas (RDA): Una respuesta se refuerza slo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente. Estos programas fomentan que los sujetos respondan rpidamente. Reforzamiento diferencial de tasas bajas (RDB): Una respuesta se refuerza slo si ocurre despus de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente. Estos programas fomentan que los sujetos respondan lentamente.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta!


!!CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

B) CONDUCTA DE ELECCIN: PROGRAMAS CONCURRENTES


Los experimentos en los que slo se mide una respuesta (los vistos hasta ahora) no proporcionan una visin completa de la conducta. En la vida real los organismos ocupan si tiempo en muchas actividades y estn continuamente estableciendo elecciones entre varias conductas. Las situaciones de eleccin pueden ser bastante complicadas y muy diferentes. Por esta razn los psiclogos han desarrollado el estudio de situaciones ms simples. La situacin de eleccin ms simple consta de dos respuestas alternativas, cada una de estas seguida por un reforzador de acuerdo con su propio programa de reforzamiento. Histricamente se utilizaban laberintos T para estudiar la conducta de eleccin. Hoy se utilizan cajas de Skinner equipadas con dos teclas. Responder en cada tecla es reforzado segn algn programa de reforzamiento. Los dos programas funcionan concurrentemente, por eso reciben el nombre de programa concurrente. Ejemplo pgina 173 (grfico). Programa concurrente. Los picotazos sobre la tecla A siguen un programa IV 60 seg. Los de la tecla B siguen un programa RF 10. El objetivo del experimento es ver cmo la paloma distribuye sus picotazos en las dos teclas y cmo influye el programa de reforzamiento propio de cada tecla en las elecciones del animal. Medidas de la conducta de eleccin Se puede medir de varias formas: Tasa relativa de respuesta de cada alternativa: La tasa relativa de respuesta en la tecla A se calcula dividiendo la tasa de respuesta en la tecla A por la tasa total de respuesta (suma de la tasa A + la tasa B) Tasa relativa de respuesta (A) = RA/ (RA+RB) Si la paloma picotea igualmente en las dos teclas de respuesta, la razn ser 0,5. Si la tasa de respuesta es mayor en A que en B, la razn ser mayor que 0,5. Si la tasa de respuesta es menor en A que en B, la razn ser menor que 0,5.

La forma en que un organismo distribuye su conducta entre las dos alternativas de respuesta est muy influida por el programa de reforzamiento que funciona para cada respuesta. Tasa relativa de reforzamiento: Es la frecuencia con la que el individuo obtiene recompensas en cada lado. Se calcula de igual manera a la tasa relativa de respuesta. (pero con una r minscula) Tasa relativa de reforzamiento (A) = rA/ (rA+rB)

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta!


!!CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN La ley de igualacin (de Herrnstein) En el punto anterior (medidas de la conducta de eleccin) en los ejemplos se utilizaba el mismo programa de reforzamiento (IV 60 seg) para las dos teclas. Por lo tanto la tasa relativa de respuesta y la tasa relativa de reforzamiento daba 0,5 ya que los programas eran iguales Pero qu ocurre si los programas son diferentes? Experimento en palomas: Tecla A: IV 6 min = Pulsando siempre a esta tecla obtendra un mximo de 10 reforzadores por hora. Tecla B: IV 2 min= Pulsando siempre a esta tecla obtendra un mximo de 30 reforzadores por hora. Cmo fue la respuesta de las palomas? La tasa relativa de respuesta en una alternativa dada estaba siempre muy cercana a igualar la tasa relativa de reforzamiento logrado en esa alternativa. Si las palomas obtenan una proporcin mayor de reforzadores en A, picoteaban ms en A. Por lo tanto, la tasa relativa de respuesta en una alternativa se iguala con la tasa relativa de reforzamiento en esa alternativa. Esto es la ley de igualacin. RA/ (RA+RB) = rA/ (rA+rB) Otra forma de escribir esta frmula es: RA/ RB = rA/rB Infraigualacin, supraigualacin y sesgo de respuesta A pesar de lo que hablbamos de la ley de igualacin, las tasas relativas de respuesta no siempre se igualan con exactamente con las tasas relativas de reforzamiento. Esto lo vamos a estudiar aadiendo dos parmetros b y s a la ecuacin. RA/ RB = b (rA/rB)s s= sensibilidad de la conducta de eleccin a las tasas relativas de reforzamiento para las alternativas de respuesta. Si s es menor que 1,0 = infraigualacin. Sensibilidad reducida a la tasa relativa de reforzamiento. Si s es mayor que 1,0 = supraigualacin. Sensibilidad aumentada a la tasa relativa de reforzamiento. La infraigualacin se encuentra ms a menudo que la supraigualacin. b = sesgo de respuesta(bias en ingls, por eso la b) Los sesgos de respuesta influyen en la eleccin cuando las alternativas de respuesta son diferentes (picotear y presionar con la pata). El sesgo tambin adquiere importancia cuando el reforzador es diferente (grano de trigo y semillas). En ausencia de sesgos, b=1. Dependiendo de la naturaleza del sesgo o de la preferencia, b ser mayor o menor que 1.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta!


!!CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN La ley de la igualacin y el valor del reforzador: La tasa relativa de respuesta es una funcin de la cantidad relativa de cada reforzador, de la demora y de la palatabilidad. Cuanto mayores, ms sabrosos y ms inmediatos sean los reforzadores, sern de mayor valor. La ley de la igualacin y los programas simples de reforzamiento: Incluso las situaciones de respuesta nica pueden involucrar una eleccin entre realizar la respuesta especificada (picotear o presionar una palanca) u ocuparse de otras actividades (caminar, acicalarse, etc) Segn esto, la ley de la igualacin quedara as: RA / (RA+RO) = rA / (rA+rO) Despejando RA = RA =(RA+RO) rA / (rA+rO)

RA= Tasa de respuesta del programa RO= Tasa de respuesta de las otras actividades rA = Reforzamiento explcito del programa rO = Reforzamiento de las otras actividades Y para liar un poco ms las cosas Si consideramos que (RA+RO) es una constante que no guarda relacin con el reforzador, podemos llamarla constante k. La frmula quedar de la siguiente manera: RA = krA / (rA+rO) Esta ltima ecuacin proporciona dos maneras de modificar la tasa de una respuesta: Mediante el cambio de su tasa de reforzamiento Mediante el cambio de la tasa de las otras fuentes de reforzamiento

Mecanismos de la ley de la igualacin 3 mecanismos: 1. Maximizacin molecular 2. Maximizacin molar 3. Mejoramiento Antes de entrar en detalle con cada uno de ellos. Vamos a explicar un concepto importante para entender el 1 y el 2: Igualacin y maximizacin de las tasas de reforzamiento: Los organismos distribuyen sus acciones entre las alternativas de respuesta para recibir la mxima cantidad posible de reforzadores en cada situacin. Y ahora s, pasamos a explicar cada uno de los mecanismos:

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta!


!!CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN 1. Maximizacin molecular: Los organismos siempre eligen cualquier alternativa de respuesta con mejores probabilidades de que sea reforzada en ese momento. Experimento en palomas con dos teclas (A y B) y programa IV-IV. Cuanto ms tiempo permanezca la paloma en la tecla A, ms probabilidad habr de que transcurra el intervalo para la tecla B y que por lo tanto el reforzamiento est disponible para B. 2. Maximizacin molar: El organismo distribuye sus respuestas entre las varias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a la larga. Se utiliz para explicar los programas de razn en los que los organismos rara vez cambian de alternativa, simplemente responden a la alternativa que requiera menor nmero de respuestas (RF10 frente a RF20) Sin embargo la maximizacin molar encuentra problemas a la hora de explicar la conducta de eleccin en programas de intervalo (IV-IV) y para programas razn-intervalo (RF-IV). 3. Mejoramiento: Los mecanismos de mejoramiento operan a una escala temporal de las teoras molas y molecular. El trmino mejoramiento se refiere a hacer algo mejor que el pasado reciente. No se refiere a elegir la mejor alternativa en ese momento. Trmino importante sobre el mejoramiento: Tasa local de respuesta y reforzamiento: Las tasas locales estn calculadas slo sobre el perodo de tiempo que un sujeto dedica a una alternativa particular de respuesta. Si la situacin incluye dos opciones (A y B), la tasa local de respuesta en A se calcula dividiendo la frecuencia de respuesta en A por el tiempo que el sujeto dedica a responder en A. Ejemplo numrico (que siempre ayudan) Un organismo da 75 respuestas en 20 minutos en la alternativa A La tasa global en A ser de 75 respuestas/hora (puede que el resto del tiempo se haya dedicado a responder en B) Sin embargo la tasa local en A sera de 225 respuestas/hora (75 cada 20 minutos)

La teora del mejoramiento asume que los organismos cambian de una alternativa de respuesta a otra para mejorar la tasa local de reforzamiento que estn recibiendo. El mecanismo de mejoramiento da como resultado la igualacin. Esta teora sostiene que un organismo cambiar su preferencia en favor de la alternativa de respuesta que arroje la tasa local de reforzamiento ms alta.

C) ELECCIN CON COMPROMISO


En nuestra vida diaria, en ocasiones elegir una alternativa hace que otras no estn disponibles. De igual forma, las elecciones importantes en la vida a menudo implican un beneficio pequeo a corto plazo frente a un beneficio ms demorado pero mayor. Es complicado extrapolar este tipo de decisiones al laboratorio para poder estudiarlas, por ello los cientficos han desarrollado el programa concurrente encadenado de reforzamiento.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta!


!!CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN Programa concurrente encadenado (grfico pg 183) Este programa involucra al menos dos fases o eslabones: 1 fase: Eslabn de eleccin: Se permite al participante elegir entre dos programas alternativos realizando una de dos respuestas. 2 fase: Eslabn terminal: Una vez que el participante ha elegido uno de los dos eslabones de eleccin, ir al eslabn terminal que est formado por dos programas de reforzamiento dependiendo de qu opcin haya escogido en la 1 fase. (esto es como lo que comentbamos antes de la vida real, en ocasiones elegir una opcin hace que otras opciones no estn disponibles) Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de razn variable (RV) ya que proporciona reforzamiento por un nmero relativamente pequeo de respuestas. El estmulo del eslabn terminal se convierte en un reforzador condicionado. Por lo tanto un programa concurrente se caracteriza en que las respuestas al eslabn inicial se refuerzan por la presentacin de un reforzador condicionado. Las diferencias en el valor del reforzador condicionado determinarn entonces la tasa relativa de cada respuesta de eleccin en el eslabn inicial. (el programa (eslabn terminal) que suscite ms valor a la paloma ser el que elija al principio en el eslabn de eleccin) Estudios de autocontrol El autocontrol a menudo supone elegir una recompensa grande demorada en lugar de una recompensa pequea inmediata. Experimento en palomas: (grfico pg 185) Utilizando el programa concurrente encadenado. En cada uno de los programas terminales responder era recompensado o bien mediante el acceso a una pequea cantidad de grano (alternativa A) o el acceso a una mayor cantidad de grano que estaba demorada 4 segundos (alternativa B). Estudiaron la conducta de eleccin en dos circunstancias diferentes: 1. Procedimiento de eleccin directa: (dibujo superior de la 185). No existe eslabn de eleccin, directamente se accede a la recompensa. En este ejemplo las palomas no mostraban autocontrol y directamente seleccionaban la recompensa pequea inmediata. 2. Procedimiento concurrente encadenado (dibujo inferior de la pgina 185, la foto de la tia no, sino el de la paloma). En este ejemplo, los componentes terminales estaban demorados despus de que las palomas realizaran su eleccin inicial. Si la demora era suficiente antes de los componentes terminales, las palomas mostraban autocontrol y elegan la recompensa grande demorada. Conclusiones: (este prrafo lo copio tal cual del libro sin resumir porque me parece interesante e importante): Las preferencias cambian a favor de cualquier recompensa

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta!


!!CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN grande demorada si se requiere que los participantes esperen ms tiempo para recibir cualquier recompensa tras realizar su eleccin. Si las recompensas se entregan rpidamente tras una respuesta de eleccin, los sujetos generalmente prefieren una recompensa pequea inmediata ms que una recompensa grande demorada. Sin embargo, si se aade una demora constante a la entrega de ambas recompensas, es ms probable que los individuos muestren autocontrol y prefieran la recompensa grande demorada. Explicaciones del autocontrol: El valor de un reforzador se reduce en funcin del tiempo que haya que esperar para obtenerlo. La funcin matemtica que representa esto se llama funcin descontadora del valor. V = M / (1+KD) (esta funcin recibe el nombre de funcin del decaimiento hiperblico) V= valor del reforzador M= Magnitud de la recompensa D= Demora de la recompensa K= Parmetro de la tasa descontadora Si el reforzador es entregado sin demora (D=0), el valor del reforzador estar directamente relacionado con su magnitud. Cuanto ms se demora el reforzador menor es su valor. La funcin descontadora del valor explica el problema del autocontrol en el grfico de la pgina 186. Me ha costado un poco entenderlo pero es bastante sencillo. Tenemos una lnea horizontal que es el tiempo y una vertical que es el valor de la recompensa. Tambin tenemos 2 momentos en el tiempo (T1 y T2). Dependiendo de qu momento escojamos elegiremos una recompensa u otra. As por ejemplo en T1 vemos que la lnea que lleva a la recompensa pequea est por encima (tiene ms valor) que la lnea que lleva a la recompensa grande. Por lo tanto en T1 escogeremos la recompensa pequea. Por el contrario en T2 la lnea que lleva a la recompensa grande est por encima y escogeremos esta opcin. La opcin T2 es la opcin de autocontrol Las funciones descontadotas y los problemas de autocontrol en la adiccin a la droga: Cuando ms acusada sea la funcin descontadora de la demora de una persona, ms dificultad tendr para mostrar autocontrol (seleccionando una recompensa mayor demorada) en lugar de impulsividad (seleccionando una recompensa ms pequea pero ms rpida). Experimentos para medir el autocontrol en personas dependientes de la herona demostr que tenan ms impulsividad que el resto de las personas. (grfico de la izquierda en 187). Para los dependientes de la herona, el valor del dinero (con el que se realizaba el experimento) disminuy muy rpido si iban a tardar en drselo.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Principios de Aprendizaje y conducta!


!!CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN Puede entrenarse el autocontrol? La respuesta es s. Ejemplo con nios. 3 fases. Fase 1- Pretest: Se les pregunta a los nios si quieren 2 centimos ahora o 3 centimos al final del da. A los que eligen los 2 cntimos se les dan enseguida, a los que eligen los 3 centimos se les dan al final del da. Fase 2- Sesin de entrenamiento: Dependiendo de la eleccin en la fase 1, se hacen 2 grupos y se comienza con la sesin de entrenamiento. Deben resolver problemas sencillos para obtener la recompensa, las respuestas correctas del grupo de los 2 cntimos recibirn el dinero al instante. Las respuestas correctas del grupo de los 3 cntimos recibirn el dinero al final del da. Fase 3 Postest: se les vuelve a preguntar a los nios lo mismo que en la fase 1. El hallazgo fue que haba mayor cantidad de nios escogiendo la recompensa ms grande demorada (3 cntimos) en el postest. Por lo tanto, siempre y cuando las tareas de entrenamiento (fase 2) impliquen bajo esfuerzo, el entrenamiento con la recompensa demorada incrementar la preferencia por la recompensa ms grande demorada. Todo esto del autocontrol lo encuentro bastante relacionado con alguno de mis artculos: Voluntad vs Hbito: el desafo de los 30 das (21 Octubre 2009) Cmo aumentar tu autodisciplina (26 y 30 Octubre 2009)

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Un sujeto est motivado para obtener un reforzador. Pero qu significa estar motivado? Existen dos perspectivas que intentan dar solucin a este problema: 1. Estructura asociativa del condicionamiento instrumental: (Thorndike). Toma una perspectiva molecular. Se centra en las respuestas individuales y sus antecedentes estimulares y consecuencias especficas. 2. Regulacin conductual: (tradicin skinneriana): El condicionamiento instrumental se considera desde un contexto ms amplio, es decir, desde una perspectiva molar. Se analizan las opciones conductuales del organismo para alcanzar las metas, por lo tanto es una perspectiva ms funcional. Y ahora vamos a ver cada una de las dos en mayor profundidad

1.ESTRUCTURA INSTRUMENTAL

ASOCIATIVA

DEL

CONDICIONAMIENTO

Thorndike: El condicionamiento instrumental incluye algo ms que una respuesta y un reforzador. Deben considerarse 3 sucesos en el anlisis del condicionamiento instrumental: Contexto estimular (E) Respuesta instrumental (R) Consecuencia de la respuesta o reforzador (C)

Estos 3 sucesos se relacionan entre s creando distintos tipos de relaciones que vamos a ver a continuacin. La asociacin E-R y la ley del efecto El papel del reforzador (C) es establecer una asociacin entre las claves contextuales (E) y la respuesta instrumental (R). La ley del efecto asume que el nico papel del reforzador es crear una asociacin E-R, ya que el reforzador (C) no participa en esta asociacin. Expectativa de recompensa y la asociacin E-C Los procesos pavlovianos son importantes en este tipo de asociacin. El reforzamiento de la respuesta (R) producir una asociacin entre el contexto estimular (E) y la consecuencia de la respuesta (C). Hull estableci que la respuesta instrumental era motivada por dos factores: a) (E) evoca la respuesta directamente por asociacin con (R) b) La actividad instrumental tambin llega a realizarse en respuesta a la expectativa de recompensa debido al establecimiento de una asociacin R-C. La teora moderna de los dos procesos: Esta teora asume que hay 2 tipos de aprendizaje, el condicionamiento pavloviano y el instrumental y estn relacionados de una forma especial:

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Durante el condicionamiento instrumental, (E) se relaciona con (C) a travs de condicionamiento pavloviano. Entonces tenemos la asociacin (E-C). A travs de esta asociacin, (E) motiva la conducta instrumental mediante la activacin de un estado emocional central que depender de la naturaleza del reforzador (como puede ser la esperanza de obtener comida). Entonces dieron un paso ms Cmo podan demostrar que este estado de esperanza finalmente motivara la conducta instrumental? La tasa de una respuesta instrumental ser modificada por la presentacin de un estmulo clsicamente condicionado. Reforzar una presin de palanca con comida crea la expectativa de comida y la emocin de esperanza. Por lo tanto la presentacin de un EC+ clsicamente condicionado con comida durante la ejecucin de una respuesta reforzada debera aumentar la esperanza y por lo tanto incrementar la respuesta. Resultados consecuentes con la teora moderna de los dos procesos Experimento de transferencia de control: (consta de 3 fases) Fase 1: Condicionamiento instrumental de una respuesta operante utilizando algn procedimiento de reforzamiento positivo o negativo. Fase 2: Se entrena a los participantes con un condicionamiento clsico en el cual se asocia un EC explcito con la presencia o ausencia de un estmulo incondicionado. Fase 3: Es la fase de transferencia crtica. Se permite a los participantes que realicen la respuesta instrumental y se presenta el EC de la fase 2 para comprobar su efecto en la tasa de conducta instrumental. Interacciones de respuesta en los experimentos de transferencia de control Un estmulo clsicamente condicionado puede influir sobre la conducta instrumental a travs de las respuestas abiertas que elicita. Situacin hipottica: Un estmulo condicionado clsicamente hace que un animal permanezca quieto y su respuesta instrumental es saltar hacia delante y hacia atrs. La consecuencia es que el EC disminuir la respuesta instrumental y saltar menos. Estados emocionales recompensa? centrales condicionados o expectativas especficas de

En ciertas circunstancias los animales adquieren expectativas especficas del reforzador en lugar de un estado emocional ms general de esperanza durante el condicionamiento instrumental y clsico. Relaciones R-C y E(R-C) en el condicionamiento instrumental En los dos tipos de asociaciones que hemos visto antes (Throndike E-R y asociacin E-C) no se inclua de forma directa una relacin entre la respuesta (R) y el reforzador (C). Esto es importante ya que de forma informal nosotros responderamos que estamos realizando una determinada conducta (R) para conseguir una determinada consecuencia o reforzador (C), sin embargo ninguno de los dos modelos contempla est asociacin directa R-C.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Evidencia de asociaciones R-C: Una tcnica para probar la asociacin respuestaconsecuencia consiste en devaluar el reforzador despus del condicionamiento clsico para ver si esto disminuye la respuesta instrumental. La devaluacin de un reforzador debilita selectivamente la respuesta particular que ha sido entrenada con ese reforzador. Evidencia del aprendizaje de una relacin jerrquica E-(R-C): Las asociaciones R-C no pueden actuar aisladamente para producir la conducta instrumental. Se necesita un factor adicional para activar la asociacin R-C. Y este factor es el estmulo (E).

2. REGULACIN CONDUCTUAL
Los anlisis de la regulacin conductual se centran en cmo las contingencias instrumentales ponen limitaciones a las actividades de un organismo. Antecedentes de la regulacin conductual Al principio se consideraba que los reforzadores eran unos estmulos especiales que fortalecan la conducta instrumental. La teora de la respuesta consumatoria: (Fred Sheffield)- Las respuestas consumatorias tpicas de la especie (comer, beber, etc) son en s mismas el rasgo crtico de los reforzadores. Se consider que las respuestas reforzadoras eran especiales porque involucraban la consumacin o completamiento de una secuencia instintiva de conducta. El principio de Premack: Las respuestas incluidas en los reforzadores comnmente utilizados son actividades que es altamente probable que realicen los animales (respuesta de comer en una rata privada de comida). Por el contrario las respuestas instrumentales son actividades que normalmente ocurren a una baja probabilidad (respuesta de presionar una palanca). Y a continuacin el enunciado de este principio como Dios manda: Dadas dos respuestas de diferente probabilidad, A y B, la oportunidad para realizar la respuesta de alta probabilidad A despus de la respuesta de baja probabilidad B tendr como resultado el reforzamiento de la respuesta B. La oportunidad para realizar la respuesta B de baja probabilidad despus de la respuesta A de alta probabilidad no dar como resultado el reforzamiento de la respuesta A

( B " A refuerza B) ( A " B no refuerza A) ! !


Comer reforzar la presin de la palanca porque comer es normalmente ms probable que presionar la palanca. Sin embargo, la presin de la palanca no puede reforzar el comer. Por todo esto, el principio de Premack tambin recibe el nombre de principio de la probabilidad diferencial.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

En resumen: El principio de Premack signific un avance importante en el pensamiento cientfico sobre el reforzamiento. Estimul la consideracin de los reforzadores como respuestas ms que como estmulos. Con este principio cualquier actividad poda servir como reforzador siempre y cuando fuera ms probable que la respuesta instrumental. La Hiptesis de la privacin de respuesta: (Timberlake y Allison): La restriccin de la respuesta reforzadora es el factor crtico para el reforzamiento instrumental. Incluso el acceso a una respuesta de baja probabilidad puede servir como reforzador siempre y cuando los sujetos tuvieran la restriccin de realizar esa respuesta. Por lo tanto esto entra en conflicto con el principio de Premack al mostrar que la privacin de respuesta es ms bsica para la motivacin de la conducta instrumental que la probabilidad diferencial de la respuesta. Tanto la teora de Premack como la hiptesis de la privacin de respuesta sugieren que los reforzadores no existen en sentido absoluto. Regulacin conductual y el punto de deleite conductual El concepto de regulacin est muy relacionado con la homeostasis. Los organismos tienen una distribucin de actividades preferida que luchan por mantener frente a los cambios. Si se perturba este nivel de actividades ptimo, se supone que la conducta cambiar para regular la desviacin. Punto de deleite conductual: Si los organismos son libres para distribuir sus respuestas entre varias alternativas, lo harn de forma en que sea ms cmodo para ellos. Este punto puede identificarse mediante la frecuencia relativa de ocurrencia de todas las respuestas de un organismo en una situacin sin restricciones. (grfico pg 205) Imposicin de una contingencia instrumental: (seguimos observando el grfico de la 205) La contingencia consiste en un programa mediante el cual se le pide al estudiante que estudie la misma cantidad de tiempo que dedica a ver la television. (es la lnea que parte del origen con un ngulo de 45). Una contingencia instrumental no permite volver al punto de deleite. Sin embargo el punto de deleite conductual sigue teniendo importancia ya que proporciona la motivacin para la conducta instrumental. Volver al punto conductual sigue siendo una meta en la distribucin de respuestas. Modelo de desviacin minima (Staddon): La introduccin de una contingencia respuesta-reforzador provoca que los organismos redistribuyan sus conductas entre las respuestas instrumentales y contingentes de manera que se minimice la desviacin total de las dos respuestas con respecto al punto ptimo o de deleite. (es el punto negro de la lnea del grfico de la pgina 205) Explicacin de los efectos del reforzamiento: El efecto de reforzamiento se identifica por un incremento en la ocurrencia de una respuesta instrumental sobre el nivel de esa conducta en ausencia de la contingencia respuesta-reforzador. Siguiendo con el ejemplo del estudiante, para acercarse al punto de deleite conductual, el estudiante tiene que

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

aumentar su estudio para obtener ms oportunidad de ver la television. Y al aumentar el estudio se produce el reforzamiento que es lo que buscamos. Una vision sobre las contingencias de reforzamiento en un contexto conductual ms amplio: El contexto tambin influye en todo esto ya que las contingencias instrumentales no suceden en un vaco, ocurren en un contexto en el que se puden dar una variedad de respuestas y reforzadores. Si el estudiante prefiere escuchar la radio en lugar de ver la TV, no aumentar su conducta de estudio como para conseguir su cantidad de tiempo preferida de TV. Y ahora nos van a relacionar todo esto con la economa Conceptos econmicos y distribucin de respuesta La economa es el estudio de la distribucin de la conducta dentro de un sistema de restricciones Economa: Las restricciones de la conducta se imponen por los ingresos de un individuo y el precio de los bienes que se quiere obtener. Psicologa: En las situaciones de condicionamiento instrumental, las restricciones estn proporcionadas por el nmero de respuestas que un organismo es capaz de realizar y el nmero de respuestas requerido para obtener el reforzador. Demanda del consumidor: Es fundamental la relacin entre el precio de una comodidad y cunto se obtiene, esto se denomina curva de la demanda Elasticidad de la demanda: Grado en el cual el precio influye en el consumo. La demanda de caramelos es mu elstica, quiere decir que conforme ms suba el precio de los caramelos ms descender su compra. (grfico pg 209) Y cmo relacionamos todo esto con el reforzamiento instrumental?: ESTABLECIENDO ANALOGAS. El nmero de respuestas (o tiempo dedicado a responder) es el dinero. El precio de un reforzador es el tiempo o nmero de respuestas requeridas para obtener (adquirir) el reforzador.

La meta es comprender cmo la conducta instrumental (gasto) est controlada por las contingencias instrumentales (precios). Determinantes de la elasticidad de la demanda: Existen 3 factores que influyen en cmo las restricciones de un programa moldean la redistribucin de la conducta: 1. Disponibilidad de sustitutos: El grado en que los aumentos en el precio de un artculo producen una disminucin en el consumo depende de la disponibilidad (y precio) de otros bienes que puedan utilizarse en sustitucin del artculo original. La disponibilidad de sustitutos aumenta la sensibilidad del artculo original a los precios altos. Si algo aumenta de precio y yo tengo una alternativa, dejar de comprarlo rpidamente y adquirir la segunda alternativa. (el caf es sustituto del te ya que ambos contienen cafeina). Economa abierta: A los animales se les da comida fuera de las sesiones experimentales

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Economa cerrada: Los animales no reciben alimentacin suplementaria.

2. Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en precios altos. En un rango de precios bajos, la demanda de comida no es elstica. (no olvidemos que cuando hablamos de precio nos estamos refiriendo al nmero de respuestas para obtener un reforzador). 3. Nivel de ingresos: Cuanto ms salario, menos se desanimar un consumidor con los incrementos del precio. Extrapolando esto a los programas de reforzamiento, el nmero de respuestas o el tiempo disponible para responder corresponde a los ingresos, por lo tanto cuantas ms respuestas o tiempo tengan disponibles los animales, menos estar su conducta influida por los aumentos en el coste del reforzador. Problemas con las aproximaciones de regulacin conductual El punto de deleite es una caracterstica molar de la conducta. Se basa en una medida de cada respuesta acumulada a lo largo de un bloque temporal amplio. En el ejemplo del nio que estudiaba y vea TV, el punto de deleite lo poda haber alcanzado viendo todo el tiempo la TV antes de estudiar o alternando ambas respuestas. Desde la aproximacin punto de deleite conductual no importa que estrategia utilizara, sin embargo s que es importante desde el punto de deleite molar. Otro problema es que las respuestas durante un perodo de lnea de base libre no siempre tienen el mismo valor como respuestas que ocurren como parte de una contingencia instrumental impuesta. Es decir, debemos asumir que estudiar en ausencia de una restriccin de respuesta impuesta externamente tiene que tener el mismo valor que estudiar para obtener acceso a la TV. Sin embargo esto es incorrecto, correr por placer es diferente que cuando se requiere por una contingencia instrumental impuesta (correr en una clase de gymnasia). La regulacin conductual no estudia los procesos conductuales moleculares, por lo tanto no dice nada acerca de cmo los organismos defienden una combinacin preferida de bienes o actividades.

Contribuciones de la regulacin conductual 1. La regulacin conductual y el principio de Premack nos alej de la consideracin de los reforzadores como tipos especiales de estmulos o como tipos especiales de respuestas. 2. Los procedimiento de condicionamiento instrumental ya no se considera que estampan o fortalecen la conducta instrumental, en su lugar es visto como una nueva distribucin de respuestas. 3. No existe una distincin fundamental entre las respuestas instrumentales y las reforzadoras. Se distinguen nicamente por los papeles asignados a ellas mediante un procedimiento de condicionamiento instrumental. 4. La regulacin conductual y la economa conductual aceptan la idea de que los organismos responden para maximizar sus beneficios

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

5. La regulacin conductual y la economa conductual han proporcionado caminos nuevos para describir las restricciones que imponen varios procedimientos de condicionamiento instrumental en el repertorio de conducta de un organismo.

3. COMENTARIOS FINALES
En este apartado se realiza una comparacin a nivel general entre el punto 1 y el 2 de este tema, es decir, la estructura asociativa y la regulacin conductual. Caractersticas propias de cada teora que no comparte con la otra Asociacionismo - Concepto de asociacin - Exploracin de los circuitos neuronales - Nivel molecular: El objetivo son los estmulos especficos, las respuestas y sus conexiones. - Est relacionada con procesos especficos (asociaciones E-R, E-C, R-C, etc) Regulacin conductual - Concepto de regulacin conductual (puntos de deleite y restricciones del programa) - Poca aplicacin neurolgica - Nivel molar de agregados de conducta. - Est relacionada con metas a largo plazo

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

Respondemos de distinta manera dependiendo del estmulo que se nos presente. La supervivencia de los animales depende de su habilidad para responder apropiadamente a la situacin.

1. IDENTIFICACIN Y MEDIDA DEL CONTROL POR EL ESTMULO


Cmo podemos afirmar que una respuesta instrumental est bajo el control de ciertos estmulos? Respuesta diferencial y discriminacin de estmulos Experimento en palomas: Reforzamiento consistente en picotear un tringulo rojo con fondo rojo. Cuando la paloma aprendi a picotear de forma estable el tringulo con fondo rojo se separaron los estmulos (por un lado el tringulo y por otro el fondo rojo) y se midi la respuesta en cada uno de ellos. El resultado fue que picoteaba mucho ms el fondo rojo que el tringulo. Por lo tanto decimos que el fondo rojo controla la conducta de picoteo mejor que el tringulo. Otro concepto importante aqu es el de discriminacin de estmulos: Un organismo muestra discriminacin de estmulos si responde de forma diferente a dos o ms estmulos. En realidad al hablar del control y de la discriminacin estamos hablando de lo mismo pero desde diferentes puntos de vista. Uno no existe sin lo otro. Adems, en ausencia de procedimientos especiales, los investigadores no siempre pueden predecir cul de varios estmulos de aquellos que un organismo experimenta adquirir control sobre su conducta instrumental. Generalizacin de estmulos Se dice que un organismo muestra generalizacin de estmulos si responde de forma similar a dos o ms estmulos. Pavlov descubri esto al observar cmo despus de utilizar un estmulo como EC, sus perros tambin daban la respuesta condicionada a otros estmulos semejantes. Gradiente de generalizacin de estmulos: Experimento en Palomas: Picoteaban una tecla de 580nm de longitud de onda, se demostr que ante variaciones de la longitud entre 570 y 590 seguan respondiendo de la misma forma. El intervalo donde se generalizan las respuestas (570-590) es lo que se conoce como gradiente de generalizacin del estmulo. Los gradientes de generalizacin del estmulo como medidas del control por el estmulo Los gradientes facilitan informacin acerca del grado de sensibilidad de la conducta de un organismo antes la variacin de un aspecto particular del ambiente. Los investigadores pueden determinar exactamente el grado en que tiene que modificarse un estmulo para producir un cambio en la conducta. Si un gradiente es muy plano (grfico pg 222) quiere decir que el rasgo que se vara en la prueba de generalizacin no controla la conducta instrumental. Por ejemplo, las palomas ciegas como no vean las diferencias en los colores, seguan

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

picoteando de igual forma aunque el estmulo se saliese del gradiente, y por lo tanto la lnea del gradiente es prcticamente plana. Por el contrario, si el gradiente es muy acusado (grfico 221) quiere decir que el organismo responde en mayor medida a algunos estmulos de prueba que a otros.

Resumiendo: Lo acusado del gradiente de generalizacin de un estmulo proporciona una medida precisa del grado de control del estmulo. La generalizacin y la respuesta diferencial son fenmenos opuestos.

2. FACTORES DEL ESTMULO Y LA RESPUESTA EN EL CONTROL POR EL ESTMULO


En el experimento de las palomas era muy fcil dividir las caractersticas del estmulo (tringulo y fondo rojo), sin embargo en la vida real es mucho ms dificil dividir las caractersticas ya que las situaciones son mucho ms complejas. Por lo tantoQu es lo que determina que una de las muchas caractersticas de una situacin estimular adquiera control sobre la conducta instrumental? Lo vamos a ver a continuacion: Capacidad sensorial y orientacin La capacidad sensorial y de orientacin determinan qu estmulos se incluyen en el mundo sensorial de un organismo. Lo que est fuera de su rango sensorial no existe para un organismo (los seres humanos no podemos oir los ultrasonidos, sin embargo los perros s) Facilidad relativa del condicionamiento de varios estmulos Aparte de tener la capacidad sensorial, la intensidad con que los organismos aprenden sobre un estmulo depende de la facilidad relativa de condicionamiento de otras claves presentes en la situacin. Esto se conoce como ensombrecimiento. Ejemplo de un nio que aprende a leer viendo los dibujos de un libro ignorando las frases. Luego al ir describiendo los dibujos parecer que est leyendo cuando en realidad no es as. Cuanto ms intenso sea el estmulo, ms rpido se condicionar y ensombrecer el aprendizaje del estmulo ms dbil. Tipos de reforzamiento Es ms probable que ciertos tipos de estmulos adquieran control sobre la conducta instrumental con reforzamiento positivo que con reforzamiento negativo. Ejemplo en Palomas Reforzamiento positivo (comida) con tono y luz roja: Respondieron ms a la luz roja Reforzamiento negativo (descarga) con tono y luz roja: Respondieron ms al tono

Esto se puede explicar por los sistemas de conducta que se activan en cada caso. En el caso de la alimentacin las claves visuales son ms dominantes (luz roja) mientras que en

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

el caso de evitar el peligro son ms importantes los tonos (el animal oye a un depredador acercarse) Por lo tanto, para una misma combinacin de estmulos se pueden dar respuestas diferentes dependiendo del tipo de condicionamiento empleado, debido al sistema de conducta que se activa en cada caso. Tipos de respuesta instrumental Otro factor importante es el tipo de respuesta requerida para el refozamiento. En un experimento con perros se demostr que las respuestas que se diferencian por la localizacin (levantar la para derecha/levantar la pata izquierda) es ms probable que estn bajo el control de la caracterstica especial de las claves auditivas. Por el contrario las respuestas que se diferencian por la naturaleza (hacer/no hacer) es ms probable que lleguen a estar bajo el control de la naturaleza de la clave auditiva. Respuestas de localizacin (levantar derecha o izquierda) Localizacin clave auditiva Respuestas de naturaleza de la accin (hacer o no hacer) Tipo de clave auditiva Aunque esto parezca un poco complejo de entender, en realidad es bastante sencillo. El experimento en perros que se explica en las pginas 226-228 lo deja bastante claro. A todo este fenmeno lo llamamos: efecto de la naturaleza-localizacin El efecto de naturaleza-localizacin es un ejemplo de asociacin selectiva. Hay otros ejemplos de asociacin selectiva: Claves relacionadas con el sabor Asociadas con la enfermedad Claves audiovisuales Asociadas con descarga elctrica Elementos del estmulo frente a claves configuracionales en los estmulos compuestos Aproximacin elemental del estmulo: Los distintos elementos que forman un estmulo (localizacin, color, sonido, etc) son tratados por el organismo como rasgos distintivos y sepadados del ambiente. Aproximacin de la clave configuracional: (es lo contrario a lo anterior): Los estmulos son percibidos como un todo integral y no se dividen en partes ms pequeas. Ejemplo metafrico con una orquesta: Como aproximacin elemental sera fijarnos en como suena la msica que emite cada integrante (flauta, clarinete, tambores, etc) y como aproximacin configuracional sera analizar cmo suena la pieza musical en s cuando todos la tocan al unsono. Aunque parezcan aproximaciones opuestas, se han elaborado teoras para unificarlas. Se piensa que en ciertas circunstancias predomina el control elemental mientras que en otras condiciones predomina el control de las caractersticas configuracionales.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

3. FACTORES DE APRENDIZAJE EN EL CONTROL POR EL ESTMULO


El hecho de que ciertos estmulos puedan percibirse no asegura que llegarn a controlar la conducta (un nio puede ver un debate Rajoy-Zapatero y no distinguir diferencias entre ellos). Para que ciertos estmulo lleguen a controlar la conducta, tambin depende de lo que el organismo haya aprendido de ellos. Pavlov: La generalizacin del estmulo se da porque el aprendizaje sobre el EC llega a tranferirse a otros estmulos. Lashley y Wade (contrarios a Pavlov): La generalizacin del estmulo ocurre si los organismos no han aprendido a distinguir las diferencias entre estmulos. Por lo tanto la generalizacin del estmulo refleja ausencia de aprendizaje. Entrenamiento en discriminacin de estmulos Los participantes se exponen a dos estmulos diferentes (luz roja y otra verde) pero solo se les refuerza en uno de los dos colores. Figura 8.7 pg 231: La luz roja seala la disponibilidad de reforzamiento para la respuesta. La luz verde seala que la respuesta no sera reforzada. El estmulo que seala disponibilidad de reforzamiento se denomina E+ o ED (e de) El estmuo que seala la falta de reforzamiento se denomina E- o E " (e delta) A medida que progresa el entrenamiento, la respuesta de los organismos en presencia de E+ aumenta mientras que la respuesta en presencia de E- declina. Cuando tanto E+ como ! E- han adquirido control sobre la conducta del organismo, se llaman estmulos discriminativos. Programa mltiple de reforzamiento: el procedimiento de la figura 8.7 es un ejemplo de este tipo de programa. En un programa mltiple funcionan diferentes programas de reforzamiento en presencia de diferentes estmulos. (Por ejemplo que est funcionando un programa de IV de reforzamiento cuando se enciende una luz y un programa de RF cuando se presenta un tono) Efectos del entrenamiento en discriminacin sobre el control por el estmulo Para poder hacernos una idea de la precisin de control que el E+ adquiere sobre la conducta instrumental no basta con solamente observar la respuesta diferencial ante E+ y E-. Se debe tambin determinar lo acusado del gradiente de generalizacin. Varios experimentos realizados por Jenkins y Harrison aportaron las siguientes conclusiones: El entrenamiento en discriminacin aumenta el control por el estmulo de la conducta instrumental Una dimensin particular del estmulo (como la frecuencia tonal) es ms probable que adquiera control sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensin del estmulo

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

Rango de posibles estmulos discriminativos Los procedimientos de discriminacin pueden ser utilzados para situar la conducta instrumental de un organismo bajo el control de una amplia variedad de estmulos (palomas aprendiendo a distinguir diapositivas de Monet y Picasso, o distinguiendo la msica de Bach de la de Stravinsky). Estos procedimientos se utilizan a menudo para evaluar la capacidad sensorial de los animales. Tambin se realizaron experimentos inyectando cocana a Palomas para ver si podan distinguir las sensaciones internas que les provocaba esa droga. La conclusin fue que efectivamente el entrenamiento en discriminacin s que aument el control de la conducta por las sensaciones internas creadas por la cocana. Qu se aprende en el entrenamiento por discriminacin? Tenemos un E+ (luz roja) y un E- (tono intenso) Un organismo puede aprender 3 cosas diferentes con prcticamente los mismos resultados: 1- Responder slo ante la presencia de E+ y no aprender nada acerca de E2- Aprender a suprimir la respuesta durante E- pero no aprender nada acerca del E+ 3- Aprender el significado tanto de E+ como de ETeora de Spence del aprendizaje de discriminacin Se basa en la tercera opcin que acabamos de ver. La mera observacin de que los organismos responden ms al E+ que al E- no es suficiente para probar que han aprendido algo acerca de ambos estmulos. Por lo tanto haremos experimentos donde utilizaremos los gradientes de generalizacin del estmulo. Gradiente de generalizacin del estmulo excitatorio: Si se ha condicionado una tendencia excitatoria al E+, debe observarse un gradiente de generalizacin acusado con la mayor cantidad de respuesta ante el E+. Gradiente de generalizacin del estmulo inhibitorio: Si se ha condicionado una tendencia inhibitoria al E-, entonces los estmulos que difieran progresivamente del E- deberan ser cada vez menos efectivos en inhibir la respuesta instrumental. Algunos experimentos relacionados con esto muestran que el entrenamiento en discriminacin puede producir tanto condicionamiento excitatorio al E+ como condicionamiento inhibitorio al E-.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

Interacciones entre el E+ y el E-: desplazamiento del mximo Lo que se aprende el sujeto sobre el E+ puede influir en la respuesta al E- y viceversa, sobre todo si ambos se encuentran relacionados de alguna manera. Discriminacin intradimensional: Se produce cuando el E+ y el E- son semejantes excepto por un rasgo o atributo. La discriminacin intradimensional es una forma de ejecucin experta. (cuando dos cosas son muy parecidas, hace falta ser un experto para poder captar las diferencias sutiles) Por ejemplo, si entrenamos una luz de 500 nm como E+ y una luz de 600 nm como E-, y luego presentamos 4 luces de 450, 490, 590 y 650 nm cmo estmulos de prueba. El mximo de respuesta no se emite ante la luz de 490 nm (que es valor ms parecido al E+ original: 500 nm), sino ante un valor distinto en direccin opuesta al E-, en este caso: 450 nm. Explicacin de Spence del desplazamiento del mximo: La explicacin de Spence a este fenmeno se basa en la interaccin en forma de superposicin matemtica de los valores absolutos de los E+ y E- originales (los que han participado en el entrenamiento). En otras palabras, Spence considera que, independientemente de los estmulos que se presenten en la prueba de generalizacin, es posible calcular el valor del rasgo del estmulo hacia el que va a desplazarse el mximo de respuestas atendiendo exclusivamente a los valores netos de los E+ y E- originales. Por ejemplo, si el E+ es una luz de 100 nm y el E- una luz de 50 nm, puede deducirse que el mximo de respuesta se emitir ante una luz de 150 nm, independientemente del valor que tengan en ese rasgo los estmulos de prueba que se presenten. Explicaciones alternativas del desplazamiento del mximo: La explicacin alternativa asume que los organismos aprenden a responder a un estmulo basndose en la relacin de ese estmulo con otras claves de la situacin (a diferencia del modelo de Spence que es un modelo de aprendizaje absoluto del estmulo) Entrenamiento de equivalencia de estmulos De la misma forma que el entrenamiento en discriminacin potencia la respuesta diferencial, el entrenamiento en equivalencia potencia la respuesta generalizada o equivalencia de estmulos. El emparejamiento de estmulos diferentes con la misma consecuencia crea equivalencia funcional entre esos estmulos con la consecuencia de que una respuesta condicionada a uno de ellos se generalizar a los otros. Se dice que existe una clase de equivalencia si sus miembros poseen 3 propiedades matemticas: 1) Reflexividad o igualdad (A=A, B=B, C=C) 2) Simetra (si A lleva a B, diremos que tambin B lleva a A) 3) Transitividad (Si A lleva a B y B lleva a C, diremos que A lleva a C)

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

4. CLAVES CONTEXTUALES Y RELACIONES CONDICIONALES


Estmulo discreto: Aquel que se presenta durante un breve perodo de tiempo y tiene un comienzo y un final claros. Sin embargo los estmulos discretos suceden en presencia de un fondo de claves contextuales que tambin pueden proporcionar una fuente importante de informacin acerca de la conducta aprendida. Control por claves contextuales Las claves contextuales pueden llegar a controlar la conducta de varias formas. En un experimento con codornices macho, mostraban predileccin por contextos en los que previamente se les haban presentado una hembra sexualmente receptiva. Por lo tanto las asociacin de claves contextuales con el reforzamiento sexual aument la preferencia por estas claves. Este experimento muestra que las claves contextuales pueden llegar a controlar la conducta si sirven como seal para un EI o un reforzador. EntoncesSirven las claves conductuales para controlar la conducta cuando no sealan ningn reforzamiento, sino que simplemente son estmulos de fondo? En varios experimentos se concluy que efectivamente las claves contextuales (sin reforzador) tambin pueden llegar a controlar la conducta instrumental. Adems el control contextual por el estmulo puede ocurrir sin que un contexto est ms fuertemente asociado con el reforzamiento que otro. Control de las relaciones condicionales Relaciones binarias: Son las relaciones entre dos eventos (un EC y un EI) Modulador: En ciertas circunstancias la naturaleza de una relacin binaria est determinada por un tercer suceso llamado modulador. (en los experimentos anteriores el contexto ejerca de modulador) Relacin condicional: Es la relacin de un modulador con la relacin binaria que seala. Control condicional en el condicionamiento pavloviano: El concepto fundamental del control condicional es que un evento seala la relacin entre otros dos eventos. Ejemplo con EC (luz naranja) y la presentacin de comida (EI) Establecer una relacin condicional requiere introducir un tercer suceso (modulador) que indica cundo la presentacin de luz en la tecla terminar con comida. Podra ser un estmulo auditivo. Los resultados muestras que los pjaros picoteaban la tecla naranja mucho ms cuando se presentaba despus de la presentacin del modulador que cuando se presentaba como un elemento aislado. Por lo tanto la presencia del modulador facilita la respuesta al EC de la luz de la tecla.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

Un estmulo discriminativo facilita la respuesta instrumental mientras que el modulador facilita la respuesta elicitada por el EC. Estmulos discriminativos: Reciben este nombre los moduladores (E+ y E-) en procedimientos de discriminacin instrumental. Otras terminologas: (En el condicionamiento pavloviano) Facilitacin: Es otro nombre con el que se conoce al control condicional de la respuesta, debido a que el modulador facilita la respuesta al EC. Facilitador: Otro nombre con el que se conoce al modulador. (en el condicionamiento clsico) Establecimiento de la ocasin: lo mismo que facilitacin Establecedor de la ocasin: lo mismo que facilitador Distincin entre la excitacin y la modulacin La extincin es un procedimiento en el cual un estmulo previamente condicionado se presenta repetidamente pero se omite el EI. El resultado tpico de la extincin es que disminuye la respuesta condicionada. los

La diferencia en los efectos de un procedimiento de extincin sobre los estmulos condicionados excitatorios y los establecedores de la ocasin est relacionada con lo que se seala en cada uno de los procedimientos (y aqu es donde encontramos la distincin): - Un estmulo condicionado excitatorio seala la prxima presentacin del EI. La ausencia del EI despus de la presentacin del EC durante la extincin es una violacin de esa expectativa. Por lo tanto el valor como seal del EC tiene que reajustarse en la extincin para estar en consonancia con la nueva realidad. Un reajuste como ste no se requiere en un procedimiento de extincin de un establecedor de la ocasin. Por otro lado Un establecedor de la ocasin seala una relacin entre un EC y un EI. La ausencia del EI cuando se presenta el establecedor de la ocasin (o modulador) por s solo durante la extincin no significa que la relacin entre el EC y el EI haya cambiado. En consecuencia la habilidad del modulador para promover la respuesta elicitada por el EC permanece intacta durante la extincin.

Modulacin frente a condicionamiento configuracional: Antes veamos un experimento con modulador (sonido) junto a un EC (luz naranja) y un EI (presetnacin de comida). Para que el sonido sirva como una seal de que la luz de la tecla se emparejar con la comida, el sonido y la luz de la tecla tiene que ser tratados como elementos independientes ms

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

que como una clave configuracional combinada. Por tanto, los efectos modulatorios requieren la respuesta al compuesto estimular como constituido por elementos independientes estimulares. Compuesto serial: Para promover que los organismos traten los compuestos estimulares como construidos por elementos independientes, los investigadores presentan los elementos uno tras otro, en lugar de simultneamente.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

La extincin implica la omisin del EI o reforzador. Extincin en el condicionamiento clsico: incluye presentaciones repetidas del estmulo condicionado por s solo. Extincin en el condicionamiento instrumental: Implica no volver a presentar el reforzador como una consecuencia de la respuesta instrumental.

El resultado es que la respuesta condicionada (ya sea clsica o instrumental) disminuye. Por ello se piensa que la extincin es lo contrario a la adquisicin (como en el Modelo de Rescorla y Wagner) sin embargo esto es incorrecto. Diferencia entre extincin y olvido Extincin: Se produce por la omisin del EI que sigue a las presentaciones del EC o la omisin del reforzador que sigue a la respuesta instrumental. Olvido: Disminucin de la respuesta condicionada que se da con el paso del tiempo.

1. EFECTO DE LOS PROCEDIMIENTOS DE EXTINCIN


La respuesta disminuye cuando no vuelve a producir reforzamiento Adems la variabilidad de la respuesta aumenta (si la llave de mi casa un da no abre la puerta intentar introducirle de distintas maneras a ver si lo consigo)

Estos efectos se muestran en un experimento con ratas en el que la extincin produjo una disminucin en el nmero de secuencias de respuesta que los sujetos realizaban pero aument la variabilidad de esas secuencias. Sin embargo es importante sealar que aparte de la variabilidad de respuestas tambin segua dndose la respuesta inicial previa a la extincin, por lo tanto podemos decir que la estructura bsica de la conducta instrumental se altera muy poco por el hecho de introducir la extincin. Por lo tanto: La extincin disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, pero no altera de otro modo la estructura de la conducta. Adems de estos efectos podemos encontrar otros efectos emocionales como consecuencia de la extincin: Frustracin: Reaccin emocional inducida por la falta de un reforzador esperado. Puede derivar en agresin.

2. EXTINCIN Y APRENDIZAJE ORIGINAL


Aqu vamos a ver varios ejemplos que explican porqu la extincin no elimina por completo lo que se aprendi originalmente: Recuperacin espontnea Recuperacin espontnea tras el condicionamiento pavloviano: El efecto de la extincin se pierde con el tiempo. Por lo tanto la respuesta condicionada volver a estar

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

presente si el sujeto se pone a prueba tras una demora que siga al procedimiento de extincin. Recuperacin espontnea tras el condicionamiento instrumental: (la explicacin es ms o menos la misma que en el ejemplo pavloviano anterior). En un experimento con ratas se demostr que la respuesta cuya recuperacin se comprob tras un perodo de descanso posterior a la extincin (R-Descanso) se dio a una tasa mucho ms alta que la respuesta cuya recuperacin se midi sin un perodo de descanso posterior a la extincin (R-No descanso). Por lo tanto: La introduccin de un perodo de descanso tras la extincin produjo una recuperacin sustancial en la respuesta. Renovacin del condicionamiento excitatorio original Renovacin: Se refiere a la recuperacin de la ejecucin propia de la adquisicin que se da cuando se cambian las claves contextuales que estaban presentes durante la extincin. En un experimento con ratas se comprob que un miedo condicionado y posteriormente extinguido se renovava cuando se retiraba al grupo de ratas del nuevo contexto y se volva a introducir en el contexto original de aprendizaje. Por lo tanto: El hecho de que el miedo condicionado se renovara, indica que la prdida de supresin durante la fase de extincin no refleja desaprendizaje de la respuesta de miedo condicionado. Es decir, a pesar de la extincin y de que las ratas han dejado de dar la respuesta, al cambiarlas de contexto la recuperan, por lo tanto nunca la desaprendieron. La renovacin tambin puede darse si el sujeto se retira del contexto de adquisicin a un contexto alternativo que no es el de la adquisicin original. Sin embargo en este caso la renovacin no es tan slida como cuando se lleva al contexto original. Otra explicacin de la renovacin: propiedades excitatorias condicionadas del contexto de renovacin: 1) Contexto A: Adquisicin original 2) Contexto B. Extincin 3) Vuelta al contexto A que tiene propiedades excitatorias ya que es ah donde se produjo la adquisicin. Sin embargo algunos experimentos han demostrado que esto no es asentonces para qu nos lo hacen estudiar???? Implicacin en la terapia de conducta: Aunque un procedimiento terapetico sea efectivo extinguiendo una fobia en la seguridad de una sala de consulta del terapeuta, el miedo condicionado puede volver a presentarse cuando el paciente se enfrente con un EC de miedo en un contexto diferente. Para reducir el efecto de renovacin, investigadores han llevado a cabo la extincin en distintos contextos.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

Restauracin de la ejecucin propia de la extincin Como ya hemos visto antes: La renovacin implica la reactivacin de la memoria del condicionamiento original mediante la retirada del sujeto de las claves contextuales presentes durante la extincin. Y ahora lo mismo dicho de otra manera: La renovacin reactiva una conducta aprendida previamente mediante el cambio del contexto a condiciones ms aproximadas a las presentes cuando la conducta se adquiri con anterioridad. Hasta aqu nada nuevo, se trata de lo mismo que hemos visto en el punto anterior. Sin embargo De la misma forma que recuperamos la respuesta original, tambin podemos recuperar la respuesta de la extincin, (osea la no respuesta) Esto tiene mucho que ver con la recuperacin espontnea ya que la conducta propia de la extincin puede restaurarse (contrarrestando la recuperacin espontnea) presentando las claves que estaban presentes durante la fase de extincin. Nota para los que tengan mala memoria (como yo): Recuperacin espontnea: Implica la recuperacin de la conducta condicionada originalmente que sigue a la extincin si transcurre un perodo suficiente de tiempo tras la fase de extincin. Restablecimiento de la excitacin condicionada Restablecimiento: Procedimiento que sirve para restaurar la respuesta a un estmulo condicionado extinguido. Ejemplo con patatas fritas: Si cojo aversin a las patatas fritas porque me puse enfermo en un viaje tras comerlas, la aversin se extinguir comiendo patatas fritas en varias ocasiones sin caer enfermo. Sin embargo, el fenmeno del restablecimiento sugiere que si se cae enfermo otra vez por alguna razn, la aversin a las patatas fritas podra reaparecer aunque la enfermedad no tuviera nada que ver con ellas. Al igual que ocurra con el efecto de renovacin, es importante considerar si el efecto del restablecimiento puede ser un resultado del condicionamiento contextual. El condicionamiento contextual es un posible factor contribuyente debido a que las presentaciones del EI que se dan durante la fase de restablecimiento pueden producir un condicionamiento de las claves contextuales de la situacin experimental. Diversos estudios han demostrado que el papel del contexto en estos casos es suprimir la ambigedad de significado de un estmulo que tiene una historia mezclada de condicionamiento y extincin. El contexto tiene un efecto pequeo en los estmulos que tienen una historia slo de condicionamiento. En realidad se considera el restablecimiento como una forma de renovacin: las claves contextuales condicionadas proporcionan algunas de las claves contextuales para la respuesta excitatoria en circunstancias normales. Estas claves contextuales se extinguen cuando se presenta el EC por s solo durante la extincin.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

Sensibilidad a la devaluacin del reforzador Por ms que he leido este apartado me cuesta mucho entenderlo por el libro. Asi que voy a poner directamente la explicacin de un docente que he encontrado en el foro: En una contingencia operante (instrumental), el procedimiento de devaluacin de un reforzador consiste en asociar de forma pavloviana el estmulo que se est usando para reforzar una conducta (comida, por ejemplo) con algn otro estmulo de naturaleza inversa, es decir, aversivo (cloruro de litio, por ejemplo). El efecto resultante es una disminucin de la respuesta operante que ha sido reforzada con el reforzador devaluado aunque sta respuesta nunca haya sido contingente con el estmulo aversivo, ni siquiera con el reforzador tras el proceso de devaluacin. En una contingencia clsica (pavloviana, respondiente), el procedimiento es muy similar y consiste en asociar el EI (con el que se estaba condicionando el EC) con otro EI de naturaleza inversa. De nuevo, el efecto encontrado es una disminucin de la RC ante el EC, aunque el EC nunca se haya relacionado directamente con el EI aversivo. Lo relevante para el captulo que nos ocupa (Extincin de la conducta condicionada) es que este efecto (el de la devaluacin del reforzador) se observa tambin en estmulos (en el caso del condicionamiento clsico) y respuestas (en el caso del condicionamiento operante) que han sido sometidas a procedimientos de extincin. Es decir, que despus de extinguir un EC, por ejemplo, si devaluamos el EI con el que se condicion, la RC ante ese EC ser todava menor que si simplemente lo hubisemos extinguido. Este fenmeno se usa como evidencia para defender que los procesos de extincin no eliminan las asociaciones realizadas durante el condicionamiento. Es decir, que las asociaciones establecidas (EC-EI o R-Er) durante el aprendizaje no desaparecen durante la extincin, aunque el sujeto no emita la RC o la R.

3- QU SE APRENDE EN LA EXTINCIN?
Asociaciones E-R inhibitorias La falta de reforzamiento produce una asociacin E-R inhibitoria. porqu ocurre esto? En realidad la extincin implica un tipo especial de ausencia de reforzamiento, es decir, se trata de ausencia de reforzamiento tras una historia de reforzamiento. La ausencia de reforzamiento sin esta historia previa no es extincin, sino ms bien habituacin. La ausencia de reforzamiento resulta aversiva slo despus de darse una historia de reforzamiento. Por lo tanto los efectos emocionales de la ausencia de reforzamiento dependen de forma crtica de la historia previa del sujeto. Si tu pareja nunca te ha hecho caf por la maana, no te sentirs desilusionado cuando te despiertes y veas que no hay caf. Los efectos de la extincin son tanto conductuales como emocionales. Los efectos emocionales se originan en la frustracin que se desencadena cuando un reforzador esperado no llega. Se supone que la ausencia de reforzamiento cuando se espera

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

recompensa desencadena una reaccin frustrante aversiva incondicionada. Esta emocin aversiva sirve para que se deje de responder durante el curso de la extincin mediante el establecimiento de una asociacin E-R inhibitoria. Efectos paradjicos de la recompensa Cuanto ms entrenamiento con reforzamiento se proporciona, ms fuerte ser la expectativa de recompensa, y en consecuencia ms fuerte ser la frustracin que se da cuando se introduce la extincin. Efecto de sobreentrenamiento en la extincin: Si la disminucin en la respuesta se debe a los efectos frustrantes de la ausencia de recompensa, un entrenamiento ms extenso debera producir una extincin ms rpida. Es paradjico ya que el sentido comn nos dira que un entrenamiento ms extenso debera crear una respuesta ms fuerte y ms resistente a la extincin, pero sucede lo contrario. Efecto de la magnitud del reforzamiento en la extincin: La respuesta disminuye ms rpido durante la extincin que sigue a un reforzamiento con un reforzador mayor. La ausencia de reforzamiento resulta ms frustrante si el individuo espera una gran recompensa que si espera una pequea. Efecto del reforzamiento parcial en la extincin (ERPE): (es el efecto ms estudiado). Los efectos de la extincin sern diferentes dependiendo del programa de reforzamiento usado. La extincin es ms lenta y produce menos reacciones de frustracin si haba un programa de reforzamiento parcial (o intermitente) en lugar de uno continuo. Un buen ejemplo de esto es el caso de los jugadores habituales ya que estn a merced del reforzamiento intermitente. Las ganancias ocasionales les animan a seguir jugando a pesar de largos perodos de prdidas. Mecanismos del efecto de reforzamiento parcial en la extincin Hiptesis de la discriminacin: La ausencia de reforzamiento es mucho ms fcil de detectar tras el reforzamiento continuo. El reforzamiento parcial parece ensear a los sujetos a no rendirse ante la ausencia del reforzador, y esta persistencia aprendida se mantiene aun cuando los sujetos posteriormente experimenten una cadena ininterrumpida de sucesos. Qu aprenden los sujetos durante el reforzamiento parcial que les hace ms persistentes al enfrentarse a una racha de mala suerte o de fracasos?: 2 teoras que vamos a ver a continuacin: Teora de la frustracin: Los sujetos aprenden sobre los efectos emocionales de la ausencia de recompensa durante el entrenamiento en reforzamiento parcial. Teora secuencial: Est basada en lo que los sujetos aprenden sobre la memoria de la ausencia de recompensa. Y ahora vamos a ver estas teoras con ms profundidad: Teora de la frustracin (Abraham Amsel): La persistencia en la extincin es resultado del aprendizaje de algo paradjico, es decir, continuar respondiendo cuando se espera no ser reforzado o ser frustrado. La teora de la frustracin asume que el reforzamiento

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Psicologa del Aprendizaje!


!!CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

intermitente da como resultado aprender a responder a pesar de esperar la ausencia de reforzamiento. El reforzamiento intermitente da como resultado el aprendizaje de realizar la respuesta instrumental como reaccin a la expectativa de ausencia de recompensa. Por el contrario, no existe nada en la experiencia del reforzamiento continuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. El reforzamiento continuo no produce persistencia en la extincin. Teora secuencial: (Capaldi) Esta teora est formulada en trminos de conceptos de memoria. Asume que los sujetos pueden recordar si fueron reforzador por realizar la respuesta instrumental en el pasado reciente. El sujeto aprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayos precedentes.

D. RESISTENCIA AL CAMBIO Y MOMENTO CONDUCTUAL


Momento conductual: Este concepto se basa en el concepto de momento de la fsica newtoniana. El momento de un objeto fsico es el producto de su peso (o masa) por su velocidad. Esta hiptesis dice que la conducta que posee un momento elevado tambin ser difcil de parar o interrumpir por las manipulaciones. La investigacin sobre el momento conductual se ha llevado a cabo utilizando programas mltiples de reforzamiento ya que capacitan a los investigadores para comparar la susceptibilidad de la conducta a la interrupcin bajo dos condiciones diferentes en la misma sesin. Diversos experimentos concluyen que: El modelo conductual est relacionado directamente con la tasa de reforzamiento. Una tasa ms alta de reforzamiento produce una conducta que tiene un mayor momento y que es menos susceptible a la interrupcin. El momento conductual no est relacionado con la tasa de respuesta, es decir, do conductas que se dan a tasas semejantes no es preciso que tengan grados similares de momento conductual. Los programas que proporcionan tasas similares de reforzamiento pero tasas diferentes de respuesta tienen similares momentos o resistencias al cambio.

La idea del momento conductual resulta intrigante porque intenta captar en un nico concepto la resistencia de la conducta a diversas posibilidades de cambio. El concepto fuerza de la respuesta est relacionado con esto.

You might also like