You are on page 1of 31

Repblica Bolivariana de Venezuela

Ministerio del Poder Popular para la Educacin Universitaria


Universidad Bicentenaria de Aragua
Escuela: Psicologa

Condicionamiento
Instrumental u Operante

Roraima Carolina Cuare Arquiades


V.-12363944 / P1
El condicionamiento instrumental o condicionamiento
operante es un tipo de aprendizaje que sucede cuando los
hechos son un resultado directo de la conducta del individuo. Es
decir, mediante el condicionamiento instrumental, las acciones
o conductas de un individuo pueden ser modificadas por sus
consecuencias.
El condicionamiento operante constituye uno de los
mecanismos de aprendizaje de mayor importancia terica y
prctica: por una parte, es seguramente el ms investigado y
mejor comprendido, y por otra es fuente de algunas de las ms
significativas aplicaciones de la psicologa a problemas
concretos.
En sentido estricto, el Condicionamiento Operante es un
caso particular de Condicionamiento Instrumental. El
Condicionamiento Instrumental se refiere a los mecanismos por
los cuales un organismo aprende a dar una respuesta ms
frecuentemente (o menos) en virtud de los eventos(o
consecuencias) que siguen sistemticamente a dicha
respuesta.
El Condicionamiento Operante se refiere a los casos en los
que dicha respuesta se define como un operante, es decir, en
virtud de sus propiedades funcionales. Sin embargo, la
importancia relativa del Condicionamiento operante es tan
grande que a menudo ambos trminos (operante e
instrumental) se emplean como sinnimos.
Antecedentes Del Condicionamiento Instrumental

Uno de los antecedentes


histricos del condicionamiento
instrumental son los trabajos de
Edward Thorndike acerca del
aprendizaje.

La intencin inicial de
Thorndike fue estudiar la
inteligencia animal, y cre su
teora del aprendizaje que se
basaba en la observacin con
modelos de aprendizaje animal.
Edward Lee Thorndike (1874-1949)

THORNDIKE:
Fue profesor de psicologa durante ms de treinta aos en el
Teachers College de Columbia, Estados Unidos.
Lo que ms atrajo su inters fue la teora del aprendizaje.
Se cuenta entre los importantes precursores del Conductismo.
Su inters por la psicologa apareci despus de un curso en la
Universidad de Harvard donde tuvo de profesor a William James.
Sostena que los animales no razonan ni avanzan en la resolucin
de problemas mediante sbitos estallidos de introvisin, sino
que aprenden de una manera ms o menos mecnica, partiendo Edward L. Thorndike
de un mtodo de ensayo y error.. (1874-1949)
Aportes de Edward Lee Thorndike

Sus principales aportaciones fueron:


El aprendizaje por ensayo/error y la ley del efecto. La formulacin
esta ley, fue a partir de los estudios que realiz con gatos en cajas-
problema de las que deban escapar. La ley del efecto explicar la
teora de Skinner del condicionamiento operante.
Sus estudios sobre la conducta animal le permitieron desarrollar la
teora del conexionismo.
Segn Thorndike, el aprendizaje se compona de una serie de
conexiones entre un estmulo y una respuesta, que se fortalecan
cada vez que generaban un estado de cosas satisfactorias para el
organismo, esta teora suministr las bases sobre las que luego
Edward L. Thorndike
Skinner construy todo su edificio acerca del condicionamiento
(1874-1949)
operante.
Aportes de Edward Lee Thorndike
Thorndike aplic sus mtodos para el adiestramiento de animales a
nios y jvenes, con xito sustancial, y lleg a tener gran
predicamento dentro del campo de la psicologa educativa.
Valor el significado de las curvas de aprendizaje, las condiciones que
pueden afectarlas y las leyes bsicas que constituyen dicho
aprendizaje como son: la ley del ejercicio, la ley del efecto y de la
disponibilidad.
Estableci un marco terico explicativo de la naturaleza del
aprendizaje considerada como un conjunto de asociaciones
existentes entre estmulos y respuestas proporcionadas por un
material experimental.
Finalmente impuls diferentes trabajos relacionados con la medida Edward L. Thorndike
de la capacidad intelectual y el rendimiento de los nios en edad (1874-1949)
escolar mediante la estandarizacin de un cierto nmero de test.
Investigacin ms Significativa de Edward Lee Thorndike

Thorndike comienza sus investigaciones en


psicologa animal. Su tesis doctoral trat sobre
Inteligencia Animal. En la cual, para desarrollar
sus investigaciones se apoy en el estudio de
animales, en concreto gatos, y la utilizacin de
herramientas como la "CAJA ROMPECABEZAS"
o "CAJA-PROBLEMA", en la que el animal deba
accionar un mecanismo para poder salir de ella;
y slo podan escapar cuando tiraban de una
cuerda, empujaban una carreta o, en algunos
casos, haciendo simultneamente hasta tres
cosas diferentes.
Investigacin ms Significativa de Edward Lee Thorndike

El resultado de sus estudios fue la elaboracin de


LA TEORA DEL APRENDIZAJE POR ENSAYO Y ERROR.
Segn l, el proceso de aprendizaje se puede reducir a
varias leyes:
La ley de la disposicin: Que establece la preparacin de las
conducciones neurolgicas en la conexin estmulo-respuesta.
La ley del ejercicio, o del uso y desuso: En la que la conexin
estmulo-respuesta se refuerza con la prctica o a la inversa.
La ley del efecto: La ms importante de ellas, que describe
cmo en el proceso de ensayo y error, si se produce una
respuesta seguida por una satisfaccin, la conexin se hace ms
fuerte y conduce a su aprendizaje, y al contrario, si hay un
refuerzo negativo, la conexin estmulo-respuesta se debilita y
acaba desapareciendo.
Principios del Condicionamiento Instrumental

En el condicionamiento instrumental hay cuatro principios bsicos: premio,


castigo, huda y omisin. En los cuatro casos ha de tenerse presente que
primero se produce la respuesta y luego recin se premia, o se castiga, etc.
Premio: Un premio despus de la respuesta aumenta la probabilidad
que ocurra. El premio se llama refuerzo positivo, y esto fue
enunciado en la ley del efecto de Thorndike.
Castigo: Un castigo despus de la R disminuye la probabilidad que
vuelva a ocurrir. Es lo inverso a lo anterior (castigo positivo).
Huda: Si una respuesta es para escapar de un castigo, aumenta la
probabilidad que vuelva a ocurrir. Esto se llama refuerzo negativo.
Omisin: Si el presente est presente pero no se da, la respuesta que
lleva a esta frustracin decrece su probabilidad de ocurrencia
(castigo negativo).
Teora de Edward Lee Thorndike (Conexionismo)
La teora del Aprendizaje de Thorndike
representa la estructura E - R original de la
Psicologa del Comportamiento: donde el
aprendizaje, es el resultado de asociaciones
formadas entre estmulos y respuestas. Tales
asociaciones o "hbitos" se observan
fortalecidos o debilitados por la naturaleza y
frecuencia de las parejas E - R.

El paradigma de la teora, estaba en el


aprendizaje a partir de prueba y el error, en el
cual las respuestas correctas vienen a imponerse
sobre otras debido a gratificaciones.
Teora de Edward Lee Thorndike (Conexionismo)
Otro concepto introducido fue "la
polaridad, que consiste en la
contraposicin de direcciones que pueden
seguir de lo positivo a lo negativo, del
agrado al desagrado, de lo justo a lo
injusto, de la atraccin a la repulsin.

Thorndike tambin introdujo la


"diseminacin del efecto" de la idea, es
decir, las gratificaciones, afectan no
solamente la conexin que las produjo
sino tambin a conexiones
temporalmente adyacentes.
Principios de Aprendizaje del Condicionamiento Instrumental
Respuesta Mltiple: se pone en juego todas las respuestas aprendidas
o instintivas de que pueda echar mano cuando se enfrenta a un nuevo
problema que no comprende totalmente. Supone un aprendizaje por
el mtodo del ensayo y el error.
Disposicin o actitud: el impulso interno o condicin que predispone al
animal a una determinada clase de comportamiento y no a otra.
Actitud parcial o fragmentaria: a medida que el aprendizaje va
teniendo lugar, el animal gradualmente elimina movimientos intiles
y no coronados por el xito.
Asimilacin o analoga: un animal es puesto en una situacin nueva y
extraa, recurrir a aquellas actividades que sabe, por haberlas
probado en situaciones idnticas a un tanto semejantes, que
conducen al xito.
Desplazamiento asociativo: el rasgo esencial es el desplazamiento de
una respuesta (reforzada) desde un estmulo efectivo a otro
previamente inefectivo mediante la generalizacin.
Condicionamiento Operante

Tambin llamado "instrumental". Aunque no ha


sido olvidado por otros conductistas, ste segundo
tipo de condicionamiento ha sido investigado con
especial cuidado por el conductismo radical de
Skinner, y tiene un claro antecedente en el
aprendizaje basado en el ensayo y el error
estudiado por Thorndike.
El condicionamiento operante pone al sujeto
en una situacin en la que alguna de sus conductas
provoca la aparicin de un refuerzo; como
consecuencia de la presencia del refuerzo se
produce en el sujeto una modificacin en la
probabilidad de la emisin de dicha conducta.
Condicionamiento Operante

Son conductas aprendidas diseadas para


operar en el ambiente a fin de obtener una
recompensa o evitar un castigo

No son reflejos automticos


causados por estmulos
biolgicamente importantes.

En otras palabras el condicionamiento operante o


instrumental, es el tipo de aprendizaje en el cual las
conductas son emitidas (en presencia de estmulos
especficos) para obtener recompensas o evitar castigos.
Burrhus Frederic Skinner (1904-1990)

Psiclogo estadounidense. Obtuvo el doctorado en psicologa por la Universidad


de Harvard en 1931. El autor ms importante en el estudio del condicionamiento
operante es B. F. Skinner.
Influido por la teora de los reflejos condicionados de Pvlov y por el
conductismo de John B. Watson, Skinner crey que era posible explicar la
conducta de los individuos como un conjunto de respuestas fisiolgicas
condicionadas por el entorno, y se entreg al estudio de las posibilidades que
ofreca el control cientfico de la conducta mediante tcnicas de refuerzo
(premio de la conducta deseada), necesariamente sobre animales.
Entre los experimentos ms clebres de Skinner cabe citar el adiestramiento de
unas palomas para jugar al pimpn, la llamada caja de Skinner, todava hoy Burrhus Frederic Skinner
utilizada para el condicionamiento de animales, o el diseo de un entorno (1904-1990)
artificial especficamente pensado para los primeros aos de vida de las
personas.
Elementos del Condicionamiento Operante
Dentro el condicionamiento operante se manejan algunos elementos
esenciales que lo ilustran:

1- La respuesta operante:
el condicionamiento operante ocurre cuando una respuesta,
llamada la RESPUESTA OPERANTE, opera en el ambiente
para producir consecuencias especificas.

2-El segundo elemento esencial es la


CONSECUENCIA, este sigue a la
conducta

3- El tercero se llama REFORZADORES a ese tipo de


consecuencias, que incrementan la probabilidad de que la
conducta se repita. En contraste de los ESTIMULOS
AVERSIVOS que ocasiona la disminucin de la probabilidad de
que una conducta operante se repita
Fases del Condicionamiento Operante
Adquisicin: La adquisicin de la respuesta se
refiere a la fase del aprendizaje en que la respuesta
es seguida por reforzadores. Durante la adquisicin
la respuesta se vuelve ms fuerte o ms frecuente,
debido a su relacin con la consecuencia
reforzante.
Generalizacin: Las respuestas fortalecidas
mediante procedimientos operantes en un
conjunto de circunstancias tienden a extenderse o
a generalizarse en situaciones similares, al igual
que ocurre en el condicionamiento clsico. Cuando
ms parecidos sean los contextos, ms probable es
la generalizacin.
Discriminacin: Los individuos desarrollan tambin
discriminaciones al reforzarse las respuestas en una
situacin, pero no en otra.
Fases del Condicionamiento Operante

Extincin: Cuando se retira el reforzamiento para


alguna respuesta particular, dicha conducta
disminuye su frecuencia gradualmente hasta que
solo ocurre con la misma frecuencia con que
ocurra antes del reforzamiento. Sin embargo, es
importante advertir que en muchas ocasiones,
despus de que se retiren los reforzadores, se
advierte inicialmente un aumento de la cantidad de
respuesta y de la frustracin antes de que empiece
la disminucin.

Recuperacin espontnea: Al igual que en el


condicionamiento clsico, las respuestas que se
han extinguido vuelven a aparecer algunas veces,
es decir, se da una recuperacin espontnea
despus de un descanso
Aporte de B. F. Skinner al Condicionamiento Operante
Una de las aportaciones tericas ms significativas de Skinner es la
reconceptualizacin de la respuesta como "operante.
Se debe a B.F. Skinner la responsabilidad del desarrollo del concepto de
condicionamiento operante. Concretamente en 1938, publica su primer gran
libro La conducta de los organismos, en donde se exponen por primera vez
de manera sistemtica los principios del condicionamiento operante
acompaados de los primeros experimentos clsicos sobre el tema.
En los aos 30-40, Skinner, adoptando un marco terico ms amplio,
consistente y operativo, reformula la ley del efecto como "ley de refuerzo":
Skinner demuestra que una rata aprende a darle a una palanca cuando dicha
accin tiene la consecuencia de obtener alimento. Segn este autor, el
condicionamiento operante o condicionamiento instrumental ocurre
cuando una respuesta en seguida por un reforzador. Contra ms nmero de
veces se repita la relacin entre respuesta-reforzador, ms probabilidad
habr de que se repita la respuesta premiada.
Tipos Bsicos del Condicionamiento Operante
Los cuatro tipos bsicos de condicionamiento operante se producen como
resultado del entrenamiento de un organismo mediante el establecimiento de
una contingencia entre una R. operante y uno de los cuatro consecuentes
bsicos.

Reforzamiento positivo: Administracin de un evento siguiendo


contingentemente a una R dada, que tiene como efecto un aumento en la
fuerza, la probabilidad o la tasa de sta. Normalmente se trata de un estmulo
apetitivo o de la posibilidad de realizar una conducta de alta probabilidad..

Ejemplo: cada vez que una rata presiona una palanca (R), se le administra
como consecuente un trozo de comida; se puede observar que la rata cada vez
presiona ms frecuentemente la palanca

El tipo de CO que resulta de aplicar sistemticamente reforzadores positivos a


una respuesta se conoce como entrenamiento de recompensa.
Tipos Bsicos del Condicionamiento Operante

Reforzamiento negativo: Omisin o interrupcin de un suceso


(tpicamente, un E aversivo) de forma contingente con la emisin de una R, a
resultas de lo cual se produce un aumento en la fuerza, la probabilidad o la
tasa de sta.

Ejemplo: cada vez que una rata se desplaza al lado opuesto de la jaula (R),
como consecuente se interrumpe una descarga elctrica que se le estaba
aplicando; se puede observar que la rata cada vez cambia de lado ms
frecuentemente.

La aplicacin sistemtica de reforzadores negativos a una R se conoce como


entrenamiento de evitacin o entrenamiento de escape, dependiendo de si
el organismo puede mediante la R llegar a prevenir la aparicin del E.
aversivo (evitacin) o slo puede interrumpirlo, acortando su duracin, una
vez administrado (escape)
Tipos Bsicos del Condicionamiento Operante

Castigo positivo: Administracin de un suceso


(en el caso tpico, un E aversivo) siguiendo
contingentemente a una R dada, que tiene como efecto
una disminucin en la fuerza, la probabilidad o la tasa de
sta.

Ejemplo: cada vez que una oveja entra en contacto con


la cerca en la que est encerrada (R), como consecuente
se le administra una descarga elctrica; se puede
observar que la oveja cada vez toca menos
frecuentemente la cerca.

La aplicacin sistemtica de castigos positivos a una R se


conoce como entrenamiento de castigo.
Tipos Bsicos del Condicionamiento Operante
Castigo negativo: Omisin o interrupcin de un estmulo de
forma contingente con la emisin de una R, a resultas de lo cual
se produce una disminucin en la fuerza, la probabilidad o la
tasa de sta.

Ejemplo: cada vez que una rata que est recibiendo pequeos
fragmentos de comida cada 15 segundos toca la pared del
fondo de la jaula, se le elimina la siguiente administracin de
comida que correspondiera; se puede observar que cada vez se
acerca menos a dicha pared.

La aplicacin sistemtica de castigos negativos a una R se


conoce como entrenamiento de omisin.
Tipos Bsicos del Condicionamiento Operante
CASTIGO :
REFORZADOR : Tiende a aumentar la
Tiende a disminuir la fuerza de la R a la que
fuerza de la R a la que sigue
sigue

Reforzamiento positivo
Castigo positivo
Entrenamiento de recompensa.
Entrenamiento de castigo.
POSITIVO : Ej. : Administrar comida tras la respuesta.
Ej. : Administrar descarga tras la respuesta.
Se administra un estmulo R aumenta.
R disminuye.
Se usa una recompensa (estmulo o suceso
Se usa un estmulo aversivo
apetitivo).

Reforzamiento negativo
Entrenamiento de escape
Castigo negativo
Ej. : Detener una descarga elctrica tras la
Entrenamiento de omisin
respuesta
NEGATIVO Ej. : Se deja de dar comida al organismo
Entrenamiento de evitacin
Se omite un estmulo cada vez que da R.
Ej. : Si se da R, omitir una descarga que se
Disminuye
hubiera dado en caso contrario.
Se usa estmulo apetitivo
R aumenta.
Se usa un estmulo aversivo
Programas de Reforzamiento (del Condicionamiento Operante)

Un da a Skinner se le acabaron las bolas de alimento que daba a las


ratas, y entonces hizo un aparato que les daba bolas de alimento
automticamente, siempre que la rata tocase la palanca un minuto.
No slo las ratas comenzaron a presionar la palanca durante ese
lapso sino que tambin aument su tasa de respuestas (cantidad de
respuestas por unidad de tiempo), lo cual iba en contra de la idea
que a menor premio o refuerzo, menor cantidad de respuestas.
Skinner pens que este programa de dar bolas automticamente
poda servir como eficaz mtodo para controlar el comportamiento.
Programas de Reforzamiento (del Condicionamiento Operante)

Hay varios tipos de programas:


a)De intervalo fijo: es el ejemplo anterior.
b)De razn fija: aqu se premia a la rata cuando realiza un cierto
nmero de respuestas.
c)Programas combinados: una combinacin de los dos anteriores.
d)Programas variables: es cuando los programas de intervalo o de
razn son variables en vez de fijos.
e)Programas de refuerzo diferencial: pueden ser de refuerzo
diferencial bajo (RDB) o alto (RDA).
Esto da tasas de respuesta muy lentas. No es eficaz para el
aprendizaje humano.
Programas de Reforzamiento (del Condicionamiento Operante)

f)Extincin despus de un refuerzo parcial: cuando una


respuesta ha sido premiada constantemente, la extincin ocurre
ms rpidamente que si aqulla fue premiada solo una vez.
g)Programas de castigo, refuerzo negativo y omisin: las pautas
de respuesta con castigo de IF son generalmente una aceleracin
inmediatamente despus del castigo y luego una supresin de la
respuesta inmediatamente antes del mismo. Un programa de
refuerzo negativo (huda) puede consistir en dar descargas
elctricas a la rata hasta que cumpla cierto requerimiento, como
una razn fija de 10 respuestas. Por ltimo, un programa de
omisin sera proporcionar premio continuamente y luego
retirarlo cuando se cumple el requerimiento serial.
En resumen :
Con el condicionamiento operante, el animal aprende a conseguir algo -
eliminar una situacin perjudicial, obtener algo beneficioso...
La efectividad de ste condicionamiento es tal que el sujeto no slo aprende a
responder ante una nueva situacin con una conducta que formaba parte de su
repertorio anterior, sino que tambin le puede permitir obtener un nuevo
repertorio de conductas.
El adjetivo "operante" se emplea para caracterizar este tipo de
condicionamiento porque, y a diferencia del "condicionamiento clsico", el
sujeto interviene u "opera" en el medio, lo modifica y este reobra sobre el
organismo: si los resultados de la accin del sujeto son "adecuados" (en la
versin ms mentalista diramos: "placenteros"), la conducta se aprender,
siendo ms probable que se emita de nuevo en las mismas circunstancias; si los
resultados de la accin no son "adecuados" (son "desagradables") dicha
conducta tender a desaparecer del sujeto.
En resumen :

En el condicionamiento clsico la asociacin se da entre un


estmulo condicionado y uno incondicionado. En el
condicionamiento instrumental, la asociacin se da entre
las respuestas y las consecuencias que se derivan de ellas.
En el condicionamiento clsico, el estmulo incondicionado
no depende de la respuesta del sujeto, mientras que en el
operante las consecuencias dependen de la respuesta del
sujeto.
En el condicionamiento clsico, la respuesta del sujeto es
involuntaria, mientras que en el instrumental es
generalmente voluntaria.
Referencias Bibliogrficas

http://trabajofinaldivulgacincientfica.blogspot.com/2008/06/teora-dia-4.html

http://blog.mentelex.com/condicionamiento-instrumental/

http://biopsicosalud4.webnode.com.ve/psicologia/enfoque-conductista/edward-
thorndike/

http://www.e-torredebabel.com/Psicologia/Vocabulario/Condicionamiento-
Operante.htm

https://prezi.com/newkafr1flui/leyes-del-aprendizaje-de-thorndike/

http://teoriasdelaprendizaje01.blogspot.com/2011/11/edward-lee-thorndike.html

You might also like