Daniel Ortega; Giordano Montiel y Ricardo Pichardo
Universidad Univer Milenium
Plantel Ciencias de la Salud Toluca Estado de México
Proyecto
Jueves 1 de Marzo del 2018
Regla De Peso Temporal 2
En al investigación respecto a la conducta de selección se hace referencia a las causas
que provocan que los operantes ejecuten una u otra conducta ante varias opciones de respuesta. En diversos estudios con humanos (Hastie y Dawers, 2001) se habla sobre una “deliveración racional” para formular situaciones donde se racionaliza hacer de las diferentes opciones de respuesta. Como la elección que se lleva a cabo al momento de comprar viveres en el supermercado o cuando elegimos una ruta para evitar congestionamiento veicular. Sin embargo en los estudios con animales humanos y no humanos es complicado observar esta reflexión, lo que dificulta el estudio de dicha elección de respuesta. A pesar de ello existen investigaciones que han intentado hacer evidentes si los mecanismos psicológicos que estan implicitos son iguales entre animales humanos y no humanos. En un articulo se citan diferentes lineas de investigación respecto a la elección de respuesta:
En la literatura de condicionamiento operante el estudio de la elección se ha
llevado a cabo a partir del estudio de programas concurrentes en los que 2 o más programas de reforzamiento están disponibles simultáneamente cada uno con un manipulado diferente, y el sujeto o participante es libre de distribuir sus respuestas entre alternativas disponibles (Herrnstein, 1961). A partir de estos programas se han desarrollado diferentes procedimientos experimentales y modelos teóricos para explicar la conducta de elección en diferentes situaciones experimentales. Por ejemplo, la ley de igualación (Davison y McCrthy, 1988; Williams, 1988), el modelo de elección contextual de (Grace, 1994;1996), o la teoría de la reducción de la demora (Fantino, 1969). Estos modelos hacen diferentes suposiciones sobre los mecanismos de la conducta de elección y cada uno ha proporcionado resultados significativos con un gran número de experimentos en programas concurrentes (Mazur, 2001). (López-Romero, Alvarado, Cabrera, Luna y Vila, 2013).
Mazur, (1996) estudió el efecto de la posible integración de experiencias
anteriormente reforzadas durante multiples bloques de entrenamiento en una última elección entre varias opciones de respuesta. Diseñó un experimento donde registró las respuestas en palomas usando un programa concurrente de reforzamiento en el que cambiaba la magnitud de reforzamiento relativo a cada uno de los elementos del diseño de forma sucesiva durante varios ensayos. Una primera condición contenia en una de la opciones un reforzador con “mayor saliencia” en comparación con la otra, y en la segunda condición ambas opciones tenian el mismo valor en saliencia durante los ensayos restantes. Los resultados de su experimento demostrron un a preferente inclinación en la ultima sesion por la opcion que proporcionaba mayor saliencia y hubo indiferencia en la eleccion bije el contexto donde varias opciones tenia la misma cantdad de reforzamiento. Mas sin en cambio la preferencia de respuesta cambiaba luego de un ntervalo de 24 hrs dentro de la condicion en la una de la opciones era mas saliente. Pero en la otra condicion donde las dos opciones contienen el mismo reforzamiento durante todos los ensyos en la eleccion despues de 24 hrs se notó indiferencia entre las opciones de respuesta. Regla De Peso Temporal 3
Se ha demostrado que la integración de la información de eventos pasados determina
la elección de respuestas en eventos presentes, según la regla de peso temporal (RPT) propuesta por Devenport, (1998). La configuración de la integración estrá sujeta a parametros temporales. Cuando se aprenden dos experiencias, durante una prueba inmediata la experiencia más reciente adquiere mayor peso, pero con el continuar del tiempo en una prueba posrterior, ambas experiencias serán equivalentes en su peso, en otras palabras, la recencia desaparece, y el valor subjetivo de las dos experiencias será similar. La integración de información basada en dos parameros basicosde las experiencias y el aprendizaje ; distancia temporal relativa (recencia) y el valor subjetivo que tiene (Davenport y Davenport, 1994). La regla de peso temporal expresa una relacion inversa entre estos dos factores, dicho en otras palabras; cuando el peso de la recencia es mayor, eel peso del valor subjetivo es menos y viseversa. Los factores se muestran en la siguiente formula: AQUÍ VA LA PINCHE FORMULA LOKA Donde vw representa el valor de estimación temporal de una experiencia, Q el valor subjetivo estimado y 1/T el valor de recencia. Cuando se requiere una respuesta de elección entre dos alternativas, se debe calcular el valor de estimación temportal de una segunda experiencia ademas se debe tener en cuenta la estimación temporal total de ambas experiencias, lo que se expresa en la ecuacion 2. Donde la elección de la opción B es la proporción de vwB en relación a vwA: (2) vwB= vwB/vwA+vwB La RPT supone la integración de las experiencias vividas en base a dos variables, la recencia (distancia temporal relativa 1/T) y el valor subjetivo (Q), en la ecuación 1 se representa como (Q * 1/T) el cual va cambiando con el avance del tiempo, asiendi así que Q aumente al disminuir 1/T y esto lleva a que las experiencias tieneden a igualarse una vez perdida la recencia por lo que se mostrará la elección de la experiencia que haya adquirido un mayor valor subjetivo (Q). Una posible predicción básica basada en estas ideas seria que al aumentar el intervalo de retención luego de un entrenamiento de dos experiencias (A y B) la elección dependera de la recencia de cada elección y de su valor subjetivo. Cuando el valor es mayor en A, durante una prueba inmediata se elegirá la ultima opción reforzada. Sin embargo al aumentar el intervalo de retención entrenamiento-prueba se notara un efecto de recencia-primicía en donde habrá una preferencia por A e incrementa proporcionalmente al aumentar el intervalo de retención de una prueba con demora, esto debido a que el valor que tiene A es en promedio mayor al que tiene B (Vila, López-Romero y Alvarado. 2010).