Reforzamiento
En psicología del comportamiento, el refuerzo es una consecuencia aplicada que fortalecerá el comportamiento futuro de un organismo siempre que ese comportamiento esté precedido por un estímulo antecedente específico. Este efecto de fortalecimiento se puede medir como una mayor frecuencia de comportamiento (por ejemplo, jalar una palanca con mayor frecuencia), mayor duración (por ejemplo, jalar una palanca por períodos de tiempo más largos), mayor magnitud (por ejemplo, jalar una palanca con mayor fuerza), o latencia más corta (por ejemplo, jalar una palanca más rápidamente después del estímulo antecedente).
Hay dos tipos de refuerzo, conocidos como refuerzo positivo y refuerzo negativo; positivo es donde se ofrece una recompensa por la expresión del comportamiento deseado y negativo está quitando un elemento indeseable en el entorno de las personas cada vez que se logra el comportamiento deseado. Los estímulos gratificantes, que están asociados con el «deseo» y el «gusto» (deseo y placer, respectivamente) y el comportamiento apetitivo, funcionan comoreforzadores positivos;
La afirmación inversa también es cierta: los reforzadores positivos proporcionan un estímulo deseable. El refuerzo no requiere que un individuo perciba conscientemente un efecto provocado por el estímulo. Por lo tanto, el refuerzo ocurre solo si hay un fortalecimiento observable en el comportamiento.
Sin embargo, también hay refuerzo negativo, que se caracteriza por eliminar un estímulo indeseable. Cambiar el trabajo de alguien podría servir como un refuerzo negativo para alguien que sufre de problemas de espalda, es decir, cambiar del trabajo de un trabajador a un puesto de oficina, por ejemplo.
En la mayoría de los casos, el término «refuerzo» se refiere a una mejora del comportamiento, pero este término también se usa a veces para denotar una mejora de la memoria; por ejemplo, «refuerzo posterior al entrenamiento» se refiere a la provisión de un estímulo (como comida) después de una sesión de aprendizaje en un intento de aumentar la amplitud, el detalle y la duración retenidos de los recuerdos individuales o la memoria general recién formada.
El estímulo para mejorar la memoria también puede ser uno cuyos efectos son directamente más que indirectamente emocionales, como ocurre con el fenómeno de la » memoria de flashbulb, «en el que un estímulo emocionalmente intenso puede incentivar el recuerdo de un conjunto de circunstancias de la situación mucho más allá del subconjunto de aquellas circunstancias que causaron el estímulo emocionalmente significativo, como cuando las personas de la edad apropiada pueden recordar dónde estaban y qué eran haciendo cuando se enteraron del asesinato de John F.
Kennedy o de los 11 de septiembre de 2001, los ataques terroristas.
El refuerzo es una parte importante del condicionamiento operante o instrumental.
Terminología
En las ciencias del comportamiento, los términos «positivo» y «negativo» se refieren cuando se usan en su sentido técnico estricto a la naturaleza de la acción realizada por el acondicionador en lugar de a la evaluación del operador que responde a esa acción y sus consecuencias. Las acciones «positivas» son aquellas que agregan un factor, ya sea agradable o desagradable, al medio ambiente, mientras que las acciones «negativas» son aquellas que eliminan o retienen del ambiente un factor de cualquier tipo.
A su vez, el sentido estricto de «refuerzo» se refiere solo al condicionamiento basado en recompensas; la introducción de factores desagradables y la eliminación o retención de factores agradables se denominan en cambio «castigo«, que cuando se usa en sentido estricto se contradice con el «refuerzo».
Por lo tanto, «
Este uso está en desacuerdo con algunos usos no técnicos de las cuatro combinaciones de términos, especialmente en el caso del término «refuerzo negativo», que a menudo se usa para denotar qué lenguaje técnico describiría como «castigo positivo» en el sentido de que El uso técnico interpreta el «refuerzo» como subsumir tanto la recompensa como el castigo y «negativo» como una referencia a la evaluación del factor que se está introduciendo por parte del operador que responde.
Por el contrario, el lenguaje técnico usaría el término «refuerzo negativo» para describir el estímulo de un comportamiento dado creando un escenario en el que un factor desagradable está o estará presente, pero involucrarse en el comportamiento resulta en escapar de ese factor o evitar su ocurrencia, como en Martin Seligman ‘sexperimentos que involucran procesos de aprendizaje de perros con respecto a evitar descargas eléctricas.
Introducción
BF Skinner fue un investigador conocido e influyente que articuló muchas de las construcciones teóricas de refuerzo y conductismo.. Skinner definió los reforzadores de acuerdo con el cambio en la fuerza de respuesta (tasa de respuesta) en lugar de criterios más subjetivos, como lo que es placentero o valioso para alguien.
En consecuencia, las actividades, alimentos o artículos considerados agradables o agradables pueden no ser necesariamente reforzadores (porque no producen un aumento en la respuesta que los precede). Los estímulos, los entornos y las actividades solo se ajustan a la definición de reforzadores si el comportamiento que precede inmediatamente al posible reforzador aumenta en situaciones similares en el futuro;
Por ejemplo, un niño que recibe una galleta cuando la pide. Si aumenta la frecuencia del «comportamiento de solicitud de cookies», se puede ver que la cookie refuerza el «comportamiento de solicitud de cookies». Sin embargo, si «comportamiento de solicitud de cookies»
El único criterio que determina si un estímulo se está reforzando es el cambio en la probabilidad de un comportamiento después de la administración de ese potencial reforzador. Otras teorías pueden centrarse en factores adicionales, como si la persona esperaba que un comportamiento produjera un resultado determinado, pero en la teoría del comportamiento, el refuerzo se define por una mayor probabilidad de respuesta.
El estudio del refuerzo ha producido un enorme cuerpo de resultados experimentales reproducibles. El refuerzo es el concepto y procedimiento central en educación especial, análisis de comportamiento aplicado y el análisis experimental de comportamiento y es un concepto central en algunos modelos médicos y psicofarmacológicos, particularmente adicción, dependencia y compulsión.
Breve historia
La investigación de laboratorio sobre refuerzo generalmente data del trabajo de Edward Thorndike, conocido por sus experimentos con gatos que escapan de las cajas de rompecabezas. Varios otros continuaron esta investigación, especialmente BF Skinner, quien publicó su trabajo seminal sobre el tema en El comportamiento de los organismos, en 1938, y elaboró esta investigación en muchas publicaciones posteriores.
Notablemente Skinner argumentó que el refuerzo positivo es superior al castigo en el comportamiento de conformación. Aunque el castigo puede parecer todo lo contrario del refuerzo, Skinner afirmó que difieren enormemente, diciendo que el refuerzo positivo resulta en una modificación duradera del comportamiento(a largo plazo) mientras que el castigo cambia el comportamiento solo temporalmente (a corto plazo) y tiene muchos efectos secundarios perjudiciales.
Muchos investigadores ampliaron posteriormente nuestra comprensión del refuerzo y cuestionaron algunas de las conclusiones de Skinner. Por ejemplo, Azrin y Holz definieron el castigo como una «consecuencia del comportamiento que reduce la probabilidad futura de ese comportamiento», y algunos estudios han demostrado que el refuerzo positivo y el castigo son igualmente efectivos para modificar el comportamiento.
La investigación sobre los efectos del refuerzo positivo, el refuerzo negativo y el castigo continúa hoy, ya que esos conceptos son fundamentales para el aprendizaje de la teoría y se aplican a muchas aplicaciones prácticas de esa teoría.
Condicionamiento operante
Condicionamiento operante Extinción
Refuerzo
Incremento de comportamiento Castigo
Disminuir el comportamiento
Refuerzo Positivo
Agregue estímulo apetitivo
Siguiendo un comportamiento correcto Reforzamiento negativo Castigo Positivo
Agregue estímulo nocivo
Después del comportamiento Castigo negativo
Eliminar el estímulo apetitivo
Después del comportamiento
Escape
Eliminar el estímulo nocivo
Después de un comportamiento correcto El
Comportamiento de evitación activa evita el estímulo nocivo
El término condicionamiento operante fue introducido por BF Skinner para indicar que en su paradigma experimental el organismo es libre de operar en el medio ambiente. En este paradigma, el experimentador no puede desencadenar la respuesta deseable; el experimentador espera a que ocurra la respuesta (que será emitida por el organismo) y luego se entrega un potencial reforzador.
En el paradigma del condicionamiento clásico, el experimentador desencadena (provoca) la respuesta deseable al presentar un estímulo inductor reflejo, el estímulo incondicional (UCS), que combina (precede) con un estímulo neutral, el estímulo condicional (CS).
El refuerzo es un término básico en el condicionamiento operante. Para el aspecto del castigo del condicionamiento operante, ver castigo (psicología).
Refuerzo positivo
El refuerzo positivo ocurre cuando se presenta un evento o estímulo deseable como consecuencia de un comportamiento y aumenta la posibilidad de que este comportamiento se manifieste en entornos similares. : 253
Ejemplo: cada vez que una rata presiona un botón, recibe un regalo. Si la rata comienza a presionar el botón con más frecuencia, el tratamiento sirve para reforzar positivamente este comportamiento.
Ejemplo: un padre le da dulces a su hija cuando ella arregla sus juguetes. Si aumenta la frecuencia de recoger los juguetes, el dulce es un refuerzo positivo (para reforzar el comportamiento de la limpieza).
Ejemplo: una empresa implementa un programa de recompensas en el que los empleados ganan premios dependiendo de la cantidad de artículos vendidos. Los premios que reciben los empleados son el refuerzo positivo si aumentan las ventas.
Ejemplo: Un maestro alaba a su alumno cuando recibe una buena calificación. El elogio que recibe el alumno es el refuerzo positivo en caso de que las calificaciones del alumno mejoren.
El tratamiento de la Instrucción de alta probabilidad (HPI) es un tratamiento psicológico conductista basado en la idea del refuerzo positivo.
Refuerzo negativo
El refuerzo negativo ocurre cuando la tasa de un comportamiento aumenta porque un evento aversivo o estímulo se elimina o se evita que ocurra. : 253
Ejemplo: un niño limpia su habitación, y este comportamiento es seguido por el padre que deja de «regañar» o le pide repetidamente que lo haga. Aquí, la molestia sirve para reforzar negativamente el comportamiento de la limpieza porque el niño quiere eliminar ese estímulo aversivo de la molestia.
Ejemplo: una empresa tiene una política que establece que si un empleado completa su trabajo asignado antes del viernes, puede tener el sábado libre. Trabajar el sábado es el reforzador negativo, la productividad del empleado aumentará ya que evitan experimentar el reforzador negativo.
Extinción
La extinción puede ser intencional o no intencional y ocurre cuando ignora un comportamiento no deseado.
Ejemplo (previsto): un niño ignora a los matones que se burlan de él. Los acosadores no reciben una reacción del niño y pierden interés en intimidarlo.
Ejemplo (no intencionado): un trabajador no ha recibido ningún reconocimiento por su trabajo más allá de lo difícil. Luego deja de trabajar tan duro.
Ejemplo (previsto): un gato siguió maullando para comer en la noche. Los dueños no le daban de comer al gato, por lo que dejó de maullar toda la noche.
Refuerzo versus castigo
Los reforzadores sirven para aumentar los comportamientos, mientras que los castigadores sirven para disminuir los comportamientos; por lo tanto, los reforzadores positivos son estímulos que el sujeto trabajará para lograr, y los reforzadores negativos son estímulos que el sujeto trabajará para deshacerse o terminar.
La siguiente tabla ilustra la suma y resta de estímulos (agradables o aversivos) en relación con el refuerzo frente al castigo.
Por ejemplo, ofrecerle dulces a un niño si limpia su habitación es un refuerzo positivo. Azotar a un niño si rompe una ventana es un castigo positivo. Quitarle los juguetes a un niño por mal comportamiento es un castigo negativo. Darle a un niño un descanso de sus tareas si se desempeña bien en una prueba es un refuerzo negativo.
Positivo y negativo» no conlleva el significado de «bueno y malo» en este uso.
Más ideas y conceptos
Distinguir entre positivo y negativo puede ser difícil y no siempre es necesario; centrarse en lo que se está eliminando o agregando y cómo se está eliminando o agregando determinará la naturaleza del refuerzo.
El refuerzo negativo no es castigo. Los dos, como se explicó anteriormente, difieren en el aumento (refuerzo negativo) o disminución (castigo) de la probabilidad futura de una respuesta. En el refuerzo negativo, el estímulo eliminado después de una respuesta es un estímulo aversivo; Si este estímulo se presentara supeditado a una respuesta, también podría funcionar como un castigo positivo.
La forma de un estímulo es independiente de su función en términos de si reforzará o castigará el comportamiento. Un evento que puede castigar el comportamiento de algunos puede servir para reforzar el comportamiento de otros. Ejemplo: un niño recibe detenciones repetidas veces por actuar mal en la escuela, pero la frecuencia del mal comportamiento aumenta.
Por lo tanto, la detención puede ser un refuerzo (podría ser positivo o negativo); tal vez el niño ahora recibe atención personalizada de un maestro o tal vez ahora evitan ir a casa donde a menudo son maltratados.
Algunos refuerzos pueden ser simultáneamente positivos y negativos, como un drogadicto que toma drogas para la euforia adicional (un sentimiento positivo) y elimina los síntomas de abstinencia (que sería un sentimiento negativo). O, en una habitación cálida, una corriente de aire externo sirve como refuerzo positivo porque es agradablemente frío y como refuerzo negativo porque elimina el aire caliente incómodo.
El refuerzo en el mundo de los negocios es esencial para impulsar la productividad. Los empleados están constantemente motivados por la capacidad de recibir un estímulo positivo, como una promoción o un bono. Los empleados también son impulsados por el refuerzo negativo. Esto se puede ver cuando se ofrece a los empleados los sábados libres si completan la carga de trabajo semanal antes del viernes.
Aunque el refuerzo negativo tiene un efecto positivo a corto plazo para un lugar de trabajo (es decir, fomenta una acción económicamente beneficiosa), la dependencia excesiva de un refuerzo negativo obstaculiza la capacidad de los trabajadores de actuar de una manera creativa y comprometida, creando crecimiento a largo plazo.
Tanto el refuerzo positivo como el negativo aumentan el comportamiento. La mayoría de las personas, especialmente los niños, aprenderán a seguir las instrucciones mediante una combinación de refuerzo positivo y negativo.
Los recursos limitados pueden hacer que una persona no pueda proporcionar un refuerzo constante.
Refuerzos primarios
Un reforzador primario, a veces llamado reforzador incondicionado, es un estímulo que no requiere emparejamiento con un estímulo diferente para funcionar como un reforzador y lo más probable es que haya obtenido esta función a través de la evolución y su papel en la supervivencia de las especies.Los ejemplos de reforzadores primarios incluyen comida, agua y sexo.
Algunos reforzadores primarios, como ciertos medicamentos, pueden imitar los efectos de otros reforzadores primarios. Si bien estos reforzadores primarios son bastante estables a lo largo de la vida y entre individuos, el valor de refuerzo de los diferentes reforzadores primarios varía debido a múltiples factores (por ejemplo, genética, experiencia).
Por lo tanto, una persona puede preferir un tipo de comida mientras que otra lo evita. O una persona puede comer mucha comida mientras que otra come muy poco. Entonces, aunque la comida es un reforzador primario para ambos individuos, el valor de los alimentos como reforzador difiere entre ellos.
Reforzadores secundarios
Un reforzador secundario, a veces llamado reforzador condicionado, es un estímulo o situación que ha adquirido su función como reforzador después de emparejarse con un estímulo que funciona como un reforzador. Este estímulo puede ser un reforzador primario u otro reforzador condicionado (como el dinero).
Un ejemplo de un refuerzo secundario sería el sonido de un clicker, como se usa en el entrenamiento de clicker. El sonido del clicker se ha asociado con elogios o golosinas, y posteriormente, el sonido del clicker puede funcionar como un reforzador. Otro ejemplo común es el sonido de las personas aplaudiendo:
No hay nada intrínsecamente positivo al escuchar ese sonido, pero hemos aprendido que está asociado con elogios y recompensas.
Cuando intente distinguir los reforzadores primarios y secundarios en ejemplos humanos, use la «prueba del hombre de las cavernas». Si el estímulo es algo que un hombre de las cavernas encontraría naturalmente deseable (por ejemplo, dulces), entonces es un reforzador primario. Si, por otro lado, el hombre de las cavernas no reaccionaría a él (por ejemplo, un billete de un dólar), es un refuerzo secundario.
Al igual que con los reforzadores primarios, un organismo puede experimentar saciedad y privación con los reforzadores secundarios.
Otros términos de refuerzo
Un reforzador generalizado es un reforzador condicionado que ha obtenido la función de refuerzo emparejándose con muchos otros reforzadores y funciona como un reforzador bajo una amplia variedad de operaciones motivadoras. (Un ejemplo de esto es el dinero porque está emparejado con muchos otros reforzadores).
83
En el muestreo de reforzadores, un estímulo potencialmente reforzador pero desconocido se presenta a un organismo sin tener en cuenta ningún comportamiento previo.
El refuerzo mediado socialmente (refuerzo directo) implica la entrega de refuerzo que requiere el comportamiento de otro organismo.
El principio de Premack es un caso especial de refuerzo elaborado por David Premack, que establece que una actividad altamente preferida puede usarse eficazmente como un refuerzo para una actividad menos preferida. : 123
La jerarquía de refuerzo es una lista de acciones, ordenando las consecuencias más deseables a las menos deseables que pueden servir como refuerzo. Se puede usar una jerarquía de refuerzo para determinar la frecuencia relativa y la conveniencia de diferentes actividades, y a menudo se emplea cuando se aplica el principio Premack.
Los resultados contingentes tienen más probabilidades de reforzar el comportamiento que las respuestas no contingentes. Los resultados contingentes son aquellos directamente vinculados a un comportamiento causal, por ejemplo, una luz que se enciende depende de que se active un interruptor. Tenga en cuenta que los resultados contingentes no son necesarios para demostrar el refuerzo, pero la contingencia percibida puede aumentar el aprendizaje.
Los estímulos contiguos son estímulos estrechamente asociados por el tiempo y el espacio con comportamientos específicos. Reducen la cantidad de tiempo necesaria para aprender un comportamiento al tiempo que aumentan su resistencia a la extinción. Darle a un perro un pedazo de comida inmediatamente después de sentarse es más contiguo (y, por lo tanto, más probable que refuerce) el comportamiento que un retraso de varios minutos en la entrega de alimentos después del comportamiento.
El refuerzo no contingente se refiere a la entrega independiente de la respuesta de estímulos identificados como reforzadores para algunos comportamientos de ese organismo. Sin embargo, esto generalmente implica la entrega basada en el tiempo de estímulos identificados como mantener un comportamiento aberrante, lo que disminuye la tasa del comportamiento objetivo.
Como no se identifica un comportamiento medido como fortalecido, existe una controversia en torno al uso del término «refuerzo» no contingente.
Natural y artificial
En su artículo de 1967, Arbitrary and Natural Refforcement, Charles Ferster propuso clasificar el refuerzo en eventos que aumentan la frecuencia de un operante como una consecuencia natural del comportamiento en sí mismo, y eventos que se supone que afectan la frecuencia por su requerimiento de mediación humana, como en Una economía simbólica donde los sujetos son «recompensados» por cierto comportamiento con una ficha arbitraria de un valor negociable.
En 1970, Baer y Wolf crearon un nombre para el uso de reforzadores naturales llamados «trampas de comportamiento».Una trampa de comportamiento requiere solo una respuesta simple para ingresar a la trampa, sin embargo, una vez ingresada, no se puede resistir la trampa para crear un cambio de comportamiento general.
Es el uso de una trampa de comportamiento que aumenta el repertorio de una persona, al exponerla al refuerzo natural de ese comportamiento. Las trampas de comportamiento tienen cuatro características:
Están «cebados» con refuerzos virtualmente irresistibles que «atraen» al estudiante a la trampa.
Solo una respuesta de bajo esfuerzo ya en el repertorio es necesaria para entrar en la trampa
Las contingencias interrelacionadas de refuerzo dentro de la trampa motivan a la persona a adquirir, ampliar y mantener habilidades académicas / sociales específicas
Pueden permanecer efectivos por largos períodos de tiempo porque la persona muestra pocos, si alguno, efectos de saciedad
Como se puede ver en lo anterior, el refuerzo artificial se crea para construir o desarrollar habilidades, y para generalizar, es importante que se introduzca una trampa de comportamiento para «capturar» la habilidad y utilizar el refuerzo natural para mantenerlo o aumentarlo.. Esta trampa de comportamiento puede ser simplemente una situación social que generalmente será el resultado de un comportamiento específico una vez que haya cumplido un cierto criterio (por ejemplo, si usa reforzadores comestibles para entrenar a una persona a saludar y sonreír a las personas cuando las conozcan, después de eso la habilidad se ha desarrollado, el refuerzo natural de otras personas sonríe, y tener interacciones más amistosas reforzará naturalmente la habilidad y los comestibles pueden desvanecerse)
Horarios de refuerzo intermitente
Gran parte del comportamiento no se refuerza cada vez que se emite, y el patrón de refuerzo intermitente afecta fuertemente la rapidez con que se aprende una respuesta operante, cuál es su tasa en un momento dado y cuánto tiempo continúa cuando cesa el refuerzo. Las reglas más simples que controlan el refuerzo son el refuerzo continuo, donde se refuerza cada respuesta, y la extinción, donde no se refuerza ninguna respuesta.
Entre estos extremos, los «cronogramas de refuerzo» más complejos especifican las reglas que determinan cómo y cuándo una respuesta será seguida por un reforzador.
Los programas específicos de refuerzo inducen de manera confiable patrones específicos de respuesta, independientemente de la especie que se esté investigando (incluidos los humanos en algunas condiciones). Sin embargo, las propiedades cuantitativas del comportamiento bajo un cronograma dado dependen de los parámetros del cronograma y, a veces, de otros factores ajenos al cronograma.
El orden y la previsibilidad de la conducta bajo esquemas de refuerzo fue evidencia de la afirmación de BF Skinner de que al usar el condicionamiento operante podría obtener «control sobre la conducta», de una manera que dejó obsoletas las disputas teóricas de la psicología comparativa contemporánea.
La confiabilidad del control del horario apoyó la idea de que un análisis experimental conductista radical del comportamientopodría ser la base de una psicología que no se refería a procesos mentales o cognitivos. La fiabilidad de los horarios también condujo al desarrollo del análisis de comportamiento aplicado como un medio para controlar o alterar el comportamiento.
Skinner investigó a fondo muchas de las posibilidades más simples, y algunas de las más complejas, utilizando palomas, pero se siguen definiendo e investigando nuevos horarios.
Horarios simples
Programa de proporción : el refuerzo depende solo de la cantidad de respuestas que haya realizado el organismo.
Refuerzo continuo (CRF) : un programa de refuerzo en el que cada aparición de la respuesta instrumental (respuesta deseada) es seguida por el reforzador. : 86
Ejemplo de laboratorio: cada vez que una rata presiona una barra, obtiene una bolita de comida.
Ejemplo del mundo real: cada vez que un perro defeca fuera de su dueño le da un regalo; cada vez que una persona pone $ 1 en una máquina de dulces y presiona los botones, recibe una barra de chocolate.
Los cronogramas simples tienen una sola regla para determinar cuándo se entrega un solo tipo de refuerzo para una respuesta específica.
Proporción fija (FR) – horarios entregan refuerzo después de cada n º respuesta. : 88 Una programación FR 1 es sinónimo de una programación CRF.
Ejemplo: FR 2 = cada segunda respuesta deseada que el sujeto hace se refuerza.
Ejemplo de laboratorio: FR 5 = el comportamiento de presión de barra de la rata se refuerza con alimentos después de cada 5 barras de presión en una caja Skinner.
Ejemplo del mundo real: FR 10 = El concesionario de autos usados recibe un bono de $ 1000 por cada 10 autos vendidos en el lote.
Programa de razón variable (VR) – reforzado en promedio cada n º respuesta, pero no siempre en el n º de respuesta. : 88
Ejemplo de laboratorio: VR 4 = primer pellet entregado en prensas de 2 bar, segundo pellet entregado en prensas de 6 bar, tercer pellet prensas de 4 bar (2 6 4 = 12; 12/3 = prensas de 4 bar para recibir el pellet).
Ejemplo del mundo real: máquinas tragamonedas (porque, aunque la probabilidad de ganar el premio mayor es constante, la cantidad de presiones de palanca necesarias para alcanzar el premio mayor es variable).
Intervalo fijo (FI): reforzado después de n cantidad de tiempo.
Ejemplo: FI 1-s = refuerzo proporcionado para la primera respuesta después de 1 segundo.
Ejemplo de laboratorio: FI 15-s = el comportamiento de presión de barra de la rata se refuerza para la primera presión de barra después de que pasen 15 segundos desde el último refuerzo.
Ejemplo del mundo real: FI 30 minutos = un ciclo de lavadora de 30 minutos.
Intervalo variable (VI): reforzado en un promedio de n cantidad de tiempo, pero no siempre exactamente n cantidad de tiempo. : 89
Ejemplo: VI 4 min = primer gránulo entregado después de 2 minutos, segundo entregado después de 6 minutos, el tercero entregado después de 4 minutos (2 6 4 = 12; 12/3 = 4). El refuerzo se entrega en promedio después de 4 minutos.
Ejemplo de laboratorio: VI 10-s = el comportamiento de presión de barra de una rata se refuerza para la primera presión de barra después de un promedio de 10 segundos transcurridos desde el último refuerzo.
Ejemplo del mundo real: VI 30 min = ir a pescar: puede pescar un pez después de 10 minutos, luego tiene que esperar una hora y luego 20 minutos.
Tiempo fijo (FT): proporciona un estímulo de refuerzo en un momento fijo desde la última entrega de refuerzo, independientemente de si el sujeto ha respondido o no. En otras palabras, es un horario no contingente.
Ejemplo de laboratorio: FT 5-s = la rata obtiene comida cada 5 segundos, independientemente del comportamiento.
Ejemplo del mundo real: FT 30-d = una persona recibe un cheque de anualidad todos los meses independientemente del comportamiento entre cheques
Tiempo variable (VT): proporciona refuerzo en un tiempo variable promedio desde el último refuerzo, independientemente de si el sujeto ha respondido o no.
Se utilizan programas simples en muchos procedimientos de refuerzo diferencial :
Refuerzo diferencial de comportamiento alternativo (DRA): un procedimiento de condicionamiento en el que una respuesta no deseada se reduce colocándola en extinción o, menos comúnmente, proporcionando castigo contingente, mientras que simultáneamente proporciona refuerzo contingente a una respuesta deseable.
Un ejemplo sería un maestro que atiende a un estudiante solo cuando levanta la mano, mientras ignora al estudiante cuando lo llama.
Refuerzo diferencial de otro comportamiento (DRO): también conocido como procedimientos de entrenamiento de omisión, un procedimiento de acondicionamiento instrumental en el que se entrega periódicamente un refuerzo positivo solo si el participante hace algo diferente a la respuesta objetivo. Un ejemplo sería reforzar cualquier acción de la mano que no sea rascarse la nariz.
338
Refuerzo diferencial de comportamiento incompatible (DRI): se utiliza para reducir un comportamiento frecuente sin castigarlo al reforzar una respuesta incompatible. Un ejemplo sería reforzar las palmas para reducir la punción nasal
Refuerzo diferencial de baja tasa de respuesta (DRL): se utiliza para alentar bajas tasas de respuesta. Es como un programa de intervalos, excepto que las respuestas prematuras restablecen el tiempo requerido entre comportamientos.
Ejemplo de laboratorio: DRL 10-s = una rata se refuerza para la primera respuesta después de 10 segundos, pero si la rata responde antes de 10 segundos no hay refuerzo y la rata tiene que esperar 10 segundos desde esa respuesta prematura sin otra respuesta antes de la barra presionar conducirá al refuerzo.
Ejemplo del mundo real: «Si me pide una papa frita no más de una vez cada 10 minutos, se la daré. Si me pide con más frecuencia, no le daré ninguna».
Refuerzo diferencial de alta tasa (DRH): se utiliza para aumentar las altas tasas de respuesta. Es como un horario de intervalos, excepto que se requiere un número mínimo de respuestas en el intervalo para recibir refuerzo.
Ejemplo de laboratorio: DRH 10-s / FR 15 = una rata debe presionar una barra 15 veces dentro de un incremento de 10 segundos para reforzarse.
Ejemplo del mundo real: «Si Lance Armstrong va a ganar el Tour de Francia que tiene que pedal de x número de veces durante la y. -Hora carrera»
Efectos de diferentes tipos de horarios simples
Relación fija: la actividad se ralentiza después de la entrega del reforzador, luego las tasas de respuesta aumentan hasta la próxima entrega del reforzador (pausa posterior al refuerzo).
Relación variable: tasa de respuesta rápida y constante; Más resistente a la extinción.
Intervalo fijo: la respuesta aumenta hacia el final del intervalo; Poca resistencia a la extinción.
Intervalo variable: resultados de actividad constante, buena resistencia a la extinción.
Los programas de razón producen tasas de respuesta más altas que los programas de intervalo, cuando las tasas de refuerzo son similares.
Los horarios variables producen tasas más altas y mayor resistencia a la extinción que la mayoría de los horarios fijos. Esto también se conoce como el efecto de extinción de refuerzo parcial (PREE).
El programa de proporción variable produce tanto la tasa más alta de respuesta como la mayor resistencia a la extinción (por ejemplo, el comportamiento de los jugadores en las máquinas tragamonedas ).
Los horarios fijos producen «pausas posteriores al refuerzo» (PRP), donde las respuestas cesarán brevemente inmediatamente después del refuerzo, aunque la pausa es una función del requisito de respuesta próxima en lugar del refuerzo anterior.
El PRP de un programa de intervalo fijo es seguido frecuentemente por una tasa de respuesta acelerada «en forma de festón», mientras que los programas de relación fija producen una respuesta más «angular».
Vieira de intervalo fijo: el patrón de respuesta que se desarrolla con el programa de refuerzo de intervalo fijo, el rendimiento en un intervalo fijo refleja la precisión del sujeto en la hora de decir.
Los organismos cuyos esquemas de refuerzo se «adelgazan» (es decir, que requieren más respuestas o una mayor espera antes del refuerzo) pueden experimentar una «relación de tensión» si se adelgazan demasiado rápido. Esto produce un comportamiento similar al observado durante la extinción.
Relación de tensión: la interrupción de la respuesta que ocurre cuando un requisito de respuesta de relación fija se incrementa demasiado rápido.
Relación de ejecución: tasa de respuesta alta y constante que completa cada requisito de relación. Por lo general, un requisito de proporción más alta provoca pausas más largas posteriores al refuerzo.
Los programas de refuerzo parcial son más resistentes a la extinción que los programas de refuerzo continuo.
Los calendarios de relación son más resistentes que los intervalos y los horarios variables más resistentes que los fijos.
Los cambios momentáneos en el valor de refuerzo conducen a cambios dinámicos en el comportamiento.
Horarios compuestos
Los horarios compuestos combinan dos o más horarios simples diferentes de alguna manera usando el mismo reforzador para el mismo comportamiento. Hay muchas posibilidades; Entre los más utilizados se encuentran:
Programas alternativos : un tipo de programa compuesto en el que están vigentes dos o más programas simples y el programa completado primero da como resultado el refuerzo.
Programas conjuntivos : un programa complejo de refuerzo donde dos o más programas simples están vigentes independientemente uno del otro, y los requisitos en todos los programas simples deben cumplirse para el refuerzo.
Horarios múltiples : dos o más horarios se alternan con el tiempo, con un estímulo que indica cuál está vigente. El refuerzo se entrega si se cumple el requisito de respuesta mientras está vigente un cronograma.
Ejemplo: FR cuando recibe un silbato y FI cuando recibe un timbre.
Horarios mixtos : cualquiera de dos o más horarios puede ocurrir sin ningún estímulo que indique cuál está vigente. El refuerzo se entrega si se cumple el requisito de respuesta mientras está vigente un cronograma.
Ejemplo: FI y luego VR sin ninguna advertencia de estímulo del cambio en el horario.
Planificaciones concurrentes : un procedimiento de refuerzo complejo en el que el participante puede elegir cualquiera de dos o más planificaciones de refuerzo simples que están disponibles simultáneamente. Los organismos son libres de cambiar de ida y vuelta entre las alternativas de respuesta en cualquier momento.
Ejemplo del mundo real: cambio de canales en un televisor.
Programa de refuerzo de cadena concurrente : un procedimiento de refuerzo complejo en el que el participante puede elegir durante el primer enlace cuál de varios programas de refuerzo simples estará vigente en el segundo enlace. Una vez que se ha hecho una elección, las alternativas rechazadas dejan de estar disponibles hasta el comienzo de la próxima prueba.
Programaciones de enclavamiento : una programación individual con dos componentes donde el progreso en un componente afecta el progreso en el otro componente. En una planificación de FR 120 FI 120-s entrelazada, por ejemplo, cada respuesta resta tiempo del componente de intervalo de modo que cada respuesta sea «igual» a eliminar dos segundos de la planificación de FI.
Programas encadenados : el refuerzo se produce después de que se hayan completado dos o más programas sucesivos, con un estímulo que indica cuándo se completó un programa y se inició el siguiente.
Ejemplo: en un horario FR 10 en presencia de una luz roja, una paloma picotea un disco verde 10 veces; entonces, una luz amarilla indica que un horario FR 3 está activo; después de que la paloma picotea un disco amarillo 3 veces, se enciende una luz verde que indica que está en vigencia un programa VI 6-s;
Si este fuera el horario final en la cadena, la paloma se vería reforzada por picotear un disco verde en un horario VI 6-s; sin embargo, todos los requisitos del cronograma en la cadena deben cumplirse antes de proporcionar un refuerzo.
Cronogramas en tándem : el refuerzo se produce cuando se han completado dos o más requisitos de cronograma sucesivos, sin estímulo que indique cuándo se completó un cronograma y se inició el siguiente.
Ejemplo: VR 10, una vez completado, el programa cambia sin aviso a FR 10, luego cambia sin aviso a FR 16, etc. Al final de la serie de programas, finalmente se proporciona un refuerzo.
Horarios de orden superior : la finalización de un horario se refuerza de acuerdo con un segundo horario; por ejemplo, en FR (FI segundos), dos cronogramas sucesivos de intervalos fijos deben completarse antes de reforzar una respuesta.
Horarios superpuestos
El término de psicología horarios de refuerzo superpuestos se refiere a una estructura de recompensas donde dos o más horarios simples de refuerzo operan simultáneamente. Los reforzadores pueden ser positivos, negativos o ambos. Un ejemplo es una persona que llega a casa después de un largo día de trabajo.
El comportamiento de abrir la puerta de entrada se ve recompensado con un gran beso en los labios por parte del cónyuge de la persona y un rasgón en los pantalones del perro de la familia saltando con entusiasmo. Otro ejemplo de esquemas de refuerzo superpuestos es una paloma en una jaula experimental picoteando un botón.
Los picoteos entregan una tolva de grano cada vigésimo picotazo y acceso al agua cada 200 picoteos.
Los esquemas de refuerzo superpuestos son un tipo de esquema compuesto que evolucionó a partir del trabajo inicial sobre esquemas simples de refuerzo de BF Skinner y sus colegas (Skinner y Ferster, 1957). Demostraron que los reforzadores podían entregarse en horarios, y además que los organismos se comportaban de manera diferente en horarios diferentes.
En lugar de un refuerzo, como alimentos o agua, que se entrega cada vez como consecuencia de algún comportamiento, un refuerzo podría entregarse después de más de una instancia del comportamiento. Por ejemplo, una paloma.Es posible que deba presionar un interruptor de botón diez veces antes de que aparezca la comida.
Este es un «horario de proporción». Además, se podría entregar un refuerzo después de un intervalo de tiempo transcurrido después de un comportamiento objetivo. Un ejemplo es una rata que recibe un gránulo de comida inmediatamente después de la primera respuesta que ocurre después de que hayan transcurrido dos minutos desde la última vez que presionó la palanca.
Esto se llama un «horario de intervalo».
Además, los calendarios de proporción pueden proporcionar refuerzo después de un número fijo o variable de comportamientos por parte del organismo individual. Del mismo modo, los horarios de intervalos pueden proporcionar refuerzo después de intervalos de tiempo fijos o variables después de una sola respuesta del organismo.
Los comportamientos individuales tienden a generar tasas de respuesta que difieren en función de cómo se crea el programa de refuerzo. Mucha investigación posterior en muchos laboratorios examinó los efectos sobre los comportamientos de los reforzadores de programación.
Si a un organismo se le ofrece la oportunidad de elegir entre dos o más programas simples de refuerzo al mismo tiempo, la estructura de refuerzo se denomina «programa concurrente de refuerzo». Brechner (1974, 1977) introdujo el concepto de esquemas de refuerzo superpuestos en un intento de crear una analogía de laboratorio de trampas sociales, como cuando los humanos cosechan en excesosus pesquerías o derribar sus selvas tropicales.
Brechner creó una situación en la que se superponían simples esquemas de refuerzo. En otras palabras, una sola respuesta o grupo de respuestas de un organismo condujo a múltiples consecuencias. Los horarios concurrentes de refuerzo pueden considerarse como «o» horarios, y los horarios superpuestos de refuerzo pueden considerarse como «y» horarios.
Brechner y Linder (1981) y Brechner (1987) ampliaron el concepto para describir cómo los horarios superpuestos y la analogía de la trampa social podrían usarse para analizar la forma en que la energía fluye a través de los sistemas.
Los horarios de refuerzo superpuestos tienen muchas aplicaciones en el mundo real además de generar trampas sociales. Se pueden crear muchas situaciones humanas y sociales humanas diferentes mediante la superposición de esquemas de refuerzo simples. Por ejemplo, un ser humano podría tener adicciones simultáneas al tabaco y al alcohol.
Incluso se pueden crear o simular situaciones más complejas superponiendo dos o más programaciones concurrentes. Por ejemplo, un estudiante de último año de secundaria podría elegir entre ir a la Universidad de Stanford o la UCLA, y al mismo tiempo tener la opción de ingresar al Ejército o la Fuerza Aérea, y simultáneamente elegir un trabajo en una empresa de Internet o un trabajo con una empresa de software.
Esa es una estructura de refuerzo de tres esquemas concurrentes superpuestos de refuerzo.
Los horarios superpuestos de refuerzo pueden crear las tres situaciones de conflicto clásicas (conflicto de aproximación-enfoque, conflicto de aproximación-evitación y conflicto de evitación-evitación) descritas por Kurt Lewin (1935) y pueden poner en práctica otras situaciones lewinianas analizadas por su análisis de campo de fuerza.
Otros ejemplos del uso de esquemas de refuerzo superpuestos como herramienta analítica son su aplicación a las contingencias del control de rentas (Brechner, 2003) y el problema del vertido de desechos tóxicos en el sistema de drenaje pluvial del condado de Los Ángeles (Brechner, 2010).
Horarios concurrentes
En el condicionamiento operante, los horarios concurrentes de refuerzo son horarios de refuerzo que están disponibles simultáneamente para un sujeto animal o un participante humano, de modo que el sujeto o participante pueda responder en cualquier horario. Por ejemplo, en una tarea de opción forzada de dos alternativas, una paloma en una caja de Skinner se enfrenta a dos teclas de picoteo;
Se pueden hacer respuestas de picoteo en cualquiera de los dos, y el refuerzo de alimentos podría seguir a un picotazo en cualquiera de los dos. Los horarios de refuerzo dispuestos para picotear las dos teclas pueden ser diferentes. Pueden ser independientes, o pueden estar vinculados para que el comportamiento en una tecla afecte la probabilidad de refuerzo en la otra.
No es necesario que las respuestas en los dos horarios sean físicamente distintas. En una forma alternativa de organizar horarios concurrentes, introducido por Findley en 1958, ambos horarios están dispuestos en una sola tecla u otro dispositivo de respuesta, y el sujeto puede responder en una segunda tecla para cambiar entre los horarios.
En dicho procedimiento «Findley concurrent», un estímulo (p. Ej., El color de la tecla principal) señala qué programa está vigente.
Los horarios concurrentes a menudo inducen una alternancia rápida entre las teclas. Para evitar esto, comúnmente se introduce un «retraso de cambio»: cada programa se desactiva durante un breve período después de que el sujeto cambia a él.
Cuando ambos programas concurrentes son intervalos variables, se encuentra una relación cuantitativa conocida como la ley de correspondencia entre las tasas de respuesta relativas en los dos programas y las tasas de refuerzo relativas que ofrecen; RJ Herrnstein observó esto por primera vez en 1961. La ley de correspondencia es una regla para el comportamiento instrumental que establece que la tasa relativa de respuesta en una alternativa de respuesta particular es igual a la tasa relativa de refuerzo para esa respuesta (tasa de comportamiento = tasa de refuerzo).
Los animales y los humanos tienden a preferir la elección en los horarios.
Dando forma
La conformación es el refuerzo de aproximaciones sucesivas a una respuesta instrumental deseada. Al entrenar a una rata para presionar una palanca, por ejemplo, simplemente girar hacia la palanca se refuerza al principio. Entonces, solo girar y dar un paso hacia él se refuerza. Los resultados de un conjunto de comportamientos comienzan el proceso de conformación para el siguiente conjunto de comportamientos, y los resultados de ese conjunto preparan el proceso de conformación para el siguiente conjunto, y así sucesivamente.
A medida que avanza el entrenamiento, la respuesta reforzada se vuelve progresivamente más parecida a la conducta deseada; cada comportamiento posterior se convierte en una aproximación más cercana del comportamiento final.
Encadenamiento
El encadenamiento implica vincular comportamientos discretos en una serie, de modo que cada resultado de cada comportamiento sea tanto el refuerzo (o consecuencia) para el comportamiento anterior, como los estímulos (o antecedente) para el siguiente comportamiento. Hay muchas formas de enseñar el encadenamiento, como el encadenamiento hacia adelante (a partir del primer comportamiento en la cadena), el encadenamiento hacia atrás (a partir del último comportamiento) y el encadenamiento total de tareas (en el que se enseña todo el comportamiento de principio a fin, en lugar de que como una serie de pasos).
Un ejemplo es abrir una puerta cerrada. Primero se inserta la llave, luego se gira, luego se abre la puerta.
El encadenamiento directo enseñaría primero al sujeto a insertar la clave. Una vez que se domina esa tarea, se les dice que inserten la clave y se les enseña a girarla. Una vez que se domina esa tarea, se les dice que realicen las dos primeras y luego se les enseña a abrir la puerta. El encadenamiento hacia atrás implicaría que el maestro primero inserte y gire la llave, y luego se le enseñe al sujeto a abrir la puerta.
Una vez que se aprende, el maestro inserta la llave y se le enseña a la materia a girarla, luego abre la puerta como el siguiente paso. Finalmente, al sujeto se le enseña a insertar la llave, y giran y abren la puerta. Una vez que se domina el primer paso, se ha enseñado toda la tarea. El encadenamiento total de la tarea implicaría enseñar toda la tarea como una sola serie, dando paso a todos los pasos.
Las indicaciones se desvanecen (reducen) en cada paso a medida que se dominan.
Comunicación persuasiva y la teoría del refuerzo
Comunicación persuasiva
La persuasión influye en cualquier persona en su forma de pensar, actuar y sentir. La habilidad persuasiva habla sobre cómo las personas entienden la preocupación, la posición y las necesidades de las personas. La persuasión se puede clasificar en persuasión informal y persuasión formal.
Persuasión informal
Esto informa sobre la forma en que una persona interactúa con colegas y clientes. La persuasión informal se puede utilizar en equipo, notas y correos electrónicos.
Persuasión formal
Este tipo de persuasión se usa para escribir cartas de clientes, propuestas y también para presentaciones formales a cualquier cliente o colegas.
Proceso de persuasión
La persuasión relata cómo influyes en las personas con tus habilidades, experiencia, conocimiento, liderazgo, cualidades y capacidades de equipo. La persuasión es un proceso interactivo mientras otros realizan el trabajo. Aquí hay ejemplos para los que puede usar las habilidades de persuasión en tiempo real.
Entrevista: puedes demostrar tus mejores talentos, habilidades y experiencia. Clientes: para guiar a sus clientes para el logro de las metas u objetivos. Notas: para expresar sus ideas y puntos de vista a sus compañeros de trabajo para mejorar las operaciones. La identificación de resistencia y la actitud positiva son los roles vitales de la persuasión.
La persuasión es una forma de interacción humana. Se lleva a cabo cuando un individuo espera una respuesta particular de uno o más individuos y se propone deliberadamente asegurar la respuesta mediante el uso de la comunicación. El comunicador debe darse cuenta de que diferentes grupos tienen diferentes valores.
24-25
En situaciones de aprendizaje instrumental, que implican un comportamiento operante, el comunicador persuasivo presentará su mensaje y luego esperará a que el receptor responda correctamente. Tan pronto como el receptor responda, el comunicador intentará arreglar la respuesta mediante alguna recompensa o refuerzo apropiado.
En situaciones de aprendizaje condicional, donde hay un comportamiento de respuesta, el comunicador presenta su mensaje para obtener la respuesta que desea del receptor, y el estímulo que originalmente sirvió para obtener la respuesta se convierte en el elemento de refuerzo o gratificante en el condicionamiento.
Modelos matemáticos
Se ha trabajado mucho en la construcción de un modelo matemático de refuerzo. Este modelo se conoce como MPR, abreviatura de principios matemáticos de refuerzo. Peter Killeen ha realizado descubrimientos clave en el campo con su investigación sobre palomas.
Críticas
La definición estándar de refuerzo conductual ha sido criticada como circular, ya que parece argumentar que la fuerza de respuesta aumenta con el refuerzo, y define el refuerzo como algo que aumenta la fuerza de respuesta (es decir, la fuerza de respuesta aumenta con cosas que aumentan la fuerza de respuesta).
Sin embargo, el uso correcto del refuerzo es que algo es un refuerzo porquede su efecto en el comportamiento, y no al revés. Se vuelve circular si uno dice que un estímulo particular fortalece el comportamiento porque es un reforzador, y no explica por qué un estímulo produce ese efecto en el comportamiento.
Se han propuesto otras definiciones, como el «comportamiento consumatorio de FD Sheffield que depende de una respuesta», pero no se utilizan ampliamente en psicología.
La comprensión cada vez mayor del papel que juegan los reforzadores se está alejando de un efecto de «fortalecimiento» a un efecto de «señalización». Es decir, la opinión de que los reforzadores aumentan la respuesta porque señalan los comportamientos que probablemente den como resultado un refuerzo.
Si bien en la mayoría de las aplicaciones prácticas, el efecto de cualquier reforzador dado será el mismo independientemente de si el reforzador está señalizando o fortaleciendo, este enfoque ayuda a explicar una serie de fenómenos de comportamiento que incluyen patrones de respuesta en esquemas de refuerzo intermitentes (vieiras de intervalo fijo) y El efecto de los resultados diferenciales.
Historia de los términos
En la década de 1920, el fisiólogo ruso Ivan Pavlov pudo haber sido el primero en usar la palabra refuerzo con respecto al comportamiento, pero (según Dinsmoor ) usó su cognición rusa con moderación, e incluso entonces se refirió al fortalecimiento de una respuesta ya aprendida pero debilitada.. No lo usó, como lo es hoy, para seleccionar y fortalecer nuevos comportamientos.
La introducción de Pavlov de la palabra extinción (en ruso) se aproxima al uso psicológico actual.
En el uso popular, el refuerzo positivo a menudo se usa como sinónimo de recompensa, y las personas (no el comportamiento) se «refuerzan», pero esto es contrario al uso técnico consistente del término, ya que es una dimensión del comportamiento y no la persona., que se fortalece. El refuerzo negativo a menudo es utilizado por laicos e incluso científicos sociales fuera de la psicología como sinónimo de castigo.
Esto es contrario al uso técnico moderno, pero fue BF Skinner quien lo usó por primera vez de esta manera en su libro de 1938. En 1953, sin embargo, siguió a otros en el empleo de la palabra castigo, y volvió a lanzar refuerzo negativo para la eliminación de los estímulos aversivos.
Algunos dentro del campo del análisis del comportamiento han sugerido que los términos «positivo» y «negativo» constituyen una distinción innecesaria al analizar el refuerzo, ya que a menudo no está claro si los estímulos se están eliminando o presentando. Por ejemplo, Iwata plantea la pregunta: «…
Un cambio de temperatura se caracteriza con mayor precisión por la presentación de frío (calor) o la eliminación de calor (frío)?» : 363 Por lo tanto, el refuerzo podría conceptualizarse como una condición previa al cambio reemplazada por una condición posterior al cambio que refuerza el comportamiento que siguió al cambio en las condiciones de estímulo.
Aplicaciones
El refuerzo y el castigo son ubicuos en las interacciones sociales humanas, y se han sugerido e implementado una gran cantidad de aplicaciones de principios operantes. Los siguientes son algunos ejemplos.
Adicción y dependencia
El refuerzo positivo y negativo juega un papel central en el desarrollo y mantenimiento de la adicción y la drogodependencia. Una droga adictiva es intrínsecamente gratificante; es decir, funciona como un reforzador positivo primario del consumo de drogas. El sistema de recompensa del cerebro le asigna prominencia de incentivo (es decir, es «deseado» o «deseado»), de modo que a medida que se desarrolla una adicción, la privación de la droga conduce al deseo.
Además, los estímulos asociados con el uso de drogas, por ejemplo, la visión de una jeringa y la ubicación del uso, se asocian con el refuerzo intenso inducido por la droga.Estos estímulos previamente neutros adquieren varias propiedades: su apariencia puede inducir antojos y pueden convertirse en reforzadores positivos condicionados de uso continuo.
Por lo tanto, si un individuo adicto encuentra una de estas señales de drogas, puede reaparecer un deseo por la droga asociada. Por ejemplo, las agencias antidrogas utilizaron previamente carteles con imágenes de parafernalia de drogas como un intento de mostrar los peligros del consumo de drogas. Sin embargo, tales carteles ya no se usan debido a los efectos de la prominencia de incentivos al provocar una recaída al ver los estímulos ilustrados en los carteles.
En individuos dependientes de drogas, el refuerzo negativo ocurre cuando una droga se autoadministra para aliviar o «escapar» de los síntomas de dependencia física (p. Ej., Temblores y sudoración) y / o dependencia psicológica (p. Ej., Anhedonia, inquietud, irritabilidad y ansiedad) que surgen durante el estado de abstinencia de drogas.
Entrenamiento animal
Los entrenadores de animales y los dueños de mascotas estaban aplicando los principios y prácticas del condicionamiento operante mucho antes de que estas ideas fueran nombradas y estudiadas, y el entrenamiento con animales todavía proporciona uno de los ejemplos más claros y convincentes de control operante.
De los conceptos y procedimientos descritos en este artículo, algunos de los más destacados son: disponibilidad de refuerzo inmediato (por ejemplo, la bolsa siempre presente de yummies para perros); contingencia, asegurando que el refuerzo sigue el comportamiento deseado y no otra cosa; el uso de refuerzo secundario, como hacer sonar un clicker inmediatamente después de una respuesta deseada;
Dar forma, como hacer que un perro salte cada vez más alto; refuerzo intermitente, reduciendo la frecuencia de esas yummies para inducir un comportamiento persistente sin saciedad; encadenamiento
El comportamiento del niño – gestión de la formación de los padres
Proporcionar refuerzo positivo para los comportamientos apropiados del niño es un enfoque principal de la capacitación en gestión de padres. Por lo general, los padres aprenden a recompensar el comportamiento apropiado a través de recompensas sociales (como elogios, sonrisas y abrazos), así como recompensas concretas (como calcomanías o puntos hacia una recompensa más grande como parte de un sistema de incentivos creado en colaboración con el niño).
Además, los padres aprenden a seleccionar comportamientos simples como enfoque inicial y recompensan cada uno de los pequeños pasos que su hijo logra para alcanzar una meta más grande (este concepto se llama «aproximaciones sucesivas»). También pueden usar recompensas indirectas como a través de tablas de progreso.
Proporcionar refuerzo positivo en el aula puede ser beneficioso para el éxito del estudiante. Al aplicar refuerzo positivo a los estudiantes, es crucial hacerlo individualizado a las necesidades de ese estudiante. De esta manera, el alumno comprende por qué está recibiendo el elogio, puede aceptarlo y eventualmente aprender a continuar la acción que se ganó con el refuerzo positivo.
Por ejemplo, el uso de recompensas o tiempo de recreo adicional podría aplicarse a algunos estudiantes más, mientras que otros podrían aceptar la aplicación al recibir calcomanías o marcas de verificación que indican elogios.
Economía
Tanto los psicólogos como los economistas se han interesado en aplicar conceptos y hallazgos operantes al comportamiento de los humanos en el mercado. Un ejemplo es el análisis de la demanda del consumidor, según lo indexado por la cantidad de una mercancía que se compra. En economía, el grado en que el precio influye en el consumo se llama «la elasticidad precio de la demanda».
Ciertos productos son más elásticos que otros; por ejemplo, un cambio en el precio de ciertos alimentos puede tener un gran efecto en la cantidad comprada, mientras que la gasolina y otros productos esenciales pueden verse menos afectados por los cambios en los precios. En términos de análisis operante, tales efectos pueden interpretarse en términos de motivaciones de los consumidores y el valor relativo de los productos como reforzadores.
Juegos de apuestas: programación de relación variable
Como se indicó anteriormente en este artículo, un programa de relación variable produce refuerzo después de la emisión de un número impredecible de respuestas. Este programa generalmente genera una respuesta rápida y persistente. Las máquinas tragamonedas pagan en un horario de relación variable, y producen este tipo de comportamiento persistente de palanca en los jugadores.
Debido a que las máquinas están programadas para pagar menos dinero del que reciben, el usuario persistente de las máquinas tragamonedas pierde invariablemente a largo plazo. Las máquinas tragamonedas, y por lo tanto el refuerzo de relación variable, a menudo se han atribuido como un factor subyacente a la adicción al juego.
Teoría de empujones
La teoría de los empujones (o empujones) es un concepto en ciencias del comportamiento, teoría política y economía que argumenta que el refuerzo positivo y las sugerencias indirectas para tratar de lograr el cumplimiento no forzado pueden influir en los motivos, incentivos y toma de decisiones de grupos e individuos, al menos como efectivamente, si no más efectivamente, que la instrucción directa, la legislación o la aplicación.
Alabanza
El concepto de alabanza como un medio de refuerzo conductual en humanos está enraizado en el modelo de condicionamiento operante de BF Skinner. A través de este lente, los elogios han sido vistos como un medio de refuerzo positivo, en donde un comportamiento observado es más probable que ocurra al elogiar de manera contingente dicho comportamiento.
Cientos de estudios han demostrado la efectividad de los elogios en la promoción de comportamientos positivos, especialmente en el estudio del uso de los elogios por parte de los maestros y los padres en los niños para promover un mejor comportamiento y rendimiento académico, pero también en el estudio de Rendimiento laboral.También se ha demostrado que los elogios refuerzan los comportamientos positivos en personas adyacentes no elogiadas (como un compañero de clase del destinatario de los elogios) a través del refuerzo indirecto.
Los elogios pueden ser más o menos efectivos para cambiar el comportamiento dependiendo de su forma, contenido y entrega. Para que el elogio produzca un cambio de comportamiento positivo, debe estar supeditado al comportamiento positivo (es decir, solo administrarse después de que se promulgue el comportamiento objetivo), debe especificar los detalles del comportamiento que debe reforzarse y debe entregarse sinceramente y creíblemente
Reconociendo el efecto del elogio como una estrategia de refuerzo positivo, numerosas intervenciones conductuales y cognitivas han incorporado el uso del elogio en sus protocolos. El uso estratégico del elogio se reconoce como una práctica basada en la evidencia tanto en el manejo del aula como en las intervenciones de capacitación para padres, aunque el elogio a menudo se incluye en la investigación de intervención en una categoría más amplia de refuerzo positivo, que incluye estrategias como atención estratégica y recompensas de comportamiento.
Manipulación psicológica
Braiker identificó las siguientes formas en que los manipuladores controlan a sus víctimas:
Refuerzo positivo : incluye elogios, encanto superficial, simpatía superficial ( lágrimas de cocodrilo ), disculpas excesivas, dinero, aprobación, obsequios, atención, expresiones faciales como una risa o una sonrisa forzada y reconocimiento público.
Refuerzo negativo : puede implicar sacar a uno de una situación negativa
Refuerzo intermitente o parcial : el refuerzo negativo parcial o intermitente puede crear un clima efectivo de miedo y duda. El refuerzo positivo parcial o intermitente puede alentar a la víctima a persistir; por ejemplo, en la mayoría de las formas de juego, es probable que el jugador gane de vez en cuando pero aún así pierda dinero en general.
Castigo : incluye regañar, gritar, el tratamiento silencioso, intimidación, amenazas, palabrotas, chantaje emocional, el viaje de culpa, enfurruñarse, llorar y jugar a la víctima.
Aprendizaje traumático en un ensayo: uso de abuso verbal, ira explosiva u otro comportamiento intimidante para establecer dominio o superioridad; incluso un incidente de tal comportamiento puede condicionar o entrenar a las víctimas para evitar molestar, confrontar o contradecir al manipulador.
Unión traumática
La vinculación traumática se produce como resultado de ciclos continuos de abuso en los que el refuerzo intermitente de la recompensa y el castigo crea poderosos lazos emocionales que son resistentes al cambio.
La otra fuente indicó que ‘Las condiciones necesarias para la vinculación traumática son que una persona debe dominar a la otra y que el nivel de abuso aumenta de forma crónica y luego disminuye. La relación se caracteriza por períodos de comportamiento permisivo, compasivo e incluso afectivo de la persona dominante, marcados por episodios intermitentes de abuso intenso.
Para mantener la ventaja, el victimario manipula el comportamiento de la víctima y limita las opciones de la víctima para perpetuar el desequilibrio de poder. Cualquier amenaza al equilibrio de dominio y sumisión se puede encontrar con un ciclo de castigo que va en aumento, desde intimidación hirviente hasta arrebatos intensamente violentos.
El victimario también aísla a la víctima de otras fuentes de apoyo, lo que reduce la probabilidad de detección e intervención, perjudica a la víctima ‘ La capacidad de recibir retroalimentación autorreferencial y fortalece la sensación de dependencia unilateral… Los efectos traumáticos de estas relaciones abusivas pueden incluir el deterioro de la capacidad de la víctima para una autoevaluación precisa, lo que lleva a una sensación de insuficiencia personal y un sentido subordinado de dependencia de la persona dominante.
Las víctimas también pueden encontrar una variedad de consecuencias sociales y legales desagradables de su afiliación emocional y conductual con alguien que perpetró actos agresivos, incluso si ellos mismos fueron los receptores de la agresión. que conduce a una sensación de insuficiencia personal y una sensación subordinada de dependencia de la persona dominante.
Las víctimas también pueden encontrar una variedad de consecuencias sociales y legales desagradables de su afiliación emocional y conductual con alguien que perpetró actos agresivos, incluso si ellos mismos fueron los receptores de la agresión. que conduce a una sensación de insuficiencia personal y una sensación subordinada de dependencia de la persona dominante.
Las víctimas también pueden encontrar una variedad de consecuencias sociales y legales desagradables de su afiliación emocional y conductual con alguien que perpetró actos agresivos, incluso si ellos mismos fueron los receptores de la agresión.
Videojuegos
La mayoría de los videojuegos están diseñados en torno a algún tipo de circuito de compulsión, agregando un tipo de refuerzo positivo a través de un horario de tasa variable para mantener al jugador jugando, aunque esto también puede conducir a la adicción a los videojuegos.
Como parte de una tendencia en la monetización de los videojuegos en la década de 2010, algunos juegos ofrecían «cajas de botín» como recompensas o adquiribles por fondos del mundo real que ofrecían una selección aleatoria de elementos en el juego, distribuidos por rareza. La práctica se ha vinculado a los mismos métodos que las máquinas tragamonedas y otros dispositivos de juego distribuyen recompensas, ya que sigue un programa de tasa variable.
Si bien la percepción general de que los botines son una forma de juego, la práctica solo se clasifica como tal en algunos países como juegos de azar y de otro modo legal. Sin embargo, los métodos para usar esos artículos como moneda virtual para los juegos de azar en línea o el comercio de dinero del mundo real ha creado un mercado de juegos de azar que está bajo evaluación legal.
Cultura del miedo en el lugar de trabajo
Ashforth discutió los lados potencialmente destructivos del liderazgo e identificó lo que él llamó pequeños tiranos : líderes que ejercen un estilo tiránico de gestión, lo que resulta en un clima de miedo en el lugar de trabajo. El refuerzo negativo parcial o intermitente puede crear un clima efectivo de miedo y duda.
Cuando los empleados tienen la sensación de que los matones son tolerados, el resultado puede ser un clima de miedo.
Las diferencias individuales en la sensibilidad a la recompensa, el castigo y la motivación se han estudiado bajo las premisas de la teoría de la sensibilidad de refuerzo y también se han aplicado al rendimiento laboral.
Referencias
Schultz W (julio de 2015). «Recompensas neuronales y señales de decisión: de las teorías a los datos». Revisiones fisiológicas. 95(3): 853–951. doi:.1152 / physrev..2014. PMC 4491543. PMID 26109341.Las recompensas en el condicionamiento operante son reforzadores positivos…. El comportamiento operativo da una buena definición de recompensas.
Cualquier cosa que haga que un individuo regrese por más es un refuerzo positivo y, por lo tanto, una recompensa. Aunque proporciona una buena definición, el refuerzo positivo es solo una de varias funciones de recompensa…. Las recompensas son atractivas. Son motivadores y nos hacen esforzarnos….
Las recompensas inducen un comportamiento de aproximación, también llamado comportamiento apetitivo o preparatorio, y un comportamiento consumatorio…. Por lo tanto, cualquier estímulo, objeto, evento, actividad o situación que tenga el potencial de hacernos acercarnos y consumirlo es, por definición, una recompensa….
Las recompensas intrínsecas son actividades que son placenteras por sí mismas y se llevan a cabo por su propio bien, sin ser el medio para obtener recompensas extrínsecas…. Las recompensas intrínsecas son recompensas genuinas por derecho propio, ya que inducen el aprendizaje, el enfoque y el placer, como perfeccionar, tocar y disfrutar del piano.
Aunque pueden servir para condicionar recompensas de orden superior, no están condicionadas, recompensas de orden superior, ya que el logro de sus propiedades de recompensa no requiere emparejamiento con una recompensa no condicionada.
Winkielman P, Berridge KC, Wilbarger JL (enero de 2005). «Las reacciones afectivas inconscientes a los rostros felices y enojados enmascarados influyen en el comportamiento de consumo y los juicios de valor». Boletín de Personalidad y Psicología Social. 31 (1): 121–35. doi : 10.1177 / 0146167204271309.
PMID 15574667.
Mondadori C, Waser PG, Huston JP (junio de 1977). «Efectos dependientes del tiempo de refuerzo posterior al juicio, castigo o ECS en el aprendizaje de evitación pasiva». Fisiología y Comportamiento. 18 (6): 1103–9. doi : 10.1016 / 0031-9384 (77) 90018-X. PMID 928533.
Fuentes
- Fuente: www.ncbi.nlm.nih.gov
- Fuente: doi.org
- Fuente: pubmed.ncbi.nlm.nih.gov
Autor
