Condicionamiento clásico
El condicionamiento clásico (también conocido como condicionamiento pavloviano o respondiente ) se refiere a un procedimiento de aprendizaje en el que un estímulo biológicamente potente (por ejemplo, comida) se combina con un estímulo previamente neutral (por ejemplo, una campana). También se refiere al proceso de aprendizaje que resulta de este emparejamiento, a través del cual el estímulo neutral llega a provocar una respuesta (por ejemplo, salivación) que generalmente es similar a la provocada por el estímulo potente.
Es distinto del condicionamiento operante (también llamado condicionamiento instrumental ), a través del cual la fuerza de un comportamiento voluntario se modifica mediante refuerzo o castigo. Los estímulos condicionados de manera clásica pueden mejorar el comportamiento operante al inducir independientemente elecciones gratificantes.
La investigación ha demostrado que este es un fenómeno beneficioso en los casos en que el comportamiento operante es propenso a errores.
El condicionamiento clásico puede desempeñar un papel importante en ciertos fenómenos sociales como el falso efecto de consenso.
Descripción general
El acondicionamiento clásico fue estudiado por primera vez en detalle por Ivan Pavlov, a través de experimentos con perros y publicado en 1897. Durante el estudio de la digestión del fisiólogo ruso, Pavlov observó que los perros que servían como sus sujetos babeaban cuando se les servía carne.
Junto con el condicionamiento operante, el condicionamiento clásico se convirtió en la base del conductismo, una escuela de psicología que era dominante a mediados del siglo XX y que sigue siendo una influencia importante en la práctica de la terapia psicológica y el estudio del comportamiento animal.
El condicionamiento clásico es un proceso de aprendizaje básico, y sus sustratos neurales ahora están comenzando a ser entendidos. Aunque a veces es difícil distinguir el condicionamiento clásico de otras formas de aprendizaje asociativo (por ejemplo, aprendizaje instrumental y memoria asociativa humana ), una serie de observaciones los diferencian, especialmente las contingencias por las cuales ocurre el aprendizaje.
Definición
El condicionamiento clásico ocurre cuando un estímulo condicionado (CS) se combina con un estímulo no condicionado (EE. UU.). Por lo general, el estímulo condicionado es un estímulo neutral (p. Ej., El sonido de un diapasón), el estímulo no condicionado es biológicamente potente (p. Ej., El sabor de los alimentos) y la respuesta no condicionada (UR) al estímulo no condicionado es una respuesta refleja no aprendida (p.
Ej., salivación). Después de repetir el emparejamiento, el organismo exhibe una respuesta condicionada (CR) al estímulo condicionado cuando el estímulo condicionado se presenta solo. (Una respuesta condicionada puede ocurrir después de un solo emparejamiento). Por lo tanto, a diferencia del UR, el CR se adquiere a través de la experiencia, y también es menos permanente que el UR.
Por lo general, la respuesta condicionada es similar a la respuesta no condicionada, pero a veces es bastante diferente. Por esta y otras razones, la mayoría de los teóricos del aprendizaje sugieren que el estímulo condicionado llega a señalar o predecir el estímulo no condicionado, y luego analiza las consecuencias de esta señal.
Robert A. Rescorla proporcionó un resumen claro de este cambio de pensamiento, y sus implicaciones, en su artículo de 1988 «Acondicionamiento pavloviano: no es lo que piensas que es». A pesar de su aceptación generalizada, la tesis de Rescorla puede no ser defendible.
Classical difiere de acondicionamiento de operante o instrumentales acondicionado : en el condicionamiento clásico, los comportamientos son modificados a través de la asociación de los estímulos como se describe anteriormente, mientras que en los comportamientos de condicionamiento operante son modificados por el efecto que producen (es decir, recompensa o castigo).
Procedimientos
La investigación de Pavlov
Ivan Pavlov realizó el trabajo temprano más conocido y completo sobre el condicionamiento clásico, aunque Edwin Twitmyer publicó algunos hallazgos relacionados un año antes.Durante su investigación sobre la fisiología de la digestión en perros, Pavlov desarrolló un procedimiento que le permitió estudiar los procesos digestivos de los animales durante largos períodos de tiempo.
Redirigió los fluidos digestivos del animal fuera del cuerpo, donde podían medirse. Pavlov notó que sus perros comenzaron a salivar en presencia del técnico que normalmente los alimentaba, en lugar de simplemente salivar en presencia de alimentos. Pavlov llamó a la salivación anticipatoria de los perros «secreción psíquica».
Poniendo estas observaciones informales a una prueba experimental, Pavlov presentó un estímulo (por ejemplo, el sonido de un metrónomo) y luego le dio de comer al perro; Después de algunas repeticiones, los perros comenzaron a salivar en respuesta al estímulo. Pavlov concluyó que si un estímulo particular en el perro ‘
Terminología
En los experimentos de Pavlov, el estímulo incondicionado (EE. UU.) Fue el alimento para perros porque sus efectos no dependían de la experiencia previa. El sonido del metrónomo es originalmente un estímulo neutro (NS) porque no provoca salivación en los perros. Después del acondicionamiento, el sonido del metrónomo se convierte en el estímulo condicionado (CS) o estímulo condicional;
Porque sus efectos dependen de su asociación con los alimentos. Del mismo modo, las respuestas del perro siguen la misma disposición condicionada versus no condicionada. La respuesta condicionada (CR) es la respuesta al estímulo condicionado, mientras que la respuesta no condicionada (UR) corresponde al estímulo no condicionado.
Pavlov informó muchos hechos básicos sobre el condicionamiento; Por ejemplo, descubrió que el aprendizaje se producía más rápidamente cuando el intervalo entre la CS y la aparición de los EE. UU. era relativamente corto.
Como se señaló anteriormente, a menudo se piensa que la respuesta condicionada es una réplica de la respuesta no condicionada, pero Pavlov señaló que la saliva producida por el CS difiere en composición de la producida por los Estados Unidos. De hecho, la RC puede ser cualquier nueva respuesta a la CS previamente neutral que puede estar claramente vinculada a la experiencia con la relación condicional de CS y EE.
UU. También se pensó que los emparejamientos repetidos son necesarios para que surja el condicionamiento, pero muchas CR se pueden aprender con una sola prueba, especialmente en el condicionamiento por miedo y el aprendizaje de la aversión al gusto.
Acondicionamiento hacia adelante
El aprendizaje es más rápido en el acondicionamiento hacia adelante. Durante el acondicionamiento hacia adelante, el inicio del CS precede al inicio de los EE. UU. Para indicar que los EE. UU. Lo seguirán. : 69 Dos formas comunes de acondicionamiento hacia adelante son el retraso y el condicionamiento de trazas.
Condicionamiento por retraso : en el condicionamiento por retraso, el CS se presenta y se superpone con la presentación de los EE. UU. Por ejemplo, si una persona oye un timbre durante cinco segundos, tiempo durante el cual se les inyecta aire en el ojo, la persona parpadeará. Después de varios emparejamientos del timbre y la bocanada, la persona parpadeará solo con el sonido del timbre. Esto es retraso en el condicionamiento
Condicionamiento de rastreo : Durante el acondicionamiento de rastreo, el CS y los EE. UU. No se superponen. En cambio, el CS comienza y termina antes de que se presente a los Estados Unidos. El período libre de estímulo se llama intervalo de rastreo o intervalo de acondicionamiento. Si en el ejemplo del zumbador anterior, la bocanada llegara un segundo después de que el sonido del zumbador se detuviera, eso sería un acondicionamiento de trazas, con un trazo o intervalo de acondicionamiento de un segundo.
Acondicionamiento simultáneo
Durante el acondicionamiento simultáneo, el CS y los EE. UU. Se presentan y finalizan al mismo tiempo. Por ejemplo: si una persona escucha una campana y tiene aire inflado en sus ojos al mismo tiempo, y repetidos emparejamientos como este hacen que la persona parpadee cuando escuche la campana a pesar de la falta de aire, esto demuestra que el condicionamiento simultáneo tiene ocurrió.
Acondicionamiento de segundo orden y orden superior
El acondicionamiento de segundo orden o de orden superior sigue un procedimiento de dos pasos. Primero, un estímulo neutral («CS») viene a señalar a los Estados Unidos a través del acondicionamiento hacia adelante. Luego, un segundo estímulo neutral («CS») se combina con el primero (CS) y produce su propia respuesta condicionada.
66 Por ejemplo: una campana puede combinarse con comida hasta que la campana provoque salivación. Si una luz se combina con la campana, entonces la luz también puede provocar salivación. La campana es el CS y la comida es los Estados Unidos. La luz se convierte en el CS una vez que se combina con el CS.
Condicionamiento hacia atrás
El condicionamiento hacia atrás ocurre cuando un CS sigue inmediatamente a un EE. UU. A diferencia del procedimiento de acondicionamiento habitual, en el que la CS precede a los EE. UU., La respuesta condicionada dada a la CS tiende a ser inhibitoria. Presumiblemente, esto sucede porque la CS sirve como una señal de que EE.
UU. Ha terminado, en lugar de una señal de que EE. UU. Está a punto de aparecer. : 71 Por ejemplo, un soplo de aire dirigido al ojo de una persona podría ser seguido por el sonido de un timbre.
Acondicionamiento temporal
En el condicionamiento temporal, se presenta un EE. UU. A intervalos regulares, por ejemplo, cada 10 minutos. Se dice que el condicionamiento ocurrió cuando el CR tiende a ocurrir poco antes de cada EE. UU. Esto sugiere que los animales tienen un reloj biológico que puede servir como CS. Este método también se ha utilizado para estudiar la capacidad de sincronización en animales (ver Cognición animal ).
El siguiente ejemplo muestra el condicionamiento temporal, ya que los EE. UU., Como la comida a un ratón hambriento, simplemente se entregan en un horario regular, como cada treinta segundos. Después de una exposición suficiente, el ratón comenzará a salivar justo antes de la entrega de alimentos. Esto hace que sea un condicionamiento temporal, ya que parece que el ratón está condicionado al paso del tiempo.
Procedimiento de contingencia cero
En este procedimiento, el CS se empareja con los EE. UU., Pero los EE. UU. También se producen en otros momentos. Si esto ocurre, se predice que es probable que EE. UU. Suceda en ausencia de la CS. En otras palabras, la CS no «predice» a los Estados Unidos. En este caso, el condicionamiento falla y el CS no llega a provocar un CR.
Este hallazgo, que la predicción en lugar del emparejamiento CS-US es la clave del condicionamiento, influyó en gran medida en la investigación y la teoría del condicionamiento posterior.
Extinción
En el procedimiento de extinción, el CS se presenta repetidamente en ausencia de los Estados Unidos. Esto se hace después de que un CS ha sido condicionado por uno de los métodos anteriores. Cuando se hace esto, la frecuencia CR finalmente regresa a los niveles previos al entrenamiento. Sin embargo, la extinción no elimina por completo los efectos del condicionamiento previo.
Esto se demuestra mediante la recuperación espontánea, cuando hay una aparición repentina de (CR) después de la extinción, y otros fenómenos relacionados (ver «Recuperación de la extinción» a continuación). Estos fenómenos pueden explicarse postulando la acumulación de inhibición cuando se presenta un estímulo débil.
Fenómenos observados
Adquisición
Durante la adquisición, el CS y los EE. UU. Se emparejan como se describe anteriormente. El alcance del condicionamiento puede ser rastreado por ensayos de prueba. En estos ensayos de prueba, el CS se presenta solo y se mide el CR. Un solo emparejamiento CS-US puede ser suficiente para producir un CR en una prueba, pero generalmente son necesarios varios emparejamientos y hay un aumento gradual en la respuesta condicionada al CS.
Este número repetido de pruebas aumenta la fuerza y / o frecuencia de la RC gradualmente. La velocidad del acondicionamiento depende de una serie de factores, como la naturaleza y la fuerza de los CS y los EE. UU., La experiencia previa y el estado de motivación del animal. El proceso se ralentiza a medida que se acerca la finalización.
Extinción
Si el CS se presenta sin los EE. UU., Y este proceso se repite con suficiente frecuencia, el CS finalmente dejará de provocar un CR. En este punto, se dice que el CR está «extinguido».
Inhibición externa
La inhibición externa puede observarse si se presenta un estímulo fuerte o desconocido justo antes o al mismo tiempo que el CS. Esto provoca una reducción en la respuesta condicionada a la CS.
Recuperación de la extinción
Varios procedimientos conducen a la recuperación de un CR que primero había sido condicionado y luego extinguido. Esto ilustra que el procedimiento de extinción no elimina completamente el efecto del condicionamiento. Estos procedimientos son los siguientes:
Nueva adquisición: si el CS se empareja nuevamente con los EE. UU., Se adquiere nuevamente un CR, pero esta segunda adquisición generalmente ocurre mucho más rápido que la primera.
Recuperación espontánea : la recuperación espontánea se define como la reaparición de una respuesta condicionada previamente extinguida después de un período de descanso. Es decir, si el CS se prueba en un momento posterior (por ejemplo, una hora o un día) después de la extinción, nuevamente provocará un CR.
Este CR renovado es generalmente mucho más débil que el CR observado antes de la extinción.
Desinhibición : si la CS se prueba justo después de la extinción y se produce un estímulo intenso pero asociativamente neutral, puede haber una recuperación temporal de la respuesta condicionada a la CS.
Restablecimiento: si los EE. UU. Utilizados en el acondicionamiento se presentan a un sujeto en el mismo lugar donde se produjo el acondicionamiento y la extinción, pero sin la presencia del CS, el CS a menudo genera una respuesta cuando se prueba más tarde.
Renovación: La renovación es un resurgimiento de una respuesta condicionada después de la extinción cuando un animal regresa al ambiente en el que se adquirió la respuesta condicionada.
Generalización de estímulos
Se dice que la generalización del estímulo ocurre si, después de que un CS en particular ha llegado a provocar un CR, se encuentra un estímulo de prueba similar para provocar el mismo CR. Por lo general, cuanto más similar es el estímulo de prueba al CS, más fuerte será el CR al estímulo de prueba. Por el contrario, cuanto más difiera el estímulo de prueba de la CS, más débil será la RC, o más diferirá de la observada previamente.
Discriminación de estímulo
Uno observa la discriminación de estímulo cuando un estímulo («CS») provoca un CR y otro estímulo («CS») provoca otro CR o ningún CR. Esto puede lograrse, por ejemplo, emparejando CS con un EE. UU. Efectivo y presentando CS sin EE. UU.
Inhibición latente
La inhibición latente se refiere a la observación de que un estímulo conocido tarda más en convertirse en CS que un estímulo nuevo en CS, cuando el estímulo se combina con un EE. UU. Efectivo.
Supresión condicionada
Esta es una de las formas más comunes de medir la fuerza del aprendizaje en el condicionamiento clásico. Un ejemplo típico de este procedimiento es el siguiente: una rata primero aprende a presionar una palanca a través del condicionamiento operante. Luego, en una serie de ensayos, la rata se expone a un CS, una luz o un ruido, seguido de los EE.
UU., Una leve descarga eléctrica. Se desarrolla una asociación entre el CS y los EE. UU., Y la rata disminuye o detiene su palanca cuando se enciende el CS. La velocidad de prensado durante la CS mide la fuerza del condicionamiento clásico; es decir, cuanto más lento presiona la rata, más fuerte es la asociación de la CS y los Estados Unidos.
La presión lenta indica una respuesta condicionada de «miedo», y es un ejemplo de una respuesta emocional condicionada; vea la sección a continuación).
Inhibición condicionada
Típicamente, se usan tres fases de acondicionamiento.
Fase 1
Un CS (CS ) se empareja con un US hasta que se alcanzan los niveles asintóticos de CR.
Fase 2
Los ensayos CS / US continúan, pero estos se entremezclan con los ensayos en los que el CS se combina con un segundo CS, (el CS-) pero no con los EE. UU. (Es decir, los ensayos CS / CS-). Típicamente, los organismos muestran CR en los ensayos CS / US, pero dejan de responder en los ensayos CS / CS−.
Fase 3
Prueba de suma para la inhibición condicionada: el CS- de la fase 2 se presenta junto con un nuevo CS que fue condicionado como en la fase 1. La inhibición condicionada se encuentra si la respuesta es menor al par CS / CS- que al CS solo.
Prueba de retardo para la inhibición condicionada: el CS de la fase 2 está emparejado con los EE. UU. Si ha ocurrido una inhibición condicionada, la tasa de adquisición a la CS anterior debería ser menor que la tasa de adquisición que se encontraría sin el tratamiento de fase 2.
Bloqueo
Esta forma de condicionamiento clásico implica dos fases.
Fase 1
Un CS (CS) está emparejado con un EE. UU.
Fase 2
Un CS compuesto (CS CS) está emparejado con un US.
Prueba
Se realiza una prueba separada para cada CS (CS y CS). El efecto de bloqueo se observa en la falta de respuesta condicional a CS, lo que sugiere que la primera fase del entrenamiento bloqueó la adquisición de la segunda CS.
Teorías
Fuentes de datos
Los experimentos sobre cuestiones teóricas en el acondicionamiento se han realizado principalmente en vertebrados, especialmente ratas y palomas. Sin embargo, el acondicionamiento también se ha estudiado en invertebrados, y datos muy importantes sobre la base neuronal del acondicionamiento provienen de experimentos en la babosa de mar, Aplysia.
Los experimentos más relevantes han utilizado el procedimiento de condicionamiento clásico, aunque también se han utilizado experimentos de condicionamiento instrumental (operante), y la fuerza del condicionamiento clásico a menudo se mide a través de sus efectos operantes, como en la supresión condicionada (ver la sección Fenómenos anterior) y automodelado.
Teoría de la sustitución de estímulos
Según Pavlov, el condicionamiento no implica la adquisición de ningún comportamiento nuevo, sino más bien la tendencia a responder de manera antigua a los nuevos estímulos. Por lo tanto, teorizó que el CS simplemente sustituye a los Estados Unidos al evocar la respuesta refleja. Esta explicación se llama la teoría del condicionamiento de sustitución de estímulo.
84 Un problema crítico con la teoría de la sustitución del estímulo es que el CR y el UR no son siempre iguales. Pavlov mismo observó que la saliva de un perro producida como CR difería en composición de la producida como UR.El CR a veces es incluso lo opuesto al UR. Por ejemplo: la respuesta incondicional a la descarga eléctrica es un aumento en la frecuencia cardíaca, mientras que un CS que se ha emparejado con la descarga eléctrica provoca una disminución en la frecuencia cardíaca.
Sin embargo, se ha propuesto que solo cuando la UR no involucra el sistema nervioso central son los opuestos CR y UR).
Modelo Rescorla – Wagner
El modelo Rescorla – Wagner (R – W) es un modelo de condicionamiento relativamente simple pero potente. El modelo predice una serie de fenómenos importantes, pero también falla de manera importante, lo que lleva a una serie de modificaciones y modelos alternativos. Sin embargo, debido a que gran parte de la investigación teórica sobre el acondicionamiento en los últimos 40 años ha sido instigada por este modelo o sus reacciones, el modelo R-W merece una breve descripción aquí.
El modelo de Rescorla-Wagner argumenta que hay un límite en la cantidad de condicionamiento que puede ocurrir en el emparejamiento de dos estímulos. Un determinante de este límite es la naturaleza de los Estados Unidos. Por ejemplo: emparejar una campana con un bistec jugoso es más probable que produzca salivación que emparejar la campana con un trozo de pan seco, y es probable que el pan seco funcione mejor que un trozo de cartón.
Una idea clave detrás del modelo R – W es que un CS señala o predice los Estados Unidos. Se podría decir que antes del condicionamiento, el tema es sorprendido por los Estados Unidos. Sin embargo, después del condicionamiento, el sujeto ya no se sorprende, porque el CS predice la llegada de los EE. UU.
Tenga en cuenta que el modelo se puede describir matemáticamente y que palabras como predecir, sorprender y esperar solo se usan para ayudar a explicar el modelo. ) Aquí se ilustra el funcionamiento del modelo con breves relatos de adquisición, extinción y bloqueo. El modelo también predice una serie de otros fenómenos, consulte el artículo principal sobre el modelo.
Ecuación
Esta es la ecuación de Rescorla-Wagner. Especifica la cantidad de aprendizaje que ocurrirá en un solo emparejamiento de un estímulo condicionante (CS) con un estímulo no condicionado (US). La ecuación anterior se resuelve repetidamente para predecir el curso de aprendizaje en muchos de estos ensayos.
En este modelo, el grado de aprendizaje se mide por lo bien que la CS predice a los EE. UU., Lo cual viene dado por la «fuerza asociativa» de la CS. En la ecuación, V representa la fuerza asociativa actual de la CS, y ∆V es el cambio en esta fuerza que ocurre en una prueba dada. ΣV es la suma de las fuerzas de todos los estímulos presentes en la situación.
Λ es la fuerza asociativa máxima que un determinado EE. UU. apoyará; su valor generalmente se establece en 1 en los ensayos cuando los EE. UU. está presente y 0 cuando los EE. UU. están ausentes. α y β son constantes relacionadas con la prominencia de la CS y la velocidad de aprendizaje para un determinado Estados Unidos.
Cómo la ecuación predice varios resultados experimentales se explica en las siguientes secciones. Para más detalles, vea el artículo principal sobre el modelo. : 85–89
Modelo R – W: adquisición
El modelo R – W mide el condicionamiento asignando una «fuerza asociativa» a la CS y otros estímulos locales. Antes de que un CS esté condicionado, tiene una fuerza asociativa de cero. Emparejar la CS y los EE. UU. Provoca un aumento gradual de la fuerza asociativa de la CS. Este aumento está determinado por la naturaleza de los EE.
UU. (Por ejemplo, su intensidad). : 85–89La cantidad de aprendizaje que ocurre durante cualquier emparejamiento CS-US depende de la diferencia entre las fuerzas asociativas totales de CS y otros estímulos presentes en la situación (ΣV en la ecuación), y un máximo establecido por los EE. UU. (Λ en la ecuación ) En el primer emparejamiento de CS y EE.
UU., Esta diferencia es grande y la fuerza asociativa de CS toma un gran paso adelante. A medida que se acumulan los emparejamientos CS-EE. UU., Los EE. UU. Se vuelven más predecibles y el aumento de la fuerza asociativa en cada prueba se vuelve cada vez más pequeño. Finalmente, la diferencia entre la fuerza asociativa de la CS (más cualquiera que pueda derivarse de otros estímulos) y la fuerza máxima llega a cero.
Es decir, EE. UU. Está completamente predicho, la fuerza asociativa de la CS deja de crecer y el condicionamiento está completo.
Modelo R – W: extinción
El proceso asociativo descrito por el modelo R – W también explica la extinción (ver «procedimientos» arriba). El procedimiento de extinción comienza con una fuerza asociativa positiva de la CS, lo que significa que la CS predice que los EE. UU. Ocurrirán. En un ensayo de extinción, EE. UU. No se produce después de la CS.
Como resultado de este resultado «sorprendente», la fuerza asociativa de la CS disminuye un paso. La extinción se completa cuando la fuerza del CS llega a cero; no se pronostica EE. UU. y no se produce EE. UU. Sin embargo, si esa misma CS se presenta sin los EE. UU. Pero acompañada de un inhibidor condicionado (IC) bien establecido, es decir, un estímulo que predice la ausencia de un EE.
UU. (En términos de RW, un estímulo con una fuerza asociada negativa) entonces RW predice que el CS no se extinguirá (su V no disminuirá de tamaño).
Modelo R – W: bloqueo
La contribución más importante y novedosa del modelo R – W es su suposición de que el condicionamiento de un CS depende no solo de ese CS solo, y de su relación con los EE. UU., Sino también de todos los otros estímulos presentes en la situación de condicionamiento. En particular, el modelo establece que los Estados Unidos se predicen por la suma de las fuerzas asociativas de todos los estímulos presentes en la situación de condicionamiento.
El aprendizaje está controlado por la diferencia entre esta fuerza asociativa total y la fuerza respaldada por los Estados Unidos. Cuando esta suma de fuerzas alcanza un máximo establecido por los EE. UU., El condicionamiento termina como se acaba de describir. : 85–89
La explicación R – W del fenómeno de bloqueo ilustra una consecuencia de la suposición que se acaba de exponer. En el bloqueo (ver «fenómenos» arriba), CS se empareja con un US hasta que se complete el acondicionamiento. Luego, en ensayos de acondicionamiento adicionales, aparece un segundo estímulo (CS) junto con CS, y ambos son seguidos por los EE.
UU. Finalmente, CS se prueba y se muestra que no produce respuesta porque el aprendizaje inicial sobre CS fue «bloqueado» por el aprendizaje inicial sobre CS. El modelo R – W explica esto diciendo que después del acondicionamiento inicial, CS predice completamente los Estados Unidos. Dado que no hay diferencia entre lo que se predice y lo que sucede, no ocurre un nuevo aprendizaje en las pruebas adicionales con CS CS, por lo tanto, CS luego no produce respuesta.
Cuestiones teóricas y alternativas al modelo Rescorla – Wagner
Una de las principales razones de la importancia del modelo R – W es que es relativamente simple y hace predicciones claras. Las pruebas de estas predicciones han conducido a una serie de nuevos hallazgos importantes y a una comprensión considerablemente mayor del condicionamiento. Alguna información nueva ha apoyado la teoría, pero mucha no, y generalmente se acepta que la teoría es, en el mejor de los casos, demasiado simple.
Sin embargo, ningún modelo único parece explicar todos los fenómenos que han producido los experimentos. A continuación se presentan breves resúmenes de algunos temas teóricos relacionados.
Contenido del aprendizaje
El modelo R – W reduce el condicionamiento a la asociación de un CS y EE. UU., Y lo mide con un solo número, la fuerza asociativa del CS. Varios hallazgos experimentales indican que se aprende más que esto. Entre estos hay dos fenómenos descritos anteriormente en este artículo.
Inhibición latente: si un sujeto se expone repetidamente a la CS antes de que comience el acondicionamiento, entonces el acondicionamiento lleva más tiempo. El modelo R – W no puede explicar esto porque la exposición previa deja la fuerza de la CS sin cambios en cero.
Recuperación de la respuesta después de la extinción: Parece que algo queda después de que la extinción ha reducido la fuerza asociativa a cero porque varios procedimientos hacen que la respuesta vuelva a aparecer sin más condicionamiento.
Rol de atención en el aprendizaje
La inhibición latente puede ocurrir porque un sujeto deja de enfocarse en un CS que se ve con frecuencia antes de emparejarse con un EE. UU. De hecho, los cambios en la atención al CS están en el corazón de dos teorías prominentes que intentan hacer frente a los resultados experimentales que le dan dificultad al modelo R-W.
En uno de estos, propuesto por Nicholas Mackintosh, la velocidad del acondicionamiento depende de la cantidad de atención dedicada a la CS, y esta cantidad de atención depende a su vez de qué tan bien la CS predice a los Estados Unidos. Pearce y Hall propusieron un modelo relacionado basado en un principio atencional diferente Ambos modelos han sido ampliamente probados y ninguno explica todos los resultados experimentales.
En consecuencia, varios autores han intentado modelos híbridos que combinan los dos procesos atencionales. Pearce y Hall en 2010 integraron sus ideas atencionales e incluso sugirieron la posibilidad de incorporar la ecuación de Rescorla-Wagner en un modelo integrado.
Contexto
Como se indicó anteriormente, una idea clave en el condicionamiento es que la CS señala o predice a los Estados Unidos (ver «procedimiento de contingencia cero» más arriba). Sin embargo, por ejemplo, la sala en la que tiene lugar el acondicionamiento también «predice» que Estados Unidos puede ocurrir.
Aún así, la sala predice con mucha menos certeza que la propia CS experimental, porque la sala también está allí entre los ensayos experimentales, cuando los Estados Unidos están ausentes. El papel de dicho contexto se ilustra por el hecho de que los perros en el experimento de Pavlov a veces comenzaban a salivar cuando se acercaban al aparato experimental, antes de que vieran o escucharan cualquier CS.Tales estímulos llamados «contexto» siempre están presentes, y su influencia ayuda a explicar algunos hallazgos experimentales que de otra manera serían desconcertantes.
La fuerza asociativa de los estímulos contextuales se puede ingresar en la ecuación de Rescorla-Wagner, y juegan un papel importante en el comparador y las teorías computacionales esbozadas a continuación.
Teoría del comparador
Para descubrir lo que se ha aprendido, de alguna manera debemos medir el comportamiento («rendimiento») en una situación de prueba. Sin embargo, como los estudiantes saben muy bien, el rendimiento en una situación de prueba no siempre es una buena medida de lo que se ha aprendido. En cuanto al condicionamiento, existe evidencia de que los sujetos en un experimento de bloqueo aprenden algo sobre el CS «bloqueado», pero no muestran este aprendizaje debido a la forma en que generalmente se prueban.
Las teorías «comparativas» del condicionamiento están «basadas en el rendimiento», es decir, enfatizan lo que está sucediendo en el momento de la prueba. En particular, observan todos los estímulos que están presentes durante las pruebas y cómo pueden interactuar las asociaciones adquiridas por estos estímulos.
Para simplificar demasiado, las teorías de comparación suponen que durante el condicionamiento el sujeto adquiere asociaciones CS-US y context-US. En el momento de la prueba, estas asociaciones se comparan y se produce una respuesta a la CS solo si la asociación CS-US es más fuerte que la asociación contexto-US.
Después de que un CS y EE. UU. Se emparejan repetidamente en una adquisición simple, la asociación CS-EE. UU. Es fuerte y la asociación contexto-EE. UU. Es relativamente débil. Esto significa que el CS provoca un fuerte CR. En «contingencia cero» (ver arriba), la respuesta condicionada es débil o ausente porque la asociación contexto-EE.
UU. Es casi tan fuerte como la asociación CS-EE. UU. El bloqueo y otros fenómenos más sutiles también pueden explicarse mediante teorías de comparación, aunque, una vez más, no pueden explicar todo.
Teoría computacional
La necesidad de un organismo de predecir eventos futuros es fundamental para las teorías modernas del condicionamiento. La mayoría de las teorías usan asociaciones entre estímulos para cumplir con estas predicciones. Por ejemplo: en el modelo R – W, la fuerza asociativa de un CS nos dice cuán fuertemente ese CS predice un EE.
UU. Modelos como el propuesto por Gallistel y Gibbon (2000, 2002) sugieren un enfoque diferente para la predicción. Aquí la respuesta no está determinada por las fuerzas asociativas. En cambio, el organismo registra los tiempos de inicio y compensación de los CS y los EE. UU. Y los utiliza para calcular la probabilidad de que los EE.
UU. Sigan al CS. Varios experimentos han demostrado que los humanos y los animales pueden aprender a cronometrar eventos (ver Cognición animal), y el modelo Gallistel & Gibbon produce muy buenos ajustes cuantitativos a una variedad de datos experimentales. Sin embargo, estudios recientes han sugerido que los modelos basados en la duración no pueden explicar algunos hallazgos empíricos, así como los modelos asociativos.
Modelos basados en elementos
El modelo de Rescorla-Wagner trata un estímulo como una entidad única, y representa la fuerza asociativa de un estímulo con un número, sin registro de cómo se alcanzó ese número. Como se señaló anteriormente, esto dificulta que el modelo tenga en cuenta una serie de resultados experimentales. Se proporciona más flexibilidad al suponer que un estímulo está representado internamente por una colección de elementos, cada uno de los cuales puede cambiar de un estado asociativo a otro.
Por ejemplo, la similitud de un estímulo con otro puede representarse diciendo que los dos estímulos comparten elementos en común. Estos elementos compartidos ayudan a explicar la generalización del estímulo y otros fenómenos que pueden depender de la generalización. Además, diferentes elementos dentro del mismo conjunto pueden tener diferentes asociaciones, y sus activaciones y asociaciones pueden cambiar en diferentes momentos y a diferentes velocidades.
Esto permite que los modelos basados en elementos manejen algunos resultados inexplicables.
El modelo SOP
Un ejemplo destacado del enfoque de elementos es el modelo «SOP» de Wagner. El modelo ha sido elaborado de varias maneras desde su introducción, y ahora puede explicar en principio una gran variedad de hallazgos experimentales. El modelo representa cualquier estímulo dado con una gran colección de elementos.
El tiempo de presentación de varios estímulos, el estado de sus elementos y las interacciones entre los elementos determinan el curso de los procesos asociativos y los comportamientos observados durante los experimentos de acondicionamiento.
La cuenta SOP del condicionamiento simple ejemplifica algunos elementos esenciales del modelo SOP. Para empezar, el modelo supone que CS y US están representados por un gran grupo de elementos. Cada uno de estos elementos de estímulo puede estar en uno de tres estados:
- Actividad primaria (A): en términos generales, el estímulo es «atendido». (Las referencias a «atención» están destinadas únicamente a ayudar a la comprensión y no forman parte del modelo).
- Actividad secundaria (A): el estímulo se «atiende periféricamente».
- Inactivo (I): el estímulo «no se atiende».
De los elementos que representan un solo estímulo en un momento dado, algunos pueden estar en el estado A1, algunos en el estado A2 y algunos en el estado I.
Cuando aparece un estímulo por primera vez, algunos de sus elementos saltan de la inactividad I a la actividad primaria A1. Desde el estado A1, decaen gradualmente a A2, y finalmente regresan a I. La actividad del elemento solo puede cambiar de esta manera; en particular, los elementos en A2 no pueden volver directamente a A1.
Si los elementos tanto de la CS como de los EE. UU. Están en el estado A1 al mismo tiempo, se aprende una asociación entre los dos estímulos. Esto significa que si, en un momento posterior, el CS se presenta antes que los EE. UU., Y algunos elementos del CS ingresan a A1, estos elementos activarán algunos elementos de los EE.
UU. Sin embargo, los elementos de EE. UU. Activados indirectamente de esta manera solo se incrementan al estado A2. (Esto puede pensarse en que la CS está despertando un recuerdo de los EE. UU., Que no será tan fuerte como la realidad). Con los repetidos ensayos CS-US, se asocian más y más elementos, y cada vez más elementos de EE.
UU. pasan a A2 cuando se activa el CS. Esto deja gradualmente cada vez menos elementos de EE. UU. Que pueden ingresar a A1 cuando aparece el propio EE. UU. En consecuencia, el aprendizaje se ralentiza y se acerca a un límite. Se podría decir que EE. UU. Está «completamente predicho» o «no es sorprendente» porque casi todos sus elementos solo pueden entrar en A2 cuando se activa el CS, dejando pocos para formar nuevas asociaciones.
El modelo puede explicar los hallazgos que representan el modelo de Rescorla-Wagner y una serie de hallazgos adicionales también. Por ejemplo, a diferencia de la mayoría de los otros modelos, SOP tiene en cuenta el tiempo. El aumento y la disminución de la activación del elemento permite que el modelo explique los efectos dependientes del tiempo, como el hecho de que el condicionamiento es más fuerte cuando la CS llega justo antes de los EE.
UU., Y que cuando la CS viene después de los EE. UU. («Condicionamiento hacia atrás») el resultado A menudo es un CS inhibitorio. También se explican muchos otros fenómenos más sutiles.
En los últimos años han aparecido otros modelos poderosos que incorporan representaciones de elementos. Esto a menudo incluye el supuesto de que las asociaciones involucran una red de conexiones entre «nodos» que representan estímulos, respuestas y quizás una o más capas «ocultas» de interconexiones intermedias.
Dichos modelos hacen contacto con una explosión actual de investigación sobre redes neuronales, inteligencia artificial y aprendizaje automático.
Aplicaciones
Bases neuronales del aprendizaje y la memoria
Pavlov propuso que el condicionamiento involucraba una conexión entre los centros cerebrales para estímulos condicionados y no condicionados. Su descripción fisiológica del condicionamiento ha sido abandonada, pero el condicionamiento clásico continúa utilizándose para estudiar las estructuras y funciones neuronales que subyacen en el aprendizaje y la memoria.
Las formas de acondicionamiento clásico que se usan para este propósito incluyen, entre otras, el acondicionamiento por miedo, el acondicionamiento de parpadeo y el acondicionamiento de la contracción del pie de Hermissenda crassicornis, una babosa de mar. Tanto el miedo como el acondicionamiento del parpadeo implican un estímulo neutral, con frecuencia un tono, que se combina con un estímulo incondicionado.
En el caso del acondicionamiento de parpadeo, los EE. UU. Son un soplo de aire, mientras que por temor a condicionarse, los EE. UU. Son amenazantes o aversivos, como un choque en el pie.
Los datos disponibles demuestran que las regiones discretas del cerebelo y las áreas asociadas del tronco encefálico contienen neuronas que alteran su actividad durante el acondicionamiento. Estas regiones son críticas para la adquisición y el desempeño de esta simple tarea de aprendizaje. Parece que otras regiones del cerebro, incluido el hipocampo, amígdala y corteza prefrontal, contribuyen al proceso de acondicionamiento, especialmente cuando las demandas de la tarea se vuelven más complejas «.
El acondicionamiento por miedo y parpadeo generalmente implica un circuito neuronal no superpuesto, pero comparte mecanismos moleculares. El acondicionamiento del miedo ocurre en la amígdala basolateral, que recibe información glutaminérgica directamente de los aferentes talámicos, así como indirectamente de las proyecciones prefrontales.
Las proyecciones directas son suficientes para retrasar el condicionamiento, pero en el caso del condicionamiento de trazas, donde el CS debe estar representado internamente a pesar de la falta de estímulo externo, son necesarias vías indirectas. El cingulado anterior es un candidato para el acondicionamiento de trazas intermedio, pero el hipocampo también puede desempeñar un papel importante.
Activación presináptica de la proteína quinasa A y activación postsináptica de los receptores NMDAy su vía de transducción de señales son necesarias para acondicionar la plasticidad relacionada. CREB también es necesario para acondicionar la plasticidad relacionada, y puede inducir la síntesis de proteínas aguas abajo necesaria para que esto ocurra.
Como los receptores NMDA solo se activan después de un aumento en el calcio presináptico (liberando así el bloqueo de Mg ), son un detector de coincidencia potencial que podría mediar la plasticidad dependiente del tiempo de pico. STDP restringe LTP a situaciones en las que el CS predice los EE. UU.
Y LTD al revés.
Terapias conductuales
Algunas terapias asociadas con el condicionamiento clásico son la terapia de aversión, la desensibilización sistemática y las inundaciones. La terapia de aversión es un tipo de terapia conductual diseñada para hacer que los pacientes dejen de tener un hábito indeseable al asociar el hábito con un fuerte estímulo desagradable y desagradable.
336 Por ejemplo, un medicamento podría usarse para asociar el sabor del alcohol con el malestar estomacal. La desensibilización sistemática es un tratamiento para las fobias en el que el paciente está entrenado para relajarse mientras está expuesto a estímulos progresivamente más que provocan ansiedad (por ejemplo, palabras de enojo).
Este es un ejemplo de contracondicionamiento, destinado a asociar los estímulos temidos con una respuesta (relajación) que es incompatible con la ansiedad : 136 Las inundaciones son una forma de desensibilización que intenta eliminar las fobias y las ansiedades mediante la exposición repetida a estímulos altamente angustiantes hasta la falta de refuerzo del La respuesta de ansiedad provoca su extinción.
133 «Inundaciones» generalmente implica una exposición real a los estímulos, mientras que el término «implosión» se refiere a una exposición imaginada, pero los dos términos a veces se usan como sinónimos.
Las terapias de acondicionamiento generalmente toman menos tiempo que las terapias humanistas.
Respuesta a drogas condicionadas
Un estímulo que está presente cuando se administra o consume un medicamento puede eventualmente evocar una respuesta fisiológica condicionada que imita el efecto del medicamento. Este es a veces el caso con la cafeína; los bebedores habituales de café pueden descubrir que el olor del café les da una sensación de alerta.
En otros casos, la respuesta condicionada es una reacción compensatoria que tiende a compensar los efectos de la droga. Por ejemplo, si un medicamento hace que el cuerpo se vuelva menos sensible al dolor, la reacción condicionada compensatoria puede ser la que hace que el usuario sea más sensible al dolor.
Esta reacción compensatoria puede contribuir a la tolerancia a los medicamentos.. Si es así, un usuario de drogas puede aumentar la cantidad de droga consumida para sentir sus efectos y terminar tomando cantidades muy grandes de la droga. En este caso, puede producirse una reacción de sobredosis peligrosa si el CS está ausente, de modo que no se produce el efecto compensatorio condicionado.
Por ejemplo, si el medicamento siempre se ha administrado en la misma habitación, los estímulos proporcionados por esa habitación pueden producir un efecto compensatorio condicionado; entonces puede ocurrir una reacción de sobredosis si el medicamento se administra en una ubicación diferente donde los estímulos condicionados están ausentes.
Hambre condicionada
Las señales que preceden constantemente la ingesta de alimentos pueden convertirse en estímulos condicionados para un conjunto de respuestas corporales que preparan al cuerpo para la alimentación y la digestión. Estas respuestas reflexivas incluyen la secreción de jugos digestivos en el estómago y la secreción de ciertas hormonas en el torrente sanguíneo, e inducen un estado de hambre.
Un ejemplo de hambre condicionada es el «efecto aperitivo». Cualquier señal que preceda constantemente a una comida, como un reloj que indica que es hora de cenar, puede hacer que las personas se sientan más hambrientas que antes de la señal. El hipotálamo lateral (LH) está involucrado en el inicio de la alimentación.
Se ha demostrado que la vía nigrostriatal, que incluye la sustancia negra, el hipotálamo lateral y los ganglios basales, está involucrada en la motivación del hambre.
Respuesta emocional condicionada
La influencia del condicionamiento clásico se puede ver en las respuestas emocionales como la fobia, el asco, las náuseas, la ira y la excitación sexual. Un ejemplo familiar son las náuseas condicionadas, en las que el CS es la vista o el olor de un alimento en particular que en el pasado ha provocado un malestar estomacal incondicionado.
Del mismo modo, cuando la CS es la vista de un perro y los Estados Unidos son el dolor de ser mordidos, el resultado puede ser un miedo condicionado a los perros. Un ejemplo de respuesta emocional condicionada es la supresión condicionada.
Como mecanismo de adaptación, el condicionamiento emocional ayuda a proteger a un individuo del daño o lo prepara para eventos biológicos importantes como la actividad sexual. Por lo tanto, un estímulo que se ha producido antes de la interacción sexual causa excitación sexual, lo que prepara al individuo para el contacto sexual.
Por ejemplo, la excitación sexual se ha condicionado en sujetos humanos al combinar un estímulo como una imagen de un frasco de centavos con vistas de un clip de película erótica. Experimentos similares con peces gourami azules y codornices domesticadas han demostrado que dicho acondicionamiento puede aumentar el número de crías.
Estos resultados sugieren que las técnicas de acondicionamiento podrían ayudar a aumentar las tasas de fertilidad en individuos infértiles y especies en peligro de extinción.
Transferencia instrumental pavloviana
La transferencia instrumental pavloviana es un fenómeno que ocurre cuando un estímulo condicionado (CS, también conocido como «señal») que se ha asociado con estímulos gratificantes o aversivos a través del condicionamiento clásico altera la prominencia motivacional y el comportamiento operante. En un experimento típico, una rata se presenta con emparejamientos de comida sana (acondicionamiento clásico).
Por separado, la rata aprende a presionar una palanca para obtener comida (condicionamiento operante). Las sesiones de prueba ahora muestran que la rata presiona la palanca más rápido en presencia del sonido que en silencio, aunque el sonido nunca se ha asociado con la presión de la palanca.
Se sugiere que la transferencia instrumental pavloviana desempeñe un papel en el efecto de resultados diferenciales, un procedimiento que mejora la discriminación operante al combinar estímulos con resultados específicos.
En cultura popular
En la novela de 1932 Brave New World de Aldous Huxley, el condicionamiento juega un papel clave en el mantenimiento de la paz social, especialmente en el mantenimiento del sistema de castas en el que se basa la sociedad. Otro ejemplo está en la novela distópica de 1962 de Anthony Burgess, La Naranja Mecánica, en la que el antihéroe y protagonista de la novela, Alex, se somete a un procedimiento llamado técnica Ludovico, donde recibe una solución para causar náuseas graves y luego se ve obligado a mirar actos violentos..
Esto lo hace incapaz de realizar actos violentos sin inducir náuseas similares. Sin querer, también forma una aversión a la música clásica.
Algunos ejemplos generales que involucran la teoría del condicionamiento clásico en acción incluyen, en muchos casos, la publicidad. Esta es una táctica utilizada para obtener una respuesta. La publicidad en programas de juegos es uno de los muchos ejemplos. Con el entorno emocionante y positivo de un programa de juegos, el espectador puede comenzar a generar una respuesta emocionante a la publicidad debido a la asociación con el entorno.
Otro ejemplo, muy similar al experimento de Pavlov, involucra la comida. Cada vez que una persona entra a la cocina, comienza a sentir hambre. Esto también puede relacionarse con comer ciertos alimentos mientras se ve una película de terror que se convierte en asociar el terror con la comida que se consumía en el momento de ver la película.
Cualquier tipo de música, como música navideña,