Antecedentes del condicionamiento operante
El condicionamiento operante tal y como lo conocemos fue formulado y sistematizado
por Burrhus Frederic Skinner.
Diferencia entre condicionamiento clásico y operante
La diferencia principal entre el condicionamiento clásico y el operante es que
el primero se refiere al aprendizaje de información sobre un estímulo,
mientras que el segundo implica un aprendizaje sobre las consecuencias de
la respuesta.
Conceptos del condicionamiento operante
Respuesta instrumental u operante
Este término designa cualquier conducta que conlleva una consecuencia
determinada y es susceptible de cambiar en función de ésta. Su nombre
indica que sirve para obtener algo (instrumental) y que actúa sobre el
medio (operante) en lugar de ser provocada por éste, como sucede en el caso
del condicionamiento clásico o respondiente.
En la teoría conductista la palabra “respuesta” es básicamente equivalente a
“conducta” y “acción”, si bien “respuesta” parece hacer referencia en mayor
medida a la presencia de estímulos antecedentes.
Consecuencia
En la psicología conductista y cognitivo-conductual una consecuencia es el
resultado de una respuesta. La consecuencia puede ser positiva (refuerzo) o
negativa (castigo) para el sujeto que lleve a cabo la conducta; en el primer
caso la probabilidad de que se dé la respuesta aumentará y en el segundo
disminuirá.
Es importante tener en cuenta que las consecuencias afectan a la respuesta y,
por tanto, en el condicionamiento operante lo que es reforzado o castigado es
dicha conducta, no la persona o el animal que la lleva a cabo. En todo
momento se trabaja con la intención de influir en el modo en el que se
relacionan los estímulos y las respuestas, ya que desde la filosofía
conductista se evita partir desde una visión esencialista de las personas,
poniendo más énfasis en aquello que puede cambiar que en lo que siempre
parece permanecer igual.
Reforzamiento
Este término designa las consecuencias de las conductas cuando hacen más
probable que se vuelvan a dar. El reforzamiento puede ser positivo, en cuyo
caso estaremos hablando de la obtención de una recompensa o premio por la
ejecución de una respuesta, o negativo, que engloba la desaparición de
estímulos aversivos.
Dentro del reforzamiento negativo podemos distinguir entre respuestas de
evitación y de escape. Las conductas de evitación previenen o impiden la
aparición de un estímulo aversivo; por ejemplo, una persona
con agorafobia que no sale de casa porque así no siente ansiedad está
evitando esta emoción. En cambio las respuestas de escape hacen que el
estímulo desaparezca cuando ya está presente.
La diferencia con la palabra “reforzador” es que ésta se refiere al evento que
se da como consecuencia de la conducta en vez de al procedimiento de
premiar o castigar. Por tanto, “reforzador” es un término más cercano a
“recompensa” y “premio” que a “reforzamiento”.
Castigo
Un castigo es cualquier consecuencia de una conducta determinada que
disminuya la probabilidad de que ésta se repita.
Como el reforzamiento, el castigo puede ser positivo o negativo. El castigo
positivo se corresponde con la presentación de un estímulo aversivo después
de que se produzca la respuesta, mientras que el castigo negativo es la
retirada de un estímulo apetitivo como consecuencia de la conducta.
El castigo positivo se puede relacionar con el uso que se da en general a la
palabra “castigo”, mientras que el castigo negativo se refiere más bien a algún
tipo de sanción o multa. Si un niño no deja de gritar y recibe una bofetada de
su madre para que se calle se le estará aplicando un castigo positivo, mientras
que si en vez de eso le quita la consola a la que está jugando recibirá un
castigo negativo.
Estímulo discriminativo y estímulo delta
En Psicología, la palabra “estímulo” se utiliza para designar eventos que
provocan una respuesta por parte de una persona o animal. Dentro del
paradigma operante, el estímulo discriminativo es aquel cuya presencia indica
al sujeto de aprendizaje que si lleva a cabo una determinada conducta ésta
tendrá como consecuencia la aparición de un reforzador o de un castigo.
Por contra, la expresión “estímulo delta” se refiere a aquellas señales que, al
estar presentes, informan de que la ejecución de la respuesta no conllevará
consecuencias.
¿En qué consiste el condicionamiento
operante?
El condicionamiento instrumental u operante es un procedimiento de
aprendizaje que se basa en que la probabilidad de que se dé una respuesta
determinada depende de las consecuencias esperadas. En el
condicionamiento operante la conducta es controlada por estímulos
discriminativos presentes en la situación de aprendizaje que transmiten
información sobre las consecuencias probables de la respuesta.
Por ejemplo, un cartel de “Abierto” en una puerta nos indica que si intentamos
girar el pomo lo más probable es que se abra. En este caso el cartel sería el
estímulo discriminativo y la apertura de la puerta funcionaría como reforzador
positivo de la respuesta instrumental de girar el pomo.
¿Cómo funciona?
El condicionamiento operante busca la modificación de la conducta. Si
alguien esgrime una conducta que quiere mantenerse o promoverse, se
introduce algo que la refuerce, como un premio.
Si la conducta quiere eliminarse se introduce un castigo o se le quita un
premio. De este modo, se fortalecen las conductas seguidas de
una recompensa y se dejan de estimular las que son seguidas de un
castigo.
Los elementos del condicionamiento operante
En el condicionamiento operante hay factores o elementos positivos y
negativos que entran en juego frente a una conducta. Son los
siguientes:
• Reforzador positivo: cuando tras una conducta se adiciona una
recompensa. Incrementa la frecuencia de esa conducta. Por ejemplo,
felicitar, dar un premio, otorgar comisiones.
• Reforzador negativo: ocurre cuando tras la conducta se elimina un
estímulo aversivo. También promueve esa conducta. Por ejemplo,
dejar de reñirle al otro o permitirle salir antes del horario habitual.
• Castigo positivo: cuando se presenta una conducta y se produce un
castigo. Esto desalienta tal conducta. Por ejemplo, regañar o dar
trabajo extra.
• Castigo negativo: si después de la conducta se elimina una
recompensa. Por ejemplo, no hablar, no contestar o no interactuar.
Los programas de condicionamiento
Los programas de condicionamiento tienen que ver con la frecuencia
o la intensidad con la que se introducen las recompensas y los
castigos. Esto depende del efecto que se quiera lograr.
Así las cosas, hay 5 posibles programas:
1. Continuo. Cada vez que se presenta la conducta se produce la
consecuencia.
2. Razón fija. Cuando solo se introduce el refuerzo después de un
determinado número de veces que se haya producido la conducta.
3. Intervalos fijos. Se introduce el refuerzo si el comportamiento tiene
lugar durante un determinado periodo de tiempo.
4. Razón variable. El refuerzo se introduce al azar, después de un
número indeterminado de conductas repetidas.
5. Intervalo variable. El refuerzo se introduce al azar tras un lapso
indeterminado de tiempo.
Técnicas operantes para desarrollar conductas
• Instigación: incluye las instrucciones, la guía física y el modelado. Ofrece los
parámetros para que alguien aprenda cómo se realiza una acción. Por ejemplo, premiar al
mejor alumno de la clase para que los demás lo imiten.
• Moldeamiento: se cambia una conducta de manera gradual hasta conseguir la conducta
que se espera. Se premian solo los avances.
• Desvanecimiento: se retiran las ayudas o instigadores de forma paulatina. El objetivo
es aprender la conducta por sí solo. Se premia el avance en la autonomía.
• Encadenamiento: se separa la conducta en diferentes partes. La persona debe aprender
una a una esas partes hasta que consiga la conducta completa. Cada eslabón debe reforzar el
anterior.
• Programas de reforzamiento: pueden ser continuos, de razón o de intervalo.
Técnicas operantes para reducir o eliminar
conductas.
• Extinción: se deja de recompensar una conducta que antes había
sido reforzada. Por ejemplo, se ignora a un niño que hace una
pataleta.
• Entrenamiento de omisión: consiste en privar de algo que agrada
en respuesta a una conducta inadecuada. Por ejemplo, se le impide al
niño ver televisión si se portó mal.
• Programas de reforzamiento diferencial: se reducen algunas
conductas, aumentando la recompensa en otras. Por ejemplo, se
premia a un niño por comer alimentos saludables.
• Coste de respuesta: es privar de una recompensa. Por ejemplo, se le
quita al niño un juguete que se le había regalado.
• Tiempo fuera: es aislar a alguien en un entorno que no le ofrezca
estímulos.
• Saciedad: se repite muchas veces la conducta o se proporciona
muchas veces el estímulo hasta que deje de ser deseable.
• Sobrecorrección: es el castigo positivo. Por ejemplo, hacer que el
niño recoja los juguetes que ha tirado y que, además, limpie la
habitación.
¿En qué se utiliza?
El condicionamiento operante se emplea en muchos ámbitos. En los
ejemplos que hemos utilizado, es claro que aplica para la crianza de los
niños.
Pero también hay utilidad en el mundo de la educación y del trabajo. En
la publicidad, las ofertas y los descuentos son un ejemplo de ello.
Dentro del plano terapéutico, el condicionamiento operante se emplea
para superar fobias y adicciones. Mediante diferentes estrategias se busca
eliminar el miedo irracional o la conducta compulsiva.
De cualquier modo, el enfoque también tiene sus críticos. Algunos piensan
que moldear la conducta del ser humano a partir de intervenciones
externas es una forma de coartar la libertad. Así mismo, puede inducir
conductas que solo benefician a unos pocos.