Qu'est-ce que le conditionnement opérant ? Définition et exemples

Lapin regardant la carotte sur un bâton

Microzoaires / Getty Images.





Le conditionnement opérant se produit lorsqu'une association est faite entre un comportement particulier et une conséquence de ce comportement. Cette association est construite sur l'utilisation de renforcement et/ou de punition pour encourager ou décourager un comportement. Le conditionnement opérant a été défini et étudié pour la première fois par le psychologue comportemental B.F. Skinner, qui a mené plusieurs expériences de conditionnement opérant bien connues avec des sujets animaux.

Principaux points à retenir : conditionnement opérant

  • Le conditionnement opérant est le processus d'apprentissage par renforcement et punition.
  • Dans le conditionnement opérant, les comportements sont renforcés ou affaiblis en fonction des conséquences de ce comportement.
  • Le conditionnement opérant a été défini et étudié par le psychologue comportemental B.F. Skinner.

Origines

B.F. Skinner était un comportementaliste , ce qui signifie qu'il croyait que la psychologie devait se limiter à l'étude des comportements observables. Alors que d'autres comportementalistes, comme John B. Watson, se concentraient sur le conditionnement classique, Skinner s'intéressait davantage à l'apprentissage qui se faisait par le conditionnement opérant.





Il a observé que dans réponses de conditionnement classiques ont tendance à être déclenchés par des réflexes innés qui se produisent automatiquement. Il a appelé ce genre de comportement intimé . Il a distingué comportement répondant à partir du comportement opérant . Comportement de l'opérateur était le terme utilisé par Skinner pour décrire un comportement qui est renforcé par les conséquences qui le suivent. Ces conséquences jouent un rôle important dans la réitération ou non d'un comportement.

de Skinner les idées étaient basées sur La loi de l'effet d'Edward Thorndike, qui stipule qu'un comportement qui entraîne des conséquences positives sera probablement répété, tandis qu'un comportement qui entraîne des conséquences négatives ne sera probablement pas répété. Skinner a introduit le concept de renforcement dans les idées de Thorndike, précisant qu'un comportement renforcé sera probablement répété (ou renforcé).



Pour étudier le conditionnement opérant, Skinner a mené des expériences à l'aide d'une Skinner Box, une petite boîte qui avait un levier à une extrémité qui fournirait de la nourriture ou de l'eau lorsqu'il était pressé. Un animal, comme un pigeon ou un rat, était placé dans la boîte où il était libre de se déplacer. Finalement, l'animal appuyait sur le levier et était récompensé. Skinner a découvert que ce processus faisait que l'animal appuyait plus fréquemment sur le levier. Skinner mesurait l'apprentissage en suivant le taux de réponses de l'animal lorsque ces réponses étaient renforcées.

Renforcement et punition

Grâce à ses expériences, Skinner a identifié les différents types de renforcement et de punition qui encouragent ou découragent le comportement.

Renforcement

Le renforcement qui suit de près un comportement encouragera et renforcera ce comportement. Il existe deux types de renfort :

    Renforcement positifse produit lorsqu'un comportement aboutit à un résultat favorable, par ex. un chien recevant une friandise après avoir obéi à un ordre, ou un élève recevant un compliment de l'enseignant après s'être bien comporté en classe. Ces techniques augmentent la probabilité que l'individu répète le comportement souhaité afin de recevoir à nouveau la récompense.Renforcement négatifse produit lorsqu'un comportement entraîne la suppression d'une expérience défavorable, par ex. un expérimentateur cessant de donner à un singe des décharges électriques lorsque le singe appuie sur un certain levier. Dans ce cas, le comportement d'appui sur le levier est renforcé car le singe voudra à nouveau supprimer les chocs électriques défavorables.

De plus, Skinner a identifié deux types différents de renforçateurs.



    Renforçateurs primairesrenforcent naturellement le comportement parce qu'ils sont intrinsèquement désirables, par ex. aliments.Renforçateurs conditionnésrenforcer les comportements non pas parce qu'ils sont intrinsèquement désirables, mais parce que nous apprendre de les associer à des renforçateurs primaires. Par exemple, le papier-monnaie n'est pas intrinsèquement souhaitable, mais il peut être utilisé pour acquérir des biens intrinsèquement souhaitables, tels que la nourriture et le logement.

Châtiment

La punition est le contraire du renforcement. Lorsque la punition suit un comportement, elle décourage et affaiblit ce comportement. Il existe deux types de punition.

    Punition positive(ou punition par application) se produit lorsqu'un comportement est suivi d'un résultat défavorable, par ex. un parent donnant une fessée à un enfant après que l'enfant ait utilisé un juron.Punition négative(ou punition par suppression) se produit lorsqu'un comportement conduit à la suppression de quelque chose de favorable, par ex. un parent qui refuse à un enfant son allocation hebdomadaire parce que l'enfant s'est mal conduit.

Bien que la punition soit encore largement utilisée, Skinner et de nombreux autres chercheurs ont découvert que la punition n'est pas toujours efficace. La punition peut supprimer un comportement pendant un certain temps, mais le comportement indésirable a tendance à revenir à long terme. La punition peut également avoir des effets secondaires indésirables. Par exemple, un enfant qui est puni par un enseignant peut devenir incertain et craintif parce qu'il ne sait pas exactement quoi faire pour éviter de futures punitions.



Au lieu de punir, Skinner et d'autres ont suggéré de renforcer les comportements souhaités et d'ignorer les comportements indésirables. Renforcement dit à un individu quel comportement est souhaité, tandis que la punition indique seulement à l'individu quel comportement n'est pas souhaité.

Façonnage du comportement

Le conditionnement opérant peut conduire à des comportements de plus en plus complexes à travers mise en forme , également appelée méthode des approximations. La mise en forme se produit étape par étape à mesure que chaque partie d'un comportement plus complexe est renforcée. La mise en forme commence par renforcer la première partie du comportement. Une fois que cette partie du comportement est maîtrisée, le renforcement ne se produit que lorsque la deuxième partie du comportement se produit. Ce schéma de renforcement se poursuit jusqu'à ce que l'ensemble du comportement soit maîtrisé.



Par exemple, lorsqu'on apprend à nager à un enfant, on peut d'abord le féliciter simplement pour être entré dans l'eau. Elle est à nouveau félicitée lorsqu'elle apprend à donner des coups de pied, et à nouveau lorsqu'elle apprend des coups de bras spécifiques. Enfin, elle est félicitée pour se propulser dans l'eau en exécutant un coup spécifique et en donnant des coups de pied en même temps. Grâce à ce processus, tout un comportement a été façonné.

Horaires de Renforcement

Dans le monde réel, le comportement n'est pas constamment renforcé. Skinner a découvert que la fréquence du renforcement peut avoir un impact sur la rapidité et le succès de l'apprentissage d'un nouveau comportement. Il a spécifié plusieurs programmes de renforcement, chacun avec des horaires et des fréquences différents.



    Renforcement continuse produit lorsqu'une réponse particulière suit chaque exécution d'un comportement donné. L'apprentissage se fait rapidement avec un renforcement continu. Cependant, si le renforcement est arrêté, le comportement déclinera rapidement et finira par s'arrêter complètement, ce que l'on appelle l'extinction.Horaires à taux fixerécompenser le comportement après un nombre spécifié de réponses. Par exemple, un enfant peut obtenir une étoile toutes les cinq tâches accomplies. Selon ce calendrier, le taux de réponse ralentit juste après la remise de la récompense.Horaires à ratio variablevarier le nombre de comportements requis pour obtenir une récompense. Ce calendrier conduit à un taux élevé de réponses et est également difficile à éteindre car sa variabilité maintient le comportement. Les machines à sous utilisent ce type de programme de renforcement.Horaires à intervalles fixesfournir une récompense après un certain laps de temps. Être payé à l'heure est un exemple de ce type de programme de renforcement. Tout comme le calendrier à ratio fixe, le taux de réponse augmente à mesure que la récompense approche, mais ralentit juste après la réception de la récompense.Horaires à intervalles variablesvarier le temps entre les récompenses. Par exemple, un enfant qui reçoit une allocation à différents moments de la semaine tant qu'il a manifesté des comportements positifs est sur un horaire à intervalles variables. L'enfant continuera d'afficher un comportement positif dans l'attente de recevoir éventuellement son allocation.

Exemples de conditionnement opérant

Si vous avez déjà dressé un animal de compagnie ou enseigné à un enfant, vous avez probablement utilisé le conditionnement opérant dans votre propre vie. Le conditionnement opérant est encore fréquemment utilisé dans diverses circonstances du monde réel, y compris en classe et dans des contextes thérapeutiques.

Par exemple, un enseignant peut encourager les élèves à faire leurs devoirs régulièrement en donnant périodiquement des quiz pop qui posent des questions similaires aux devoirs récents. De plus, si un enfant fait une crise de colère pour attirer l'attention, le parent peut ignorer le comportement, puis reconnaître à nouveau l'enfant une fois la crise terminée.

Le conditionnement opérant est également utilisé dans modification du comportement , une approche du traitement de nombreux problèmes chez les adultes et les enfants, notamment les phobies, l'anxiété, l'énurésie nocturne et bien d'autres. La modification du comportement peut être mise en œuvre par le biais d'un Économie symbolique , dans lequel les comportements souhaités sont renforcés par des jetons sous forme de badges numériques, de boutons, de puces, d'autocollants ou d'autres objets. Finalement, ces jetons peuvent être échangés contre de vraies récompenses.

Critiques

Alors que le conditionnement opérant peut expliquer de nombreux comportements et est encore largement utilisé, il existe plusieurs critiques du processus. Premièrement, le conditionnement opérant est accusé d'être un explication incomplète pour l'apprentissage parce qu'il néglige le rôle des éléments biologiques et cognitifs.

De plus, le conditionnement opérant dépend d'un Figure d'autorité renforcer le comportement et ignore le rôle de la curiosité et la capacité d'un individu à faire ses propres découvertes. Les critiques s'opposent à l'accent mis par le conditionnement opérant sur le contrôle et la manipulation du comportement, arguant qu'ils peuvent conduire à des pratiques autoritaires. Skinner pensait cependant que les environnements contrôlaient naturellement le comportement et que les gens pouvaient choisir d'utiliser ces connaissances pour le meilleur ou pour le pire.

Enfin, parce que les observations de Skinner sur le conditionnement opérant reposaient sur des expériences avec des animaux, on lui reproche extrapoler de ses études sur les animaux pour faire des prédictions sur le comportement humain. Certains psychologues pensent que ce type de généralisation est erroné car les humains et les animaux non humains sont physiquement et cognitivement différents.

Sources