Le conditionnement opérant

L’éducation canine, comme nous aimons l’appeler, n’est pas qu’une simple question d’obéissance. Nous avons la chance d’être les heureux propriétaires de Golden Retriever et leurs caractères, que nous aimons chez eux, nous le démontre chaque jour. Alors posons nos valises et réfléchissons 5 minutes.

L’utilisation du conditionnement est inhérente à l’éducation et l’apprentissage. Un petit peu de théorie pour clarifier les propos qui suivent. Tout ceci est largement documenté sur internet et le texte qui suit en est largement inspiré. Nous n’avons rien inventé, mais nous y adhèrons.

Nous ne nous éterniseons pas sur le conditionnement classique ou répondant qui est basé sur l’apprentissage dû à l’association entre des stimulis de l’environnement et les réactions automatiques du chien (Pavlov). Un réflexe étant une réponse involontaire ou automatique qui échappe à la volonté du chien.

Avant de parler proprement dit du conditionnement opérant il est important de se remémorer les notions de renforcements, bases de tout apprentissage. Il y en a quatre :

1- Le renforcement positif (R +) c’est ajouter une conséquence au comportement du chien qui fera augmenter celui-ci. C’est précisément cette conséquence qui définit ce qui est un renforcement positif (en clair, si le comportement n’augmente pas, ce n’est pas un renforcement positif). Comprenez, dès lors, l’absurdité de la phrase « j’ai essayé le renforcement positif mais ça ne marche pas ».

C’est le comportement qui définit le renforcement, pas les croyances du maître. Au chapitre des donneurs de conseils « il ne faut pas travailler à la friandise, la caresse suffit » ou encore « il vaut mieux travailler au jouet ». Ce que vous définissez être une récompense n’est pas, automatiquement, un renforcement – c’est, encore une fois et nous insistons – le comportement de votre « chien » qui déterminera ce qui et ce qui n’est pas un renforcement positif. Il est par contre, et par conséquence, tout à fait juste de considérer que votre bout de saucisse ou de fromage n’est pas l’unique réponse possible.

2- Le renforcement négatif (R-) c’est enlever quelque chose en conséquence du comportement du chien qui fera que le comportement en question diminue. Contraindre un chien physiquement par exemple : le chien cesse de gigoter, tirer et la contrainte physique disparaît. Le collier étrangleur également : le chien cesse de tirer, l’inconfort (suffocation) disparaît. C’est le fondement de la technique de « pressure release » on inflige au chien un inconfort physique ou émotionnel que l’on retire quand ses comportement de fuite ou d’évitement cessent. Inutile de dire que c’est une manière de faire qui provoque du stress par définition et, pour nous, à proscrire absolument.

3- La punition positive (P+) c’est ajouter une conséquence au comportement du chien qui fera que celui-ci diminue (hurler, frapper, provoquer la peur et/ou la douleur). A éviter impérativement avec n’importe quel chien ou n’importe quel être vivant en ce qui me concerne mais dramatique (et dangereux) sur un chien craintif, réactif et/ou agressif. Même si le comportement diminue (confirmant que la conséquence était bel et bien une punition), les problèmes ressurgiront ailleurs et sous une autre forme tout à fait inattendue, soyez-en certains. La relation entre l’animal et vous sera définitivement modifiée pour le pire et c’est à peu près le contraire de ce que nous cherchons à faire.

4- La punition négative (P-) c’est enlever quelque chose qui a une valeur pour le chien en conséquence immédiate de son comportement et qui fera diminuer celui-ci. L’exemple le plus classique : le chien vous saute dessus et nous lui tournons le dos ou nous nous éloignons. A considérer : il est impératif de penser à anticiper par le renforcement positif d’un comportement alternatif. Demandez un assis au chien avant qu’il ne vous saute dessus (pour autant que ce comportement soit connu et ait été abondamment récompensé évidemment). Évitez de créer une chaîne de comportements : je saute sur la personne ==> je m’assieds ==> je suis récompensé.

Pour simplifier le discours et faire simple retenez ceci :
R : on tente de renforcer un comportement
P : on tente de supprimer un comportement
+ : on ajoute un stimulus
– : on retire un stimulus

Donc les méthodes d’éducation dites « traditionnelles » sont un mélange de R- P+ voire un mélange de R- R+ et P+ et les méthodes d’éducation dites « positives » sont un mélange de R+ P-

Revenons au conditionnement opérant. Le conditionnement opérant (Skinner) est la base de l’apprentissage par essais et erreurs. Le chien sélectionne parmi les opérations qu’il effectue spontanément et au hasard dans son environnement, celles qui lui sont favorables. Il se crée alors une association entre les stimulations présentes, le comportement effectué par le chien et l’effet favorable ou défavorable pour lui.

On associe donc le conditionnement opérant avec un des renforcements. Donc :

1- Le conditionnement opérant avec le renforcement positif : ajouter quelque chose que le chien désire augmente la probabilité qu’un comportement se produise à nouveau. Par exemple, si vous donnez une récompense quand votre chien vient vers vous, il est fort probable qu’il vienne plus rapidement la prochaine fois que vous l’appellerez. (si si)

2- Le conditionnement opérant avec le renforcement négatif : en supprimant quelque chose d’aversif, vous augmentez la probabilité qu’un comportement se produise. Par exemple, si vous mettez de la pression sur la laisse lorsque votre chien tire, tout en la relâchant immédiatement lorsqu’il ne tire plus, le chien apprendra éventuellement à marcher à vos côté pour éviter la pression. Si vous utilisez cette technique, il est impératif de stopper la pression dès que le chien adopte le bon comportement.

3- Le conditionnement opérant avec la punition positive : on ajoute quelque chose d’aversif (punition physique, verbale ou émotionnelle) en vue de diminuer la probabilité qu’un comportement se produise à nouveau, comme le coup de laisse.

4- Le conditionnement opérant avec la punition négative : on enlève quelque chose que le chien désire en vue de diminuer la probabilité qu’un comportement se produise à nouveau. Par exemple, si votre chien vous saute dessus pour recevoir une friandise plus rapidement, si vous enlevez la récompense de sa vue ou lui tournez le dos dès qu’il commence à sauter, vous diminuerez ce comportement.

Un exemple et mise en condition :

– Situation 1: Le chien est en laisse et s’éloigne de moi, alors qu’il s’approche de la limite que j’ai décidé je dis “non”, le chien continue, se prend un coup de sonnette et revient en place (réflexe ou réponse inconditionnelle). Au bout d’un moment, le chien reviendra en place dès l’annonce du “non”. On a alors un comportement appris par association stimulus-réponse: un conditionnement Pavlovien.

– Situation 2: Le chien est en laisse et s’éloigne de moi, alors qu’il s’approche de la limite je ne dis rien mais dès qu’il franchit la limite je donne un coup de sonnette. Le coup de sonnette est une sensation désagréable que le chien apprendra à éviter en restant à distance de la limite. J’ai diminué le comportement “approche de la limite” en ajoutant une conséquence désagréable, c’est une punition positive dans un conditionnement opérant (association comportement-conséquence).

La même avec la friandise: ( c’est un exemple J )

– Situation 1 (méthode naturelle): Le chien en laisse s’éloigne de moi, je dis “au pied” et deux secondes après je place une friandise à hauteur de mon genou. Le chien à la vue de la friandise adopte la réponse inconditionnelle de se rapprocher. Après quelques essais, le chien se rapproche dès qu’il entend l’ordre “au pied”. Association stimulus-réponse : conditionnement Pavlovien.

– Situation 2: (clicker ) Le chien en laisse se promène autour du maître puis passe à hauteur du genou: “clic!” puis récompense. On ajoute une conséquence favorable (+) qui augmente l’apparition du comportement “s’approcher du genou”, c’est donc un renforcement positif dans le cadre d’un conditionnement opérant.

Selon vous, qu’est-ce qui est le plus respectueux du chien ?

Nous insistons, l’objectif est d’obtenir un renforcement positif du comportement. Ce n’est pas parce que tu lis dans un livre de dressage que la friandise est un renforcement positif qu’elle l’est. Donc celui qui décide si ce que vous faite est un renforcement positif, c’est le chien.

Il faut à chaque fois se demander si :
–          Est-ce que ce que je fais augmente l’apparition d’un comportement (renforcement) ou la réduit (punition)
–          Est-ce que pour obtenir cet effet j’ai ajouté quelque chose (+) ou retiré quelque chose (-)
–          Est-ce que mon chien a répondu à un stimulus (conditionnement Pavlovien) ou est-ce que c’est moi qui ai répondu au comportement de mon chien (conditionnement opérant)?

Ceci remet en question beaucoup de cours d’éducation canine, non ?

Parlons un peu de la punition. La punition, ça fait partie l’apprentissage, on est tous d’accord à ce sujet. Si punition j’utilise, il s’agit de punition négative (P-), qui implique le retrait de quelque chose de désirable au chien pour décourager un comportement (retrait du contact social, fin du jeu, disparition des récompenses etc.) Ce type d’intervention a pour avantage de ne créer aucune douleur ou peur chez l’animal. Par contre, si elle est surexploitée, la punition négative crée de la frustration chez le chien qui finit par en avoir marre de constamment échouer. Néanmoins, la punition négative reste un mécanisme valable, selon la situation, si utilisé avec parcimonie.

Maintenant, abordons la fameuse P+, la punition positive, aussi appelée la « Et pan dans ta gueule ». D’un point de vue purement rationnel, c’est un fantastique interrupteur de comportement. “Tu fais une connerie, je te balance un coup sur la tronche, fin du comportement, tout le monde est content”. D’un point de vue plus global, c’est inefficace puisque ça n’enseigne pas le comportement adéquat et ça abime radicalement la relation entre le puni et le maître qui sévit.

Là nous entendons déjà crier « oui mais je ne frappe pas, je donne un petit coup sur la laisse, c’est rien de bien méchant! » Pour sûr, il y a des degrés de sévices. Un coup sur la laisse ce n’est jamais aussi dommageable qu’un coup de pied. Sauf que si ton petit coup sur la laisse ne fonctionne pas, vous faites quoi? Si votre modèle est punitif, vous augmentez la pression jusqu’à satisfaction. Voilà ! C’est le même mécanisme qui entre en jeu pour mener les entraîneurs et les propriétaires de chiens du collier plat à l’étrangleur puis, si échec, au collier à pointe ou autres niveaux de « super-punition ». C’est une spirale infernale qui n’en finit plus et même la « petite punition » à un impact sur la relation avec le chien…

Alors, est-ce que nous nous servons du P+ ? Comme tous les humains, nous perdons parfois patience dans le cadre de mon quotidien. Nous élevons la voix. Nous tirons un brin sur la laisse parce que nous sommes pressés. Nous faisons les gros yeux parce que nous n’avons pas le temps/pas envie/pas entraîné le comportement approprié chez mon chien. Chaque fois, les toutous me font la mine basse. Chaque fois, nous nous disons « Hé merde, je me suis planté ! ». Chaque fois, on se sent loin de nos objectifs.

Est-ce dire que la punition positive, appliquée volontairement et de façon planifiée est tabou ? En fait, la P+, c’est l’outil du fond du coffre. Le dernier recours avec le risque de dommages collatéraux élevés.

Question suivante, qui arrive normalement de ce genre de discussion : ‘oui mais tu fais quoi si ça marche pas ?’ Facile. On réfléchi un maximun et onappelle meilleur que moi. Voyez-vous, lorsque le moniteur échoue, c’est généralement un problème d’application pratique, pas un échec de la méthode elle-même. Pour nous, c’est suffisant pour nous convaincre que si nous échouons, nous sommes à côté de la plaque et que le recul et la réflexion nous permettront d’ajuster le tir.

Donc il est impératif de se donner des objectifs clairs dans l’apprentissage. Malheuresement trés peu de personnes savent répondre à cela. Mes objectifs ne sont pas les vôtres, mais les moyens pour y arriver le sont, eux.

Vous nous lisez toujours ? Bravo !

Pour terminer par une sujet qui fâche : la friandise ! Alors au regard de tous ce que vous avez lu, la friandise, pensez-vous que ce soit la chose la plus importante ? En toute honnêteté, est-ce le plus important car l’essentiel dans l’éducation du chien, c’est le chien et le respect que nous avons pour lui. Nous pouvons juste dire que la friandise et le clicker est, pour nous, le moyen (outil) qui est le plus en accord avec nos objectifs et le respect du chien. C’est et cela ne reste qu’un outil, efficace avec nous et nos chiens. Est-ce le seul ? Bien évidemment que non, et si vous avez d’autres solutions (qui marchent) , merveilleux, nous serons les premiers à vous écouter, à vous aider et à faire profiter les autres.

conditionnement opérant, Training Tips:

GREAT – Golden Retriever Education And Training

Une autre façon d'éduquer votre Golden Retriever