Verschil tussen belonen/bekrachtigen

een discussie -

Hallo allemaal,

Herman schreef een reactie op de vraag over verschil tussen belonen en positief bekrachtigen. Herman, ik vind je een schat, maarrehhhh ik ben het toch niet helemaal met je eens en hier en daar vind ik je uitleg nogal moeilijk te begrijpen.

In de operante conditionering gaat men uit van een wisselwerking tussen gedrag en omgeving.

Ik zou hier zeggen gedrag en de directe gevolgen hiervan.
Wat je zegt klopt wel aardig, maar is voor de meeste mensen onbegrijpelijk. Die denken dan huis-, tuin- en keuken-omgeving.

Als direct (onmiddellijk) gevolg van het gedrag ontstaat er een prikkel vanuit de omgeving die het dier waarneemt. Als het gevolg van die prikkel is dat het gedrag toeneemt dan praat je over "bekrachtigen" of "versterken" van gedrag. Zo spreekt men ook van "straf" of "correctie" als het gevolg van de prikkel is dat het gedrag afneemt.
De essentie hierbij is dus dat je kijkt naar het effect van de prikkel op het gedrag.

Tja... technisch juist, maar klinkt alweer verdraaid ingewikkeld. Ik zou hierbij dan toch vermelden vanuit het te trainen dier bekeken... Laten we eerlijk zijn, als trainer gebruik je je eigen gedrag niet om later van je hond een rapportje te krijgen met daarin de beoordeling die aangeeft of de hond het als bekrachtiger of als straf heeft ervaren. Je wilt als trainer heel doelbewust bezig zijn met het toepassen van bekrachtiging (positief of negatief) en/of straf (positief of negatief). Met als doel dat de hond het als zodanig ervaart. Anders ben je niet aan het trainen, maar aan het experimenteren.

Positief betekent hier dat je een prikkel toegediend wordt direct na het vertoonde gedrag, en wel zo snel dat de hond verband legt tussen zijn gedrag en de prikkel. Positieve bekrachtiging betekent dan dat je direct na het gedrag een prikkel toedient waardoor het gedrag (in frequentie of in intensiteit) toeneemt.

Nou, hier ben ik het NIET mee eens. Bekrachtiging vindt plaats TIJDENS gedrag, beloning vindt plaats NA gedrag.

Enneh, er werd ook naar voorbeelden gevraagd: als een hond tijdens het blaffen de postbode ziet verdwijnen, wordt hij positief bekrachtigd door middel van zijn opluchting (het is gelukt...pfffft... lichaam maakt serotonine aan hetgeen dit gevoel nog versterkt etc.) En tegelijkertijd negatief bekrachtigd, de akelige prikkel verdwijnt... Reden temeer om de volgende keer weer te blaffen. Positief betekent hier dus ook: de hond ontvangt iets (hormonale stimulering ten gevolge van opluchting) en negatief betekent: een vervelende prikkel wordt verwijderd.

Ander voorbeeld van negatieve bekrachtiging is het piepertje dat ik in mijn auto heb om mij te waarschuwen als ik mijn lichten aan laat staan. Het is een akelig geluid, ik zet snel de lampen uit en word bekrachtigd door het verdwijnen van de herrie. (Ook ik ontvang als gevolg hiervan de positieve gevolgen van opluchting... dus zelfs bij negatieve bekrachtiging vindt ook een positieve bekrachtiging plaats...)

Een clickertrainer kijkt er weer iets anders naar. Bij het clickeren gebruik je een geconditioneerde positieve bekrachtiger, de click. Tijdens het conditioneren leer je de hond dat de click betekent dat er een beloning aankomt.

Dus: het nietszeggende geluidje gaat de betekenis krijgen -beloning komt er aan-. En daardoor wordt het geluid als positief ervaren. Het geluid heeft nu de functie van een geconditioneerde (lees: aangeleerde) positieve (lees: toegediende EN positief ervaren) bekrachtiger (lees: signaal dat kan worden toegediend TIJDENS het vertoonde gedrag).

Als de hond dat eenmaal doorheeft ga je die geconditioneerde bekrachtiger gebruiken om aan te geven "yes! dat gedrag wordt beloond" en vervolgens kan de hond zijn beloning komen halen.

OEPS... Ik zou liever zeggen: kan de hond zijn beloning krijgen. Hetzij omdat hem die wordt toegeworpen, hetzij omdat hij hem krijgt aangegeven, hetzij omdat hij hem kan komen halen. Anders krijg je van die honden die telkens terug moeten lopen naar hun baas omdat ze leren dat ze de beloning moeten gaan halen. Tijdverspilling en lastig ook, zeker als de hond gedrag ver weg moet vertonen, of als hij net bezig is om een voor hem ingewikkeld probleem op te lossen.

De click is dan een "brug" geworden tussen het gewenste gedrag en de eigenlijke beloning. Het voordeel hiervan is dat je erg nauwkeurig kunt "timen" met het geluid van de clicker, en het moment waarop de uiteindelijke beloning valt is dan niet meer bepalend voor het herhalen van het gedrag.

Ja. Dat zou ik ook zeggen. De clicker heeft zowel een markeer- als een brugfunctie: je kunt met het geluid het gedrag markeren, en je kunt hiermee de tijd tussen het daadwerkelijk te belonen gedrag (hetgeen dus gemarkeerd/bekrachtigd wordt met het geluid) en het geven van de beloning overbruggen.

Ik hoop dat ik het zo ietsje duidelijker maak....

En ik hoop dat ik het nog ietsje duidelijker heb gemaakt!

Groetjes,

Bianca