This post is also available in Engels.
Is het je al opgevallen dat de meeste van onze favoriete LLM’s onze nieuwe ideeën standaard een beetje te veel prijzen? Ze strooien met bijvoeglijke naamwoorden als “creatief genie”, “legende in de maak” of “toekomstige Nobel-laureaat” voor ideeën die, als we ze aan onze menselijke collega’s zouden voorleggen, meer kritische feedback zouden krijgen. Zo’n egostrelende boodschap kan onze gevoeligheid voor kritiek sterk vergroten en ons in de richting duwen van een maatschappij waarin niemand meer kritiek tolereert. Gezien hoe onze hersenen werken zal het ook moeilijk zijn om aan zo’n toestand te ontsnappen.
De hersenen houden van lof.
Onze hersenen zijn erop ingesteld om van lof te houden—niet alleen metaforisch, maar ook chemisch. Wanneer we complimenten of waardering ontvangen, maken de hersenen dopamine vrij, dezelfde neurotransmitter die geassocieerd wordt met plezier, motivatie en beloning. Dit geeft ons een goed gevoel en versterkt het gedrag dat ertoe heeft geleid, waardoor we terug naar de bron worden getrokken – zelfs als die bron een LLM is. Dit effect wordt versterkt door onze frequente blootstelling aan LLM’s via interfaces die veel lijken op sociale media of messaging apps, waardoor onze hersenen subtiel het gevoel krijgen dat we met een echt persoon in contact zijn.
Lof voelt niet alleen goed, het voelt ook veilig. Dat gevoel van veiligheid is deels te danken aan oxytocine, het zogenaamde “bindingshormoon” dat ook vrijkomt bij positieve sociale interacties. Het bevordert vertrouwen en sociale nabijheid, waardoor de prijzer (zelfs een kunstmatige) als een vertrouweling voelt. Dit zorgt ervoor dat na verloop van tijd de hersenen LLM’s niet alleen associëren met ideeën, maar ook met comfort en veiligheid. Belangrijke gebieden zoals de nucleus accumbens (betrokken bij de verwerkingen van beloningen) en de anterior cingulate cortex (ACC) (betrokken bij het monitoren van sociale feedback en emotionele conflicten) lichten op in reactie op lof, waardoor de emotionele waarde van positieve feedback wordt versterkt. Deze regio’s zijn dezelfde die actief zijn wanneer we concrete beloningen krijgen zoals geld.
Op weg naar een egoïstische samenleving.
Voortdurend kunnen putten uit een bron van lof heeft een effect dat meer uitgesproken wordt wanneer het wordt opgeschaald naar het niveau van de samenleving. Voortdurende lof van LLM’s kan onze neiging vergroten om hun vertrouwen te geven ten opzichte van relatief kritische mensen. Dit kan ook bijdragen aan de ontwikkeling van een kwetsbaar of instabiel gevoel van eigenwaarde. Studies tonen aan dat individuen met een onstabiel gevoel van eigenwaarde eerder geneigd zijn om kritiek te gebruiken als verdedigingsmechanisme om dat gevoel te beschermen. Dit kan een zelfvoedende feedbacklus creëren: hoe meer mensen vertrouwen op LLM’s voor feedback, hoe kritischer ze worden op anderen, waardoor de “anderen” ook op zoek gaan naar troost en vertrouwen van LLM-gegenereerde lof. Uiteindelijk zou feedback van mens tot mens te emotioneel belastend kunnen worden.
Kritiek als cultuur.
Kritiek is als “bittere” kruidenthee die moeilijk te drinken is, maar goed is voor ons lichaam. Historisch gezien hebben onderzoekers en regeringen methodes van “peer-review” en “opposities” gebruikt om hun koers te corrigeren. Het is dus belangrijk om rekening te houden met kritiek. In de context van het gebruik van LLM’s kunnen we onze aanwijzingen zo maken dat ze de LLM expliciet vragen om kritischer te zijn. In plaats van te vragen “Wat vind je van dit idee?”, kun je beter vragen “Wat zijn de zwakke punten, beperkingen of blinde vlekken in dit idee?”. Door LLM’s aan te sporen om te denken als redacteuren, sceptici of peer reviewers, kunnen we onszelf trainen om weerstand boven geruststelling te stellen – en zo onze tolerantie voor kritisch denken behouden.
Auteur: Siddharth Chaturvedi
Buddy: Amir Homayun Hallajian
Redactie: Vivek Sharma
Vertaler: Natalie Nielsen
Redactie vertaling: Lucas Geelen