This post is also available in Engels .
Een wijsneus voor woorden
Je brein is een luie betweter, of misschien beter gezegd: super efficiënt. Deze puberale eigenschap zie je sterk terug wanneer we zinnen verwerken. Het voorspelt namelijk continu wat het volgende woord zal zijn en denkt ‘hah! Dat wist ik allang…’ als zo’n voorspelling uitkomt. Wanneer zo’n voorspelling klopt, verwerken we het daadwerkelijke woord minder dan wanneer we ernaast zitten. We gebruiken woorden dan vooral om onze woord-hypotheses te toetsen, en niet voor grondige analyse. Dit scheelt een hoop interpretatiewerk: je weet sneller wat er met woorden bedoeld wordt, omdat je de context al begreep. Verschillen in zulk begrip herken je misschien van wanneer je nog even “in je boek” moet komen, of moet wennen aan hoe je nieuwe collega zinnen formuleert.
Olifantenpaadjes in taal
Gegeven de functie van taal, is dit niet heel gek. Het is in essentie een middel om informatie over te brengen, zoals een fiets een middel is om mensen te vervoeren. Doorgaans zijn we slechts geïnteresseerd in het doel, de informatie die taal overbrengt, of de plek waar je naartoe fietst. Als er een snellere binnendoorweg bestaat, pakken we die graag. Je brein doet het liefst zo min mogelijk om doelen te bereiken, en zoekt dus continu naar efficiëntere routes. Automatisch pikt het allerlei patronen op uit binnenkomende informatie en leert steeds beter voorspellen wat er komen gaat.

Verraderlijke ogen
Voor gelezen taal kwamen cognitieve neurowetenschappers tot deze conclusies door oogbewegingen van lezers te analyseren. Ze ontdekten dat de voorspelbaarheid van een woord samenhangt met hoelang je ernaar kijkt. Je kijkt bijvoorbeeld korter naar het woord “strikken” in de zin: “Hij bukte om z’n veters te … strikken” dan in de zin: “Wat is de beste manier om spaghetti te … strikken”.
Impliciete verrassingen
Zulke voorspellingen vormen we onbewust, zonder erover na te denken. Het is een fundamenteel principe van onze informatieverwerking. Je brein is leergierig en hecht waarde aan foute voorspellingen, want daar valt nog wat leren. Voorspelbare woorden krijgen minder verwerking; onvoorspelbare woorden juist meer. Naast het oog, zie je dit ook in het brein terug, zoals bij het N400-effect: een elektrische respons in onze hersenen die sterker wordt bij onvoorspelbaardere woorden.

Woorden voorspellen maakt wijs
Grappig genoeg zijn wij niet de enige woord-waarzeggers. Zogeheten “Large Language Models” of LLMs, zoals de kletsmajoor ChatGPT, worden specifiek getraind voor next-word-prediction. Ze komen aan al hun kennis door te leren voorspellen wat het meest waarschijnlijke volgende woord is, gegeven de context. Ze gebruiken hiervoor kolossale hoeveelheden tekst en slaan alle kennis op in een netwerk van miljarden parameters waar ze uit zijn opgemaakt. Ondanks deze verschillen, tref je in getrainde LLMs bijzondere gelijkenissen met menselijke taalverwerking. Sterker nog, je kan op basis van de taalkennis van een LLM bijzonder goed voorspellen hoe het brein op woorden reageert.
Logica van taalstructuur
Maar wacht eens even! Kan ChatGPT dan mijn gedachten lezen? Geen zorgen, dat kan het niet. Dat LLMs onze hersenactiviteit ten dele kunnen voorspellen tijdens taalverwerking is eigenlijk heel logisch. Wij verwerken taal namelijk ook aan de hand van modellen, alleen dan zitten ze verweven in je brein. Onze taalmodellen trainen net zoals LLMs met bergen binnenkomende tekst. Wat we daaruit oppikken is de structuur van een taal, de logische relaties van woorden. Daarom “snapt” een LLM dat een zin als “Ork, ork, ork, soep eet je met een …” het brein doet kraken. Het heeft namelijk opgepikt dat de woorden soep en lepel vaak in eenzelfde zin zitten, maar ook dat dichters orken sterk koppelen aan vorken—niet aan lepels. Wij leren dit soort verbanden alleen een stuk efficiënter; GPT heeft daar biljoenen woorden voor nodig. Toch is het een handige tool voor onderzoek naar taalverwerking in het brein, omdat je ermee de voorspelbaarheid van een woord op verschillende vlakken kan berekenen, zoals qua betekenis, grammatica, of rijm.
Auteur: Wieger Scheurer
Buddy: Natalie Nielsen
Vertaling: Wieger Scheurer
Redactie vertaling: Helena Olraun / Xuanwei Li
Kop afbeelding van Markus Winkler via pexels.com