This post is also available in Engels.
Vandaag de dag kan software veel doen wat wij mensen kunnen, zoals emoties in gezichtsuitdrukkingen herkennen. Computers worden hierin getraind door miljoenen afbeeldingen te verwerken die allemaal gelabeld zijn met emotie-categorieën, zoals blijheid, woede, of afkeer. Wat verrassend is, en misschien onvoldoende erkend wordt, is dat computers helemaal niet zo goed zijn in het herkennen van natuurlijke emoties – de emoties die je in het dagelijks leven tegenkomt, en niet in het lab. Zowel mensen als computers zijn slecht in het herkennen van gezichtsuitdrukkingen die spontaan ontstaan in plaats van expres (zie de afbeelding hieronder voor bewust uitgedrukte emoties).
In de jaren 70 heeft de Amerikaanse psycholoog Paul Ekman het idee populair gemaakt dat mensen universeel gezichtsuitdrukkingen kunnen herkennen. Ekman en andere onderzoekers deden experimenten waarin mensen extreme voorbeelden van gezichtsuitdrukkingen te zien kregen, zoals een fronsend gezicht voor woede en een pruillip voor verdriet. Hun resultaten gaven aan dat mensen zes gezichtsuitdrukkingen (woede, afkeer, angst, blijheid, verdriet en verrassing) zeer goed kunnen herkennen, met een nauwkeurigheid tussen de 70 en 90 procent. Maar, onderzoek van de laatste tien tot vijftien jaar geeft aan dat wanneer mensen spontane emoties zien, hun nauwkeurigheid in het herkennen een stuk slechter is, tussen de 22 en 63 procent! En dit geldt niet alleen voor mensen, maar ook voor computers.
Recent onderzoek onderzocht hoe goed drie automatische gezichtsuitdrukking-herkenningssystemen (facial expression recognition; FER) waren in het herkennen van bewust gemaakte gezichtsuitdrukkingen en meer spontane (dus meer natuurlijke) gezichtsuitdrukkingen. Hiervoor testten de onderzoekers twee datasets van afbeeldingen: (1) acteurs die expres gezichtsuitdrukkingen uitbeelden in een lab en (2) gezichtsuitdrukkingen uit films. De gemiddelde nauwkeurigheid voor de ‘spontane’ gezichtsuitdrukkingen was 40%. Daartegenover staat een 80% nauwkeurigheid voor bewust gemaakte gezichtsuitdrukkingen. Opmerkelijk genoeg zagen de onderzoekers dat de FER-systemen veel gezichtsuitdrukkingen incorrect als neutraal bestempelden en dat er veel verschil zat tussen de nauwkeurigheid voor specifieke emotie-categorieën. Blijheid werd bijvoorbeeld het beste herkend, en angst het slechtste. Het aanzienlijke verschil in het herkennen van verschillende emoties kan komen door de frequentie van deze emoties in het echte leven; vrolijke gezichtsuitdrukkingen komen vaker voor dan angstige.
Deze resultaten laten zien hoe moeilijk het is om emotie van een gezicht af te lezen. Je denkt misschien dat computers veel beter zijn dan mensen. Je moet echter goed nagaan wat de context is om te weten of een taak enigszins lijkt op het echte leven. De meeste gezichtsuitdrukkingen bestaan niet uit duidelijke fronsen en pruillippen, maar subtiele en vluchtige trekjes. Daarnaast passen veel gezichtsuitdrukkingen niet in kant en klare hokjes, maar zijn het combinaties van verschillende categorieën.
Het is aanlokkelijk om te denken dat software zomaar emoties uit gezichten kan lezen, zoals sommige tech-bedrijven claimen (denk aan Microsoft, Amazon, Affectiva). Maar je moet altijd even stilstaan bij het type gezichtsuitdrukking waar het over gaat.
Credits
Auteur: Julija Vaitonyte
Buddy: Judith Scholing
Redactie: Christienne Damatac
Vertaling: Wessel Hieselaar
Redactie vertaling: Felix Klaassen
Beeld van Gerd Altmann via Pixabay