Het is hét onderwerp van dystopische science fiction films als ‘Terminator’ en ‘I, Robot’: intelligente machines die in opstand komen tegen hun eigen scheppers. Maar ook prominente denkers als Stephen Hawking en Bill Gates waarschuwen voor het potentiële gevaar voor de mensheid. Vooral nu kunstmatige intelligentie een steeds groter onderdeel van ons leven gaat vormen. Onlangs gingen wetenschappers nog een stapje verder: ze claimden een nieuwe doorbraak te hebben bereikt met een programma dat in de buurt komt van een (boven)menselijk intelligentieniveau.
In 1950 voorspelde Alan Turing dat we in 2000 machines zouden hebben die de Turing test zouden kunnen doorstaan. Dat houdt in dat een machine gedrag produceert dat niet van dat van een mens te onderscheiden is. Die voorspelling is inaccuraat gebleken. Vorig jaar claimden onderzoekers wel dat het hen was gelukt, maar hierover woedt nog steeds een flinke discussie.
Diepe neurale netwerken
De laatste tijd volgen de ontwikkelingen in A.I. elkaar echter steeds sneller op. Een belangrijke mijlpaal vormde de verbetering van de zogenaamde ‘diepe neurale netwerken’. Dit zijn netwerken die bestaan uit een laag waar informatie binnenkomt (input), enkele tussenlagen van knooppunten en verbindingen, en een laag die output genereert. Grofweg lijkt dit op hoe wij onze omgeving waarnemen (input), hoe die informatie verder wordt verwerkt door een netwerk van neuronen (knooppunten en verbindingen), en hoe dat uiteindelijk gedrag produceert (output). Deze netwerken worden al gebruikt om patronen te herkennen. Zo stelt het Facebook in staat om gezichten op je profielfoto’s te herkennen, en kun je de Iphone-app Siri jouw spraak laten herkennen. Hoewel programma’s goed zijn in specifieke taken zijn ze nutteloos bij het uitvoeren van andere taken; niet erg menselijk dus.
Deep-Q
Bij het technologiebedrijf ‘Deep Mind’ werkten ze daarom aan een machine die in staat is om meerdere taken te leren. Onlangs publiceerden zij hun ‘Deep-Q netwerk’. Deep-Q bleek in staat om Atari 2600 spellen te leren zoals ‘BreakOut’ en ‘Video Pinball’. Hierbij maakte het alleen gebruik van de pixelwaarden (input), mogelijke acties (output) en de scores van het spel (beloningen). Deep-Q ontwikkelde daarnaast ook vaak slimme strategieën om nog betere scores te behalen. Samen zorgde de combinatie van diepe neurale netwerken en beloningen ervoor dat het programma patronen in de pixels kon herkennen, kon analyseren welke acties tot betere scores leidden, en vervolgens zijn gedrag aanpaste. Ondanks dat het programma op veel spellen betere ‘high scores’ behaalde dan een menselijke expert, is er nog wel het een en ander op aan te merken. Zo was het programma hopeloos slecht in spellen waar het nodig is om verder in de toekomst te plannen, zoals ‘Pac-Man’ en ‘Asteroids’.
Filmpje dat laat zien hoe Deep-Q ‘Space Invaders’ en ‘Breakout’ leert spelen
De toekomst
Toch zag Google er wel brood in, en kocht het vorig jaar Deep Mind voor een luttele 400 miljoen dollar. Daar zijn ze nu bezig het programma uit te breiden zodat het ook spellen als Mario Kart kan spelen. Het lange termijn doel is om een programma te maken dat de intelligentie van een peuter benadert, iets waar waarschijnlijk meer voor nodig is dan winnen bij een spelletje ‘BreakOut’. We hoeven dus voorlopig niet bang zijn dat de machines in opstand komen.
Meer informatie
Artikel over het ‘slagen’ voor de Turing-test
Bronartikel waarin Deep-Q wordt gepresenteerd
Dit blog is geschreven door onze vaste gastblogger Ruud Berkers.
Bewerking door Lieneke.