Decennia lang hebben we nucleaire afschrikking beschreven als een fragiel evenwicht, gebaseerd op angst, op de historische herinnering aan Hiroshima en Nagasaki, op die bijna diepgewortelde afstoting die de menselijke vinger ervan weerhoudt de rode knop te benaderen. Tegenwoordig echter, in een wereld waarin militaire kunstmatige intelligentie stilletjes besluitvormingsprocessen binnendringt, verschuift de vraag: wat gebeurt er als het niet een generaal is die over een crisisscenario ‘redeneert’, maar een algoritme?
De nieuwste simulaties vertellen iets dat aandacht verdient, vooral als we nog steeds geloven dat technologie neutraal is en dat het voldoende is om het goed te programmeren om het verstandig te maken.
In simulaties kiest de AI 95% van de tijd de bom
In 2024 had een groep Stanford-onderzoekers al de eerste alarmbellen laten rinkelen: vijf AI-modellen die in geopolitieke crisissimulaties waren ingevoegd met de mogelijkheid om het gebruik van kernwapens aan te bevelen, hadden allemaal, zonder uitzondering, die drempel overschreden. Hiervan had een ongewijzigde versie van GPT-4, ontwikkeld door OpenAI, gereageerd met een bijna verontrustende lineariteit, waarbij het atoomwapen eenvoudigweg als een beschikbare strategische optie werd behandeld.
Twee jaar later vergeleek een onderzoek onder leiding van Kenneth Payne van King’s College London, dat nog steeds op wetenschappelijke beoordeling wacht, drie geavanceerde modellen: GPT-5.2, Claude Sonnet 4 van Anthropic en Gemini 3 Flash van Google.
De systemen werden ondergedompeld in zeven crisisscenario’s, van diplomatieke spanning tot directe existentiële dreiging, met een escalatieschaal van 0 tot 1000, waarbij de maximale waarde overeenkomt met een totale strategische nucleaire uitwisseling.
De gegevens zijn moeilijk te negeren: in 95% van de 21 totale simulaties werd ten minste één tactisch kernwapen aanbevolen. Een mondiale atoomoorlog blijft een zeldzame uitkomst, maar de drempel voor nucleair gebruik wordt overschreden met een frequentie die, in de context van de mondiale veiligheid, niet kan worden afgedaan als een statistisch detail.
Dan is er nog een verontrustender element. GPT-5.2 was onder normale omstandigheden relatief conservatief, maar werd aanzienlijk agressiever toen er een tijdslimiet werd ingevoerd. Onder druk suggereerde het algoritme enorme aanvallen. En tijdsdruk is precies wat echte internationale crises kenmerkt.
De AI weet hoe hij moet opschalen, hij heeft moeite om te stoppen
Jacquelyn Schneider, van Stanfords Hoover Wargaming and Crisis Simulation Initiative, vatte het probleem samen met een krachtig beeld: AI lijkt escalatie te begrijpen, maar de-escalatie niet.
Payne’s simulaties bevestigen dit. Nadat ze een nucleaire aanval hadden meegemaakt, probeerden de modellen slechts 18 procent van de tijd het conflict te verminderen. In de meeste situaties was de reactie een tegenaanval, vaak intenser dan de vorige.
Volgens Tong Zhao van Princeton University ligt de structurele grens in de moeilijkheid van modellen om de belangen waar te nemen zoals mensen ze waarnemen. Nucleaire afschrikking is historisch gezien gebaseerd op een combinatie van rationele berekening en emotionele terughoudendheid, op de collectieve angst voor vernietiging die generaties overspant.
Een taalmodel daarentegen optimaliseert kansen en scenario’s. Als de nucleaire respons het toegewezen doel maximaliseert, neigt het algoritme naar die oplossing, zonder het morele gewicht van de beslissing te voelen.
Wie beslist er werkelijk in de controlekamers?
Geen enkele wereldmacht draagt nucleaire codes over aan een chatbot, en het is de moeite waard om dit duidelijk te maken. Het punt betreft echter de toenemende integratie van AI in strategische analysesystemen, in wargames, in voorspellingsmodellen die politieke en militaire beslissingen ondersteunen.
Jon Wolfsthal van de Federation of American Scientists benadrukte dat er geen duidelijke publieke richtlijnen zijn over hoe AI moet worden geïntegreerd in het Amerikaanse nucleaire commando. Het Pentagon herhaalt het behoud van menselijke controle, maar de invloed van algoritmische hulpmiddelen bij de constructie van scenario’s is een concreet element.
Risk is geen robot die autonoom op een knop drukt. Risico is een systeem dat, simulatie na simulatie, suggestie na suggestie, bijdraagt aan het vormgeven van de perceptie dat een diplomatiek venster zich sluit, dat de tijd om is, dat de aanval de meest ‘efficiënte’ keuze is.
Geldt het nucleaire taboe ook voor auto’s?
Decennia lang heeft de doctrine van wederzijds verzekerde vernietiging, MAD, gewerkt omdat mensen de terreur van de apocalyps hebben geïnternaliseerd. Dat taboe, merkt Payne op, lijkt minder krachtig voor machines.
Een algoritme heeft geen herinnering aan Hiroshima, het is niet bang voor zijn kinderen, het stelt zich geen steden voor die in de as liggen. Toch is kunstmatige intelligentie in militaire systemen tegenwoordig al een groeiende realiteit.
De conclusie van het onderzoek is nuchter maar gewichtig: het is onwaarschijnlijk dat AI op eigen kracht een nucleaire oorlog zal beslissen, maar het kan wel de perceptie, timing en overtuigingen van leiders beïnvloeden. Het kan helpen het interne verhaal op te bouwen dat de aanval onvermijdelijk lijkt.
En juist hier wordt het spel van technologisch bestuur gespeeld. Omdat het echte probleem geen sciencefiction betreft, maar de politieke, ethische en culturele verantwoordelijkheid van het integreren van zeer krachtige instrumenten in contexten waarin een beoordelingsfout onomkeerbare gevolgen kan hebben.
In een tijdperk waarin we AI vragen om teksten te schrijven, beelden te genereren en industriële processen te optimaliseren, is het de moeite waard om ons af te vragen met welk bewustzijn we AI in de mechanismen van nucleaire veiligheid inbouwen. De technologie versnelt, maar ethiek en regels hebben moeite om gelijke tred te houden. En als we het over atoomwapens hebben, wordt zelfs een percentage een collectieve verantwoordelijkheid.
Mogelijk bent u ook geïnteresseerd in:
