Veel mensen proberen het elk jaar weer: snel nog even een gedicht laten maken door ChatGPT. Maar het resultaat is vaak net niet wat je zoekt. Waarom hebben AI-modellen zoveel moeite met rijm? AI-onderzoeker Thijs van Ede (Universiteit Twente) legt uit hoe dat zit.
AI ziet letters — geen klanken
Rijmen doe je op klank, niet op spelling. Je luistert naar de laatste klankgroep van een woord en zoekt een match: jaar → -aar → daar, maar, haar. Dat lukt zolang letters en uitspraak overeenkomen. Maar in het Nederlands zijn er talloze uitzonderingen.
Een klassiek voorbeeld van mislukte AI-rijm: “Hier zijn wat pennen voor in je etui.”
Op papier lijkt bui – etui goed, maar uitgesproken is het geen rijm. Dat heet oogrijm, en taalmodellen die alleen tekst zien, trappen daar standaard in. Ze hebben geen begrip van fonetiek; ze zien alleen letterreeksen.
Waarom rijmwoordenboeken wél goed werken
Software zoals Mick’s rijmwoordenboek pakt het anders aan. Duizenden woorden zijn handmatig beoordeeld op klank en rijm, een soort crowdsourcing. De computer hoeft daarbij niet zelf zinnen te bouwen — hij geeft alleen een lijst met mogelijke rijmwoorden. Daardoor werkt het veel beter dan bij een generatief AI-model.
Hoe ChatGPT denkt
ChatGPT voorspelt simpelweg welk woord statistisch het meest logisch volgt. Het model knipt de invoer op in kleine stukjes (tokens) en kijkt naar bekende patronen in trainingsteksten. Bij zinnen als “Sinterklaas zat te denken, wat hij jou zou…” kiest het woorden die veel voorkomen, niet per se rijmen. Daardoor eindigt het soms in “zeggen?” in plaats van een rijmend slot.
Kan AI beter leren rijmen?
Jazeker. Taalmodellen worden al beter doordat ze meer voorbeelden van goede gedichten krijgen. Een paar jaar geleden was er nauwelijks bruikbaar rijm te vinden; inmiddels lukt het soms verrassend goed. De volgende stap is het koppelen van AI aan externe bronnen, zoals een fonetische database of een rijmwoordenboek. Net zoals ChatGPT nu actuele informatie kan opvragen via een query, kan er in de toekomst een “rhyme-query” komen die klanken controleert voordat de zin wordt gegenereerd.
Van rijm naar veiligheid
Het begrijpen van taalklanken is niet alleen relevant voor gedichten. Van Ede onderzoekt hoe AI gebruikt kan worden om digitale kwetsbaarheden te vinden. Grote taalmodellen kunnen afwijkende patronen in enorme datasets herkennen — precies het soort subtiele signalen dat nodig is om moderne cyberaanvallen te detecteren.
Zo helpt onderzoek naar taalbegrip niet alleen bij betere gedichten, maar ook bij een veiligere digitale wereld.