Waarom RAG zonder bronvermelding waardeloos is

Vraag een willekeurige leverancier vandaag naar zijn AI-product en je hoort binnen één minuut het woord RAG — Retrieval-Augmented Generation. Het is dé belofte tegen hallucinatie: het model verzint niets meer, want het kijkt eerst in jouw documenten. Klinkt waterdicht. Is het niet.

Wat RAG werkelijk doet

RAG bestaat uit drie stappen. Retrieval: bij een vraag worden relevante stukken tekst opgehaald uit een kennisbank. Augmented: die stukken worden meegegeven aan het taalmodel als context. Generation: het model formuleert een antwoord. De aanname is dat het model zich netjes aan de aangereikte bronnen houdt.

Die aanname klopt vaak — maar niet altijd. En "niet altijd" is precies het probleem bij werk waar het op aankomt.

Waar het misgaat

Er zijn twee stille faalmodi. De eerste: de retrieval haalt de verkeerde of onvolledige stukken op, en het model vult de gaten op met wat het "weet" — dat wil zeggen, met plausibel klinkende verzinsels. De tweede, gemener: het model citeert wél een bron, maar de bewering staat er niet echt in. Het nummer klopt, de strekking niet.

Een model dat een bron noemt die het verkeerd samenvat, is gevaarlijker dan een model dat eerlijk zegt dat het het niet weet.

In een demo valt dit nooit op. In productie — bij een juridische vraag, een medisch dossier, een beleidsstuk — is het de reden dat niemand het systeem nog vertrouwt zodra de eerste fout boven water komt.

De ontbrekende stap: citatie-verificatie

Het verschil tussen een demo en een systeem waar je op kunt bouwen, is een extra stap die de meeste leveranciers overslaan: verifieer dat elke bewering daadwerkelijk in de aangehaalde bron staat. Niet "lijkt erop", maar aantoonbaar. Beweringen die deze toets niet doorstaan, gaan eruit — niet weggepoetst met een mooiere formulering.

Pas dan betekent een bronkaart iets. De gebruiker kan klikken, het origineel lezen, en zien dat het klopt. Dat is geen extraatje; het is het hele punt.

Goede retrieval is de helft van het werk

Verificatie helpt alleen als de juiste bronnen überhaupt zijn opgehaald. Daarom combineren we semantisch zoeken (vectoren, voor betekenis) met trefwoord- zoeken (voor exacte termen, namen en nummers) en zetten we er een rerankstap overheen die de écht relevante passages bovenaan plaatst. Puur semantisch zoeken mist exacte verwijzingen; puur trefwoord mist de bedoeling. De combinatie wint.

Meten, niet hopen

Hoe weet je of het werkt? Door het te meten. Een vaste set gecontroleerde vragen met bekende, juiste antwoorden — een goldenset — draait bij elke wijziging opnieuw. Zo wordt zichtbaar of een aanpassing de kwaliteit verbetert of stilletjes verslechtert, en kun je de hallucinatiegraad als hard cijfer onder die van marktleiders houden.

En de data?

Een laatste punt dat geen technisch detail is maar een randvoorwaarde: bij gevoelige data hoort de hele pijplijn op een plek te draaien die je vertrouwt. On-prem of in een AVG-proof omgeving in Nederland. De beste bronvermelding is waardeloos als de vraag en het document onderweg naar een buitenlandse cloud lekken.

Conclusie

RAG is geen knop die je omzet. Het is een keten — retrieval, reranking, generatie, verificatie, evaluatie — en de keten is zo sterk als de stap die iedereen overslaat. Vraag een leverancier dus niet óf hij RAG doet. Vraag hoe hij verifieert dat de bron klopt, en hoe hij dat meet. Het antwoord op die vraag scheidt de demo van het systeem.