Pas op: wetenschappelijk verantwoord stuk

In de jaren ’80 werd door de Stichting voor Publieksvoorlichting over Wetenschap en Techniek (PWT) een onderzoek gedaan naar hoe vaak de letters van ons alfabet in Nederlandse teksten voorkomen; de letterfrequentie dus.


Hiervoor werd maandenlang De Haarlemse Courant (!) gescreend waarbij in totaal iets van anderhalf miljoen woorden uit de redactionele stukken voorbijkwamen.

Het onderzoek bleek zo zinvol, bruikbaar en nuttig dat het na de spellingherziening in de jaren ’90 niet meer is herhaald.

Maar ik kwam het dus vorige week weer tegen en ik dacht: “Hier moet iets mee gedaan worden. Dit is nog niet genoeg uitgediept.” En meteen ging ik aan de slag. De PWT wist goddomme niet dat ze goud in handen had!

Kijk, numerologie, de Kaballah en zo, dat is natuurlijk allemaal onzin. Letterfrequentie daarentegen zegt gewoon wel iets over de zin het het bestaan, de ontdekking van de hemel, het ontstaan van het heelal en dat soort dingen.

Dat de letter e in de gemiddelde Nederlandse tekst het vaakst voorkomt, zal u wellicht niets verbazen. Maar liefst 18,9% van alle letters is een e. En de q komt slechts iets van 1 keer op de 11.000 letters voor.

Verder wil ik er op dit moment niet te veel woorden aan vuil maken. Ik wil dat u het onderstaande grafiekje eens bekijkt en goed tot u door laat dringen.

Dit kan toch geen toeval zijn?

Later meer…