De, en, in, van, op…: de 5.000 woorden die u dagelijks gebruikt

In Berichten by robert

Tot voor kort dateerde het enige frequentiewoordenboek dat voor de Nederlandse taal voorhanden was, uit 1975. Maar taal leeft en groeit. Bijna veertig jaar later was het dan ook hoog tijd voor een frisse, nieuwe versie. Dankzij het onderzoek van computerlinguïst Carole Tiberius en lexicograaf Tanneke Schoonheim beschikken we nu over een frequentiewoordenboek dat, met woorden zoals internet, data en cool, accurater het taalgebruik van vandaag weergeeft.

Uit een verzameling van 300 miljoen Nederlandse woorden filterden de twee medewerkers van het Instituut voor Nederlandse Lexicologie in Leiden de 5.000 vaakst voorkomende. Tiberius en Schoonheim stelden een gevarieerd corpus samen dat vier genres omvat: proza, krantenartikelen, webmateriaal en gesproken Nederlands (uitgeschreven gesprekken, debatten en lezingen). In elk genre namen ze zowel teksten uit Nederland als België op. Hun frequentiewoordenboek geeft dus een algemeen overzicht voor de Nederlandse taal in al haar facetten. Toch bevat het ook een apart lijstje met woorden die typerend zijn voor het Nederlands dat in België gesproken wordt. Het komt vast niet als een verrassing dat allee, gij en goesting hier een hoge frequentiescore behaalden. Maar ook woorden als federaal en parket staan op het lijstje, wat dan weer treffend de dagelijkse besognes van ons land schetst.

www.demorgen.be

hits=771=