Samenwerking Instituut voor de Nederlandse Taal en DPG Media om krantenmateriaal uit te breiden

Om ontwikkelingen in het hedendaagse Nederlands in kaart te brengen legt het Instituut voor de Nederlandse Taal (INT) het Corpus Hedendaags Nederlands (CHN) aan: een steeds groeiende verzameling van Nederlandstalige teksten uit onder meer kranten.

Onlangs heeft het INT een overeenkomst gesloten met DPG Media, het grootste mediabedrijf van Nederland en België. Hierdoor is het krantenmateriaal in het CHN uitgebreid met alle teksten uit het AD, de Volkskrant, Trouw, Het Parool, Het Laatste Nieuws en De Morgen.

Tot voor kort bevatte het Corpus Hedendaags Nederlands alleen teksten uit NRC, Het Nieuwsblad, De Standaard, Het Belang van Limburg en Gazet van Antwerpen. Door de samenwerking met DPG Media komen daar nu nog zes belangrijke kranten uit Nederland en België bij. Het krantenmateriaal wordt continu aangeleverd, en iedere maand is er een update van het CHN zodat de meest recente kranten direct doorzocht kunnen worden.

Belang van data

Het INT wil als kennisinstituut voor het Nederlands over de grootst mogelijke datacollectie beschikken om op deze wijze te kunnen bijdragen aan onderzoek en onderwijs. Frieda Steurs, directeur Instituut voor de Nederlandse Taal: "Zo is de recente hype rond ChatGPT en generatieve AI een goede reden om ook voor het Nederlands een zo krachtig mogelijk taalmodel te bouwen." DPG Media hoopt dat de beschikbaarheid van de teksten een bijdrage kan leveren aan wetenschappelijk taalonderzoek.

Bart Verkade, zakelijk directeur van DPG Media: "De Nederlandse taal is voortdurend in ontwikkeling. Dit wordt weerspiegeld in de teksten in dagbladen en op hun sites. Nieuwe woorden en veranderend taalgebruik komen daar snel tevoorschijn. Wij zijn blij dat we taalwetenschappers kunnen helpen met de taal uit onze media."

Wetenschappelijk onderzoek

Het Corpus Hedendaags Nederlands (CHN) is gratis toegankelijk voor wetenschappelijk onderzoek. Met het oog op auteursrechten zijn alleen wel een gebruikersnaam en wachtwoord vereist. Het CHN is automatisch taalkundig verrijkt met woordsoort en lemma. De aanwezigheid van metadata bij de teksten (titel, auteur, taal, publicatiejaar, medium) zorgt ervoor dat er gericht in het corpus gezocht kan worden. Wie bijvoorbeeld alleen in krantenteksten van de laatste tien jaar wil zoeken, kan dat eenvoudig doen. Inmiddels bevat het CHN bijna drie miljoen teksten uit kranten, tijdschriften, journaaluitzendingen, blogs, websites en romans.

www.ivdnt.org

www.dpgmedia.nl


Volg Marketing Report op LinkedIn
Volg Marketing Report op Instagram
Volg Marketing Report op Facebook
Abonneer je op onze gratis dagelijkse nieuwsbrief
Registreer jouw bureau gratis in de Marketing Report reclamebureau database The List





Lees ook:

AI AM breidt uit en wijst op AI-achterstand Nederland

23-04-2026 | 15:42:12
Volgens de initiatiefnemers wijst die groei op een bredere uitdaging: de adoptie van AI in Nederland blijft achter door een gebrek aan infrastructuur.

Dorst & Lesser verzorgt socialstrategie Center Parcs

23-04-2026 | 15:17:53
De samenwerking richt zich op het verbreden van de merkperceptie, waarbij het merk zich positioneert als meer dan een familieresort.

Coen Zuijdervliet: Reet, kak, bil (of gewoon goede reclame?)

23-04-2026 | 10:12:30
Er lijken de laatste tijd wat ongeschreven reclameregels te sneuvelen. En eerlijk? Dat is verfrissend.

SteamTalmark start wervingscampagne Veiligheid & Service

23-04-2026 | 09:50:00
In de campagne staan huidige medewerkers centraal, die potentiële collega’s uitnodigen om als buddy mee te lopen en het vak van dichtbij te ervaren.

Stukje van mij Global Grand Effie Contender

23-04-2026 | 07:19:00
KPN heeft met de campagne Stukje van mij een nominatie gekregen als Global Grand Effie Contender tijdens de Global Best of the Best Effie Awards 2025. Eerder werd de campagne al bekroond bij de Effie Europe Awards
 

Dit artikel is gepubliceerd door: Lieselot Berentzen

Uitgelicht





Abonneer je op onze nieuwsbrief.