Het KNMI verzamelt meteorologische in-situ waarnemingen in Nederland. Deze waarnemingen zijn geaggregeerd tot uurlijkse, dagelijkse, maandelijkse en jaarlijkse datasets. De gegevens zijn gebaseerd op automatische 10-minutenmetingen sinds begin jaren negentig, uurlijkse waarnemingen vanaf 1951 en dagelijkse waarnemingen vanaf 1901. De oudste gegevens dateren uit 1901, toen metingen begonnen met één station. Inmiddels bestaat het meetnet uit meer dan 50 automatische weerstations.

De weerstations meten essentiële klimaatvariabelen, waaronder neerslag, luchtdruk, globale straling, temperatuur, waterdamp, windsnelheid en -richting, bewolking en zicht. Zonneschijnduur en potentiële evapotranspiratie worden berekend uit de klimaatvariabelen. Waar relevant worden minima, maxima, gemiddelden en sommen vastgesteld of berekend.

Doel

Deze datasets maken meteorologische waarnemingen in Nederland beschikbaar. Er wordt onderscheid gemaakt tussen snel beschikbare uurlijkse en dagelijkse datasets die alleen een operationele kwaliteitscontrole hebben doorlopen, en datasets die handmatig zijn gevalideerd (zie figuur onder "Data aggregatie en validatie flow", onderaan de pagina). 

Met deze gegevens kan het KNMI statistieken berekenen om het klimaat in Nederland te beschrijven. Het gebruik is niet beperkt tot klimaatonderzoek, de datasets zijn ook bruikbaar voor toepassingen buiten de meteorologie en klimatologie. 

Door verplaatsingen van stations en veranderingen in meettechnieken zijn de gegevens in deze datasets niet homogeen. Hierdoor zijn deze reeksen niet geschikt voor trendanalyses. Voor onderzoek naar klimaatverandering verwijst het KNMI naar de gehomogeniseerde dagelijkse temperatuurreeksen van de vijf hoofdmeetstations in Nederland en naar de geactualiseerde maandelijkse tijdreeksen van de Centraal-Nederlandse Temperatuur. Trendanalyses zijn opgenomen in de KNMI’23-klimaatscenario’s

Tijdsnotatie

Tijden in de bestanden en bestandsnamen worden weergegeven in UTC. Voor Nederland is de lokale tijd UTC+1 (CET) en tijdens de zomertijd UTC+2 (CEST). 

De tijden in het bestand verwijzen naar het einde van het meetinterval. De bestandsnaam bevat een verkorte tijdsaanduiding die het totale interval aanduidt. Voorbeelden zijn weergegeven in de tabel hieronder. 

Individuele variabelen kunnen gemeten en geaggregeerd worden over een ander tijdsinterval. Dit kan korter zijn dan het interval van het bestand. Dit wordt aangegeven in de het veld `description` en in het veld measurementType.duration van de EDR-metadata. 

Tabel 1: Voorbeelden van hoe verschillende tijdsaanduidingen weer worden gegeven
TypeAggregatieperiodeBestandsnaamNetCDF en EDR
Uurlijks2025-01-02T23:00:00Z 
2025-01-03T00:00:00Z 
hourly-observations-20250102-23.nc 2025-01-03T00:00:00Z 
Dagelijks2025-01-02T00:00:00Z 
2025-01-03T00:00:00Z 
daily-observations-20250102.nc 2025-01-03T00:00:00Z 
Maandelijks2024-12-01T00:00:00Z 
2025-01-01T00:00:00Z 
monthly-observations-202412.nc 2025-01-01T00:00:00Z 
Jaarlijks2024-01-01T00:00:00Z 
2025-01-01T00:00:00Z 
annual-observations-2024.nc 2025-01-01T00:00:00Z 

Beschikbaarheid

De niet-gevalideerde uurlijkse en dagelijkse datasets worden elke nacht bijgewerkt met gegevens van de voorgaande dag. Gevalideerde datasets worden op werkdagen bijgewerkt en kunnen tot 10 werkdagen later beschikbaar komen. Gevalideerde gegevens kunnen op elk later moment worden aangepast als er problemen worden gevonden.

De maandelijkse en jaarlijkse datasets worden bijgewerkt zodra alle dagen in de betreffende periode gevalideerd zijn. Aanpassingen kunnen nog maanden later plaatsvinden. 

Het wordt sterk aangeraden om de MQTT Notification Service te gebruiken om meldingen te ontvangen wanneer datasets nieuwe of bijgewerkte bestanden binnenkrijgen. Zo bent u altijd verzekerd van de meest actuele gegevens zonder onnodig te pollen of opnieuw te downloaden. 

De datasets zijn beschikbaar in NetCDF-bestanden en kunnen worden gedownload via de Open Data API. De gegevens zijn daarnaast beschikbaar als Environmental Data Retrieval (EDR)-collectie. Met de EDR API kunnen specifieke variabelen op spatio-temporele wijze worden bevraagd, zonder dat volledige datasets hoeven te worden gedownload. 

Aggregatiemethoden

Waarnemingen van sensoren op automatische weerstations worden verwerkt tot tijdreeksen van 10 minuten. Deze 10-minutenreeksen worden vervolgens geaggregeerd naar uurlijkse, dagelijkse, maandelijkse en jaarlijkse intervallen. Geaggregeerde waarden kunnen alleen worden berekend als er voldoende onderliggende data beschikbaar is. 

De methode van aggregeren verschilt per variabele. Voorbeeld: de dagelijkse gemiddelde luchtdruk wordt berekend als het gemiddelde van de 24 uurlijkse waarden van die dag (middernacht tot middernacht UTC).

De maandelijkse maximale windstoot wordt berekend als de hoogste waarde van de dagelijkse maxima, waarbij deze dagelijkse maxima zijn afgeleid uit de 24 uurlijkse maximale windstoten (middernacht tot middernacht UTC). 

Handmatige validatie

De uurlijkse gegevens worden grondig gevalideerd door KNMI-experts. Hierbij worden gegevens vergeleken met aangrenzende stations en beoordeeld op basis van de expertise van het validatieteam. Bij ontbrekende datapunten wordt voor alle landstations 100% volledigheid gegarandeerd voor temperatuur, zonnestraling en neerslag. Andere variabelen worden aangevuld zolang de kwaliteit kan worden gewaarborgd. Bijvoorbeeld: bij een langdurige storing van een sensor kan een variabele niet altijd worden aangevuld.

De handmatige validatie wordt uitgevoerd tijdens kantooruren en kan ook in niet-chronologische volgorde plaatsvinden. In sommige gevallen kan de validatie tot 30 werkdagen duren. De exacte beschikbaarheid van elke dataset is te vinden in de tabel onder "Lijst van de datasets".