Documentatie uurlijkse, dagelijkse, maandelijkse en jaarlijkse in-situ grondgebaseerde meteorologische waarnemingen in Nederland
Het KNMI verzamelt meteorologische in-situ waarnemingen in Nederland. Deze waarnemingen zijn geaggregeerd tot uurlijkse, dagelijkse, maandelijkse en jaarlijkse datasets. De gegevens zijn gebaseerd op automatische 10-minutenmetingen sinds begin jaren negentig, uurlijkse waarnemingen vanaf 1951 en dagelijkse waarnemingen vanaf 1901. De oudste gegevens dateren uit 1901, toen metingen begonnen met één station. Inmiddels bestaat het meetnet uit meer dan 50 automatische weerstations.
De weerstations meten essentiële klimaatvariabelen, waaronder neerslag, luchtdruk, globale straling, temperatuur, waterdamp, windsnelheid en -richting, bewolking en zicht. Zonneschijnduur en potentiële evapotranspiratie worden berekend uit de klimaatvariabelen. Waar relevant worden minima, maxima, gemiddelden en sommen vastgesteld of berekend.
Doel
Deze datasets maken meteorologische waarnemingen in Nederland beschikbaar. Er wordt onderscheid gemaakt tussen snel beschikbare uurlijkse en dagelijkse datasets die alleen een operationele kwaliteitscontrole hebben doorlopen, en datasets die handmatig zijn gevalideerd (zie figuur onder "Data aggregatie en validatie flow", onderaan de pagina).
Met deze gegevens kan het KNMI statistieken berekenen om het klimaat in Nederland te beschrijven. Het gebruik is niet beperkt tot klimaatonderzoek, de datasets zijn ook bruikbaar voor toepassingen buiten de meteorologie en klimatologie.
Tijden in de bestanden en bestandsnamen worden weergegeven in UTC. Voor Nederland is de lokale tijd UTC+1 (CET) en tijdens de zomertijd UTC+2 (CEST).
De tijden in het bestand verwijzen naar het einde van het meetinterval. De bestandsnaam bevat een verkorte tijdsaanduiding die het totale interval aanduidt. Voorbeelden zijn weergegeven in de tabel hieronder.
Individuele variabelen kunnen gemeten en geaggregeerd worden over een ander tijdsinterval. Dit kan korter zijn dan het interval van het bestand. Dit wordt aangegeven in de het veld `description` en in het veld measurementType.duration van de EDR-metadata.
Tabel 1: Voorbeelden van hoe verschillende tijdsaanduidingen weer worden gegeven
Type
Aggregatieperiode
Bestandsnaam
NetCDF en EDR
Uurlijks
2025-01-02T23:00:00Z
2025-01-03T00:00:00Z
hourly-observations-20250102-23.nc
2025-01-03T00:00:00Z
Dagelijks
2025-01-02T00:00:00Z
2025-01-03T00:00:00Z
daily-observations-20250102.nc
2025-01-03T00:00:00Z
Maandelijks
2024-12-01T00:00:00Z
2025-01-01T00:00:00Z
monthly-observations-202412.nc
2025-01-01T00:00:00Z
Jaarlijks
2024-01-01T00:00:00Z
2025-01-01T00:00:00Z
annual-observations-2024.nc
2025-01-01T00:00:00Z
Beschikbaarheid
De niet-gevalideerde uurlijkse en dagelijkse datasets worden elke nacht bijgewerkt met gegevens van de voorgaande dag. Gevalideerde datasets worden op werkdagen bijgewerkt en kunnen tot 10 werkdagen later beschikbaar komen. Gevalideerde gegevens kunnen op elk later moment worden aangepast als er problemen worden gevonden.
De maandelijkse en jaarlijkse datasets worden bijgewerkt zodra alle dagen in de betreffende periode gevalideerd zijn. Aanpassingen kunnen nog maanden later plaatsvinden.
Het wordt sterk aangeraden om de MQTT Notification Service te gebruiken om meldingen te ontvangen wanneer datasets nieuwe of bijgewerkte bestanden binnenkrijgen. Zo bent u altijd verzekerd van de meest actuele gegevens zonder onnodig te pollen of opnieuw te downloaden.
De datasets zijn beschikbaar in NetCDF-bestanden en kunnen worden gedownload via de Open Data API. De gegevens zijn daarnaast beschikbaar als Environmental Data Retrieval (EDR)-collectie. Met de EDR API kunnen specifieke variabelen op spatio-temporele wijze worden bevraagd, zonder dat volledige datasets hoeven te worden gedownload.
Aggregatiemethoden
Waarnemingen van sensoren op automatische weerstations worden verwerkt tot tijdreeksen van 10 minuten. Deze 10-minutenreeksen worden vervolgens geaggregeerd naar uurlijkse, dagelijkse, maandelijkse en jaarlijkse intervallen. Geaggregeerde waarden kunnen alleen worden berekend als er voldoende onderliggende data beschikbaar is.
De methode van aggregeren verschilt per variabele. Voorbeeld: de dagelijkse gemiddelde luchtdruk wordt berekend als het gemiddelde van de 24 uurlijkse waarden van die dag (middernacht tot middernacht UTC).
De maandelijkse maximale windstoot wordt berekend als de hoogste waarde van de dagelijkse maxima, waarbij deze dagelijkse maxima zijn afgeleid uit de 24 uurlijkse maximale windstoten (middernacht tot middernacht UTC).
Handmatige validatie
De uurlijkse gegevens worden grondig gevalideerd door KNMI-experts. Hierbij worden gegevens vergeleken met aangrenzende stations en beoordeeld op basis van de expertise van het validatieteam. Bij ontbrekende datapunten wordt voor alle landstations 100% volledigheid gegarandeerd voor temperatuur, zonnestraling en neerslag. Andere variabelen worden aangevuld zolang de kwaliteit kan worden gewaarborgd. Bijvoorbeeld: bij een langdurige storing van een sensor kan een variabele niet altijd worden aangevuld.
De handmatige validatie wordt uitgevoerd tijdens kantooruren en kan ook in niet-chronologische volgorde plaatsvinden. In sommige gevallen kan de validatie tot 30 werkdagen duren. De exacte beschikbaarheid van elke dataset is te vinden in de tabel onder "Lijst van de datasets".
Deze flowchart geeft de dataflow weer met aggregatie- en validatiestappen.
Tabel 2: Een overzicht van (aankomende) datasets beschikbaar via het KNMI Data Platform
Hourly indicator present weather code; 1=manned and recorded (using code from visual observations); 2; 3=manned and omitted (no significant weather phenomenon to report; not available); 4=automatically recorded (using code from visual observations); 5; 6=automatically omitted (no significant weather phenomenon to report; not available); 7=automatically set (using code from automated observations)
Daily vector mean wind direction, representative for 10 meters, in degrees. Wind direction has been weighted with wind speed during aggregation. 360=north; 90=east; 180=south; 270=west; 0=calm/variable
*1: The derived value has been calculated from the hourly timeseries. For this variable the
hourly timeseries reflects the measurements in the 1 min up to the whole hour, not all samples measured over
the whole period.
*2: The derived value has been calculated from the hourly timeseries. For this variable the
hourly timeseries reflects the measurements in the 10 min up to the whole hour, not all samples measured over
the whole period.