VUB-klimaatonderzoeker Derrick Muheki snorde op een motorfiets naar het hart van het Congobekken om oude meteorologische logs in te scannen. Terug in Brussel ontwikkelde hij de tool MeteoSaver, die de handschriften in digitale tekst omzette. Nature wijdde een nieuwsartikel aan zijn avonturen en ook TIME was onder de indruk. Het selecteerde MeteoSaver als één van de belangrijkste uitvindingen van 2025. De jonge wetenschapper wist even niet waar hij het had. “Het heeft een paar dagen geduurd voor ik geloofde dat het echt was.” 

Het archief van INERA, het land- en bosbouwkundig instituut van de Democratische Republiek Congo, bevat een schat aan weerkundige informatie: meteorologische logs van 37 weerstations, verzameld na de onafhankelijkheid in 1960. Yangambi, want daar bevindt het archief zich, is niet gemakkelijk bereikbaar. In de zomer van 2023 vloog Derrick Muheki eerst van Kinshasa naar Kisangani. Vervolgens voer hij een stuk van de Congorivier af. Het laatste stuk van de reis legde hij met de motor af, dokkerend over een onverharde weg,  

Derrick Muheki: “De motor is daar een vorm van openbaar vervoer. Ik zat achterop, mijn materiaal reisde mee met een tweede motor: een fototoestel, fotolampen en een flinke voorraad batterijen. Er is geen elektriciteitsnetwerk in de streek, ook niet in het archief zelf. De enige stroom komt van batterijen en generatoren.” 

Portret van Derrick Muheki

Derrick Muheki aan het werk in Yangambi

In welke staat vond je het archief? 
“Het België worden meteorologische logs uit de koloniale periode in metalen dozen en zuurvrij papier bewaard, onder gecontroleerde temperatuur en luchtvochtigheid. In Yangambi hebben ze daar de middelen niet voor. De documenten lagen er in stapels op rekken, blootgesteld aan vocht en insecten. Een maand of vier voor mijn verblijf was er in een van de andere vleugels trouwens nog een brand uitgebroken. Als je zoiets ziet, besef je meteen hoe kwetsbaar papieren archieven zijn en hoe belangrijk het is om die data te redden voor ze verloren gaan.” 

Wat heb je daar precies gedaan?
“Ik heb twee maanden lang documenten gescand, ongeveer 9.000 stuks in totaal.” 

Dat viel mee?  
“Ja hoor. De samenwerking met de INERA-stafleden verliep prima. Zonder hun ondersteuning als lokale partner zou mijn werk onmogelijk geweest zijn. Zij hebben gedurende decennia de waarnemingen zorgvuldig verzameld en bewaard. Ik ben afkomstig uit het zuidwesten van Oeganda, vlakbij de grens met Congo. Tot mijn verrassing leek het Lingala dat men daar spreekt behoorlijk goed op mijn eigen taal, het Runyankole. Ik heb snel een mondjevol woorden en uitdrukkingen geleerd, zodat ik me goed uit de slag kon trekken.” 

Terug in Brussel stond je voor een tweede uitdaging: de handschriften op de scans transcriberen. 
“Normaal gebeurt dat handmatig, meestal via citizen science: vrijwilligers of studenten ontcijferen de documenten en typen alle cijfers en andere gegevens over. Dat is zeer omslachtig en tijdrovend werk. Als alternatief heb ik een transcriptieprogramma ontwikkeld: de machine learning tool MeteoSaver. Ik kon daarvoor rekenen op hulp van collega’s van de UGent, die al decennia in Yangambi werken en ook hun expertise in tekstmining deelden.” 

"Uiteindelijk haalden we een nauwkeurigheid van meer dan 90 procent. Dat is vergelijkbaar met het werk van een mens"

Wat waren de grootste hindernissen? 
“Om te beginnen krijg je te maken met veel verschillende formaten en kwaliteiten van papier. Ook de tabellenstructuur is een probleem: transcriptietools hebben het daar traditioneel altijd moeilijk mee. En dan zijn er nog de handschriften. Ik had er nooit bij stilgestaan hoeveel variatie daarin zit. Bij sommige mensen lijkt de 3 op een 8, bij andere zie je nauwelijks het verschil tussen een 2 en een 9. Ik heb alle beschikbare tools uitgeprobeerd, maar het resultaat was telkens slecht. Ze werken alleen goed met geprinte teksten.”

Met jouw tool MeteoSaver lukt het beter? 
“Niet meteen. In het begin transcribeerde MeteoSaver de geschreven tekst met een nauwkeurigheid van 75 procent. Met behulp van Tesseract, een open-source pakket voor optische tekstherkenning, en machine learning slaagden we erin om de resultaten steeds verder verfijnen. Uiteindelijk haalden we een nauwkeurigheid van meer dan 90 procent. Dat is vergelijkbaar met het werk van een mens.”

Hoe gaat het nu verder met MeteoSaver? 
“De tool komt met een handleiding en is open-source: iedereen mag hem downloaden en gratis gebruiken. De ‘data rescue community’ – dat zijn mensen die zich inspannen om oude archieven te redden en te ontsluiten - reageert enthousiast. Wetenschappers uit België, Nederland en het Verenigd Koninkrijk MeteoSaver beginnen de tool nu al te gebruiken. We hopen dat veel anderen zullen volgen. De klimaatwetenschap kan er maar wel bij varen.”  

Derrick Muheki werkt aan een doctoraat over hydroklimatologische trends in het Congobekken. Volgens zijn promotor prof. dr. Wim Thiery (onderzoeksgroep bclimate) is zijn MeteoSaver een gamechanger in het klimaatonderzoek.

Wim Thiery: “Klimaatmodellen zijn maar zo goed als de data die we erin stoppen. Voor het regenwoud in centraal Afrika en andere delen van het Mondiale Zuiden ontbreken nog veel data, vaak omdat die stof liggen te vergaren op een rek of in een kelder. Dat zorgde onder andere voor een leemte voor het Afrikaanse continent in het IPCC-rapport van 2021, dat de ernst en de snelheid van de opwarming van de aarde inschatte. Met tools als MeteoSaver kunnen we een deel van die achterstand sneller inhalen en de klimaatmodellen robuuster maken.”  

Wat heeft de Democatische Republiek Congo hier zelf aan? 
“De data kunnen helpen om de impact van klimaatverandering op extreme weersfenomenen te onderzoeken. We zouden bijvoorbeeld kunnen nagaan of ernstige droogte en overstromingen daar vroeger op dezelfde manier voorkwamen of dat er net verschillen waren.”  

Komt de tool ook elders van pas? 
Wim Thiery: “Zeker. Ook in het Mondiale Noorden zijn veel archieven nog niet digitaal ontsloten. Ze bevatten vaak informatie over vroegere kolonies, in het geval van de Nederlandse archieven onder andere over de Caraïbische eilanden. En het Verenigd Koninkrijk heeft letterlijk honderdduizenden documenten uit de tijd dat ze nog overal in de wereld aanwezig waren. Door die data te redden en digitaal beschikbaar te stellen, geven we ze meteen ook terug aan die landen.”

Digitalisering door Derrick Muheki

Hoe ver kunnen we op deze manier in de tijd teruggaan? 
“Verder dan 1850. Dat jaar wordt meestal gebruikt als cesuur tussen de pre- en postindustriële periode, en dus als het begin van de menselijke impact op het klimaat. Maar eigenlijk is 1850 vooral gekozen omdat de metingen pas vanaf dat moment als betrouwbaar beschouwd werden. Nochtans zijn er in de archieven nuttige meteorologische gegevens te vinden die teruggaan tot de late jaren 1700.” 

Valt er nog iets te ontdekken in de archieven van ons eigen KMI? 
“Het Koninklijk Meteorologisch Instituut van België bezit de langst ononderbroken reeks van luchtdrukmetingen ter wereld. Sinds 1833 voert het KMI in Brussel dagelijkse luchtdrukmetingen uit, op een consistente en wetenschappelijk betrouwbare manier. Die gegevens zijn heel relevant voor het internationale klimaatonderzoek. Je kunt ze bijvoorbeeld gebruiken om na te gaan wanneer er in de laatste twee eeuwen intense stormen geweest zijn, en die vergelijken met de stormen van vandaag. Ook die data zijn nog niet gedigitaliseerd.” 

Portret van Derrick Muheki

BIO

Derrick Muheki haalde aan de VUB een joint master (VUB - KULeuven) in Water Resources Engineering. Momenteel heeft hij een FWO-aspirantenmandaat. Dit fellowship, gefinancierd door het Fonds Wetenschappelijk Onderzoek Vlaanderen, is een persoonlijke onderzoeksbeurs die hem in staat stelt om zelfstandig zijn doctoraatsonderzoek uit te voeren.  



 

BIO

Prof. Wim Thiery werd in 2017 aangesteld als onderzoeksprofessor aan de Vrije Universiteit Brussel (VUB), waar hij de bclimate-groep leidt. Hij was medeauteur van het IPCC Special Report on Climate Change and Land (2019) en het Zesde Evaluatierapport (2021). Zijn expertise omvat klimaatverandering, klimaatextremen, regionale en mondiale klimaatmodellering, interacties tussen land en atmosfeer, landbeheer, vroegtijdige waarschuwingen voor stormen, energiemeteorologie en modellering van klimaateffecten op wereldschaal. 

Portret van Wim Thiery