VUB ontrafelt taalevoluties via deep learning agents
Taal verandert constant. Hoe die taalverandering precies tot stand komt, onderzoekt doctoraatstudent Peter Dekker via computersimulaties in het Artificial Intelligence Lab van de Vrije Universiteit Brussel. Dekker: “Wij onderzoeken taalverandering met een combinatie van moderne technieken uit de artificiële intelligentie en data van echte talen. Ik experimenteer momenteel met Indonesische talen: het Alorees en het Lamaholot. Maar nu al wordt duidelijk dat computersimulaties interessante nieuwe inzichten kunnen opleveren. Zeker wanneer ze worden gecombineerd met gedegen taalkundige kennis over het leren van taal, en het uitgebreide veldwerk dat al is gedaan om talen te documenteren.”
Simulaties versnellen taalkundig onderzoek
In het AI Lab van de VUB ontwikkelen de onderzoeker en zijn promotor professor Bart de Boer computersimulaties, waarin virtuele sprekers van een taal duizenden gesprekken met elkaar voeren. De sprekers (in jargon: agents) wisselen onderling woorden uit. Met een woord drukt een spreker telkens een bepaald concept of een bepaalde betekenis uit: ze gebruiken bijvoorbeeld het woord “appel” om te verwijzen naar een appel. De luisteraar hoort het woord en probeert de betekenis te bepalen. Dekker: “Die simulaties leren ons hoe taal in de loop van de tijd evolueert. Zo hoeven we geen honderd jaar te wachten om taalverandering op te sporen. Onze computersimulaties versnellen zo taalkundig onderzoek. En dat levert heel wat nieuwe inzichten op. Hypothesen kunnen vaak niet – of maar moeizaam – worden onderzocht. Omdat de onderzoeksmethode te invasief is om bij bepaalde taalsprekers uit te testen. Of omdat het onmogelijk is om een bepaalde stelling in werkelijkheid te testen. Nu kunnen we dat dankzij ons computermodel wél allemaal onderzoeken. Aan de hand van de uitkomsten kan dan gerichter taalkundig onderzoek in de werkelijkheid worden gedaan.”
Studie van het Alorees
Momenteel onderzoekt Dekker, samen met onderzoekers van de Universiteit Leiden, het Alorees. Dat is een taal die alleen gesproken wordt op Alor en Pantar, twee eilandjes in het oosten van Indonesië. Het opvallende aan Alorees is dat het bijna zijn hele systeem van woorduitgangen heeft verloren. In het Nederlands zegt men ‘ik spreek, jij spreekt, wij spreken’. In het Alorees is het altijd ‘tutu (ik), tutu (jij), tutu (wij)’. Gek genoeg behield de meest verwante taal van het Alorees – het Lamaholot – wél alle werkwoorduitgangen. Daarin zeg je: tutuken (ik), tutuko (jij), tutute (wij). Dekker: “Als je je als volwassene probeert uit te drukken in een vreemde taal, bestaat de kans dat je die gaat vereenvoudigen. Bijvoorbeeld door het ingewikkelde systeem van uitgangen overboord te gooien. Taalkundigen denken dus dat het Alorees zijn woorduitgangen verloren had door contact met andere taalsprekers. Maar de eerste resultaten van de simulatie wijzen voorlopig nog een andere kant op.”
“Het probleem is dat je niet zomaar een situatie mét en zonder taalcontact kan gaan vergelijken. Want je kunt de geschiedenis van de eilanden Alor en Pantar, met veel taalcontact, niet terugspoelen, en opnieuw afspelen met minder taalcontact. Taalexperimenten met proefpersonen in het lab zijn interessant, maar staan dan weer verder af van het taalgebruik in de echte wereld. Dankzij AI en computersimulaties kunnen we vroeg of laat wél achterhalen waarom het Alorees in de loop van de tijd zijn woorduitgangen heeft verloren, en ook vele andere taalkundige vragen oplossen,” besluit Dekker.
Dit onderzoek werd gefinancierd door AI Flanders en FWO.