Door Steijn van Schie - Foto: Flickr/Christoph Scholz - 16-01-2021 - Microbiologie

Welke virusvarianten gaan in de toekomst voor problemen zorgen? Een zelflerend algoritme uit de taalwetenschap poogt dat te achterhalen, ook voor sars-cov-2.
De mutaties waardoor virussen kunnen ontsnappen aan vaccins, antivirale middelen of het immuunsysteem zijn te voorspellen met een linguïstisch model dat oorspronkelijk is ontwikkeld om computers te trainen in het begrijpen van menselijke taal. Dat demonstreren MIT-onderzoekers 15 januari in Science door het zelflerend algoritme los te laten op aminozuursequenties van de bij infectie betrokken envelop-eiwitten van sars-cov-2, influenza en hiv-1. Het model wijst niet alleen vrij accuraat de zogeheten ontsnappingsmutaties aan, maar ook de regionen waarin de kans op dergelijke veranderingen groot is.
Regels
Hoewel hier ogenschijnlijk totaal verschillende vakgebieden aan elkaar worden gekoppeld, zien de onderzoekers duidelijke overeenkomsten tussen taal- en viruseigenschappen. Hun redenatie: net zoals zinnen moeten voldoen aan bepaalde grammaticale regels, moeten mutante virussen voldoen aan een set biologische regels om te kunnen overleven. Simpel gezegd, een mutatie mag niet ten koste gaan van het vermogen om gastheercellen binnen te dringen, oftewel de besmettelijkheid. Aan de andere kant kan een mutatie – net als een enkele woordwijziging in een zin – het virus zodanig van betekenis doen veranderen dat het niet meer te herkennen is voor antilichamen.
Spike-eiwit
De analogie lijkt misschien vergezocht, maar door algoritmes uit de taalwetenschap op sequentiedata van virussen los te laten, weten de onderzoekers wel eiwitregionen te identificeren met een hoog ‘ontsnappingspotentieel’: bij influenza het kopgedeelte van hemagglutinine, voor hiv-1 de zogeheten v1/v2-hypervariabele regionen en voor sars-cov-2 de aminoterminus van het beruchte spike-eiwit. Ook is het naar eigen zeggen een veel snellere manier om problematische virusmutanten te voorspellen, dan via de tijdsintensieve experimentele technieken die daar nu doorgaans voor worden ingezet.
In een begeleidend perspective in Science noemen twee Amerikaanse bio-informatici de publicatie ‘een elegant voorbeeld van hoe onderzoek plotsklaps in een stroomversnelling kan komen door een onverwachte verbintenis met een volledig ander vakgebied’. Wel vragen ze zich af in hoeverre dit model ook echt toepasbaar is, aangezien er veel individuele variatie is in immuunsystemen.
Deep learning
Ook Berend Snel, hoogleraar bio-informatica aan de Universiteit Utrecht, zet vooralsnog vraagtekens bij de toepasbaarheid: ‘Aan de ene kant laten ze prachtig zien hoe ongelooflijk waardevol deep learning kan zijn om – daar waar klassieke methoden ontoereikend zijn – betekenis te halen uit aminozuursequenties. Aan de andere kant is de voorspellende waarde van het model niet goed genoeg om daar bijvoorbeeld de ontwikkeling van vaccins op te baseren. Daarvoor moet het nog verder worden verfijnd. Al met al is het een mooie aanvulling op experimentele ontwikkelingen, die natuurlijk ook niet stil staan.’