sidebanner

nyheder

Årets Lasker Basic Medical Research Award blev tildelt Demis Hassabis og John Jumper for deres bidrag til skabelsen af ​​det kunstige intelligenssystem AlphaFold, der forudsiger proteiners tredimensionelle struktur baseret på førsteordenssekvensen af ​​aminosyrer.

 

Deres resultater løser et problem, der længe har plaget det videnskabelige samfund, og åbner døren for at accelerere forskningen på tværs af det biomedicinske felt. Proteiner spiller en central rolle i sygdomsudvikling: ved Alzheimers sygdom folder og klumper de sig sammen; ved kræft mistes deres regulerende funktion; ved medfødte stofskiftesygdomme er de dysfunktionelle; ved cystisk fibrose havner de i det forkerte rum i cellen. Dette er blot nogle få af de mange mekanismer, der forårsager sygdom. Detaljerede proteinstrukturmodeller kan give atomkonfigurationer, drive design eller udvælgelse af molekyler med høj affinitet og accelerere lægemiddeludvikling.

 

Proteinstrukturer bestemmes generelt ved hjælp af røntgenkrystallografi, kernemagnetisk resonans og kryoelektronmikroskopi. Disse metoder er dyre og tidskrævende. Dette resulterer i eksisterende 3D-proteinstrukturdatabaser med kun omkring 200.000 strukturelle data, mens DNA-sekventeringsteknologi har produceret mere end 8 millioner proteinsekvenser. I 1960'erne opdagede Anfinsen et al., at aminosyrers 1D-sekvens spontant og gentagne gange kan foldes ind i en funktionel tredimensionel konformation (figur 1A), og at molekylære "chaperoner" kan accelerere og lette denne proces. Disse observationer fører til en 60 år lang udfordring inden for molekylærbiologi: at forudsige proteiners 3D-struktur ud fra aminosyrers 1D-sekvens. Med succesen med Human Genome Project er vores evne til at opnå 1D-aminosyresekvenser blevet betydeligt forbedret, og denne udfordring er blevet endnu mere presserende.

ST6GAL1-proteinstruktur

Det er vanskeligt at forudsige proteinstrukturer af flere årsager. For det første kræver alle mulige tredimensionelle positioner for hvert atom i hver aminosyre en masse udforskning. For det andet udnytter proteiner maksimalt komplementaritet i deres kemiske struktur for effektivt at konfigurere atomer. Da proteiner typisk har hundredvis af hydrogenbindings-"donorer" (normalt ilt), der bør være tæt på hydrogenbindings-"acceptoren" (normalt nitrogen bundet til hydrogen), kan det være meget vanskeligt at finde konformationer, hvor næsten hver donor er tæt på acceptoren. For det tredje er der begrænsede eksempler på træning af eksperimentelle metoder, så det er nødvendigt at forstå de potentielle tredimensionelle interaktioner mellem aminosyrer på basis af 1D-sekvenser ved hjælp af information om udviklingen af ​​de relevante proteiner.

 

Fysik blev først brugt til at modellere atomers interaktion i søgen efter den bedste konformation, og en metode blev udviklet til at forudsige proteiners struktur. Karplus, Levitt og Warshel blev tildelt Nobelprisen i kemi i 2013 for deres arbejde med beregningsmæssig simulering af proteiner. Fysikbaserede metoder er imidlertid beregningsmæssigt dyre og kræver omtrentlig behandling, så præcise tredimensionelle strukturer kan ikke forudsiges. En anden "vidensbaseret" tilgang er at bruge databaser med kendte strukturer og sekvenser til at træne modeller gennem kunstig intelligens og maskinlæring (AI-ML). Hassabis og Jumper anvender elementer fra både fysik og AI-ML, men innovationen og fremskridtet i tilgangens ydeevne stammer primært fra AI-ML. De to forskere kombinerede kreativt store offentlige databaser med industrielle computerressourcer for at skabe AlphaFold.

 

Hvordan ved vi, at de har "løst" gåden om strukturel forudsigelse? I 1994 blev konkurrencen Critical Assessment of Structure Prediction (CASP) etableret, som mødes hvert andet år for at spore fremskridtene inden for strukturel forudsigelse. Forskerne vil dele 1D-sekvensen af ​​det protein, hvis struktur de for nylig har løst, men hvis resultater endnu ikke er blevet offentliggjort. Prædiktoren forudsiger den tredimensionelle struktur ved hjælp af denne 1D-sekvens, og evaluatoren bedømmer uafhængigt kvaliteten af ​​de forudsagte resultater ved at sammenligne dem med den tredimensionelle struktur, som eksperimentatoren har leveret (kun leveret til evaluatoren). CASP udfører ægte blinde gennemgange og registrerer periodiske præstationsspring forbundet med metodologisk innovation. På den 14. CASP-konference i 2020 viste AlphaFolds forudsigelsesresultater et sådant spring i præstation, at arrangørerne annoncerede, at problemet med 3D-strukturforudsigelse var blevet løst: nøjagtigheden af ​​de fleste forudsigelser var tæt på nøjagtigheden af ​​eksperimentelle målinger.

 

Den bredere betydning er, at Hassabis og Jumpers arbejde overbevisende demonstrerer, hvordan AI-ML kan transformere videnskaben. Forskningen viser, at AI-ML kan opbygge komplekse videnskabelige hypoteser ud fra flere datakilder, at opmærksomhedsmekanismer (svarende til dem i ChatGPT) kan opdage centrale afhængigheder og korrelationer i datakilder, og at AI-ML selv kan bedømme kvaliteten af ​​sine outputresultater. AI-ML handler i bund og grund om at udføre videnskab.


Opslagstidspunkt: 23. september 2023