Ovogodišnja nagrada Lasker Basic Medical Research Award dodijeljena je Demisu Hassabisu i Johnu Jumperu za njihov doprinos stvaranju sustava umjetne inteligencije AlphaFold koji predviđa trodimenzionalnu strukturu proteina na temelju slijeda aminokiselina prvog reda.
Njihovi rezultati rješavaju problem koji dugo muči znanstvenu zajednicu i otvaraju vrata ubrzanju istraživanja u biomedicinskom području. Proteini igraju ključnu ulogu u razvoju bolesti: kod Alzheimerove bolesti se savijaju i skupljaju; kod raka se gubi njihova regulatorna funkcija; kod urođenih metaboličkih poremećaja su disfunkcionalni; kod cistične fibroze ulaze u pogrešan prostor u stanici. Ovo su samo neki od mnogih mehanizama koji uzrokuju bolest. Detaljni modeli strukture proteina mogu pružiti atomske konfiguracije, potaknuti dizajn ili odabir molekula visokog afiniteta i ubrzati otkrivanje lijekova.
Strukture proteina općenito se određuju rendgenskom kristalografijom, nuklearnom magnetskom rezonancijom i krioelektronskom mikroskopijom. Ove su metode skupe i dugotrajne. To rezultira postojećim 3D bazama podataka o strukturama proteina s oko 200 000 strukturnih podataka, dok je tehnologija sekvenciranja DNA proizvela više od 8 milijuna proteinskih sekvenci. U 1960-ima, Anfinsen i suradnici otkrili su da se 1D slijed aminokiselina može spontano i ponovljeno saviti u funkcionalnu trodimenzionalnu konformaciju (slika 1A) te da molekularni "šaperoni" mogu ubrzati i olakšati taj proces. Ova opažanja dovode do 60-godišnjeg izazova u molekularnoj biologiji: predviđanja 3D strukture proteina iz 1D slijeda aminokiselina. S uspjehom Projekta ljudskog genoma, naša sposobnost dobivanja 1D slijedova aminokiselina uvelike se poboljšala, a ovaj izazov postao je još hitniji.
Predviđanje proteinskih struktura teško je iz nekoliko razloga. Prvo, svi mogući trodimenzionalni položaji svakog atoma u svakoj aminokiselini zahtijevaju puno istraživanja. Drugo, proteini maksimalno koriste komplementarnost u svojoj kemijskoj strukturi kako bi učinkovito konfigurirali atome. Budući da proteini obično imaju stotine "donora" vodikovih veza (obično kisik) koji bi trebali biti blizu "akceptora" vodikove veze (obično dušik vezan za vodik), može biti vrlo teško pronaći konformacije gdje je gotovo svaki donor blizu akceptora. Treće, postoje ograničeni primjeri za obuku eksperimentalnih metoda, stoga je potrebno razumjeti potencijalne trodimenzionalne interakcije između aminokiselina na temelju 1D sekvenci koristeći informacije o evoluciji relevantnih proteina.
Fizika je prvi put korištena za modeliranje interakcije atoma u potrazi za najboljom konformacijom, a razvijena je i metoda za predviđanje strukture proteina. Karplus, Levitt i Warshel dobili su Nobelovu nagradu za kemiju 2013. za svoj rad na računalnoj simulaciji proteina. Međutim, metode temeljene na fizici računalno su skupe i zahtijevaju približnu obradu, pa se ne mogu predvidjeti precizne trodimenzionalne strukture. Drugi pristup „temeljen na znanju“ je korištenje baza podataka poznatih struktura i sekvenci za treniranje modela putem umjetne inteligencije i strojnog učenja (AI-ML). Hassabis i Jumper primjenjuju elemente i fizike i AI-ML-a, ali inovacija i skok u performansama pristupa proizlaze prvenstveno iz AI-ML-a. Dvojica istraživača kreativno su kombinirali velike javne baze podataka s računalnim resursima industrijske razine kako bi stvorili AlphaFold.
Kako znamo da su „riješili“ zagonetku strukturnog predviđanja? Godine 1994. osnovano je natjecanje Kritička procjena strukturnog predviđanja (CASP), koje se sastaje svake dvije godine kako bi se pratio napredak strukturnog predviđanja. Istraživači će podijeliti 1D sekvencu proteina čiju su strukturu nedavno riješili, ali čiji rezultati još nisu objavljeni. Prediktor predviđa trodimenzionalnu strukturu koristeći ovu 1D sekvencu, a evaluator neovisno ocjenjuje kvalitetu predviđenih rezultata uspoređujući ih s trodimenzionalnom strukturom koju je dao eksperimentalac (koja se daje samo evaluatoru). CASP provodi prave slijepe preglede i bilježi periodične skokove performansi povezane s metodološkim inovacijama. Na 14. CASP konferenciji 2020. godine, rezultati predviđanja AlphaFolda pokazali su takav skok u performansama da su organizatori objavili da je problem 3D predviđanja strukture riješen: točnost većine predviđanja bila je blizu onoj eksperimentalnih mjerenja.
Šire značenje je u tome što rad Hassabisa i Jumpera uvjerljivo pokazuje kako bi AI-ML mogao transformirati znanost. Njihovo istraživanje pokazuje da AI-ML može graditi složene znanstvene hipoteze iz više izvora podataka, da mehanizmi pažnje (slični onima u ChatGPT-u) mogu otkriti ključne ovisnosti i korelacije u izvorima podataka te da AI-ML može samostalno procijeniti kvalitetu svojih izlaznih rezultata. AI-ML u biti radi znanost.
Vrijeme objave: 23. rujna 2023.




