Az idei Lasker Alapvető Orvosi Kutatási Díjat Demis Hassabis és John Jumper kapta az AlphaFold mesterséges intelligencia rendszer létrehozásához való hozzájárulásukért, amely az aminosavak elsőrendű szekvenciája alapján jósolja meg a fehérjék háromdimenziós szerkezetét.
Eredményeik megoldanak egy problémát, amely régóta foglalkoztatja a tudományos közösséget, és megnyitják az utat a biomedicinális területen zajló kutatások felgyorsítása előtt. A fehérjék kulcsszerepet játszanak a betegségek kialakulásában: Alzheimer-kór esetén feltekerednek és összecsomósodnak; rákban szabályozó funkciójuk elvész; veleszületett anyagcserezavarokban diszfunkcionálisak; cisztás fibrózisban a sejtben a rossz helyre kerülnek. Ezek csak néhány példa a betegségeket okozó számos mechanizmusra. A részletes fehérjeszerkezeti modellek atomkonfigurációkat biztosíthatnak, irányíthatják a nagy affinitású molekulák tervezését vagy szelekcióját, és felgyorsíthatják a gyógyszerkutatást.
A fehérjeszerkezeteket általában röntgenkrisztallográfiával, mágneses magrezonanciával és krioelektronmikroszkópiával határozzák meg. Ezek a módszerek drágák és időigényesek. Ennek eredményeként a meglévő 3D fehérjeszerkezeti adatbázisok mindössze körülbelül 200 000 szerkezeti adatot tartalmaznak, míg a DNS-szekvenálási technológia több mint 8 millió fehérjeszekvenciát eredményezett. Az 1960-as években Anfinsen és munkatársai felfedezték, hogy az aminosavak egydimenziós szekvenciája spontán és ismételhetően feltekeredhet funkcionális háromdimenziós konformációba (1A. ábra), és hogy a molekuláris „chaperonok” felgyorsíthatják és elősegíthetik ezt a folyamatot. Ezek a megfigyelések egy 60 éves kihíváshoz vezetnek a molekuláris biológiában: a fehérjék 3D-s szerkezetének előrejelzése az aminosavak egydimenziós szekvenciájából. A Humán Genom Projekt sikerével az egydimenziós aminosavszekvenciák megszerzésének képessége jelentősen javult, és ez a kihívás még sürgetőbbé vált.
A fehérjeszerkezetek előrejelzése több okból is nehéz. Először is, minden egyes atom összes lehetséges háromdimenziós pozíciójának meghatározása minden aminosavban sok kutatást igényel. Másodszor, a fehérjék maximálisan kihasználják a komplementaritást kémiai szerkezetükben az atomok hatékony konfigurálása érdekében. Mivel a fehérjék jellemzően több száz hidrogénkötés „donorral” (általában oxigénnel) rendelkeznek, amelyeknek közel kell lenniük a hidrogénkötés „akceptorához” (általában nitrogénhez kötődve), nagyon nehéz lehet olyan konformációkat találni, ahol szinte minden donor közel van az akceptorhoz. Harmadszor, korlátozott számú példa áll rendelkezésre a kísérleti módszerek betanítására, ezért szükséges megérteni az aminosavak közötti lehetséges háromdimenziós kölcsönhatásokat az egydimenziós szekvenciák alapján, a releváns fehérjék evolúciójára vonatkozó információk felhasználásával.
A fizikát először az atomok kölcsönhatásának modellezésére használták a legjobb konformáció keresése során, és kifejlesztettek egy módszert a fehérjék szerkezetének előrejelzésére. Karplus, Levitt és Warshel 2013-ban kémiai Nobel-díjat kaptak a fehérjék számítógépes szimulációjával végzett munkájukért. A fizikán alapuló módszerek azonban számítási szempontból drágák és közelítő feldolgozást igényelnek, így a pontos háromdimenziós szerkezetek nem jósolhatók meg. Egy másik „tudásalapú” megközelítés az ismert szerkezetek és szekvenciák adatbázisainak használata a modellek mesterséges intelligencia és gépi tanulás (AI-ML) segítségével történő betanítására. Hassabis és Jumper mind a fizika, mind az AI-ML elemeit alkalmazzák, de a megközelítés innovációja és teljesítménybeli ugrása elsősorban az AI-ML-ből fakad. A két kutató kreatívan kombinálta a nagy nyilvános adatbázisokat ipari szintű számítási erőforrásokkal az AlphaFold létrehozásához.
Honnan tudjuk, hogy „megoldották” a szerkezeti predikció rejtélyét? 1994-ben létrehozták a Szerkezet-predikció Kritikus Értékelése (CASP) versenyt, amely kétévente kerül megrendezésre, hogy nyomon kövesse a szerkezeti predikció előrehaladását. A kutatók megosztják annak a fehérjének az egydimenziós szekvenciáját, amelynek szerkezetét nemrégiben megoldották, de amelynek eredményeit még nem publikálták. A prediktor ezen egydimenziós szekvencia segítségével jósolja meg a háromdimenziós szerkezetet, és az értékelő függetlenül megítéli az előrejelzett eredmények minőségét a kísérletező által megadott háromdimenziós szerkezettel összehasonlítva (amelyet csak az értékelő kap meg). A CASP valódi vakvizsgálatokat végez, és rögzíti a módszertani innovációval összefüggő időszakos teljesítményugrásokat. A 2020-as 14. CASP konferencián az AlphaFold predikciós eredményei olyan teljesítményugrást mutattak, hogy a szervezők bejelentették, hogy a 3D szerkezet-predikciós problémát megoldották: a legtöbb predikció pontossága közel volt a kísérleti mérések pontosságához.
A tágabb értelemben vett jelentőség abban rejlik, hogy Hassabis és Jumper munkája meggyőzően bemutatja, hogyan alakíthatja át a mesterséges intelligencia és a gépi tanulás (MI-ML) a tudományt. Kutatása azt mutatja, hogy a mesterséges intelligencia és a gépi tanulás (AI-ML) összetett tudományos hipotéziseket képes felállítani több adatforrásból, hogy a figyelmi mechanizmusok (hasonlóan a ChatGPT-ben találhatóakhoz) képesek felfedezni a kulcsfontosságú függőségeket és korrelációkat az adatforrásokban, és hogy a mesterséges intelligencia és a gépi tanulás képes önállóan megítélni a kimeneti eredmények minőségét. A mesterséges intelligencia és a gépi tanulás lényegében tudományt művel.
Közzététel ideje: 2023. szeptember 23.




