TehnoȘtiri

DETERMINAREA STRUCTURII PROTEINELOR CU AJUTORUL INTELIGENȚEI ARTIFICIALE

(c) DeepMind

Pentru a cartografia structura a doar 17% din proteinele din corpul uman a fost nevoie de zeci de ani de cercetări minuțioase. Totuși, în mai puțin de un an, DeepMind, compania de inteligență artificială din Marea Britanie, a ridicat acest procent la 98,5%. Compania pune la dispoziție toate aceste date în mod liber, ceea ce ar putea conduce la realizarea unor progrese rapide în dezvoltarea de noi medicamente.

Determinarea formei complexe a proteinelor pe baza secvenței de aminoacizi din care sunt compuse a reprezentat un imens obstacol științific. Unii aminoacizi sunt atrași între ei, alții sunt hidrofobi, iar lanțurile de aminoacizi formează forme complicate, greu de calculat cu precizie. Înțelegerea acestor structuri ar putea permite dezvoltarea unor medicamente noi, foarte specializate, care să acționeze doar în anumite zone ale proteinelor.

Pentru o lungă perioadă de timp, cercetarea genetică a oferit oamenilor capacitatea de a determina secvența unei proteine, dar o modalitate eficientă de a vizualiza forma acestora, care este crucială pentru înțelegerea proprietăților sale, s-a dovedit a fi o sarcină foarte grea. Deși supercomputerele și proiectele de calcul distribuite au fost eficiente, acestea nu au reușit să facă progrese semnificative.

În anul 2020, compania DeepMind a publicat o serie de cercetări prin care s-a dovedit faptul că inteligența artificială (IA) poate rezolva aceste probleme într-un timp foarte scurt. AlphaFold, rețeaua neuronală a companiei, a fost instruită pe secțiuni de forme proteice rezolvate anterior și a învățat să deducă structura noilor secvențe, care au fost apoi verificate în raport cu datele experimentale.

Din acel moment, compania a aplicat și rafinat tehnologia pentru mii de proteine, începând cu proteomul uman și continuând cu proteine ​​relevante pentru studiul bolii Covid-19. În prezent, compania a publicat rezultatele într-o bază de date creată în parteneriat cu Laboratorul European de Biologie Moleculară.

DeepMind a cartografiat structura a 98,5% din cele aproximativ 20.000 de proteine ​​din corpul uman. Pentru 35,7% dintre acestea, algoritmul a avut o precizie de 90% atunci când a venit vorba de prezicerea formei acestora.

Compania a lansat peste 350.000 de previziuni ale structurilor proteinelor, inclusiv pentru 20 de organisme care sunt importante în cercetarea biologică, precum Escherichia coli și drojdia. Echipa speră ca în următoarele luni să poată adăuga în baza de date aproape toate proteinele secvențiate cunoscute, adică mai mult de 100 de milioane de structuri.

John Moult din cadrul Universității din Maryland a declarat faptul că utilizarea cu succes a modulelor IA în domeniul proteinelor a fost o „surpriză plăcută”.

„Este un lucru revoluționar. Dacă în trecut studierea unor boli rare era foarte anevoioasă din considerente structurale, acum vom putea analiza aceste informații care erau practic foarte, foarte greu sau imposibil de obținut”, a adăugat Moult.

Demis Hassabis, director executiv și fondator al companiei DeepMind, a declarat faptul că AlphaFold, care este compus din aproximativ 32 de algoritmi separați și care este un sistem de tip open source, poate determina în prezent forme de proteine ​​în câteva minute sau, în unele cazuri, în câteva secunde, folosind hardware care nu este mai sofisticat decât un placă grafică standard.

„Este nevoie de utilizarea unei unități grafice de procesare timp de câteva minute pentru a determina forma unei proteine, ceea ce, desigur, ar fi durat ani de zile dacă ar fi fost utilizate metode experimentale. Vom oferi publicului larg întregul set de date. Într-un fel, această realizare este una extraordinară, deoarece trecerea de la progresul creării unui sistem care poate face acest lucru până la producerea efectivă a tuturor datelor a fost realizată în doar câteva luni. Sperăm că acesta va deveni un instrument standard, pe care îl vor folosi toți biologii din întreaga lume”, a declarat Hassabis.

Hassabis consideră că scorurile de încredere mai mici pentru o parte din proteinele umane ar putea fi datorate erorilor în secvență sau a unor „informații intrinseci din biologie”, precum proteinele care sunt inerent dezordonate sau imprevizibile. Restul de 1,5% din proteomul uman pentru care nu a fost publicată nicio structură era format din proteine ​​cu secvențe mai lungi de 2700 de segmente, care au fost excluse din analiză pentru moment pentru a minimiza timpul de rulare.