Predviđanje proteinske strukture

Izvor: Wikipedia

Predviđanje strukture proteina je jedna od najznačajnijih tehnologija koju koriste računska strukturna biologija i teoretska hemija. Ima za cilj određivanje trodimenzionalne strukture proteina u zavisnosti od redosleda aminokiselina. Prostije rečeno, ova tehnologija predviđa tercijarnu strukturu[1] proteina u zavisnosti od njene primarne strukture[2]. S obzirom na korisnost poznate strukture proteina, kao što je recimo racionalno otkrivanje lekova, ovo je veoma aktivno istraživačko polje.

Uvod[uredi - уреди]

Praktična uloga predviđanja strukture proteina je sada važnija nego ikad. Ogromne količine podataka o strukturi proteina se mogu dobiti pomoću modernih napora struktuisanja velikog opsega DNK, kao što je „Human Genome Project“. Uprkos sveobuhvatnim naporima u strukturnoj genetici, rezultat eksperimantalno određenih struktura proteina, obično korišćenjem relativno skupe rendgenostrukturne analize i NMR sprektroskopije, veoma kasni za rezltatima proteinskog poredka. Postoji veći broj faktora, koji predviđanje strukture proteina čine teškim zadatkom, a među njih spadaju:

  • Broj mogućih struktura koje protein može da ima je veoma veliki i to je označeno kao Levintalov paradoks.
  • Fizička baza stabilnosti proteinske strukture nije u potpunosti shvaćena (poznata).
  • Za formiranje tercijarne strukture neophodni su proteini poznati kao „pratioci“ (chaperones, eng.) koji su potrebni nekim proteinima kako bi se pravilno uvili, dok se drugi proteini ne mogu pravilno uviti bez modifikacija kao što je glikozilacija.
  • Određeni redosled aminokiselina u zavisnosti od svoje okoline bi možda mogao da pretpostavi višestruke konformacije, pa tada biološki aktivna konformacija ne bi bila termodinamički najpovoljnija.
  • Direktna simulacija uvijanja proteina putem metoda kao što je molekularna dinamika, uprkos naporima rasprostranjenih kompjuterskih projekata (kao što je Folding@home), nije lako obradiva, kako iz praktičnih tako i iz teoretskih razloga, osim u slučaju veoma malih proteina.

Uprkos gore navedenim preprekama, mnoge istraživačke grupe, koje se bave ovim zadatkom, prave veliki napredak. Predviđanje strukture malih proteina je sada savršeno realan cilj. Širok spektar metoda se rutinski primenjuje za ovakva predviđanja. Ovi pristupi se mogu podeliti u dve klase:

  • Ab initio modeliranje i
  • komparativno modeliranje.

Ab initio modeliranje proteina[uredi - уреди]

Ab initio, ili de novo metode modeliranja proteina teže izgradnji trodimenzionalnog modela proteina „od nule“ (from scratch, eng.), odnosno više su bazirani na fizičkim principima nego na prethodno rešenim strukturama. Postoje mnoge moguće procedure, koje ili pokušavaju da imitiraju uvijanje proteina ili pokušavaju da primene neke stohastičke metode kako bi pronašli moguća rešenja. Ove procedure zahtevaju ogromne računske resurse i zbog toga su bile sprovedene samo za sitne proteine. Za pokušaj predviđanja strukture proteina de novo metodom za velike proteine, biće nam neophodni bolji algoritmi i veliki računski resursi, koji se mogu sprovesti uz pomoć ili moćnih superkompjutera (kao štu su „Blue Gene“ ili „MDGRAPE-3“) ili rasprostranjenih računarskih projekata (kao što su Folding@home i Human Proteome Folding Project). Iako su ove računske barijere ogromne, potencijalna dobrobit strukturne genomike čini ab initio strukturno predviđanje aktivnim istraživačkim poljem.

Komparativno modeliranje proteina[uredi - уреди]

Komparativno modeliranje proteina koristi prethodno rešene strukture kao polazne tačke, ili uzorke. Ova metoda daje efekta jer iako je broj pravih proteina ogroman, postoji ograničen broj tercijarnih strukturnih osnova kojima većina proteina može da pripada. Utvrđeno je da, iako postoje milioni različitih proteina, u prirodi postoji samo oko 2000 karakterističnih načina njihovog uvijanja. Ove metode takođe možemo podeliti u dve grupe:

  • Homologno modeliranje je bazirano na prihvatljivoj pretpostavci da dva homologna proteina mogu da dele veoma slične strukture. Obzirom da je uvijanje proteina kroz evoluciju više sačuvano nego njihov niz aminokiselina, ciljni niz može biti izgrađen, sa prihvatljivom tačnošću, na veoma udaljenom srodnom uzorku, pod uslovom da se veza između cilja i uzorka razlikuje samo po načinu uređenja primarne strukture. Utvrđeno je da će primarna smetnja u komparativnom modeliranju pre nastati iz poteškoća u sekvenci, nego iz grešaka u predviđanju strukture koja nastaje iz dobro poznatih poravnanja.[3] Nije iznenađujuće što je homologno modeliranje najtačnije kada cilj i uzorak imaju slične nizove.
  • Računarska predikcija proteinske sekvence ili strukture („protein threading“, eng.)[4] upoređuje niz aminokiselina nepoznate strukture sa bazama podataka poznatih struktura. U svakom pojedinačnom slučaju, dobijena funkcija se koristi za procenjivanje kompatibilinosti niza sa strukturom, čime se proširuju mogući trodimenzionalni modeli. Ovakav tip metoda je takođe poznat kao 3D – 1D prepoznavanje uvijanja, zbog svoje kompatibilne analize između trodimenzionalnih struktura i linearnog niza proteina. Ovaj metod je omogućio napredak drugim metodama, koje se bave obrnutim istraživanjem uvijanja, na način kojim upoređujući kompatibilnost date strukture sa ogromnim bazama podataka nizova predviđaju koji nizovi poseduju potencijal da prouzrokuju dato uvijanje.

Geometrijsko predviđanje bočnog lanca[uredi - уреди]

Čak i metode predviđanja strukture, koje imaju prihvatljivu tačnost za peptidnu osnovu, obično daju pogrešnu orijentaciju i pakovanje bočnog lanca aminokiselina. Metode koje se isključivo bave predviđanjem geometrije bočnog lanca, uključuju metode eliminacije mrtvih krajeva („dead-end elimination“, eng.) i samodoslednosti sredine polja („self-consistent mean field“, eng.). Obe metode izoluju neprekidno promenljive dvostrane uglove koji određuju usmeravanje bočnog lanca povezanog sa osnovom u grupu rotamera (konformacije bočnog lanca sa niskom energijom) sa pričvršćenim dvostranim uglovima. Metode zatim pokušavaju da identifikuju grupe rotamera koje minimiziraju energiju krajnjeg modela. Ove metode se najviše koriste za analizu hidrofobnog jezgra proteina, gde su bočni lanci veoma gusto pakovani. One imaju više problema sa slobodnim grupama i sa visokom fleksibilnošću ostataka površine.[5]

Softver[uredi - уреди]

  • MODELLER je popularna softverska alatka za pravljenje homolognih modela korišćenjem metodologije izvedene iz obrade podataka NMR spektroskopije.
  • SwissModel pruža automatski web server za osnovno homologno modeliranje.

Najčešća softverska alatka za zavijanje proteina je 3D-PSSM. Osnovni algoritam za zavijanje je opisan u[4] i veoma jasan za korišćenje.

  • TIP je baza podataka STRUCTFAST[6] modela i kompjuterizovanih sličnosti između nizova, struktura i veza.

Protein-protein kompleks[uredi - уреди]

U slučaju kompleksa dva ili više proteina, gde su strukture proteina poznate ili se mogu predvideti sa velikom tačnošću, za predviđanje strukture kompleksa se može koristiti metoda pristajanja proteina na protein (protein-protein docking method, eng.). Informacije o efektima mutacije na određenim mestima srodnih kompleksa pomažu da razumemo kompleksne strukture i da upravljamo ovim metodama.

Vidi još[uredi - уреди]

Reference[uredi - уреди]

  1. Donald Voet, Judith G. Voet (2005). "Chapter 8. Three-Dimensional structures of proteins". Biochemistry (3 izd.). Wiley. ISBN 978-0-471-19350-0. http://www.chem.upenn.edu/chem/research/faculty.php?browse=V. 
  2. Donald Voet, Judith G. Voet (2005). "Chapter 7. Covalent structure of proteins and nucleic acids". Biochemistry (3 izd.). Wiley. ISBN 978-0-471-19350-0. http://www.chem.upenn.edu/chem/research/faculty.php?browse=V. 
  3. Zhang Y and Skolnick J (2005). "The protein structure prediction problem could be solved using the current PDB library". Proc Natl Acad Sci USA 102 (4): 1029–1034. 
  4. 4.0 4.1 Bowie JU, Luthy R, Eisenberg D (1991). "A method to identify protein sequences that fold into a known three-dimensional structure". Science 253 (5016): 164–170. 
  5. Voigt CA, Gordon DB, Mayo SL (2000). "Trading accuracy for speed: A quantitative comparison of search algorithms in protein sequence design". J Mol Biol 299 (3): 789–803. 
  6. Debe DA, Danzer JF, Goddard WA, Poleksic A (2006). "STRUCTFAST: Protein sequence remote homology detection and alignment using novel dynamic programming and profile-profile scoring". Proteins 64: 960–967. 

Spoljašnje veze:[uredi - уреди]