Üksiku nukleotiidi polümorfismid ehk üksiknukleotiidsed polümorfismid on DNA järjestuse variatsioonid, mis on toimunud ühe genoomi nukleotiidi muutumisel.
Üksiku nukleotiidi polümorfismid ehk üksiknukleotiidsed polümorfismid (inglise single nucleotide polymorphisms; SNPs (hääldatakse snips) eestipäraselt SNP-d) on DNA järjestuse variatsioonid, mis on toimunud ühe genoomi nukleotiidi (A, T, C või G) muutumisel.
Kui genoom (või mõni muu jagatud jada) erineb ühe liigi isendite vahel või paariskäivates kromosoomides – näiteks kahe isiku DNA fragmentide järjestamisel saadakse ühel AAGCCTA ja teisel AAGCTTA –, siis sel juhul me ütleme, et on olemas kaks alleeli (näites olid nendeks C ja T). Peaaegu kõigil tavalistel SNP-del ongi ainult kaks alleeli.
Erinevalt paljudest teistest mutatsioonidest ei vii SNP-d tavaliselt kodeeritavate aminohapete muutumiseni ning ei ole seetõttu organismile kahjulikud. Kuigi SNP-d ei põhjusta enamasti haigusi, võivad nad siiski aidata kindlaks määrata haigestumise tõenäosust.
Ühenukleotiidilised polümorfismid mängivad olulist rolli ülegenoomsetes assotsiatsiooniuuringutes, kus neil on primaarsete biomarkerite roll. Nende biomarkerite asukoht on oluline ennustamaks valkude funktsionaalset tähtsust, geenide kaardistamises ja populatsioonigeneetikas.
SNPde efekti või mõju ennustamist vastavate töövahenditega nimetatakse SNPde annoteerimiseks.
SNP-d inimese genoomis
Inimese genoom koosneb 3 miljardist DNA aluspaarist, mis jaguneb 23 paari kromosoomide vahel. Kaasaegsete andmete kohaselt erineb kahe eri inimese DNA kuni 0,1% ehk vähem kui 3 miljonit DNA aluspaari. Erinevates inimpopulatsioonides erineb alleelide esinemissagedus – ühe geograafilise või etnilise rühma juures võib osa alleele olla üldisest keskmisest palju sagedamini või just harvemini esindatud.
SNP esineb keskmiselt iga 100–300[1][2], aga mõnedel andmetel ka kuni iga 1000 nukleotiidi järel[3][4] ja nendevahelised erinevused muudavadki kõik indiviidid geneetiliselt unikaalseks (välja arvatud ühemunakaksikud, kes jagavad ühte genotüüpi).
Minevikus nimetati SNP-deks neid üksiku nukleotiidi polümorfisme, mille minimaalne esinemissagedus oli vähemalt 1% (kohati ka vähem).[5] Väiksema sagedusega variatsioonide nimetamiseks kasutasid mõned mõistet "mutatsioon". Enam sellist vahet tavaliselt ei tehta ja näiteks dbSNP andmebaasis liigitatakse ka väiksema kui 1% esinemissagedusega alleelid SNP-de hulka.[6]
Üksiku nukleotiidi polümorfismid on kõige sagedamini esinev geneetiline varieeruvus inimese genoomis – avalikesse andmebaasidesse jõudnud SNP-de koguarv ületab juba 9 miljonit.[7]
SNP-de tüübid
Kõige tavalisem on transitsioon: üks puriin asendub teisega või üks pürimidiin asendub teisega (C ↔ T, A ↔ G). Harvemini esineb pürimidiini asendumist puriiniga või puriini asendumist pürimidiiniga ehk transversiooni (C/T ↔ A/G).
Kui ekslikult replitseerunud koodon kodeerib sama aminohapet mis ennegi, siis on tegemist vaikiva mutatsiooniga, mis ei mõjuta organismi. Kui tulemuseks saadakse koodon, mis valgu sünteesi lõpetab, siis on tegu nonsenssmutatsiooniga, kui aga saadud koodon kodeerib teist aminohapet, on tegu missensse mutatsiooniga.
Lisaks ühtede nukleotiidide asendumisele teisega võivad toimuda ka uute nukleotiidide lisandumised – insertsioonid – ja olemasolevate kustumised – deletsioonid. Mõlemal juhul leiab aset geeni lugemisraami nihe (raaminihe) või muutub mRNA splaissimine. Kummalgi juhul muutub oluliselt geeni saadus.
Muutused, mis ei leia aset valke kodeerivates regioonides, võivad siiski mõju avaldada ning seda geenide splaissimisele, transkriptsioonifaktorite seondumisele või mittekodeeriva RNA järjestusele.
SNP-de kasutamine ja tähtsus
Variatsioonid DNA järjestuses võivad määrata kuidas inimestel arenevad haigused ning kuidas toimub reageerimine patogeenidele ja kemikaalidele aga ka ravimitele ning vaktsiinidele, ning millised võivad olla kõrvaltoimed. Seetõttu keskendub ka meditsiinialane uurimistegevus järjest enam SNP-dele – püütakse välja arendada personaalset meditsiini, mida võib arvata antud valdkonna põhiliseks tulevikusuunaks.[8]
Üheks põhiliseks SNP-de eeliseks arvatakse nende analüüsimise lihtsust – on täiesti võimalik analüüsida korraga kümneid või isegi sadu tuhandeid SNP-sid, kasutades selleks näiteks geenikiibi tehnoloogiat.
2012. aasta seisuga on tehtud üle 1300 ülegenoomse assotsiatsiooniuuringu, mille käigus on uuritud üle 200 haiguse ja tunnuse, ja avastatud üle 7400 SNP, mis on haigusega seostatud.[9]
Näiteid
- "Uurimuse käigus leiti geenis HNF4A (hepatocyte nuclear factor 4 alpha) SNPd ehk üksiku nukleotiidi polümorfismid. Geen reguleerib sadade teiste geenide, sh insuliini tootvate geenide, aktiivsust."[10]
- "Ajakirja American Journal of Psychiatry 2004. aasta aprillinumbris avaldatud uurimuse kohaselt seostatakse autismiga geeni SLC25A12 üksiku nukleotiidi polümorfisme (SNP-d). [---] 411-st vaatlusalusest perekonnast 197-s oli vähemalt üks vanem vähemalt ühe SNP suhtes heterosügootne."[11]
- "rs6311 ja rs6313 on SNP-d HTR2A geenis, mis paikneb inimese 13. kromosoomis."
- "SNP faktor V geenis põhjustab trombofiiliat (faktor V Leideni mutatsioon) ja tegu on kõige sagedasema päriliku hüübimishäirega europiidide populatsioonis."[12]
- "rs3091244 on näide kolmealleelsest SNP-st, mis paikneb CRP geenis inimese 1. kromosoomis."[13]
Andmebaasid
Lisaks paljudele geenivariante talletavatele andmebaasidele leidub ka bioinformaatika andmebaase üksikute nukleotiidide polümorfismide tarvis. Näiteks üks tuntumaid on USA Riikliku Biotehnoloogia Informatsiooni Keskuse (National Center for Biotechnology Information; NCBI) hallatav dbSNP.[14] SNPedia on aga näiteks viki-tüüpi[15] ning OMIM (Online Mendelian Inheritance in Man) kirjeldab seoseid polümorfismide ja haiguste vahel.
Nomenklatuur
SNP-de nomenklatuur võib olla segadusse ajav. Ühe SNP üleskirjutamisel on kasutatud mimeid mooduseid ja konsensust pole saavutatud. Ühe lähenemise järgi kirjutatakse SNP-d prefiksiga, millele järgneb periood ning siis ">"-märk, näitamaks metsiktüüpi ja nukleotiidi, mis sellega vahetus (näiteks: c.76A>T, kus A>T tähendab, et adeniin on asendunud tümiiniga).
Levinud viis on ka SNP alleeli kirjeldamine dbSNP andmebaasis kasutatava ID järgi, millele lisatakse sidekriips ja sellele omakorda nukleotiidi tähis (näiteks: rs6200232-G). Kui SNP ei asu aga mõnes kodeeritavas geenis, siis saab kasutada dbSNP andmebaasi ID-d lookuse sümbolina, millele lisada nukleotiidi tähis (näiteks: rs6200616T).