隨著基因組測序工作的進展,日益發(fā)現(xiàn)基因組中存在著數(shù)量龐大的 SNP。SNP是一種最常見的可遺傳變異,在人類DNA多態(tài)性中,SNP約占 90 %。 SNP是指在基因組內(nèi)特定核苷酸位置上存在兩種不同的堿基,其中最少一種在群體中的頻率不小于1 %。 SNP分為兩種形式,一是基因編碼區(qū)的 SNP,稱為 cSNP;二是遍布于基因組的大量單堿基變異。SNP作為一種堿基的替換,大多數(shù)為轉(zhuǎn)換,即一種嘌呤換為另一種嘌呤或一種嘧啶換為另一種嘧啶,轉(zhuǎn)換與顛換之比為 2∶1。研究發(fā)現(xiàn),SNP在人類基因組 CpG序列上出現(xiàn)最頻繁,約占全部SNP的25%,而且多為 C→T,原因在于CpG中胞嘧啶殘基 (C)是甲基化的,能夠自發(fā)地脫氨基產(chǎn)生胸腺嘧啶 (T)。因此,SNP與 RFL P和 STR等 DNA標(biāo)記的主要不同在于:它不再以“長度”的差異作為檢測手段,而是直接以序列的差異作為標(biāo)記。但 SNP單個基因座的多態(tài)性很差,只有二態(tài),為此采用多個SNP基因座進行“單倍型” 分析尤顯重要。與第 1、2代遺傳標(biāo)記相比,醫(yī)學(xué)教|育網(wǎng)|收集整理SNP分析具有以下特點:(1 )SNP數(shù)量大,分布密集,平均每 1000bp就有1個 SNP。在 PKD基因內(nèi)部或附近可能會找到許多 SNP,聯(lián)合用于ADPKD的單倍型診斷;(2 ) SNP比STR擴增更可靠,不會產(chǎn)生假帶;(3 )由于 SNP是二態(tài)的,易于自動化批量檢測,易于計算機分析結(jié)果。
SNP的研究已受到廣泛的重視,它已成為實驗室和公司爭奪的對象,也是人類基因組計劃中的一個重要補充和研究熱點。用于 RFLP、STR的技術(shù)方法,理論上均可用于 SNP的識別和檢出。但印跡分析和 PCR方法,如 SSCP、DGGE等,大都需要標(biāo)記和電泳,費時費力,難于自動化。近年來,采用了微陣列 DNA芯片、飛行質(zhì)譜分析和變性高效液相層析法等非電泳分型技術(shù),大大加快了SNP檢測效率。
SNP檢測已廣泛地應(yīng)用于疾病的連鎖分析及關(guān)聯(lián)分析、腫瘤的雜合性缺失研究、疾病遺傳機制研究、個性化用藥研究等諸多領(lǐng)域。盡管沒有人懷疑SNP在搜尋疾病基因方面的價值,但事實卻比人們想象的要難得多。首先基因中存在著的重組破壞了SNP和增加疾病風(fēng)險性的變異之間的聯(lián)系,使得相關(guān)分析變得困難。有研究指出關(guān)聯(lián)分析比典型的家系分析需要的樣本要多得多,以便篩除錯誤的信號。因此只有高速率分析數(shù)千個DNA樣本的新技術(shù)的出現(xiàn)才會使SNP分析變得真正有價值;其次,雖然關(guān)聯(lián)分析對于只有一個基因位點上的缺陷等位基因的鑒定有實用意義,但這種情況又不常見,大約 90 %疾病易感基因有 1 0個以上相關(guān)突變存在,而癌癥及其它一些疾病則常涉及多個基因。另外,最普遍的SNP也是最古老的,他們可以同時存在于正常人或患者中,這就意味著SNP和基因的關(guān)鍵突變之間的特定聯(lián)系可能不存在一個特殊的模式,人們很容易錯失一個很重要的聯(lián)系,或者作出一個錯誤的聯(lián)系。樣本數(shù)量也是SNP應(yīng)用的一個障礙。盡管大部分SNP出現(xiàn)在各種群體中,但是某一種SNP可能只出現(xiàn)在一個亞群中,一些有意義的cSNP也以相當(dāng)高的比例出現(xiàn)在某一亞群中。所以要搜尋SNP就要盡可能地采用多種多樣的大樣本。專利問題也限制著SNP技術(shù)應(yīng)用。由于SNP具有的新穎性、實用性和不明確性等特征,使得許多商業(yè)公司搶先獲得SNP后能夠?qū)ζ渖暾垖@?,限制了許多研究者對它們的使用。