高等真核生物的基因組一般具有80 000~100 000個(gè)基因,而每一個(gè)細(xì)胞大約只表達(dá)其中的15%[1]。基因在不同細(xì)胞間及不同生長(zhǎng)階段的選擇性表達(dá)決定了生命活動(dòng)的多樣性,如發(fā)育與分化、衰老與死亡、內(nèi)環(huán)境穩(wěn)定、細(xì)胞周期調(diào)控等。比較細(xì)胞間基因表達(dá)的差異為我們揭示生命活動(dòng)的規(guī)律提供了依據(jù)。
由于真核細(xì)胞mRNA 3′端一般含有Poly(A)尾,因此現(xiàn)有的方法基本上都是利用共同引物將不同的mRNA反轉(zhuǎn)錄成cDNA,以cDNA為對(duì)象研究基因表達(dá)的差異。1992年 Liang等[2]建立了一種差異顯示反轉(zhuǎn)錄PCR法(differential display reverse transcription PCR,DDRT-PCR),為檢測(cè)成批基因表達(dá)的差異開(kāi)辟了新天地。迄今為止已出現(xiàn)了大量應(yīng)用該技術(shù)的研究報(bào)道[3,4]。然而,盡管應(yīng)用DDRT-PCR方法已經(jīng)取得了不少成果,而且該方法還在不斷改進(jìn)之中,但它仍然存在幾個(gè)難以解決的問(wèn)題:(1) 重復(fù)率低,至少有20%的差異條帶不能被準(zhǔn)確重復(fù)[5];(2) 假陽(yáng)性率可以高達(dá)90%[6];(3) 獲得的差異表達(dá)序列極少包含編碼信息。近年來(lái),針對(duì)DDRT-PCR方法的不足,又有幾種新的檢測(cè)差異表達(dá)基因的方法出現(xiàn),現(xiàn)僅就這方面的進(jìn)展做一簡(jiǎn)要介紹。
1.基因表達(dá)指紋(gene expression fingerprinting,GEF):GEF技術(shù)使用標(biāo)記的引物Bio-T13合成cDNA*鏈,用dGTP對(duì)其進(jìn)行末端加尾,再以富含C的引物引發(fā)合成cDNA第二鏈。用限制性內(nèi)切酶消化雙鏈cDNA,以交聯(lián)有抗蛋白的微球捕獲cDNA3′端,以T4DNA連接酶連接同前述內(nèi)切酶相對(duì)應(yīng)的適配子,并以Bio-T13及適配子中的序列作為新的引物進(jìn)行特異的PCR擴(kuò)增,得到大量的特異cDNA片段。適配子末端被32P-dATP標(biāo)記后,固定于微球上的cDNA片段經(jīng)過(guò)一系列酶切,產(chǎn)生的酶切片段從微球表面釋放出來(lái),其中那些含有標(biāo)記末端的片段經(jīng)凝膠電泳后構(gòu)成mRNA指紋圖譜。通過(guò)分析不同細(xì)胞間的指紋圖譜就能得到差異表達(dá)的序列[7]。GEF技術(shù)所需的工作量較DDRT-PCR明顯減少,由于用酶切反應(yīng)替代了條件不嚴(yán)格的PCR反應(yīng),其重復(fù)性也較好,假陽(yáng)性率低,并且所獲得的片段中包含有一定的編碼信息。GEF技術(shù)zui大的缺點(diǎn)在于電泳技術(shù)的局限。由于它的指紋圖譜要顯示在同一塊電泳膠上,經(jīng)過(guò)幾輪酶切之后常會(huì)得到1 000~2 000條電泳帶,而現(xiàn)有的PAGE電泳很少能分辨超過(guò)400條帶,故只有15%~30%的mRNA能夠被辨認(rèn)出來(lái),因此得到的只能是高表達(dá)基因。如果希望尋找部分新基因,這是一種比較簡(jiǎn)單有效的方法;如果希望得到有關(guān)某種細(xì)胞的基因表達(dá)譜,可能比較困難;采用雙向電泳技術(shù)可能會(huì)有所幫助[8]。
2.基因表達(dá)系統(tǒng)分析(serial analysis of gene expression,SAGE):SAGE法的建立基于兩條理論。首先,一段來(lái)自某個(gè)轉(zhuǎn)錄子確定位置的核苷酸,其長(zhǎng)度只要有9~10個(gè)bp,就能夠特異地確認(rèn)該轉(zhuǎn)錄子。第二,對(duì)短片段標(biāo)簽的鏈接有利于在同一克隆中對(duì)多個(gè)標(biāo)簽測(cè)序。SAGE也是用標(biāo)記的Bio-Oligo(dT)為引物合成雙鏈cDNA,然后以限制酶(錨定酶)進(jìn)行酶切,捕獲cDNA3′端。在此處產(chǎn)物被分為兩部分,分別與包含有IIS型內(nèi)切酶(標(biāo)簽酶)位點(diǎn)的A、B連接子相接。IIS型內(nèi)切酶的特點(diǎn)是作用位點(diǎn)處于識(shí)別位點(diǎn)之外。這樣經(jīng)過(guò)酶切,就有可能得到只有9~10bp的標(biāo)簽序列。每?jī)蓚€(gè)標(biāo)簽的鈍端結(jié)合后成為PCR的模板,以基于A、B連接子的引物進(jìn)行PCR反應(yīng)的結(jié)果是得到了大量每條包含兩個(gè)不同來(lái)源標(biāo)簽的序列,接下來(lái)再用錨定酶酶切、連接,就能將多個(gè)不同的標(biāo)簽鏈接在一起(大約為每條包含數(shù)十個(gè)不同來(lái)源的標(biāo)簽),克隆至質(zhì)粒載體中后集中測(cè)序[9,10]。SAGE的zui終結(jié)果是通過(guò)計(jì)算機(jī)統(tǒng)計(jì)得到的,根據(jù)某個(gè)標(biāo)簽出現(xiàn)頻率的高低來(lái)判斷并計(jì)算其所屬基因表達(dá)的豐度。對(duì)于在數(shù)據(jù)庫(kù)中找不到對(duì)應(yīng)序列的標(biāo)簽,還可以利用13bp的寡核苷酸探針(9bp加上錨定酶識(shí)別位點(diǎn)的4bp)對(duì)cdna文庫(kù)進(jìn)行篩選,以尋找新基因。SAGE可以檢測(cè)不同細(xì)胞間已知基因表達(dá)的具體差異,到每個(gè)細(xì)胞中大約有多少拷貝,可以建立較全面的基因表達(dá)譜,系統(tǒng)地分析基因表達(dá)的差異。它的缺點(diǎn)在于工作量非常大,有大量的測(cè)序及計(jì)算機(jī)分析任務(wù);而且,對(duì)于尋找新基因而言,僅用長(zhǎng)度為13bp的寡核苷酸探針篩選cDNA文庫(kù)是很不嚴(yán)格的,根據(jù)我們的經(jīng)驗(yàn),往往是假陽(yáng)性結(jié)果居多。