自然界絕大多數生物體的遺傳信息貯存在DNA的核苷酸排列順序中。DNA是巨大的生物高分子,一般將細胞內遺傳信息的攜帶者棗染色體所包含的DNA總體稱為基因組(genome)。同一物種的基因組DNA含量總是恒定的,不同物種間基因組大小和復雜程度則差異,一般講,進化程度越高的生物體其基因組構成越大、越復雜,見表。
某些有代表性的生物體內DNA大小
分子量 堿基對(bp) 千堿基對(kb)
zui簡單的微生物 SV40病毒 3×106 5×103 5
λ噬菌體 3.4×107 5×104 50
細菌 大腸桿菌 2.2×109 4.6×106 4600
哺乳動物 小鼠 1.5×1012 2.3×109 230萬
人 1.8×1012 2.8×109 280萬
DNA分子中不同排列順序的DNA區(qū)段構成特定的功能單位,即基因(gene)。基因的功能取決于DNA的一級結構。一個DNA分子能攜帶多少基因呢?如果以1000~1500bp編碼一個基因計算,猿猴病毒SV40基因組DNA有5000堿基對(base pair,bp),可編碼5種基因,人類基因組含3×109bp DNA,理論上可編碼200萬以上的基因,然而,由于哺乳動物的基因含有內含子(intorn),因而每個基因可長達5000~8000bp,少數可達20,000bp。按這樣大小的基因進行推算,人類基因組相當于40~60萬個基因。這可能嗎?雖然現在還不知道確切數字,但利用核酸雜交已測得哺乳類細胞含50,000~100,000種mRNA,由此推論整個基因組所含基因不會超過10萬個,只占全部基因組的6%,另外5~10%為rRNA等重復基因,其余80~90%屬于非編碼區(qū),沒有直接的遺傳學功能。DNA的復性動力學研究發(fā)現這些非編碼區(qū)往往都是一些大量的重復序列,這些重復序列或集中成簇,或分散在基因之間,可能在DNA復制、調控中具有重要意義,并與生物進化、種族特異性有關。可見原核細胞由于DNA分子較小,必須充分利用有限的核苷酸序列,這是真核基因組與原核基因組顯然不同之處。
真核基因組與原核基因組在結構上還有很多不同的特點,歸納如下:
1.真核生物基因組結構特點
①真核生物基因組DNA與蛋白質結合形成染色體,儲存于細胞核內,除配子細胞外,體細胞內的基因組是雙份的(即雙倍體,diploid),即有兩份同源的基因組。
②真核細胞基因轉錄產物為單順反子(monocistron),即一個結構基因轉錄、翻譯成一個mRNA分子,一條多肽鏈。
③存在大量重復序列,即在整個DNA中有許多重復出現的核苷酸順序,重復序列長度可長可短,短的僅含兩個核苷酸,長的多達數百、乃千。重復頻率也不盡相同;高度重復序列重復頻率可達106次,包括衛(wèi)星DNA、反向重復序列和較復雜的重復單位組成的重復序列;中度重復序列可達103~104次,如為數眾多的Alu家族序列,KpnI家族,Hinf家族序列,以及一些編碼區(qū)序列如rRNA基因、tRNA基因、組蛋白基因等;單拷貝或低度重復序列,指在整個基因組中只出現一次或很少幾次的核苷酸序列,主要是編碼蛋白質的結構基因,在人基因組中占約60~65%,因此所含信息量zui大。
④基因組中不編碼的區(qū)域多于編碼區(qū)域。
⑤基因是不連續(xù)的,在真核生物結構基因的內部存在許多不編碼蛋白質的間隔序列(intervening sequences),稱為內含子(intron),編碼區(qū)則稱為外顯子(exon)。內含子與外顯子相間排列,轉錄時一起被轉錄下來,然后RNA中的內含子被切掉,外顯子連接在一起成為成熟的mRNA,作為指導蛋白質合成的模板。
⑥基因組遠大于原核生物的基因組,具有許多復制起點,而每個復制子的長度較小。
2.原核生物基因組結構特點
①基因組較小,沒有核膜包裹,且形式多樣,如病毒基因組可能是DNA,也可能是RNA,可能是單鏈的,也可能是雙鏈的,可能是閉環(huán)分子,也可能是線性分子;細菌染色體基因組則常為環(huán)狀雙鏈DNA分子,并與其的RNA和支架蛋白構成一致密的區(qū)域,稱為類核(nucleoid)。
②功能相關的結構基因常常串連在一起,并轉錄在同一個mRNA分子中,稱為多順反子mRNA(polycistronic mRNA),然后再加工成各種蛋白質的模板mRNA。
③DNA分子絕大部分用于編碼蛋白質,不編碼部分(又稱間隔區(qū))通常包含控制基因表達的順序。例如,噬菌體ψx 174中只有5%是非編碼區(qū)。
④基因重疊是病毒基因組的結構特點,即同一段DNA段能夠編碼兩種甚至三種蛋白質分子。
⑤除真核細胞病毒外,基因是連續(xù)的,即不含內含子序列。