- 臨床檢驗一萬個為什么:遺傳檢驗分冊
- 傅啟華 徐晨明 余永國
- 8字
- 2020-03-06 16:41:09
第一章 遺傳學基礎
第一節 基因及基因突變
1.為什么人類基因大多為兩個拷貝
答:基因是遺傳的基本生理及功能單位,主要由脫氧核糖核酸(deoxyribonucleic acid,DNA)組成,通過編碼各種蛋白質發揮功能。基因具有自我復制的特性,通過形成配子結合成受精卵,人類的基因得以傳遞給后代,最終發育為成熟的個體。在這個過程中,每個個體的染色體一套來自父親,一套來自母親,共包含22對常染色體和1對性染色體。除性染色體X和Y的形態和組成存在重大差異外,其他每對常染色體上的基因都相同,因此這些染色體上的基因都有兩個拷貝。如果發生遺傳變異導致這些基因出現拷貝數的變化,往往會造成個體發生嚴重的遺傳性疾病。
2.什么是人類基因組
答:人類基因組即人體細胞內全部DNA序列,包括人的所有遺傳信息,由細胞核基因組和線粒體基因組組成,以染色體的物理形式存在。完整的核基因組由23對染色體組成,其中包括22對常染色體和1對性染色體;線粒體基因組指存在于線粒體中的閉合環狀雙鏈DNA分子。人類基因組計劃在1990年啟動,由美、英、法、德、日、中等國共同參與,耗時十余年,最終于2001年公布人類基因組草圖。這項偉大的計劃共花費約30億美元,與曼哈頓原子彈計劃和阿波羅登月計劃并稱為科學界的三大工程。經過此項計劃的實施,人類染色體中包含的30億個堿基對組成的核苷酸序列被解碼,開啟了生命科學的新時代。
3.為什么要實施人類基因組計劃
答:人類基因組計劃的宗旨在于測定組成人類染色體(主要指單倍體)中所包含的30億個堿基對組成的核苷酸序列,從而繪制人類基因組圖譜,辨識其載有的基因及其序列,達到破譯人類遺傳信息的目的。1986年,DNA序列自動分析技術得到了發明,科學家們意識到基因組信息對腫瘤治療等具有重大意義,便開始對人類基因組測序的可行性進行探討。最終,人類基因組計劃由美國能源部和美國國立衛生研究院在1990年牽頭實施。這項研究計劃的實施使得人們可以從整體層面解析人類的遺傳信息,為單基因疾病、多基因疾病(如心血管系統疾病、腫瘤、糖尿病、神經精神類疾病及自身免疫性疾病等)的病因學診斷提供依據,同時也為基于基因組信息的基因治療、疾病預防、易感基因的識別、風險人群生活方式及環境與遺傳交互作用的研究提供了契機。
4.為什么會發生遺傳現象
答:遺傳是指子代的性狀可以從親代得到繼承從而具有與之相似性的現象。從表型上看,遺傳是性狀從親代到子代的延續。從分子水平上看,遺傳是由基因決定的。從配子形成、受精卵形成直到個體發育,基因完成了在親代中的復制以及在子代中的分配、繼承。這個過程使得遺傳信息以基因序列的形式傳遞給子代,最終決定了子代的性狀。近年來的研究發現,除了基因序列使得性狀在子代得以繼承以外,一些發生在基因上的表觀遺傳修飾也可以通過生殖細胞傳遞給子代,對子代的性狀產生影響。基因決定的遺傳主要遵循4個定律:分離律、自由組合律、連鎖律與交換律,而表觀遺傳決定的遺傳往往受環境因素影響較大,不符合這樣的規律。
5.什么是脫氧核糖核酸
答:脫氧核糖核酸(DNA)是人及絕大多數有機體的遺傳物質。在每個人體內,每一個正常細胞的DNA均相同。大部分DNA定位于細胞核中,稱為細胞核DNA;小部分DNA定位于線粒體中,稱為線粒體DNA或mtDNA。DNA所攜帶的遺傳信息主要由4種堿基即腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)及胸腺嘧啶(T)以不同密碼子組合的形式構成。人類DNA擁有約30億個堿基對,堿基的排列順序決定了個體的生物性狀,類似于字母以不同的組合組成不同的單詞和句子。堿基以A=T、C≡G的形式相互配對形成堿基對,每個堿基同時與一個戊糖和一個磷酸根連接,即一個堿基+戊糖+磷酸根稱為核苷酸。核苷酸彼此相連形成核苷酸鏈并螺旋上升,即雙螺旋結構,該結構形似梯子,堿基對形成階梯,戊糖及磷酸根分子形成梯子垂直的側面。
6.什么是核糖核酸
答:核糖核酸(ribonucleic acid,RNA)是由核糖核苷經磷酸二酯鍵縮合而成的長鏈狀分子,是一類遺傳信息傳遞的載體。與DNA類似,RNA的組成堿基也為4種,分別為腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C) 和尿嘧啶(U)。RNA按功能和結構主要可以分為以下幾種:①信使RNA(messenger RNA,mRNA),是遺傳信息的中間載體,在蛋白質合成過程中作為信使分子,將DNA的遺傳信息轉化為氨基酸序列;②轉運RNA(transfer RNA,tRNA),在蛋白質合成過程中攜帶特定的氨基酸加入正在合成的肽鏈中;③核糖體RNA(ribosomal RNA,rRNA),在細胞RNA中占比75%~85%,是蛋白質加工復合物核糖體的主要成分;④端粒酶RNA,存在于真核細胞中,是端粒酶的組成部分,作為模板輔助端粒的延長;⑤反義RNA,通過與mRNA配對抑制其翻譯,調控其轉錄或表達;⑥核酶,是一類具有催化活性的RNA,可以發揮切割核酸、RNA連接酶以及磷酸酶等活性。此外,還存在許多非編碼RNA,如長非編碼RNA和小RNA,在細胞中起到調控作用。
7.為什么人類基因組存在非編碼序列
答:基因是由成千上萬個核苷酸組成的,核苷酸序列可以分為不同的區段,在基因表達的過程中,不同區段所起的作用不同:
(1) 編碼序列(coding sequence,CDS):
能夠轉錄為相應信使RNA,進而指導蛋白質合成(也就是能編碼蛋白質)的區段。
(2)非編碼序列:
不能編碼蛋白質的區段。在基因內部,非編碼區域稱為內含子,將基因的蛋白質編碼序列分隔開。這樣的基因組成形式使得真核生物的同一個基因可以通過可變剪接方式形成大量不同的蛋白質異構體以行使不同的功能,大大提高了基因組的利用效率。在基因間也存在大量的非編碼序列,一方面,這些非編碼序列形成了對遺傳變異的緩沖,使得一些隨機發生的突變不至于改變蛋白質的結構因而對生命個體不產生嚴重的影響;另一方面,在非編碼序列中存在著許多調控元件,對于染色體結構的穩定性、基因表達等細胞生命活動起到重要的調控作用。
8.為什么真核生物中編碼序列往往不是連續的
答:蛋白質合成過程中,DNA序列轉錄為mRNA,mRNA經過翻譯后加工最終指導合成蛋白質。編碼序列(CDS)是指與編碼蛋白序列一一對應的DNA序列。在真核生物中,編碼序列往往不是連續的,而是由一些不翻譯成蛋白質的序列隔開,這些斷裂基因中的編碼序列稱為外顯子(exon),它在剪接后仍會被保留下來,并可在生物合成過程中被表達為蛋白質。外顯子是最后出現在成熟RNA中的基因序列,是既存在于最初的轉錄產物中,也存在于成熟的RNA分子中的核苷酸序列。內含子(intron)是斷裂基因的非編碼區,可被轉錄,但在mRNA加工過程中被剪切掉,故成熟mRNA中無內含子序列。內含子可能含有 “舊碼”,就是在進化過程中喪失功能的部分基因。正因為內含子對翻譯產物的結構無意義,不受自然選擇的壓力,所以它比外顯子累積有更多的突變。
9.什么是密碼子
答:密碼子是指mRNA分子上每相鄰3個核苷酸組成的三聯體,在蛋白質翻譯過程中,分別對應編碼一種氨基酸。密碼子具有簡并性、通用性和連續性等特點。①簡并性:同一種氨基酸可以由幾個不同的密碼子決定,除了起始密碼子甲硫氨酸及色氨酸外,每一種氨基酸至少對應著兩個密碼子,此為密碼子的簡并性;②通用性:從原核生物到真核生物,不同的生物密碼子基本相同,即共用一套密碼子,此為密碼子的通用性;③連續性:密碼子與密碼子間沒有任何不編碼的核苷酸存在,且任意兩個相鄰的密碼子不共用任何核苷酸,蛋白質翻譯時從起始密碼子開始,一個不漏的直到終止密碼子,此為密碼子的連續性。
10.為什么密碼子具有簡并性
答:構成mRNA的堿基有四種,即腺嘌呤(A)、尿嘧啶(U)、鳥嘌呤(G)及胞嘧啶(C),理論上以3個核苷酸為一組可以產生64種密碼子組合,即代表64種氨基酸。但實際上,64種密碼子組合僅代表20種氨基酸,意味著同一種氨基酸可以由幾個不同的密碼子決定。除了色氨酸及起始密碼子甲硫氨酸外,每一種氨基酸至少對應著兩個密碼子,此為密碼子的簡并性。密碼子的簡并性具有重要的生物學意義,使得基因突變后改變原有編碼蛋白質序列的可能性大大降低,減少了有害突變的遺傳。
11.為什么中心法則的提出是個不斷發展完善的過程
答:中心法則(genetic central dogma)是遺傳信息在細胞內的生物大分子間轉移的基本法則,首先由弗朗西斯·克里克于1958年提出,內容主要包括:遺傳信息從DNA傳遞到RNA實現轉錄,再從RNA傳遞到蛋白質完成翻譯,以及從DNA傳遞到DNA完成DNA自我復制的過程,這是所有具有細胞結構的生物遵循的法則。1965年科學家發現RNA自身可以完成復制,1970年研究人員又發現某些病毒在宿主細胞中的復制過程是先以病毒的RNA作為模板合成DNA,再以DNA為模板合成新的病毒RNA。這些均是對中心法則的補充,據此弗朗西斯.克里克于1970年重新提出了中心法則更為完整的形式。朊病毒是中心法則目前已知的唯一例外。
12.為什么會有RNA世界假說
答:RNA世界假說(RNA world hypothesis)由1981年度諾貝爾化學獎獲得者吉爾伯特提出。RNA世界假說認為生命進化的早期,RNA是唯一的遺傳物質,是生命的源頭。RNA的五碳糖2′位是羥基,化學活性遠大于DNA,特別容易發生突變,因而其攜帶遺傳信息的能力不如DNA;再者,RNA的組成沒有蛋白質復雜,因而其在功能分子的作用方面不如蛋白質。但是,RNA是唯一既能攜帶遺傳信息又可以作為功能分子的化合物。因此,生命起源之初,很可能在原始的自然環境條件下,核苷酸經過億萬年的進化,形成了具有自我復制能力的RNA,其中的某些過程已在人工條件下被成功地模擬。核糖體具有核酶功能的發現大大支持了RNA的世界假說,此后發現了更多種類的RNA,在基因表達的整個階段扮演著不同的結構和功能角色,也支持了這樣的觀點:整個遺傳物質的維持和表達過程,都是在 “RNA世界”中完成的。
13.為什么蛋白質的合成需要三種主要的RNA
答:蛋白質的翻譯過程需要三種主要的RNA直接參與:信使RNA(mRNA)、轉運RNA(tRNA)及核糖體RNA(rRNA),不同種類RNA行使的功能是不同的。mRNA提供了特定蛋白質的DNA序列信息,其中每個三聯密碼子核苷酸都代表了一種特定的氨基酸;另外mRNA兩側的序列,在調控其活性及由此所產生的蛋白質數量方面扮演著重要角色。tRNA是用來運輸氨基酸到對應的mRNA密碼子上的小RNA,它的三維結構非常重要,可以被酶識別,同時具有與mRNA堿基配對并結合的能力,提供了與特定氨基酸建立連接的靶標。rRNA是核糖體的組成元件,核糖體是一個包括多種蛋白質和RNA組件的核糖核蛋白,可以將特定的氨基酸聚合成肽鏈;rRNA既提供了核糖體蛋白結合的骨架,又參與了核糖體的催化活動。因此,這三種主要的RNA是蛋白質合成過程中必需的成分。
14.為什么翻譯過程并非將mRNA的全長轉化為蛋白質信息
答:基因是可以編碼產生各種蛋白質的DNA序列,但是基因并不直接翻譯成蛋白質,而是通過mRNA來完成這個過程。基因產生蛋白質的過程稱為基因表達,包含兩個過程:第一步是產生一條與DNA鏈序列互補的mRNA,稱為轉錄;第二步是以mRNA為模板合成蛋白質的過程,稱為翻譯。蛋白質的翻譯過程即將序列中包含的核苷酸以三聯體(密碼子)對應的氨基酸逐個連接成肽鏈的方式合成相應的蛋白質。然而,mRNA除了包括一系列與蛋白質中氨基酸對應的核苷酸序列外,還包括兩側的附加序列5′非翻譯區和3′非翻譯區,這些序列不編碼蛋白質。因此,翻譯過程并非利用全長mRNA,只是將mRNA的基因編碼序列翻譯為蛋白質。
15.為什么一個基因會有多個轉錄本
答:真核生物的許多基因由若干個編碼序列(外顯子)和非編碼序列(內含子)互相間隔組成,這些基因也稱為斷裂基因。在斷裂基因的轉錄過程中,內含子區域會被剪接掉,mRNA通過不同的剪接方式(可變剪接)產生不同的mRNA剪接異構體,這是導致一個基因存在多個轉錄本的根本原因。由于mRNA的可變剪接不牽涉遺傳信息的永久性改變,所以這是真核生物基因表達調控所采用的一種比較靈活的方式,豐富了蛋白質組的多樣性,也造成人類基因數與蛋白質總數存在較大的差異。
16.什么是線粒體DNA
答:線粒體DNA是指存在于線粒體中的閉合環狀雙鏈DNA分子,也是獨立于細胞核DNA之外的遺傳物質,與細胞核DNA共同構成人類基因組。線粒體DNA可以分為外環的重鏈及內環的輕鏈,雙鏈中有一小段三鏈的D-loop 7S DNA,是線粒體DNA復制和轉錄的起始位點。線粒體DNA結構緊湊,沒有內含子也不含重復序列,共包含37個基因,均在線粒體正常功能行使中發揮重要的作用。已發現線粒體DNA結構異常或點突變可導致人類多種疾病,常累及能量需求較高的中樞神經系統和肌肉組織,最常見的為線粒體性腦肌病。
17.為什么線粒體DNA易于突變
答:線粒體DNA易于發生突變,主要是由線粒體內部的結構和環境決定的。線粒體是真核細胞的能量工廠,內膜富含呼吸鏈-氧化磷酸化系統的酶復合體,通過電子傳遞和氧化磷酸化產生大量ATP及高氧化的環境。因此,線粒體DNA容易受到氧化而導致突變。另外,線粒體DNA分子上沒有核苷酸結合蛋白,缺乏組蛋白的保護作用;同時,線粒體內缺乏DNA損傷修復系統;再者,由于線粒體基因不存在內含子,在整個細胞周期中不斷復制,更容易積累變異。因此,與細胞核DNA相比,線粒體基因的突變速率要高得多。
18.為什么基因轉錄后加工需要 “加帽”
答:加帽是指在DNA轉錄產物mRNA的5′端連接上一個甲基化帽,即7-甲基鳥苷酸(m7GTP)帽子。5′帽子的形成主要是在細胞核內完成的,但是某些動物病毒mRNA的加帽過程可以在宿主細胞的胞漿中完成。加帽封閉了轉錄產物的5′端,同時也避免5′端被磷酸酶和核酸酶消化,增加了mRNA的穩定性,避免了mRNA受到5′-3′核酸外切酶的攻擊。此外,mRNA5′端帽子也是翻譯起始過程所必需的,有助于mRNA從細胞核至細胞質的運輸,同時有助于被細胞質中的核糖體小亞基所識別,可以使得mRNA較易與核糖體結合,從而提高蛋白質合成的效率。
19.為什么基因轉錄后加工需要 “加尾”
答:加尾是基因轉錄遇到轉錄終止信號后,在轉錄產物mRNA 5′端加帽的同時,腺苷酸聚合酶催化在其3′端附加約200個腺苷酸(A)的長鏈,即多聚腺苷酸(poly A)尾的過程,該過程也稱為多腺苷酸化。Poly A尾不是由DNA序列編碼的,完全是轉錄后在細胞核內添加的。Poly A尾可促進mRNA從細胞核向細胞質的轉運,避免mRNA被磷酸酶及核酸酶降解,對維持mRNA的穩定性具有重要的意義。此外,細胞中出核復合體可以與mRNA的polyA結合,引導mRNA出細胞核。
20.為什么基因表達需要調控
答:正常人體的每個細胞內都含有完整的基因組,若每個細胞中的每個基因均同等程度的表達,則人體將沒有組織和器官特異性。實際上,特定組織、特定器官的細胞中只有部分基因表達,且不同基因在細胞分化的不同時期或條件下表達程度也不同。基因的這種差異表達構成了人體內功能和形態各異的細胞類型,即細胞類型的差別并非在于基因組的不同,而在于基因的表達差異。如果基因在不恰當的時間或條件下表達,或表達水平出現差異,均可導致疾病的發生。因此,人體基因組每個基因的表達都需要精細的調控,以確保人體各個組織、器官功能的正常運行。
21.為什么說基因突變是人類進化的動力
答:所有生物體的基因組既要維持相對穩定性,以確保遺傳性狀代代傳遞;又要有所變化,以保持性狀的多樣性。如果基因組的DNA序列一成不變,就不會有進化。基因突變是指組成基因的DNA序列發生了永久性改變,使該序列不同于大多數人。基因突變是生物遺傳變異的主要來源,突變產生的性狀是進化過程中自然選擇的對象,可以說突變是進化的原材料,選擇是進化的動力。因此可以說基因突變是人類進化的動力。
22.為什么會發生動態突變
答:動態突變又稱為不穩定三核苷酸重復,主要是指在基因的編碼區、3′或5′-UTR區、啟動子區、內含子區出現的三核苷酸重復,以及其他長短不等的小衛星、微衛星序列的重復拷貝數,可隨著世代傳遞而呈現逐代遞增的累加突變效應,因此稱為動態突變。動態突變主要是由于細胞在減數分裂或有絲分裂過程中,配對的含有重復序列的等位基因區域中的一條鏈復制過程中,新生鏈不斷擴增導致形成多余的未配對的環狀結構最終未被切割修復而保留,從而產生重復序列拷貝數的擴增。動態突變造成遺傳物質的不穩定狀態,可引起某些單基因遺傳性狀的異常或疾病的發生。
23.為什么基因會發生自發突變
答:基因的本質是脫氧核糖核酸,是一種化學物質。在自然界中DNA在受到物理、化學及生物學因素的作用下可能會發生損傷而引起基因突變。生物體細胞內存在DNA修復系統,主要通過光修復、切除修復、重組修復及SOS修復等方式對突變位點進行修復。但有時DNA修復系統在修復過程中出現錯誤而造成突變,稱為自發突變。事實上,在每一次復制過程中,DNA都在發生變異,這也是生命進化的動力。在自然選擇的作用下,有利突變會被保留下來,而有害突變會逐漸被淘汰。當有害突變為非胚胎致死性時,就會導致遺傳性疾病個體的出現。
24.為什么基因會發生誘發突變
答:誘發突變是指由各種誘變劑導致的基因突變。由于DNA的本質是一種化學物質,會在物理化學因子的影響下發生化學反應產生突變。常見的可以引起突變的誘變劑包括物理因素(如X射線)、化學因素(如亞硝酸鹽)及生物因素(如細菌、病毒等)等。物理誘變劑如X射線作用于細胞DNA時,染色體或DNA分子受到射線作用產生電離和激發,同時產生各種游離基團,最終引起DNA分子結構改變。化學誘變劑可以通過改變DNA化學結構、或是競爭堿基互相配對、或是直接插入DNA分子結構中,最終造成基因突變或結構異常。生物誘變劑如反轉錄病毒等則直接將自身DNA導入細胞DNA分子中,引起基因突變。
25.為什么一個基因可以控制多個性狀
答:生物體發育過程中,基因所表達的蛋白質主要通過調控新陳代謝的一系列反應,進而影響到個體的發育方式并決定遺傳性狀的形成。生物體內許多生理和生化反應都是相互聯系和彼此依賴的,蛋白質與蛋白質之間彼此相互協作共同構成了多個獨立而又交叉的調控網絡。因此,一個基因的變異可以直接或間接的影響多個生理和生化反應過程,導致多個性狀發生相應的改變,也稱為基因的多效性。
26.為什么順式作用元件與反式作用因子共同調控基因表達
答:順式作用元件是指與結構基因串聯的特定DNA序列,具有轉錄調節功能,按功能特性分為啟動子、增強子、沉默子及其他可誘導元件等。順式作用元件本身不編碼任何蛋白質,主要提供作用位點。反式作用因子是指與順式作用元件相結合的調控性蛋白分子,包括轉錄因子、誘導因子等。反式作用因子與特定靶基因的順式作用元件結合,通過蛋白質和DNA相互作用、蛋白質和蛋白質相互作用、蛋白質修飾等途徑實現對基因表達的調節。因此,真核生物的基因表達過程的轉錄調控是順式作用元件與反式作用因子相互作用實現的。
27.為什么啟動子本身不控制基因的活動
答:啟動子(promoter)是基因表達(轉錄)起始時RNA聚合酶特異性識別和結合的DNA序列,位于基因5′端上游,能活化RNA聚合酶,使之與模板DNA準確結合并具有轉錄起始的特異性。基因的特異性轉錄主要取決于RNA聚合酶與啟動子是否可以有效地形成二元復合物,故RNA聚合酶如何有效找到啟動子區并與之結合是轉錄起始過程的關鍵。啟動子是基因的一個組成部分,控制著基因表達(轉錄)的起始時間和表達的程度。然而啟動子本身并不具備調控活性,它只是基因上游的一個開關標識,指導轉錄因子、RNA聚合酶等形成轉錄起始復合物開啟基因的表達。
28.為什么增強子不同于啟動子
答:增強子(enhancer)是指增強與其連鎖的基因轉錄效率的DNA序列,可以位于基因的5′端、3′端以及內含子中。增強子的效應非常明顯,一般可以使基因轉錄效率增加10~200倍,有的甚至可以高達上千倍。增強子可以分為兩類:①組織和細胞專一性增強子,這類增強子只有在特定的轉錄因子參與下才能發揮功能;②誘導性增強子,這類增強子的活性通常需要有特定的啟動子參與。雖然增強子是通過啟動子來影響轉錄的,但它與啟動子有兩個主要的區別:①定位不確定,啟動子位置相對固定,而增強子位置不固定,可有很大的變動;②能在基因上下游兩個方向均產生相互作用,啟動子僅作用于其下游特定基因的轉錄,而增強子能刺激其附近任一啟動子的轉錄。
29.為什么沉默子與增強子作用相反
答:沉默子(silencer)是真核生物基因序列中可降低基因啟動子活性的一段DNA序列,主要與調控蛋白結合后阻斷轉錄起始復合物的形成或活化,使基因表達活性關閉。沉默子與增強子有一些相似的性質:①可以在遠距離作用于下游順式連接的啟動子;②對基因的作用沒有方向的限制,即無論位于啟動子的上游還是下游均可以抑制啟動子的活性。因此,可以將增強子看作相應誘導信號的正調控元件,而沉默子則是一種負調控元件。前者使得基因表達大量增加,而后者抑制基因的表達。因此,沉默子與增強子可以看作兩個作用相反的基因調控元件。
30.為什么終止子與終止密碼子不同
答:終止子(terminator)是在轉錄過程中提供轉錄終止信號的DNA序列,位于poly A序列下游,長度在數百堿基以內,在mRNA水平上通過轉錄出來的終止子序列形成莖環結構而起作用,其與三聯體密碼子無關。終止密碼子(stop codon)是蛋白質翻譯過程中終止肽鏈合成的mRNA序列上的三聯體堿基序列,一般情況下有三種,分別為UAA,UAG或UGA。因此,終止子是相對于DNA轉錄mRNA來說的,而終止密碼子是相對于mRNA翻譯蛋白質來說的,兩者是不同的概念。
31.為什么基因突變具有多種類型
答:基因突變(gene mutation)是指DNA分子發生的可遺傳的變異現象。根據堿基變化的情況,基因突變一般可以分為以下幾類:①堿基替換突變:指DNA分子中一個堿基被另一個不同的堿基取代引起的突變,也稱點突變;②移碼突變:指DNA片段中某一個位點插入或丟失一個或幾個(非3或3的倍數)堿基時,造成插入或丟失位點以后的一系列編碼順序發生錯位的一種突變;③缺失突變:指DNA片段中發生一個或幾個堿基甚至大片段的DNA缺失;④插入突變:一個基因的DNA中插入一段外來的DNA,引起結構破壞而導致的突變。基因突變可以由物理、化學、生物等因素影響,具有不同的產生機制。不論何種突變類型,只要其不致死,均可以在存活個體中保留下來。因此,我們可觀測的基因突變具有多種類型。
32.為什么會發生同義突變
答:由于密碼子存在簡并性的特點,即不同的密碼子可能編碼同一種氨基酸,核苷酸的堿基置換后雖然三聯體密碼子發生改變,但所編碼的氨基酸沒有改變,即為同義突變。同義突變通常發生在三聯體密碼子的第3個堿基上,如脯氨酸的密碼子為CAU、CAC、CAA及CAG,它們的第3個堿基發生的突變即為同義突變,突變前后僅有堿基的變化,所對應的氨基酸序列沒有改變,也不產生遺傳表型的變化。
33.為什么基因組與蛋白質組的總數是不同的
答:基因組是指有機體的一組完整的基因,它最終由DNA的全序列決定。蛋白質組是指一組完整的肽鏈,它由全基因組編碼。但是,基因組與蛋白質組的總數不是一致的:首先,有些基因是以多拷貝的形式存在的,這些基因編碼相同的肽鏈;其次,一些基因可以通過可變剪接的方式產生多種肽鏈;再次,蛋白質采用不同的翻譯后修飾,也使得單一轉錄產物最終可以產生更多種類的蛋白質。
34.為什么人類基因數目少于預期
答:人類基因組是第一個完成測序的脊椎動物基因組,包含22條常染色體和2條性染色體(男性為1條X和1條Y染色體;女性為2條X染色體),總長度約為3×10 9個堿基對。隨著對其認識的深入,人們發現人類基因組實際上只有不到2%的序列是用來編碼蛋白質的,即使加上內含子的序列,這些區域也只占到基因組總量的25%左右,其余大部分都是非編碼序列。目前通常認為人類基因組存在約兩萬個基因,只比果蠅和線蟲(分別為13 600個和18 500個)多一點,因此遠比早期人們預期的少得多。
35.為什么基因組存在C值悖論
答:每種生物單倍體基因組的DNA總量被稱為C值,反映了該種生物基因組的大小。高等生物比低等生物具有更為復雜的生命活動,早期人們認為它們的C值也應當更高。實際上,物種的C值與其進化復雜性之間并無嚴格對應的關系。生物體的復雜程度并不能僅僅從染色體的多少或DNA的總量來衡量,許多生物的基因組是冗余的,存在大量的非編碼序列或重復序列,并不與生物的進化程度相對應。因此,基因組存在C值悖論。
36.為什么基因在基因組上的分布不是均一的
答:基因在基因組上并不是均勻分布的,人類基因組總共約20%的區域是沒有基因存在的。有些染色體上基因分布很少,多達25%的區域無基因存在;即使基因最豐富的染色體,也有大約10%的區域是無基因的。重復序列占據了人類基因組的50%以上,包括:①轉座子(活性的及非活性的)占據了重復序列的45%左右;②已加工的假基因約3000個,約占基因組的0.1%;③簡單重復序列(如CA重復占據了重復序列的3%左右);④區段重復序列(長度為10~300kb的區段模塊),大部分位于不同染色體上;⑤串聯重復序列(特別是著絲粒和端粒處)。
37.為什么會有單核苷酸多態性
答:在比較等位基因時,有些基因位點的變異頻繁地發生,其中發生在超過1%的人群中的基因位點變異稱為單核苷酸多態性(single nucleotide polymorphism,SNP)。理論上講,SNP既可能是二等位多態性,也可能是3個或4個等位多態性,但后兩者罕見。在人類基因組中存在大量的SNP,是人類可遺傳的變異中最為常見的一種,平均每1300多個堿基中就存在1個SNP。單核苷酸多態性的產生源于核苷酸水平的變異,當對生物體沒有明顯的有害性時,該突變可能會通過遺傳漂變等機制在一個種群中得到較高的頻率并保留下來,形成SNP。
38.為什么基因組中會存在假基因
答:基因組中,由于位點突變等原因,有些基因的拷貝喪失了功能,它們被稱為假基因。假基因是基因組中與編碼基因序列非常相似的非功能性基因組DNA拷貝,一般情況下不被轉錄。第一個假基因是1977年在研究非洲爪蟾5s RNA基因時發現的。假基因和真基因的結構上的差異主要包括在不同部位不同程度的發生了缺失或插入、在內含子和外顯子鄰接區中的順序變化、5′端啟動子區域的缺陷等,這些變化往往使假基因不能夠轉錄形成正常的mRNA,最終導致基因不能表達。由于基因突變是隨機產生的,當個體中由于突變導致的缺陷基因在一個群體中得到保留并固定下來后,便成了一個沒有功能的基因拷貝,即假基因。
39.為什么生物不太可能保留兩份完全相同的基因序列
答:除非基因編碼的產物在細胞中需要維持很高的濃度,或在以下情況兩個基因都被生物體所必需:兩個基因編碼的蛋白質產生了不同的功能,或它們在不同時間/不同細胞類型中表達。如果此事件沒有發生,其中一個基因很可能會變成假基因,因為如果它獲得有害突變后,最終將由于缺乏選擇壓力而消亡。由于隨機的遺傳漂變,出現突變體的頻率可能提高,并固定在某一物種中。
40.為什么非編碼區位點突變也會影響基因的功能
答:發生在非編碼區的突變雖然不會像編碼區突變一樣,通過改變編碼的氨基酸序列而影響相關蛋白功能,但非編碼區位點突變可以通過直接改變調節序列、DNA的二級結構以及染色質的空間結構來改變基因的調控模式,從而影響基因的轉錄速率、RNA加工、翻譯效率等,最終影響基因的表達。因此,非編碼區位點突變也會影響基因的功能。
41.為什么基因突變既可以引起蛋白質功能的喪失也可以導致其功能的獲得
答:等位基因由于點突變、片段缺失、插入以及重排等原因使其編碼的蛋白質功能完全喪失的突變稱為無效突變(nullmutation),既可以指導致無法合成有功能性蛋白質的突變,也可以指促進合成無功能蛋白質的突變。無效突變或其他阻止基因表達功能的突變被稱為功能缺失突變(loss-of-function mutation,LOF);其中有一部分喪失功能的基因突變,其編碼的蛋白質功能失活不完全,仍保留了一些功能,但在雜合狀態下不能產生足夠多的野生型表型,這類突變稱為滲漏突變(leaky mutation)。有時某些位點突變后可引起相反的效應,使蛋白質獲得新的功能或表達模式,這樣的突變稱為功能獲得突變(gain-of-function mutation,GOF)。
(王波 楊海鷗 傅啟華)