官术网_书友最值得收藏!

人類基因組測序

其實(shí),生物學(xué)真正需要的是一個(gè)龐大的信息庫——對幾種關(guān)鍵生物的遺傳結(jié)構(gòu)的詳細(xì)了解。其中包括人類,原因很明顯。

——羅伯特·辛斯海默

圣克魯斯工作室,1985年5月

1939年,在著名科學(xué)家阿爾伯特·愛因斯坦向富蘭克林·羅斯福送達(dá)一封信件后,曼哈頓計(jì)劃啟動了。這封信件的內(nèi)容現(xiàn)在已經(jīng)盡人皆知:根據(jù)愛因斯坦對歐洲各地科學(xué)進(jìn)展的了解,他認(rèn)為我們已經(jīng)具備了制造一種強(qiáng)力炸彈的技術(shù)可行性。通過這一絕密計(jì)劃,人們實(shí)現(xiàn)了兩種核鏈?zhǔn)椒磻?yīng)的途徑。在第二次世界大戰(zhàn)末期,它們被部署在原子彈里,投放到了長崎和廣島。后續(xù)美國能源部領(lǐng)導(dǎo)發(fā)起的所有“大科學(xué)”項(xiàng)目都以曼哈頓計(jì)劃的組織形式與工程模式為典范。

隨著生物技術(shù)的誕生和人類遺傳學(xué)研究的進(jìn)步,從1985年左右開始,知名生物學(xué)家們和能源部健康與環(huán)境研究辦公室的管理人員就在各種會議上提出并討論了對整個(gè)人類基因組進(jìn)行測序的提議。[60][61]這一項(xiàng)目被美國能源部稱為人類基因組計(jì)劃,它旨在為生物學(xué)和醫(yī)學(xué)研究提供寶貴的信息資源,展示美國在科學(xué)領(lǐng)域的競爭力。同時(shí),作為美國能源部評估核武器與核能源健康風(fēng)險(xiǎn)的任務(wù)的一部分,人類基因組參考序列可以成為一個(gè)理想的選擇,幫助能源部評估輻射和能量透射造成的遺傳損傷。但對生物學(xué)界來說,這是一個(gè)極其大膽的目標(biāo)。與曼哈頓計(jì)劃不同的是,這個(gè)項(xiàng)目的每一階段都沒有明確的技術(shù)路線。

在1985年的圣克魯斯會議上,研討會與會者明確了幾項(xiàng)必須滿足的要求。其中,至少3項(xiàng)對人類基因組測序至關(guān)重要的技術(shù)仍然不夠成熟。首先,我們需要分子技術(shù)來構(gòu)建基因組的物理和遺傳圖譜。戴維·博特斯坦首創(chuàng)的遺傳定位技術(shù)為我們帶來了曙光。當(dāng)時(shí),這一技術(shù)正在逐漸成熟,并可能用于定位人類基因組中的致病基因。[62]另外兩個(gè)實(shí)驗(yàn)室正在同時(shí)進(jìn)行基因的物理定位工作:華盛頓大學(xué)的梅納德·奧爾森團(tuán)隊(duì)在研究酵母基因組,而劍橋大學(xué)的約翰·薩爾斯頓關(guān)注線蟲研究。這兩項(xiàng)工作提供了人類基因組物理定位的技術(shù)可行性,但它們的方法對大型基因組來說可能過于煩瑣。[63][64]奧爾森開發(fā)出了最早一代計(jì)算算法,從限制酶處理后的DNA產(chǎn)物中恢復(fù)基因定位信息。

自動DNA測序技術(shù)也是必不可少的。但在當(dāng)時(shí),只有一個(gè)實(shí)驗(yàn)室實(shí)現(xiàn)了這項(xiàng)技術(shù)。1985年,第一臺原型DNA測序儀剛剛在帕薩迪納的加州理工學(xué)院的勒羅伊·胡德團(tuán)隊(duì)中建成。[65]與測序相關(guān)的問題是,大家并不清楚我們需要什么樣的計(jì)算方法來輔助測序與重構(gòu)基因組,也不知道如何處理、儲存和分析這些信息。第一個(gè)核苷酸序列匹配與比對算法慢得出奇,根本沒有辦法擴(kuò)展到高通量數(shù)據(jù)分析的場景。此時(shí),距離我們發(fā)明那些關(guān)鍵算法——測序質(zhì)量評估、將測序片段組裝為基因組,還有很長的一段時(shí)間。更要命的是,人們甚至不知道到底應(yīng)該選擇什么樣的測序方式,也不清楚實(shí)現(xiàn)基因組測序計(jì)劃需要解決什么樣的計(jì)算問題。在1985年,測序完成的最大基因組是EB病毒[66],一共有1.72×105個(gè)堿基。人類基因組大約有3×109個(gè)堿基。打個(gè)比方,這就好像我們的目標(biāo)是抵達(dá)距地球9 000萬英里[67]的太陽。當(dāng)時(shí),我們已經(jīng)通過商業(yè)飛行器完成了舊金山到巴黎的5 500英里航程。為了完成剩下的旅程,我們必須打造一艘航天器。對懷疑論者而言,實(shí)現(xiàn)這一生物學(xué)領(lǐng)域的“大科學(xué)”項(xiàng)目似乎是白日做夢。

在1985年舉行的圣克魯斯會議上,12位專家打成了平手:一半贊成,一半反對。麻省理工學(xué)院的遺傳學(xué)家博特斯坦是人類基因組測序項(xiàng)目的堅(jiān)定反對者。博特斯坦以及其他科學(xué)家擔(dān)心這樣的大型科學(xué)項(xiàng)目會影響那些小型研究組繼續(xù)從美國國立衛(wèi)生研究院獲取RO1經(jīng)費(fèi)。另一些來自科學(xué)界和國會的反對者則對項(xiàng)目預(yù)算持有異議。據(jù)初步估計(jì),這一項(xiàng)目將在未來的15年間花費(fèi)10億~30億美元。除此之外,人們對科學(xué)的政治化、項(xiàng)目如何組織以及誰來決定項(xiàng)目的科學(xué)重要性等問題均有爭議。一些研究人員認(rèn)為,獲取染色體全部DNA序列并沒有什么意義,他們更加關(guān)心外顯子中包含的蛋白質(zhì)編碼序列。但我們無法輕易從真核基因的基因組DNA中分辨出內(nèi)含子或外顯子。由于當(dāng)時(shí)的基因組項(xiàng)目并未包含基因發(fā)現(xiàn)算法的開發(fā),我們只能通過信使RNA轉(zhuǎn)錄物分析獲取編碼序列信息。

與之相反的是,分子生物學(xué)家和人類遺傳學(xué)家對人類基因組項(xiàng)目熱情高漲。在他們的宏偉愿景里,全面解讀我們自己這種物種的基因組序列,將會極大地幫助我們理解人類本質(zhì)、實(shí)現(xiàn)醫(yī)學(xué)突破。當(dāng)時(shí)盛行的還原論的擁躉認(rèn)為,基因組序列信息將為我們揭示每一個(gè)基因的奧秘,這將是通向所有生物學(xué)秘密的鑰匙。從遺傳學(xué)家的角度來看,基因組研究將極大地推動醫(yī)學(xué)發(fā)展。他們期冀測序與遺傳變異名錄的建立能夠揭露約3 000種已知遺傳疾病的病因。后來,人們意識到這種觀點(diǎn)過于理想化與簡單化。例如,對精神分裂癥而言,盡管我們掌握了豐富的家族史和病史信息,以及精神分裂癥患者的已知基因變化,但我們?nèi)詫@種疾病的神經(jīng)病理學(xué)細(xì)胞基礎(chǔ)知之甚少,針對各種神經(jīng)遞質(zhì)系統(tǒng)的治療方法也均以失敗告終。

沃爾特·吉爾伯特是基因組計(jì)劃的狂熱支持者之一。那時(shí),他剛剛離開渤健(屬于最早一批開發(fā)基于重組DNA技術(shù)療法的生物科技公司),回到哈佛大學(xué)。但是,吉爾伯特不相信政府的努力會取得成功,在詹姆斯·沃森領(lǐng)導(dǎo)的探索人類基因組計(jì)劃的美國國家科學(xué)院委員會里,吉爾伯特一直是刺頭一樣的存在。[68]后來,吉爾伯特退出了這一委員會,開始做出將基因組測序私有化的努力——為他新孵化的靈感,一家名為基因組公司的初創(chuàng)公司尋找風(fēng)險(xiǎn)投資。[69]這是一個(gè)頗為大膽的舉動。吉爾伯特第一次管理生物技術(shù)公司的經(jīng)歷并不成功,他在1984年被迫辭去了渤健首席執(zhí)行官的職務(wù)。此前兩年,渤健一直處于虧損狀態(tài),考慮到與同類型優(yōu)質(zhì)公司,尤其是舊金山的基因泰克公司的競爭,情緒緊張的投資者想要一位商業(yè)領(lǐng)導(dǎo)經(jīng)驗(yàn)更加豐富的管理者。但拋開商業(yè)經(jīng)歷不談,吉爾伯特是一位才華橫溢、富有創(chuàng)新精神的科學(xué)家,自20世紀(jì)60年代初以來,他就為分子生物學(xué)領(lǐng)域貢獻(xiàn)了諸多基礎(chǔ)性發(fā)現(xiàn)。1980年,吉爾伯特因開發(fā)DNA測序技術(shù)與弗雷德里克·桑格共同獲得諾貝爾化學(xué)獎。

吉爾伯特?zé)嶂杂谕七M(jìn)他自己的人類基因組測序計(jì)劃,并將基因序列信息轉(zhuǎn)化為商業(yè)利潤。這種想法引起了許多人的擔(dān)憂,甚至引發(fā)了倫理問題。一家私營企業(yè)怎么可以擁有基因組信息?如果你擁有一個(gè)新測序的DNA片段,那么其是否會被視作一種新穎的“物質(zhì)組成”,并能夠申請專利?對風(fēng)投資本家來說,他們無法想象其中可以盈利的商業(yè)模式,也不知如何評估基因數(shù)據(jù)市場的規(guī)模。最終,由于1987年10月的股市崩盤,基因組公司從未實(shí)現(xiàn)騰飛。然而,10年之后,基因組測序領(lǐng)域的同人們震驚地發(fā)現(xiàn),在人類基因組測序計(jì)劃逐步推進(jìn)的時(shí)候,生物學(xué)家與生物技術(shù)企業(yè)家克雷格·文特爾成立了一家私人公司——塞雷拉基因組公司,其與政府資助的項(xiàng)目展開了競爭。文特爾的目標(biāo)是通過一個(gè)堿基接一個(gè)堿基的測序,實(shí)現(xiàn)基因組信息的商業(yè)化。

盡管美國國立衛(wèi)生研究院支持的學(xué)術(shù)界整體上對人類基因組測序項(xiàng)目興致不高,國會卻非常看好這一瘋狂的想法。1988年,國會向人類基因組計(jì)劃撥款,這筆款項(xiàng)流向了美國能源部與美國國立衛(wèi)生研究院,雙方同意合作推動項(xiàng)目進(jìn)行。這一計(jì)劃草案于1990年4月公布,第一個(gè)5年目標(biāo)是完成相應(yīng)技術(shù)的開發(fā),第二階段則預(yù)計(jì)在2005年完成完整基因組測序,項(xiàng)目整個(gè)生命周期的預(yù)算估計(jì)為30億美元。美國能源部的工作將由3個(gè)具有出色技術(shù)開發(fā)經(jīng)驗(yàn)的國家實(shí)驗(yàn)室牽頭:勞倫斯·利弗莫爾、勞倫斯·伯克利和洛斯·阿拉莫斯國家實(shí)驗(yàn)室。美國國立衛(wèi)生研究院則成立了一個(gè)專門的機(jī)構(gòu)——人類基因組研究辦公室來監(jiān)管測序項(xiàng)目,由沃森兼職管理。項(xiàng)目的另一項(xiàng)戰(zhàn)略舉措是招徠全球頂級研究中心里從事基因組測序工作的實(shí)驗(yàn)室,并以國際人類基因組測序聯(lián)盟的名義推動各組織間的合作。幾年之后,美國國立衛(wèi)生研究院成立了國家人類基因組研究中心,其在1992年沃森離職后由弗朗西斯·柯林斯領(lǐng)導(dǎo)。人類基因組計(jì)劃于2003年正式完成,估計(jì)耗資27億美元——提前了2年,節(jié)約了3億美元預(yù)算。

自2001年人類基因組工作草圖發(fā)表以來,人類基因組計(jì)劃已經(jīng)成了載入史冊的巨大成就,每一步突破都得到了詳盡記錄。[70][71]不管作為政府項(xiàng)目還是私人項(xiàng)目,我們能夠完成這一不可能的挑戰(zhàn),離不開最初對它的工程化設(shè)計(jì)。美國能源部就是為了管理這樣高預(yù)算的大型技術(shù)開發(fā)項(xiàng)目而存在的,其涉及的項(xiàng)目從望遠(yuǎn)鏡到高能物理設(shè)備,不一而足。人類基因組計(jì)劃的推進(jìn)也伴隨著DNA測序儀器、DNA序列組裝策略和基因組中心之間項(xiàng)目數(shù)據(jù)協(xié)調(diào)等領(lǐng)域源源不斷的技術(shù)創(chuàng)新。對包含30億個(gè)堿基對的人類基因組進(jìn)行測序,這一愿景驅(qū)使測序通量指數(shù)級提升,測序成本大幅降低,并同時(shí)推動了許多其他重要的基因組學(xué)項(xiàng)目。

在人類基因組項(xiàng)目的初期,人們沒有意識到,如果一直采取最初的方式,對嵌入大量克隆載體的重疊、連續(xù)DNA片段進(jìn)行測序,我們就無法在10年之內(nèi)完成測序。直到全基因組鳥槍法出現(xiàn),完成基因組測序才成了可能。全基因組鳥槍法測序的概念于1981年提出,后續(xù)由基因組研究所的克雷格·文特爾實(shí)現(xiàn)了大規(guī)模開發(fā)。[72][73]1995年,基因組研究所宣布了一項(xiàng)開創(chuàng)性的研究成果,他們利用鳥槍法完成了流感嗜血桿菌的測序,這也標(biāo)志著DNA測序能力的騰飛(見表1—2)。從1965年測定第一個(gè)DNA分子,到完成第一個(gè)人類基因組測序,隨著時(shí)間的推移,推動研究取得進(jìn)展的力量由化學(xué)突破轉(zhuǎn)變?yōu)樵O(shè)備發(fā)展,最終,大規(guī)模并行測序和與之相匹配的高性能計(jì)算幫我們實(shí)現(xiàn)了目標(biāo)。

表1—2 DNA測序的里程碑事件——從單基因到宏基因組

在人類基因組計(jì)劃的整個(gè)生命周期中,生物信息學(xué)和計(jì)算生物學(xué)技術(shù)得以誕生并發(fā)展。在基因組測序接近完成的時(shí)候,信息技術(shù)的重要性越發(fā)凸顯——DNA序列組裝需要大量的CPU與內(nèi)存。人類基因組計(jì)劃建立了一個(gè)全新的生物學(xué)研究框架,為生物學(xué)研究帶來了影響深遠(yuǎn)的益處。從此,科學(xué)家不再需要在實(shí)驗(yàn)之前就選定基因、變異或細(xì)胞機(jī)制作為假設(shè)驗(yàn)證的對象,而是可以客觀全面地從基因組的角度看待問題。從人類學(xué)到動物學(xué),人類參考基因組序列的完成為我們打開了跨越不同領(lǐng)域的發(fā)現(xiàn)之門。

現(xiàn)在看來,信息革命帶來的強(qiáng)大能力是高科技領(lǐng)域賦予生物學(xué)的重要禮物。推動人類基因組計(jì)劃的幾位首席科學(xué)家在2003年回憶了計(jì)算在項(xiàng)目中的重要性。戴維·博特斯坦說,項(xiàng)目完成過程中最令人驚訝的一點(diǎn)是,如果沒有計(jì)算機(jī),就不會有人類基因組計(jì)劃。梅納德·奧爾森說:“在這之前,整個(gè)計(jì)算基礎(chǔ)體系都不存在。”[74]對加州大學(xué)圣克魯斯分校的戴維·豪斯勒來說,他的同事吉姆·肯特的工作直接反映了計(jì)算的重要性。吉姆·肯特負(fù)責(zé)最終的基因組組裝,是基因組組裝軟件和基因組瀏覽器軟件的主要開發(fā)人員。[75][76]人類基因組計(jì)劃的宏偉壯麗激發(fā)了豪斯勒心中的詩意:

我們意識到——我們有一種走進(jìn)歷史的感覺,就是這樣!這是世界——整個(gè)世界第一次看到它世代繼承的基因遺產(chǎn)。人類是38億年進(jìn)化的產(chǎn)物。這就是我們的祖先歷經(jīng)無數(shù)次偉大勝利和沉重失敗,為我們精心雕琢出的令人贊嘆的信息序列。這是我們第一次閱讀它。我們真的在閱讀祖先傳承下來的有關(guān)生命的密碼。[77]

主站蜘蛛池模板: 楚雄市| 措勤县| 开封市| 昌江| 天津市| 蒙城县| 东乌珠穆沁旗| 桃江县| 沈丘县| 土默特右旗| 宜丰县| 南通市| 渭南市| 铜陵市| 克拉玛依市| 宜宾县| 晋江市| 罗平县| 运城市| 黎城县| 余姚市| 崇信县| 元氏县| 体育| 克什克腾旗| 蕲春县| 罗平县| 太白县| 新营市| 当雄县| 长顺县| 法库县| 莎车县| 凯里市| 新干县| 汾西县| 乌鲁木齐县| 朝阳市| 丰原市| 宜宾县| 淳安县|