你的遺傳密碼,究竟來自何方?

jopen 10年前發布 | 6K 次閱讀 密碼

            GTGCCAGCAGCCGCGGTAATTCCAGCTCCAATA GCGTATATTAAAGTTGCTGCAGTTAAAAAG

        這看起來像是錯按鍵盤打出的亂碼,但這條 DNA 序列確實意義重大,它存在于你身體的每一個細胞中,在你養的貓狗體內,在你盤中的魚、花園中的蜜蜂與蝴蝶,甚至你腸道的細菌中。事實上,你在地球上任何地 方找到的生物,從深海底沸騰的熱泉生物到云端的冰冷細菌,都擁有這條 DNA 序列。甚至,在一些事實上并沒有活性的物體,比如巨型病毒擬菌病毒中,你也能找到它。

        這條 DNA 序列分布如此廣泛,是因為它是在所有生命的共同祖先體內演化而來的。它擔負著一項決定性的任務,幾乎從未改變。換一種方法說,你體內一些 DNA 的年齡不可思議地高達 30 億歲,從你的幾萬億祖先那里未經干擾地傳遞給了你。

        你的另一些 DNA 則是嶄新的。你的基因組大約有 100 個基因突變是你父母沒有的,小到僅僅一至兩個核苷酸的改變,大到整條 DNA 的得與失。

        通過基因組對比,我們可以確認哪些 DNA 是新的,哪些是老的。例如,對比你跟兄弟姐妹的基因組,可以將嶄新的基因突變揭示出來。將人類基因組與動物的作比較,則可以分辨基因的新老。

        我們的基因組不僅是造人的“秘方”,還是活的歷史詞典。基因組由 60 億個核苷酸組成,足夠寫滿一堆十米高的書藉,正因為它們是如此巨量,才能記錄我們過去的點點滴滴,允許我們追溯從現在到生命之初的整個演化歷史。

        在剛開始破譯這些記錄的時候,我們就發現自己的祖先不止面臨著血肉相博的生存競爭,還經歷了史詩般的基因組戰役,這改變了基因組的工作方式,使我們成為現在的我們。

你的遺傳密碼,究竟來自何方?
從第一個生物細胞的形成,到人類出現的黎明,地球生命 30 多億年來的演化歷史,就隱藏在你的基因組中。圖片來源:redorbit.com

        共同祖先

        最初存在的是 RNA,它是一種“多才多藝”的分子,不僅能存儲信息,還能催化反應。這意味著,一些 RNA 可以自我復制。一旦一個或一群 RNA 開始自我復制,最早的基因便誕生了。

        RNA 的基部不是特別穩定,因此很早的時候,生命體就開始在另一種分子——DNA 上儲存信息。DNA 有一個略微不同的化學骨架,更不容易斷裂。蛋白質也將 RNA 當作催化劑,RNA 的作用逐漸弱化成了介質。DNA 存儲制造蛋白質的信息,并向蛋白質工廠釋放相應的 RNA 轉錄體。

        RNA 曾經主宰世界的許多痕跡,仍存在于我們的基因組中。比如文章開頭提到的那段無處不在的基因序列,仍編碼一種 RNA 酶的一部分。這種 RNA 酶在蛋白質的合成過程中仍然起著關鍵作用。

        大約 35 億年前,出現了一種含有基因組的生命體,被稱為所有生命的共同祖先(LUCA,Last Universal Common Ancestor of all life)。它的基因組由制造 RNA 和蛋白質的信息體組成。在美國馬里蘭州貝塞斯達國家衛生研究院研究生命演化的尤金·庫寧(Eugene Koonin)說,至少 100 個基因確信源于 LUCA,而 LUCA 可能總共擁有超過 1000 個基因。

        雖然與我們所知的現代生命長得不一樣,LUCA 擁有許多在現代生命中仍可找到的核心體系,包括蛋白質制造體系。一些研究者相信,LUCA 絕不是一個分離的、由膜包覆的細胞,而是由類似病毒的個體組織而成的復合體,在無生命的隔間(比如堿性熱液噴口的孔洞)內不斷復制。

        分離與重聚

        接下來可能發生的情況是,LUCA 類似病毒的部分機體,通過兩次不同的契機,吸附了細胞膜而變成了簡單的細胞。這可以解釋兩種截然不同的簡單細胞,細菌和古菌,為什么會擁有完全不同的細胞 膜。庫寧說:“這是非常引人注目的假設。”可以肯定的是,生命在很早之前就產生了分枝。

        細菌與古菌演化出了一些奇妙的分子機器,并且改變了地球,但仍然只是化合物構成的小小囊泡而已。直到發生了一件非同尋常的事件,將這兩大分枝重新聚合成一個復雜細胞,即真核細胞。這一事件改變了基因組,也為第一批動物的出現鋪平了道路。

        距今大約 10 億年前,一只古菌“吞食”了一只細菌,但并沒有殺死它。相反,它們攜手形成了一種共生關系,細菌的后代逐漸擔負起了一個重要角色——線粒體,成為了細胞內供應能量的工廠。

        如果沒有這次重聚,復雜生命或許根本不會出現。我們傾向于假設,簡單有機體向復雜個體演化是自然趨勢,但單獨的細菌和古菌至今在復雜程度上也沒有太大變化。原因何在?

        據英國倫敦大學學院的尼克·萊恩(Nick Lane)說,這是因為它們遇到了一個能量瓶頸。所有的簡單有機體都利用細胞膜產生能量。當它們變大時,相對表面積變小,因此不能產生足夠的能量,所以簡 單有機體必須維持微小體。同時,小細胞也沒有足夠的空間容納大的基因組。通過提供模塊化的完備能量源,線粒體突破了這一瓶頸。細胞只需要制造更多線粒體, 就能夠變得更大。相應地,基因組得以擴充,信息存儲能力也有效提高。

        除了讓細胞從能量困境中擺脫出來,線粒體的祖先還是我們多達3/4 基因的源泉。最古老的細菌大約擁有 3000 個基因,它們中的大多數都隨著時間流逝或消失,或進入主基因組中,只給現在的線粒體留下了少量的基因。

        盡管益處顯而易見,但重聚也存在極大的危險。確切地說,線粒體祖先的基因被一些寄生 DNA 感染了。這些寄生 DNA 被稱為轉位子(transposon),除了不停復制自己之外什么都不做。有時它們在基因中段定位,攜帶大量不相干的 DNA 形成內含子(intron)。這就像在一本熬湯菜譜中夾了一段糕點配方一樣。

        當然結果并不總會致病,因為內含子能在 RNA 離開細胞核(這是蛋白質生成的第一步)進行轉譯前自我剪接。但這個過程并不總會發生,因此內含子的存在是有害的。絕大多數細菌基因中沒有內含子,因為細菌 數量眾多,相互之間競爭激烈,自然選擇會殘酷地將有內含子的個體剔除。然而,早期真核細胞數量極少,因此自然選擇作用較弱,古老線粒體上的寄生基因便開始 瘋狂進行自我復制,最終導致基因組上有成百上千的內含子。

        現在,我們的每一個基因中都有約 8 個內含子,它們中的絕大多數可追溯至最早的真核生物——我們的祖先沒有采取任何措施來擺脫它們。相反,祖先演化出了一些方法來應對它們,比如改變基因的結構以及細胞再生的方式。性,便是其中之一。

        性的優勢

        性的關鍵作用不僅是不同個體基因的混合,同樣重要的,還有將兩個不同譜系的進化優勢綜合起來。單細胞生物早就在通過無性的方式交換基因了。

        性還涉及到一個過程,被稱為再結合(recombination)——在分裂為精子或卵細胞之前,染色體會交換相應的單體。再結合將基因組中的許多基因像項鏈上的珠子那樣串起來,從而解決了一個基本問題。

        想象一串項鏈上有一顆珍貴的珍珠,挨著另一顆有瑕疵的珍珠。如果不能對單顆珍珠進行替換,你就只有兩種選擇:要么將整串項鏈扔掉,要么全部留 下。同樣的道理,如果有益突變鄰近有害突變,要么一起扔掉有益突變,要么就連有害突變都一同保留,最終通過相鄰細胞傳染整個族群。

        再結合提供了一個交換單顆珍珠的機會。通過交換單顆珍珠,你可以得到一條完美項鏈和一條滿是瑕疵的項鏈。同樣的道理,你的一些后代會獲得大量的優秀基因,另一些則會得到大量有害基因,甚至包含一些致命的內含子。不幸的個體極易死去,而優秀個體將存活下去。

        大族群中會產生大量突變,其中總有一些能夠抵消有害基因的影響,因此不太需要借助再結合之力。對于小族群而言,性就勝出了。也正因為如此,性成 了最早的真核生物及其絕大部分后代的標準配置。因此,下一次你在享受魚水之歡的時候,一定不要忘記感謝古老的細菌祖先將性愛之樂的寄生基因保留至今。

你的遺傳密碼,究竟來自何方?
我們的基因中有許多外來的入侵序列,但這些序列也為演化打開了一條新的途徑。圖片來源:《新科學家》

        到了性演化出現的時候,已經有太多的內含子需要擺脫。因此早期真核生物很快就面臨了另一個嚴重問題:隨著內含子獲得越來越多的變異,自我剪接機 制開始失效。相應地,早期真核生物演化出了一種特殊機制,被稱做“剪接體”(spliceosome),會將內含子從轉錄后的 RNA 上剪下來。

        剪接體是演化產生的一種不夠“靈光”的解決方法:從 RNA 上剪下基因的無用片段,比直接從 DNA 上剪下來,效率要低得多。更嚴重的是,剪接體反應較慢,許多 RNA 都已經到達蛋白質工廠了,內含子仍未剪掉,便導致了缺陷蛋白質的產生。

        庫寧推測,這就是細胞核出現的原因。一旦一個細胞的 DNA 被封閉在一個相對隔絕的空間中,遠離蛋白質工廠,只有剪接過的 RNA 可以進出,就可以防止細胞浪費能量去制造無用的蛋白質。

        但這也無法解決所有問題,剪接體常常誤將已編碼的基因片段(被稱為外顯子)剪掉,從而產生蛋白質的突變體。庫寧說:“選擇性剪接不是一種適應,而是有機體不得不去應付的一件事情。”

        因此,我們的古老祖先演化出了一層又一層的復雜機制,以對抗內含子的增生,但這無法解決它們引起的所有問題。不過,與簡單細胞不一樣,它們能量充裕,已能負擔得起這樣的浪費。同時,長遠來看,這樣的復雜化也蘊育了新的良機。

        多功能與調控

        內含子與外顯子的存在,能夠使基因更加模塊化。在一個連續不間斷的基因中,基因片段得失而產生的突變,往往會改變剩余基因的讀取,從而產生混亂。相反,外顯子的移除卻不會干擾其他基因。于是,基因現在可以通過雜合外顯子而演化了。

        例如,偶然的突變將一個額外的外顯子添加到一個基因上。由于選擇性剪接的存在,原始版本的蛋白質仍能被制造出來,但這也意味著該基因還能產生一 種新的蛋白質。這一突變可能沒有太多影響,因此不會被自然選擇剔除。但久而久之,新種蛋白質有可能承擔新的作用。極其偶然的情況下,真核生物這種不“靈 光”的應對內含子的方法,讓它們的基因變得功能更加多樣化,也更容易演化了。

        如果關于復雜細胞演化的這種觀點是正確的,我們基因組的諸多關鍵特征,從模塊化基因到性,就都是線粒體寄生基因存在的直接結果。其他學說無法被完全否定,但這是最漂亮的解釋。庫寧說:“這是我最喜歡的場景。”

        所有這些新奇的特征導致了演化變革的大爆發,真核生物不僅生存了下來,還開始多樣性分異。盡管如此,它們仍然面對著新型寄生 DNA 及病毒入侵的猛烈攻擊。不過,在超越簡單細胞的大小限制之后,復雜生命體能自由演化出越來越復雜的防御體系。

        其中之一便是給 DNA 加標記,使轉位子的寄生基因失去活性,從而阻止 RNA 拷備的出現——這被稱為甲基化作用(methylation)。另一種方法是,破壞入侵病毒的 RNA 來禁止其自我復制。這些防御方法僅部分有用。現在,約5% 的人類基因由病毒的殘余及變異片段組成,其中殘余片段占大多數。令人驚訝的是,有多達 50% 的人類基因由轉位子的殘余組成——這也足以證明,有多少次這些寄生物設法闖入了我們祖先的基因組,并肆虐開來。

        這些防御體系很快就被委以另一項重任:調控細胞自身基因的活性。加拿大圭爾夫大學的瑞安·格雷戈里(Ryan Gregory)是研究基因組演化的專家,他說:“原本調控轉位子的機制成了調控基因的機制。”

        塑造身體

        大約在 8 億年前,演化進入到一個新的階段,細胞開始了從未有過的密切合作關系。雖然有少量細菌是多細胞的,但復雜程度上的限制使它們絕不會在復雜化道路上走得太 遠。相反,真核生物則利用一系列的契機進入了多細胞演化階段,最終產生了高度復雜的有機體,如真菌、水藻、陸生植物,還有動物。

        原因之一便是它們越來越豐富和大型化的基因組,這些基因組被委以新的重任,比如將細胞聯接起來并相互交流。更重要的是,這些基因組的本質屬性允 許快速演化的發生。例如,將細胞聯接起來的蛋白質由橫跨細胞膜的和向外突出的兩部分組成。由于基因的模塊化,所有蛋白質的向外突出部分都可以任意與橫跨細 胞膜的部分錨接起來,就像真空吸塵器上粘附著不同的物品。許多控制多細胞性的關鍵基因,都是通過外顯子的混雜演化出來的。

        另外,真核生物控制基因的復雜機制能夠使細胞更加專業化。通過控制不同基因的表達與否,不同的細胞群可以扮演差異極大的角色。于是,有機體開始發展出不同類型的組織,使早期生命從簡單的水綿類生物逐漸演化為擁有復雜體征的動物。

        接下來的跳躍式演化,是一系列基因“事故”的結果。繁殖過程發生錯誤時,有時整條基因都可能被重復復制——在所有脊椎動物的祖先身上,這樣的偶然事件不止發生了一次,而是兩次。

        這些基因的復制品產生了大量額外的基因拷備,其中的絕大多數都遺失了,另外一些卻承擔起了新的角色。確切地說,這樣的重復復制產生了 4 組 Hox 基因,這是一種在發育過程中塑造身體的主宰基因,在內骨胳的演化過程中扮演著極為關鍵的角色。

        整個基因組的重復復制是少見的,絕大多數新基因都來自較小的重復復制,或外顯子的混雜,或二者兼有。演化會利用任何有用的基因,而不管它們從何而來,一些關鍵基因源于垃圾 DNA,另一些則來自其他地方。

        例如,大約在 5 億年前,我們祖先的基因組被一種稱作 hAT 轉位子的寄生基因入侵。它能通過一種“剪切與粘貼”機制來復制自己。這種“剪切”的過程,由與特定 DNA 序列聯結的兩種酶來實現。

        早期脊椎動物演化到某一時間點,這種與 DNA 剪切酶相關的序列進入到了一個基因當中(或是出現在了它的附近),這個基因與辨識入侵的細菌與病毒有關。結果便是,在個體的整個生活史中,只要它的細胞進 行復制,hAT 酶就會剪切掉這個基因的一部分。關鍵是,在不同的細胞譜系中,被剪切掉的部分不相同,這便形成了大量不同的蛋白質變異體。

        在某些情況下,這種變化是救命的,因為變異蛋白質更適合鎖定入侵病原體。很快,一種用于辨識最有效細胞并促進其快速復制的機制產生了,這就是免 疫系統。現今人類的免疫系統復雜得難以置信,但其中的兩種調控剪切與重排基因的酶正是 hAT 酶的直系后裔,是靶定入侵者的關鍵環節。所以,我們要感謝那種古老的“寄生蟲”,帶給了我們防御疾病的最有效武器。

你的遺傳密碼,究竟來自何方?
人類擁有 23 條染色體。圖片來源:bubblews.com

        人類基因組

        配備了這些先進武器,再加上能夠產生各種身體形狀的基因組,早期脊椎動物異常成功。它們占領了海洋,攻陷了陸地,攀上了樹木,最后從樹上下來,用兩條腿直立行走。

        是什么使我們與其他猿類差異甚大?最主要的區別在于:我們擁有 23 條染色體,而不是猿類祖先的 24 條。但是染色體本質上是基因庫:只要我們需要的基因還在,染色體在分離或合并時就只會產生出極小的差異。更確切地說,一系列小變化的積累才逐漸改變了我們 的大腦與身體。我們已經辨識出了一些關鍵變異,但仍有成千上萬個沒被發現。

        我們可以清楚地看出,細胞和身體復雜性的增加始于基因組復雜性的增加。不過讓人震驚的是,最初基因復雜性的增加是由于自然選擇的缺失,而非受其引導。格雷戈里說:“基因層面上發生的絕大多數事情,可能都是中性的。”

        換句話說,變異的出現不會產生任何影響,比如某個基因的重復復制。在大族群中,這種變異很快就會丟失。但在小族群中,它能通過遺傳漂變隨機傳 播。庫寧說:“這是群體遺傳不可避免的結果。”只有到后來,比如重復復制的這個基因獲得新的功用之時,這樣的復雜性才會被自然選擇所選中。

        許多人類史上的關鍵事件,如產生 Hox 基因的基因重復復制,可能是某個小族群在沒有什么選擇壓力的情況下出現的。事實上,正是人類出現之初種群數量上的一次“瓶頸”事件(即全部人類的數量下降 到某個極小數值),能夠解釋引起人類與猿類巨大差異(比如肌肉力量的降低)的變異為何能夠分布得如此廣泛。

        另一個驚人事實就是,病毒與寄生基因也發揮著重要的作用。我們基因組的許多主要特征,從性到甲基化,都演化自對病毒與寄生基因入侵的抵抗。更有 甚者,我們體內相當數量的基因和外顯子,如免疫酶類,都直接來自于這些入侵者。庫寧說:“在最開始,病毒就是細胞生命的必要組成部分。”

        雖是必要,卻并不舒服。我們的演化付出了巨大的代價。他們都說歷史是由勝利者書寫的,那么好吧,我們的基因組就是一部充滿了各種實驗的勝利史。 這些實驗要么是成功的,要么至少沒把祖先殺死。我們是一長串“樂透”彩票中獎者的后裔,這個“樂透”彩票的獎品,就是生產能夠繼續繁衍后代的后代。在這條 道路上,有不計其數的失敗者,超過萬億的動物都沒能存活下來。

        我們的基因組離優秀與完美還相差很遠,相反,它是將遺傳“事故”的殘余與古寄生物的遺存簡單拼接起來的產物,它是某種會受到倫理學范疇批判的瘋 狂、無序實驗的產物。這個過程持續至今:去到任何一家醫院,您都會發現死于可怕遺傳疾病的嬰兒,但死亡率已不像過去那么高了。多虧了胎兒掃描之類的技術, 我們開始有能力控制人類基因組的演化了。

        一個新的紀元,即將來臨!

        編譯自:《新科學家》,A brief history of the human genome

來自: 果殼網
                    <span id="shareA4" class="fl">                          </span>
 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!