宿主体内有很多基因可能最初来自病毒,这件事听起来实在是太诡异了。我们通常认为基因组是人类最本源的身份特征。细菌基因组中绝大多数DNA就是病毒引入的,人们也思考过类似的问题——细菌到底有没有自己明确而独立的身份,还是只是一个拼接怪物,就像科幻故事里弗兰肯斯坦造的怪人一样。
以前,我们并不会觉得这个问题和人类有关系,它更像是微生物才会面对的问题,只有这些“低等”的生物基因组里会有一些病毒基因,看起来也是偶然混进去的。然而现在,我们再也不能这样自我安慰了。审视一下人类基因组,里面有大量病毒基因的痕迹,数量成千上万。
认识到这一点还得感谢鹿角兔。鹿角兔本是一个民间传说,却给医学研究提供了重要线索,众多病毒学家对其追根溯源,竟做出病毒致癌的重要发现。20世纪60年代,人们最深入研究的致癌病毒之一,是禽白血病病毒。当时,这种病毒席卷了所有养鸡场,威胁着整个家禽行业。禽白血病病毒是一种逆转录病毒,逆转录病毒能把遗传物质插入宿主细胞的DNA中。宿主细胞分裂的时候,会同时复制细胞和病毒的DNA。在特定的条件下,细胞会被迫生产出大量新病毒——先合成病毒的基因和蛋白质外壳,接着把病毒从细胞里释放出去,进一步感染其他细胞。如果逆转录病毒的遗传物质不小心插到了错的地方,就有可能让宿主细胞发生癌变。逆转录病毒带有一些特殊的基因“开关”,这些开关能作用于宿主细胞,让插入位置附近的基因开始合成蛋白质。有时候这些开关会打开一些本来应该关闭的宿主基因,这就会导致癌症。
禽白血病病毒是一种非常奇怪的逆转录病毒。以前,科学家检测病毒的方法是从鸡的血液里寻找属于病毒的蛋白质。有时候他们甚至能在从没得过癌症的健康鸡只的血液中找到禽白血病病毒的蛋白质。更奇怪的是,携带病毒蛋白质的健康母鸡生下的小鸡也是健康的,但同时也携带这种蛋白质。
当时在华盛顿大学工作的病毒学家罗宾·韦斯(Robin Weiss)猜测,病毒或许已经成为了鸡DNA中永恒且无害的一部分。他和同事们从健康鸡只身上取了一些细胞,用能引发突变的化学物质和辐照来处理这些细胞,想看看能不能把病毒从它的藏匿之处给逼出来。正如他们所料,突变的细胞果然释放出禽白血病病毒。也就是说,这些健康的鸡并不是单纯在一些细胞中感染上了禽白血病病毒,事实上,制造病毒的遗传指令已经嵌入它们所有的细胞之中,并随着分裂和增殖传递给后代。
这些“私藏”病毒的鸡并不是什么奇怪的品种。韦斯和其他科学家开展了更多的研究,在若干品系里都发现了禽白血病病毒。一个直观的推论是,这种病毒或许是鸡DNA中由来已久的一分子。那么,这种病毒到底是在什么时候感染了鸡的祖先呢?韦斯和他的同事们将目光锁定在马来西亚丛林。他们从那里抓了一些红原鸡,这是和家鸡亲缘关系最近的野生物种。韦斯发现红原鸡携带着同样的病毒。然而在后来的探索中,在原鸡其他种个体的基因组中,韦斯却没有找到病毒的踪影。
科学家逐渐归纳出一个相对合理的假说,可以解释病毒是怎么整合到鸡的基因组去的。原来,在几千年前,病毒感染了家鸡和红原鸡的共同祖先。它入侵宿主细胞后,开始自我复制,继而去感染其他个体。病毒所到之处,基本上都引发了肿瘤。但在其中至少一只身上却发生了不寻常的事。这只鸡祖先不仅没有得癌症,它的免疫系统反而把病毒制服了。病毒就这样在它体内无声地扩散,最终移动到鸡的性器官。这只鸡祖先交配之后,受精卵的DNA里就自然含有病毒的DNA。
这个受精卵随后会发育成胚胎。胚胎的所有细胞最初都是由这个受精卵发育而来的,所以胚胎中所有细胞里都应该含有病毒DNA。最后,破壳而出的小鸡就成了一个鸡和病毒的“嵌合体”。嵌合体小鸡长大,有了自己的后代,后代的基因组中同样藏着禽白血病病毒的DNA。就这样,病毒在数千年的时间里一代代无声地传递。但在特定的情况下,病毒会被重新激活,产生肿瘤,并扩散到其他宿主身上。
科学家还发现,这种病毒自成一类。科学家称其为内源性逆转录病毒——“内源性”的意思是说,它们是从生物内部产生出来的。科学家很快从其他动物身上发现了更多内源性逆转录病毒。事实上,这类病毒潜伏在几乎所有重要的脊椎动物类群里,从鱼类、爬行动物到哺乳动物的基因组中,都能找到它们的痕迹。一些最近发现的内源性逆转录病毒,如同禽白血病病毒一样会致癌,但同时也有很多对宿主完全没有影响——因为这些病毒又出现了额外的突变,让它们没法利用宿主细胞制造新病毒。不过,这些因为“残疾”而禁锢了脚步的病毒仍然有可能再重新插入宿主的基因组,重新开始复制自己的基因。还有些内源性逆转录病毒实在被突变搞得过于支离破碎,无法再发挥任何威力,沦为宿主基因组里一件小小的行李,从一代传递到下一代。
科学家一般认为人类基因组中没有活跃的内源性逆转录病毒。但在法国维勒瑞夫(犹太城)的古斯塔夫·鲁西癌症研究中心(Gustave Roussy Institute),研究人员蒂里·海德曼(Thierry Heidmann)和同事却找到了让这些静默的病毒重新活化的方法。当时,海德曼正在研究一种内源性逆转录病毒,他注意到,这种病毒在不同人中有不同的版本。而这些个体差异大概是在逆转录病毒整合到人类祖先基因组里之后产生的。随着人类的繁衍,病毒基因的不同部分相继出现了不同的突变。
海德曼和他的同事们比较了病毒相关序列的不同变异类型。这个过程就像在研究莎士比亚剧本的四个版本,每个版本都是粗心的文职人员抄写的。每个人犯的错误各不相同,同一个词就可能抄成四种样子。比如逆转录病读、拟转录病毒、逆转鹿病毒、逆转录兵毒……通过比较四个版本,历史学家就能推断出原来的词是“逆转录病毒”。
用这种方法,海德曼和他的同事们就能用人体中现存各种各样突变版本的序列,来确定最初的DNA序列,再参照算出的序列合成相应的DNA,并插入到培养的人类细胞中。被感染的一部分细胞真的生产出了很多病毒,还能再去感染其他细胞。换句话说,起初的这段DNA的确是能感染细胞的活病毒。2006年,海德曼将这种病毒命名为“不死鸟”(Phoenix),取其寓意,这种病毒就像从灰烬中重生的神秘凤凰一样,可以起死回生。
不死鸟病毒可能是在距今不到100万年的时间里感染了我们的祖先。而我们身体里也有一些病毒比这还要古老。我们是怎么知道的呢?科学家发现了一些同时存在于人类和其他物种基因组中的病毒,说明它们是在人类和这些生物在演化上分道扬镳前就进入了我们共同祖先的基因组。比如伦敦帝国学院的病毒学家亚当·李(Adam Lee)和他的同事就在人体内发现了一种名为ERV-L的内源性逆转录病毒,同时他们也在许多其他物种中发现了同样的病毒,这其中不乏马和食蚁兽这样和人差别巨大的生物。科学家画出的病毒演化树同它们宿主的演化树完美重合。看来这种内源性逆转录病毒似乎在距今1亿年前感染了有胎盘类哺乳动物的共同祖先,之后随着这一支哺乳动物演化至今,成为了犰狳、大象、海牛也包括我们人类体内的常驻客。
内源性逆转录病毒整合到宿主基因组中之后,仍然可以复制自身的DNA,并重新插入宿主基因组。上百万年来,内源性逆转录病毒一直在反复不断地入侵我们的基因组,日积月累,到今天已经数量惊人。我们每个人的基因组中携带了近10万个内源性逆转录病毒的DNA片段,占到人类DNA总量的8%。反过来看,人类基因组中2万个负责蛋白质编码的基因,也只不过占到1.2%而已。科学家对人类基因组里其他被同步复制且会重新插入的DNA小片段进行了整理,这些DNA片段的数量高达数百万个。他们推测这些片段中很多可能也是从内源性逆转录病毒演变而来。这些入侵者经过数百万年的演化,已经被剥夺了大量的DNA,只剩下自我复制的最关键基因。换句话说,我们的基因组中简直病毒泛滥。
虽然这类病毒DNA中的大多数都没用,但我们的祖先也的确“征用”了一些对我们自身有好处的病毒。如果没有这些病毒,我们甚至没法出生。
1999年,让—吕克·布隆(Jean-Luc Blond)和他的同事发现了一种名为HERV-W的人类内源性逆转录病毒。他们惊讶地发现,这种逆转录病毒中的一个基因能合成出一种名为合胞素(syncytin)的蛋白质。这种蛋白质有一项非常重要且精准的使命,但并非针对病毒,而是针对它的人类宿主。它只出现在人类的胎盘里。
胎盘外层的细胞产生合胞素,这样细胞就能黏着在一起,从而让分子在细胞之间顺畅地流通。科学家发现小鼠也会制造合胞素,于是他们就用小鼠来做实验,研究这个蛋白质的功能。他们删除了小鼠的合胞素基因,结果小鼠胚胎没有一个能活到生出来。他们就此推断,这种病毒蛋白对于胚胎从母亲血液中吸收营养是必需的。
科学家在其他有胎盘类哺乳动物中都找到了合胞素。随着研究的深入,关于这种奇异蛋白质又有了另一个意外发现:它实际上并不是单一的一种蛋白质,而是好几种。在演化的历史中,不同的内源性逆转录病毒分别感染了不同的有胎盘类哺乳动物。包括我们人类在内的一部分物种先后被两种病毒感染,它们合成的是两种不同的蛋白质,之后,旧的蛋白质逐渐被新的取代。
蒂里·海德曼在研究中发现了许多种合胞素蛋白,他提出一种假说。一亿年前,哺乳动物的祖先被一种内源性逆转录病毒感染,从而获得了最早的合胞素蛋白,同时产生了最早的胎盘。几百万年来,有胎盘类哺乳动物祖先演化出若干分支,在演化的过程中又被其他内源性逆转录病毒感染。有的新病毒也带有合胞素基因,而且编码的蛋白质性状更佳。因此哺乳动物的不同分支,包括啮齿动物、蝙蝠、牛、灵长类动物等体内的合胞素蛋白,就得以更新换代了。
在演化史上最近的瞬间,人类脱颖而出,病毒对我们的生存功不可没。原本就并没有什么“它们”和“我们”之分——生物在本质上只是一堆不断混合、不断闪转腾挪的DNA而已。