论文部分内容阅读
从1953年詹姆斯·沃森和弗朗西斯·克里克发现DNA双螺旋结构算起, DNA向人类展露其本来面目已经有59年了,然而分子生物学依然是一门年轻的学科。人类已经绘制出包括自身在内的许多物种的全基因组(即整套遗传信息、生命之书)图谱,DNA测序似乎已经成为技术难度不太大的机械化操作。然而,平时充斥于学术论文和新闻媒体的“基因”,只是“生命之书”中一些极小的段落,基因组绝大部分区域仍然隐藏在暗影中,长久以来被人们当作 “垃圾”而忽视,只在近年来才显露出几缕光芒,显示这个巨大的垃圾场可能隐藏着与其体积相称的宝藏。
人类基因组计划的意外发现
地球上绝大多数生命都以DNA为遗传物质(有一些病毒使用RNA),没有别的方案——为什么是这样,科学家们很难解释。DNA由4种碱基也就是4种“字母”组成,分别是A、T、C、G(在RNA中,字母T被换成U)。整个DNA双螺旋就像一条极长的、扭曲的梯子,梯子的两边各是一条由许多字母逐个连成的带子,每个字母与对面带子上相应位置的字母通过氢键结合在一起,成为一个被称为“碱基对”的梯级,其中A只能与T相互结合,C只能与G相互结合。因此,这两条DNA双链是互补的,知道了其中一条的碱基顺序,另一条也就确定了。
生物的遗传,就是DNA链上的这4种字母将蓝图转化为实际产品的过程:一段DNA根据其碱基序列“复印”出对应的RNA序列(这叫转录),然后RNA序列指导氨基酸拼合形成蛋白质(这叫翻译)。生物体的生理机能,基本上都由蛋白质完成,比如在血液中运送氧气、进行新陈代谢等等。可以说,DNA发出命令,RNA挥动鞭子,蛋白质则是卖苦力的牛马。从DNA到RNA再到蛋白质的这个过程,就是弗朗西斯·克里克倡导的生物学“中心法则”。能够最终编码形成蛋白质的一段DNA,就是我们传统意义上所说的“基因”。
20世纪80年代时,若要在实验室中测定DNA密码中碱基的序列,可不是一件容易的事,方法特别讲究,需要许多准备步骤,要用到昂贵且危险的试剂,如放射性化合物。那时,耗费大量的时间,通过大量的试错过程,一次也只能测出人类DNA密码中的几百个碱基。然而尽管困难重重,人类想要了解自身遗传密码的热情并没有减退。1984年12月,在美国犹他州举行的环境诱变物和致癌物防护国际会议上,科学家提出了人类基因组计划(Human Genome Project)构想。1985年,诺贝尔奖获得者、著名分子生物学家杜贝科在美国《科学》杂志上撰文指出,弄清人类基因组序列有助于治疗癌症。同年3月,美国能源部正式提出承担此项研究工作。1988年,美国国会终于批准资助能源部和国家卫生署同时实施人类基因组计划。1998年9月,基因组研究计划的负责人宣布:将于2001年完成大部分蛋白质编码区的测序,将包括人的大部分基因;与此同时,完成基因组序列的一幅“工作草图”,至少覆盖基因组的90%。
在推进人类基因组计划的过程中,DNA测序方法也得到了突飞猛进的改进,DNA自动测序仪的发明和不断的功能升级,使测序效率不断提高。到1999年,分布于全球各地的20个基因测序中心,24小时不停地运作,每秒能测序1000个碱基对。2000年6月,中、美、英、法、德、日六国科学家联手提前完成了人类基因组的工作草图,中国科学家承担了1%的测序任务,即测定3000万个碱基对的序列。
如果把DNA上的每个碱基对作为一个字母印成书籍,那么人类的30亿个碱基对将印成200本1989年版《辞海》缩印本那么厚的书,把这么厚的书从地面上堆起来将有16米高。每本书打开来,看到的只是A、T、G、C四个字母的反复排列,就是在这样排列的碱基序列中,包含了人之所以是人而不是黑猩猩的全部遗传信息。这部“生命之书”中每一章、每一节的内容——也就是基因组里的每一个基因或每一种特定排列的DNA碱基序列的功能,都有待今后的研究和解读。
人类基因组计划的测序成果向我们显示,人类基因数目少得出奇。原先估计人的基因数目在8万~12万个之间,一般都认为有10万个左右,可是实际测定下来却只有2.6万个,远远低于预期数。这是大大出乎意料的,因为已测定的生物如单细胞的酵母有0.6万个基因,像黑芝麻那么大小的果蝇(苍蝇的同类)有1.3万个基因,体长不到1毫米的线虫(一种蠕虫)也有1.9万个基因。人类无论是从身体结构的复杂程度,还是从具有意识、思维和语言等高级神经活动功能等方面,与果蝇、线虫和酵母相比,不知要复杂多少倍,可是决定生物特征的基因,人却比果蝇和线虫多不了许多,这真是不可思议。
人类的基因数目虽然少,可是不参与编码蛋白质的DNA序列却多得出乎意料。参与编码蛋白质的DNA序列,只占基因组的2%~3%,即使把能转录成RNA的序列算进去,也不过占基因组序列的1/4左右。这就是说基因组序列中有3/4是没有编码功能的,既不生成RNA,也不产生蛋白质。实际上,这类非编码的DNA序列在真核生物中很常见,早在20世纪70年代就被命名为“垃圾DNA”、“废料DNA”或“自私的DNA”了,意思是说它们对于生物体来说只是一堆无用的“垃圾”,充其量也不过是可望加以再生利用的“废物”,或者只是为了自身的存在而对生物体毫无用处的“自私的DNA”。
如果让你看一部两个小时的电影,中间却有一个半小时都是广告,你是不是觉得太过分?人类DNA看上去比这样的电影更过分,每套DNA只有约2%的内容是基因。在其他哺乳动物的体内,比例也大致如此。生命为何要如此浪费?
大野博士的预言
早在20世纪70年代,分子生物学界就已经知道,很多生物的DNA分子链上都存在着大量的不能编码蛋白质的序列。
让我们把时光倒回1972年。美国洛杉矶东区的希望城国家医学中心,在一间宁静的研究室里,遗传学家大野 乾(S. Ohno)博士正伏案写一篇论文,题目是“So much junk DNA in our genome”(中文的意思是:我们的基因组里有那么多垃圾DNA)。这是他为了参加在布鲁克黑文市举行的学术研讨会而准备的稿子。在大野的那个时代,人们已经知道,真核生物的DNA分子中除了能编码蛋白质的真正的基因外,大片的区域都是非编码区,它们看上去没有任何用处。不仅如此,真正的基因内部也总是夹杂着不能进行蛋白质编码的部分,叫“内含子”(intron)。大野认为内含子可能含有“旧码”,就是在生物进化过程中丧失功能的基因部分。他在论文中写道:“地球上充满了灭绝的物种”,“难道我们的基因组中充满了灭绝基因的残留物不是理所当然的事吗?”
写到这里,大野觉得思路更加清晰,他加快了敲击打字机键盘的速度:“不能编码蛋白质的DNA占了95%~98%,它们是不活跃的‘垃圾’”,是已经失效的古老DNA的墓碑。而这些“垃圾”的存在,恰恰是新达尔文主义,即综合进化理论的佐证。这篇文章他写得很顺,因为他手上有足够的证据能够说明,DNA分子上有太多的部分不能编码蛋白质。大野一边写一遍整理思路:既然几乎所有具体的生理机能都要靠蛋白质来完成,那么不编码蛋白质的DNA就应该是没有用的——这就是他在文章中要主张的。这些不能编码蛋白质的DNA在当时学术圈子里已经有了个名字,叫“非编码DNA”,但是大野觉得用这种不痛不痒的名称来称呼它们太没有创意、太不“解恨”了——这些DNA本来就是占着茅坑不拉屎的废物嘛!
捻着八字胡须,经过深思熟虑后,大野将这种非编码区域命名为“垃圾DNA”。他认为,这也是根据生物进化理论做出的一个合理的预言。他坚信这些非编码部分是生物在漫长的进化过程中,通过随机突变而产生的无用之物;它们中至少有一部分在远古时代确实是有用的基因,但是后来新的基因产生后,它们就成了多余的摆设,被丢在旮旯里弃之不用了。
大野 乾何许人也?他是一位旅美日侨、遗传学家。当时在生物学界提到大野,那可是如雷贯耳,因为他研究硕果累累,提出过著名的“基因重复假说”,发现过“X染色体上的基因保存法则”。大野还是个桃李满天下的导师,他一生培养了不少才智过人的科学家,包括因对动物免疫系统的研究而荣获2011年度诺贝尔生理学或医学奖的布鲁斯·博伊特勒。
大野的这篇论文,犹如在平静的池塘中丢下一块大石头,给生物学界带来了震荡。人们纷纷称赞大野站在“综合进化理论”的高度,预言了非编码DNA是无用的废弃物。直到1994年,美国布朗大学的进化生物学家肯尼斯·米勒还对大野的预言作了这样的评价:“进化论…能容易地说明,它们(垃圾DNA)只不过是随机进化过程中失败的试验。”
大野的预言,在当时无疑是给“垃圾DNA”判了“死刑”。在此后将近20年的时间里,虽然有些好事的分子生物学家心存怀疑,蠢蠢欲动,想仔细探究一下这些“垃圾”到底有无功效,可终因大野的观点牢牢主导了学术界,使这些好事者们申请不到科研经费,只好知难而退。事实上,在相当长的时间里,大野的那篇论文已经成了人们认识生物遗传奥秘的指南针。直到1998年,英国牛津大学的著名动物学家理查德·道金斯(《自私的基因》一书的作者)仍然说:有太多的DNA,它们甚至不配被称为“假基因”,因为它们是由一个接着一个的无用DNA多次重复而形成的,看上去毫无意义,显然对生物体没有什么作用。
突破禁区
这个世界的精彩之处在于,即使是死囚犯,也有人为其鸣不平,也有律师愿意出庭为其辩护。被科学界主流判了死刑的“垃圾DNA”,也从来不乏有人为之争辩。上世纪80年代,英国著名遗传学家约翰·梅纳德·史密斯就警告人们说:“我们对重复编码的DNA(即大片的非基因区域:笔者注)的认识是新近的事,很不完整,所以持守一个独断的、教条式的观点是愚蠢的。”而美国加利福尼亚州立大学一位名叫乔纳森·威尔斯的生物学家则更加明确地指出:“生物极不可能浪费这么多资源来保留和传递这么多的‘垃圾’。更可能的是这些非编码的区域有功能,我们尚未发现而已。”到了20世纪90年代,虽然垃圾DNA是否有功能仍是未知数,但是已经有更多人突破了认识的禁区,对垃圾DNA展开系统的研究。正如有位生物学家约翰·威斯特所主张的:“动物基因中大部分的‘垃圾DNA’,将来必定可以找到它们有用的功能。”
果然,1998年,美国斯坦福大学医学院的安德鲁·法尔和马萨诸塞大学医学院的克雷格·梅洛发现虽然垃圾DNA与蛋白质制造无关,它们仍可被转录为小分子RNA。他们发现双链小分子RNA可以引发特定基因RNA的降解,不再执行基因的功能,导致蛋白无法合成。他们将这一由RNA介导的基因沉默过程称为RNA干扰。这种方法用在医学上可使癌症基因沉默,具有重大意义。由于这一重大发现,法尔和梅洛二人双双获得2006年诺贝尔生理学或医学奖。至今人们已发现了这类小分子RNA的450种功能。这些转录出来的小分子RNA有重要的调控功能,如可以控制蛋白质的表达,可以激活或者抑制基因的表达,协助非常复杂的细胞分裂,等等。
此外,人们已经知道,“垃圾DNA”中大量重复的DNA序列,虽然看似没有意义也不能编码蛋白质,却能形成特殊的DNA高级结构,并以此调节附近基因的活性。
人类对于“垃圾DNA”功能的研究才刚刚开始,后头肯定有好戏连连!
“垃圾”来自何方
人们对“垃圾DNA”的来源提出了多种解释,比如有一种垃圾来自病毒。逆转录病毒是一类以RNA为遗传物质的病毒,其中我们最熟悉的是艾滋病病毒。它们侵袭宿主细胞时,会把自身的RNA转换成DNA,插入基因组中。从DNA到RNA的过程叫转录,反过来就叫逆转录,这也是这类病毒的名称由来。逆转录病毒有的会致病,引起艾滋病或癌症等,也有的没什么影响。人们相信,在进化历程中,有许多逆转录病毒DNA留在了人类基因组里,成为垃圾。
“垃圾DNA”中,除了大量的看似毫无用处的反复重复序列之外,还有一些可能是死亡基因的遗骸,称为“假基因”。科学家认为,它们原本是编码蛋白质的真基因,由于发生变异而失去功能,被弃之不用。它们的序列与真基因非常相似,但有着细微差别,正是这些差别使假基因不能编码蛋白质。过去,多数科学家认为去掉假基因不会影响机体的功能;偶尔某个假基因发生变化,死而复生,倒可能造成麻烦。
更有个别人提出了耸人听闻的猜测,他们认为人类DNA中的遗传代码是外星人编制的,而其中97%以上的垃圾DNA,其实就是没能派上用场的“备用程序”。地外的生命编写者很可能在一个大代码上同时做好几个项目,这些项目应该已经在不同的星球上产生了各种形态的生命体。编写者们很可能做得很急,他们把大代码功能大量地削减,并保留了用于地球人类的基本编码。不过,那时他们可能不太确信究竟大代码里哪些是以后用得着的,哪些是用不着的,所以他们把所有的代码都保留了下来,这其中大部分就成了我们身体中的垃圾DNA。
不过,这样的奇思遐想缺乏科学依据,多数科学家都对之嗤之以鼻。
著名动物学家理查德·道金斯说,有太多的DNA,它们甚至不配被称为“假基因”,因为它们是由一个接着一个的无用DNA多次重复而形成的,看上去对生物体毫无意义。
人类基因组计划的意外发现
地球上绝大多数生命都以DNA为遗传物质(有一些病毒使用RNA),没有别的方案——为什么是这样,科学家们很难解释。DNA由4种碱基也就是4种“字母”组成,分别是A、T、C、G(在RNA中,字母T被换成U)。整个DNA双螺旋就像一条极长的、扭曲的梯子,梯子的两边各是一条由许多字母逐个连成的带子,每个字母与对面带子上相应位置的字母通过氢键结合在一起,成为一个被称为“碱基对”的梯级,其中A只能与T相互结合,C只能与G相互结合。因此,这两条DNA双链是互补的,知道了其中一条的碱基顺序,另一条也就确定了。
生物的遗传,就是DNA链上的这4种字母将蓝图转化为实际产品的过程:一段DNA根据其碱基序列“复印”出对应的RNA序列(这叫转录),然后RNA序列指导氨基酸拼合形成蛋白质(这叫翻译)。生物体的生理机能,基本上都由蛋白质完成,比如在血液中运送氧气、进行新陈代谢等等。可以说,DNA发出命令,RNA挥动鞭子,蛋白质则是卖苦力的牛马。从DNA到RNA再到蛋白质的这个过程,就是弗朗西斯·克里克倡导的生物学“中心法则”。能够最终编码形成蛋白质的一段DNA,就是我们传统意义上所说的“基因”。
20世纪80年代时,若要在实验室中测定DNA密码中碱基的序列,可不是一件容易的事,方法特别讲究,需要许多准备步骤,要用到昂贵且危险的试剂,如放射性化合物。那时,耗费大量的时间,通过大量的试错过程,一次也只能测出人类DNA密码中的几百个碱基。然而尽管困难重重,人类想要了解自身遗传密码的热情并没有减退。1984年12月,在美国犹他州举行的环境诱变物和致癌物防护国际会议上,科学家提出了人类基因组计划(Human Genome Project)构想。1985年,诺贝尔奖获得者、著名分子生物学家杜贝科在美国《科学》杂志上撰文指出,弄清人类基因组序列有助于治疗癌症。同年3月,美国能源部正式提出承担此项研究工作。1988年,美国国会终于批准资助能源部和国家卫生署同时实施人类基因组计划。1998年9月,基因组研究计划的负责人宣布:将于2001年完成大部分蛋白质编码区的测序,将包括人的大部分基因;与此同时,完成基因组序列的一幅“工作草图”,至少覆盖基因组的90%。
在推进人类基因组计划的过程中,DNA测序方法也得到了突飞猛进的改进,DNA自动测序仪的发明和不断的功能升级,使测序效率不断提高。到1999年,分布于全球各地的20个基因测序中心,24小时不停地运作,每秒能测序1000个碱基对。2000年6月,中、美、英、法、德、日六国科学家联手提前完成了人类基因组的工作草图,中国科学家承担了1%的测序任务,即测定3000万个碱基对的序列。
如果把DNA上的每个碱基对作为一个字母印成书籍,那么人类的30亿个碱基对将印成200本1989年版《辞海》缩印本那么厚的书,把这么厚的书从地面上堆起来将有16米高。每本书打开来,看到的只是A、T、G、C四个字母的反复排列,就是在这样排列的碱基序列中,包含了人之所以是人而不是黑猩猩的全部遗传信息。这部“生命之书”中每一章、每一节的内容——也就是基因组里的每一个基因或每一种特定排列的DNA碱基序列的功能,都有待今后的研究和解读。
人类基因组计划的测序成果向我们显示,人类基因数目少得出奇。原先估计人的基因数目在8万~12万个之间,一般都认为有10万个左右,可是实际测定下来却只有2.6万个,远远低于预期数。这是大大出乎意料的,因为已测定的生物如单细胞的酵母有0.6万个基因,像黑芝麻那么大小的果蝇(苍蝇的同类)有1.3万个基因,体长不到1毫米的线虫(一种蠕虫)也有1.9万个基因。人类无论是从身体结构的复杂程度,还是从具有意识、思维和语言等高级神经活动功能等方面,与果蝇、线虫和酵母相比,不知要复杂多少倍,可是决定生物特征的基因,人却比果蝇和线虫多不了许多,这真是不可思议。
人类的基因数目虽然少,可是不参与编码蛋白质的DNA序列却多得出乎意料。参与编码蛋白质的DNA序列,只占基因组的2%~3%,即使把能转录成RNA的序列算进去,也不过占基因组序列的1/4左右。这就是说基因组序列中有3/4是没有编码功能的,既不生成RNA,也不产生蛋白质。实际上,这类非编码的DNA序列在真核生物中很常见,早在20世纪70年代就被命名为“垃圾DNA”、“废料DNA”或“自私的DNA”了,意思是说它们对于生物体来说只是一堆无用的“垃圾”,充其量也不过是可望加以再生利用的“废物”,或者只是为了自身的存在而对生物体毫无用处的“自私的DNA”。
如果让你看一部两个小时的电影,中间却有一个半小时都是广告,你是不是觉得太过分?人类DNA看上去比这样的电影更过分,每套DNA只有约2%的内容是基因。在其他哺乳动物的体内,比例也大致如此。生命为何要如此浪费?
大野博士的预言
早在20世纪70年代,分子生物学界就已经知道,很多生物的DNA分子链上都存在着大量的不能编码蛋白质的序列。
让我们把时光倒回1972年。美国洛杉矶东区的希望城国家医学中心,在一间宁静的研究室里,遗传学家大野 乾(S. Ohno)博士正伏案写一篇论文,题目是“So much junk DNA in our genome”(中文的意思是:我们的基因组里有那么多垃圾DNA)。这是他为了参加在布鲁克黑文市举行的学术研讨会而准备的稿子。在大野的那个时代,人们已经知道,真核生物的DNA分子中除了能编码蛋白质的真正的基因外,大片的区域都是非编码区,它们看上去没有任何用处。不仅如此,真正的基因内部也总是夹杂着不能进行蛋白质编码的部分,叫“内含子”(intron)。大野认为内含子可能含有“旧码”,就是在生物进化过程中丧失功能的基因部分。他在论文中写道:“地球上充满了灭绝的物种”,“难道我们的基因组中充满了灭绝基因的残留物不是理所当然的事吗?”
写到这里,大野觉得思路更加清晰,他加快了敲击打字机键盘的速度:“不能编码蛋白质的DNA占了95%~98%,它们是不活跃的‘垃圾’”,是已经失效的古老DNA的墓碑。而这些“垃圾”的存在,恰恰是新达尔文主义,即综合进化理论的佐证。这篇文章他写得很顺,因为他手上有足够的证据能够说明,DNA分子上有太多的部分不能编码蛋白质。大野一边写一遍整理思路:既然几乎所有具体的生理机能都要靠蛋白质来完成,那么不编码蛋白质的DNA就应该是没有用的——这就是他在文章中要主张的。这些不能编码蛋白质的DNA在当时学术圈子里已经有了个名字,叫“非编码DNA”,但是大野觉得用这种不痛不痒的名称来称呼它们太没有创意、太不“解恨”了——这些DNA本来就是占着茅坑不拉屎的废物嘛!
捻着八字胡须,经过深思熟虑后,大野将这种非编码区域命名为“垃圾DNA”。他认为,这也是根据生物进化理论做出的一个合理的预言。他坚信这些非编码部分是生物在漫长的进化过程中,通过随机突变而产生的无用之物;它们中至少有一部分在远古时代确实是有用的基因,但是后来新的基因产生后,它们就成了多余的摆设,被丢在旮旯里弃之不用了。
大野 乾何许人也?他是一位旅美日侨、遗传学家。当时在生物学界提到大野,那可是如雷贯耳,因为他研究硕果累累,提出过著名的“基因重复假说”,发现过“X染色体上的基因保存法则”。大野还是个桃李满天下的导师,他一生培养了不少才智过人的科学家,包括因对动物免疫系统的研究而荣获2011年度诺贝尔生理学或医学奖的布鲁斯·博伊特勒。
大野的这篇论文,犹如在平静的池塘中丢下一块大石头,给生物学界带来了震荡。人们纷纷称赞大野站在“综合进化理论”的高度,预言了非编码DNA是无用的废弃物。直到1994年,美国布朗大学的进化生物学家肯尼斯·米勒还对大野的预言作了这样的评价:“进化论…能容易地说明,它们(垃圾DNA)只不过是随机进化过程中失败的试验。”
大野的预言,在当时无疑是给“垃圾DNA”判了“死刑”。在此后将近20年的时间里,虽然有些好事的分子生物学家心存怀疑,蠢蠢欲动,想仔细探究一下这些“垃圾”到底有无功效,可终因大野的观点牢牢主导了学术界,使这些好事者们申请不到科研经费,只好知难而退。事实上,在相当长的时间里,大野的那篇论文已经成了人们认识生物遗传奥秘的指南针。直到1998年,英国牛津大学的著名动物学家理查德·道金斯(《自私的基因》一书的作者)仍然说:有太多的DNA,它们甚至不配被称为“假基因”,因为它们是由一个接着一个的无用DNA多次重复而形成的,看上去毫无意义,显然对生物体没有什么作用。
突破禁区
这个世界的精彩之处在于,即使是死囚犯,也有人为其鸣不平,也有律师愿意出庭为其辩护。被科学界主流判了死刑的“垃圾DNA”,也从来不乏有人为之争辩。上世纪80年代,英国著名遗传学家约翰·梅纳德·史密斯就警告人们说:“我们对重复编码的DNA(即大片的非基因区域:笔者注)的认识是新近的事,很不完整,所以持守一个独断的、教条式的观点是愚蠢的。”而美国加利福尼亚州立大学一位名叫乔纳森·威尔斯的生物学家则更加明确地指出:“生物极不可能浪费这么多资源来保留和传递这么多的‘垃圾’。更可能的是这些非编码的区域有功能,我们尚未发现而已。”到了20世纪90年代,虽然垃圾DNA是否有功能仍是未知数,但是已经有更多人突破了认识的禁区,对垃圾DNA展开系统的研究。正如有位生物学家约翰·威斯特所主张的:“动物基因中大部分的‘垃圾DNA’,将来必定可以找到它们有用的功能。”
果然,1998年,美国斯坦福大学医学院的安德鲁·法尔和马萨诸塞大学医学院的克雷格·梅洛发现虽然垃圾DNA与蛋白质制造无关,它们仍可被转录为小分子RNA。他们发现双链小分子RNA可以引发特定基因RNA的降解,不再执行基因的功能,导致蛋白无法合成。他们将这一由RNA介导的基因沉默过程称为RNA干扰。这种方法用在医学上可使癌症基因沉默,具有重大意义。由于这一重大发现,法尔和梅洛二人双双获得2006年诺贝尔生理学或医学奖。至今人们已发现了这类小分子RNA的450种功能。这些转录出来的小分子RNA有重要的调控功能,如可以控制蛋白质的表达,可以激活或者抑制基因的表达,协助非常复杂的细胞分裂,等等。
此外,人们已经知道,“垃圾DNA”中大量重复的DNA序列,虽然看似没有意义也不能编码蛋白质,却能形成特殊的DNA高级结构,并以此调节附近基因的活性。
人类对于“垃圾DNA”功能的研究才刚刚开始,后头肯定有好戏连连!
“垃圾”来自何方
人们对“垃圾DNA”的来源提出了多种解释,比如有一种垃圾来自病毒。逆转录病毒是一类以RNA为遗传物质的病毒,其中我们最熟悉的是艾滋病病毒。它们侵袭宿主细胞时,会把自身的RNA转换成DNA,插入基因组中。从DNA到RNA的过程叫转录,反过来就叫逆转录,这也是这类病毒的名称由来。逆转录病毒有的会致病,引起艾滋病或癌症等,也有的没什么影响。人们相信,在进化历程中,有许多逆转录病毒DNA留在了人类基因组里,成为垃圾。
“垃圾DNA”中,除了大量的看似毫无用处的反复重复序列之外,还有一些可能是死亡基因的遗骸,称为“假基因”。科学家认为,它们原本是编码蛋白质的真基因,由于发生变异而失去功能,被弃之不用。它们的序列与真基因非常相似,但有着细微差别,正是这些差别使假基因不能编码蛋白质。过去,多数科学家认为去掉假基因不会影响机体的功能;偶尔某个假基因发生变化,死而复生,倒可能造成麻烦。
更有个别人提出了耸人听闻的猜测,他们认为人类DNA中的遗传代码是外星人编制的,而其中97%以上的垃圾DNA,其实就是没能派上用场的“备用程序”。地外的生命编写者很可能在一个大代码上同时做好几个项目,这些项目应该已经在不同的星球上产生了各种形态的生命体。编写者们很可能做得很急,他们把大代码功能大量地削减,并保留了用于地球人类的基本编码。不过,那时他们可能不太确信究竟大代码里哪些是以后用得着的,哪些是用不着的,所以他们把所有的代码都保留了下来,这其中大部分就成了我们身体中的垃圾DNA。
不过,这样的奇思遐想缺乏科学依据,多数科学家都对之嗤之以鼻。
著名动物学家理查德·道金斯说,有太多的DNA,它们甚至不配被称为“假基因”,因为它们是由一个接着一个的无用DNA多次重复而形成的,看上去对生物体毫无意义。