我们身体里有多少“垃圾DNA”

来源 :自然与科技 | 被引量 : 0次 | 上传用户:doublepay2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  从1953年詹姆斯·沃森和弗朗西斯·克里克发现DNA双螺旋结构算起, DNA向人类展露其本来面目已经有59年了,然而分子生物学依然是一门年轻的学科。人类已经绘制出包括自身在内的许多物种的全基因组(即整套遗传信息、生命之书)图谱,DNA测序似乎已经成为技术难度不太大的机械化操作。然而,平时充斥于学术论文和新闻媒体的“基因”,只是“生命之书”中一些极小的段落,基因组绝大部分区域仍然隐藏在暗影中,长久以来被人们当作 “垃圾”而忽视,只在近年来才显露出几缕光芒,显示这个巨大的垃圾场可能隐藏着与其体积相称的宝藏。
  
  人类基因组计划的意外发现
  地球上绝大多数生命都以DNA为遗传物质(有一些病毒使用RNA),没有别的方案——为什么是这样,科学家们很难解释。DNA由4种碱基也就是4种“字母”组成,分别是A、T、C、G(在RNA中,字母T被换成U)。整个DNA双螺旋就像一条极长的、扭曲的梯子,梯子的两边各是一条由许多字母逐个连成的带子,每个字母与对面带子上相应位置的字母通过氢键结合在一起,成为一个被称为“碱基对”的梯级,其中A只能与T相互结合,C只能与G相互结合。因此,这两条DNA双链是互补的,知道了其中一条的碱基顺序,另一条也就确定了。
  生物的遗传,就是DNA链上的这4种字母将蓝图转化为实际产品的过程:一段DNA根据其碱基序列“复印”出对应的RNA序列(这叫转录),然后RNA序列指导氨基酸拼合形成蛋白质(这叫翻译)。生物体的生理机能,基本上都由蛋白质完成,比如在血液中运送氧气、进行新陈代谢等等。可以说,DNA发出命令,RNA挥动鞭子,蛋白质则是卖苦力的牛马。从DNA到RNA再到蛋白质的这个过程,就是弗朗西斯·克里克倡导的生物学“中心法则”。能够最终编码形成蛋白质的一段DNA,就是我们传统意义上所说的“基因”。
  20世纪80年代时,若要在实验室中测定DNA密码中碱基的序列,可不是一件容易的事,方法特别讲究,需要许多准备步骤,要用到昂贵且危险的试剂,如放射性化合物。那时,耗费大量的时间,通过大量的试错过程,一次也只能测出人类DNA密码中的几百个碱基。然而尽管困难重重,人类想要了解自身遗传密码的热情并没有减退。1984年12月,在美国犹他州举行的环境诱变物和致癌物防护国际会议上,科学家提出了人类基因组计划(Human Genome Project)构想。1985年,诺贝尔奖获得者、著名分子生物学家杜贝科在美国《科学》杂志上撰文指出,弄清人类基因组序列有助于治疗癌症。同年3月,美国能源部正式提出承担此项研究工作。1988年,美国国会终于批准资助能源部和国家卫生署同时实施人类基因组计划。1998年9月,基因组研究计划的负责人宣布:将于2001年完成大部分蛋白质编码区的测序,将包括人的大部分基因;与此同时,完成基因组序列的一幅“工作草图”,至少覆盖基因组的90%。
  在推进人类基因组计划的过程中,DNA测序方法也得到了突飞猛进的改进,DNA自动测序仪的发明和不断的功能升级,使测序效率不断提高。到1999年,分布于全球各地的20个基因测序中心,24小时不停地运作,每秒能测序1000个碱基对。2000年6月,中、美、英、法、德、日六国科学家联手提前完成了人类基因组的工作草图,中国科学家承担了1%的测序任务,即测定3000万个碱基对的序列。
  如果把DNA上的每个碱基对作为一个字母印成书籍,那么人类的30亿个碱基对将印成200本1989年版《辞海》缩印本那么厚的书,把这么厚的书从地面上堆起来将有16米高。每本书打开来,看到的只是A、T、G、C四个字母的反复排列,就是在这样排列的碱基序列中,包含了人之所以是人而不是黑猩猩的全部遗传信息。这部“生命之书”中每一章、每一节的内容——也就是基因组里的每一个基因或每一种特定排列的DNA碱基序列的功能,都有待今后的研究和解读。
  人类基因组计划的测序成果向我们显示,人类基因数目少得出奇。原先估计人的基因数目在8万~12万个之间,一般都认为有10万个左右,可是实际测定下来却只有2.6万个,远远低于预期数。这是大大出乎意料的,因为已测定的生物如单细胞的酵母有0.6万个基因,像黑芝麻那么大小的果蝇(苍蝇的同类)有1.3万个基因,体长不到1毫米的线虫(一种蠕虫)也有1.9万个基因。人类无论是从身体结构的复杂程度,还是从具有意识、思维和语言等高级神经活动功能等方面,与果蝇、线虫和酵母相比,不知要复杂多少倍,可是决定生物特征的基因,人却比果蝇和线虫多不了许多,这真是不可思议。
  人类的基因数目虽然少,可是不参与编码蛋白质的DNA序列却多得出乎意料。参与编码蛋白质的DNA序列,只占基因组的2%~3%,即使把能转录成RNA的序列算进去,也不过占基因组序列的1/4左右。这就是说基因组序列中有3/4是没有编码功能的,既不生成RNA,也不产生蛋白质。实际上,这类非编码的DNA序列在真核生物中很常见,早在20世纪70年代就被命名为“垃圾DNA”、“废料DNA”或“自私的DNA”了,意思是说它们对于生物体来说只是一堆无用的“垃圾”,充其量也不过是可望加以再生利用的“废物”,或者只是为了自身的存在而对生物体毫无用处的“自私的DNA”。
  如果让你看一部两个小时的电影,中间却有一个半小时都是广告,你是不是觉得太过分?人类DNA看上去比这样的电影更过分,每套DNA只有约2%的内容是基因。在其他哺乳动物的体内,比例也大致如此。生命为何要如此浪费?
  
  大野博士的预言
  早在20世纪70年代,分子生物学界就已经知道,很多生物的DNA分子链上都存在着大量的不能编码蛋白质的序列。
  让我们把时光倒回1972年。美国洛杉矶东区的希望城国家医学中心,在一间宁静的研究室里,遗传学家大野 乾(S. Ohno)博士正伏案写一篇论文,题目是“So much junk DNA in our genome”(中文的意思是:我们的基因组里有那么多垃圾DNA)。这是他为了参加在布鲁克黑文市举行的学术研讨会而准备的稿子。在大野的那个时代,人们已经知道,真核生物的DNA分子中除了能编码蛋白质的真正的基因外,大片的区域都是非编码区,它们看上去没有任何用处。不仅如此,真正的基因内部也总是夹杂着不能进行蛋白质编码的部分,叫“内含子”(intron)。大野认为内含子可能含有“旧码”,就是在生物进化过程中丧失功能的基因部分。他在论文中写道:“地球上充满了灭绝的物种”,“难道我们的基因组中充满了灭绝基因的残留物不是理所当然的事吗?”
  写到这里,大野觉得思路更加清晰,他加快了敲击打字机键盘的速度:“不能编码蛋白质的DNA占了95%~98%,它们是不活跃的‘垃圾’”,是已经失效的古老DNA的墓碑。而这些“垃圾”的存在,恰恰是新达尔文主义,即综合进化理论的佐证。这篇文章他写得很顺,因为他手上有足够的证据能够说明,DNA分子上有太多的部分不能编码蛋白质。大野一边写一遍整理思路:既然几乎所有具体的生理机能都要靠蛋白质来完成,那么不编码蛋白质的DNA就应该是没有用的——这就是他在文章中要主张的。这些不能编码蛋白质的DNA在当时学术圈子里已经有了个名字,叫“非编码DNA”,但是大野觉得用这种不痛不痒的名称来称呼它们太没有创意、太不“解恨”了——这些DNA本来就是占着茅坑不拉屎的废物嘛!
  捻着八字胡须,经过深思熟虑后,大野将这种非编码区域命名为“垃圾DNA”。他认为,这也是根据生物进化理论做出的一个合理的预言。他坚信这些非编码部分是生物在漫长的进化过程中,通过随机突变而产生的无用之物;它们中至少有一部分在远古时代确实是有用的基因,但是后来新的基因产生后,它们就成了多余的摆设,被丢在旮旯里弃之不用了。
  大野 乾何许人也?他是一位旅美日侨、遗传学家。当时在生物学界提到大野,那可是如雷贯耳,因为他研究硕果累累,提出过著名的“基因重复假说”,发现过“X染色体上的基因保存法则”。大野还是个桃李满天下的导师,他一生培养了不少才智过人的科学家,包括因对动物免疫系统的研究而荣获2011年度诺贝尔生理学或医学奖的布鲁斯·博伊特勒。
  大野的这篇论文,犹如在平静的池塘中丢下一块大石头,给生物学界带来了震荡。人们纷纷称赞大野站在“综合进化理论”的高度,预言了非编码DNA是无用的废弃物。直到1994年,美国布朗大学的进化生物学家肯尼斯·米勒还对大野的预言作了这样的评价:“进化论…能容易地说明,它们(垃圾DNA)只不过是随机进化过程中失败的试验。”
  大野的预言,在当时无疑是给“垃圾DNA”判了“死刑”。在此后将近20年的时间里,虽然有些好事的分子生物学家心存怀疑,蠢蠢欲动,想仔细探究一下这些“垃圾”到底有无功效,可终因大野的观点牢牢主导了学术界,使这些好事者们申请不到科研经费,只好知难而退。事实上,在相当长的时间里,大野的那篇论文已经成了人们认识生物遗传奥秘的指南针。直到1998年,英国牛津大学的著名动物学家理查德·道金斯(《自私的基因》一书的作者)仍然说:有太多的DNA,它们甚至不配被称为“假基因”,因为它们是由一个接着一个的无用DNA多次重复而形成的,看上去毫无意义,显然对生物体没有什么作用。
  
  突破禁区
  这个世界的精彩之处在于,即使是死囚犯,也有人为其鸣不平,也有律师愿意出庭为其辩护。被科学界主流判了死刑的“垃圾DNA”,也从来不乏有人为之争辩。上世纪80年代,英国著名遗传学家约翰·梅纳德·史密斯就警告人们说:“我们对重复编码的DNA(即大片的非基因区域:笔者注)的认识是新近的事,很不完整,所以持守一个独断的、教条式的观点是愚蠢的。”而美国加利福尼亚州立大学一位名叫乔纳森·威尔斯的生物学家则更加明确地指出:“生物极不可能浪费这么多资源来保留和传递这么多的‘垃圾’。更可能的是这些非编码的区域有功能,我们尚未发现而已。”到了20世纪90年代,虽然垃圾DNA是否有功能仍是未知数,但是已经有更多人突破了认识的禁区,对垃圾DNA展开系统的研究。正如有位生物学家约翰·威斯特所主张的:“动物基因中大部分的‘垃圾DNA’,将来必定可以找到它们有用的功能。”
  果然,1998年,美国斯坦福大学医学院的安德鲁·法尔和马萨诸塞大学医学院的克雷格·梅洛发现虽然垃圾DNA与蛋白质制造无关,它们仍可被转录为小分子RNA。他们发现双链小分子RNA可以引发特定基因RNA的降解,不再执行基因的功能,导致蛋白无法合成。他们将这一由RNA介导的基因沉默过程称为RNA干扰。这种方法用在医学上可使癌症基因沉默,具有重大意义。由于这一重大发现,法尔和梅洛二人双双获得2006年诺贝尔生理学或医学奖。至今人们已发现了这类小分子RNA的450种功能。这些转录出来的小分子RNA有重要的调控功能,如可以控制蛋白质的表达,可以激活或者抑制基因的表达,协助非常复杂的细胞分裂,等等。
  此外,人们已经知道,“垃圾DNA”中大量重复的DNA序列,虽然看似没有意义也不能编码蛋白质,却能形成特殊的DNA高级结构,并以此调节附近基因的活性。
  人类对于“垃圾DNA”功能的研究才刚刚开始,后头肯定有好戏连连!
  “垃圾”来自何方
  人们对“垃圾DNA”的来源提出了多种解释,比如有一种垃圾来自病毒。逆转录病毒是一类以RNA为遗传物质的病毒,其中我们最熟悉的是艾滋病病毒。它们侵袭宿主细胞时,会把自身的RNA转换成DNA,插入基因组中。从DNA到RNA的过程叫转录,反过来就叫逆转录,这也是这类病毒的名称由来。逆转录病毒有的会致病,引起艾滋病或癌症等,也有的没什么影响。人们相信,在进化历程中,有许多逆转录病毒DNA留在了人类基因组里,成为垃圾。
  “垃圾DNA”中,除了大量的看似毫无用处的反复重复序列之外,还有一些可能是死亡基因的遗骸,称为“假基因”。科学家认为,它们原本是编码蛋白质的真基因,由于发生变异而失去功能,被弃之不用。它们的序列与真基因非常相似,但有着细微差别,正是这些差别使假基因不能编码蛋白质。过去,多数科学家认为去掉假基因不会影响机体的功能;偶尔某个假基因发生变化,死而复生,倒可能造成麻烦。
  更有个别人提出了耸人听闻的猜测,他们认为人类DNA中的遗传代码是外星人编制的,而其中97%以上的垃圾DNA,其实就是没能派上用场的“备用程序”。地外的生命编写者很可能在一个大代码上同时做好几个项目,这些项目应该已经在不同的星球上产生了各种形态的生命体。编写者们很可能做得很急,他们把大代码功能大量地削减,并保留了用于地球人类的基本编码。不过,那时他们可能不太确信究竟大代码里哪些是以后用得着的,哪些是用不着的,所以他们把所有的代码都保留了下来,这其中大部分就成了我们身体中的垃圾DNA。
  不过,这样的奇思遐想缺乏科学依据,多数科学家都对之嗤之以鼻。
  著名动物学家理查德·道金斯说,有太多的DNA,它们甚至不配被称为“假基因”,因为它们是由一个接着一个的无用DNA多次重复而形成的,看上去对生物体毫无意义。
其他文献
一颗名为VFTS 102的恒星简直要把自己的五脏六腑都甩出来了。它是一颗炙热的蓝巨星,位于大麦哲伦星云,以每小时100万英里(160万公里)的速度乐此不疲地旋转着,已经到达被离心力扯碎的边缘。它的旋转速度是我们太阳的300倍,为史上有记载以来最快转速。这颗恒星可能是在一场猛烈的爆炸中从一个双星系统里分裂出来的。  通过欧洲南方天文台设立在智利帕瑞纳天文台的超大望远镜,一个研究蜘蛛星云中最大质量和最
期刊
一条爆炸性新闻  2011年9月22日,意大利格兰萨索国家实验室下属的一个名为“OPERA”的实验装置,接收到来自欧洲核子研究中心的中微子。经测算,中微子在跑过这段732公里距离所用的时间,比光还快了60纳秒(1纳秒等于十亿分之一秒)。这一结果给科学界带来了巨大困惑,因为这与爱因斯坦狭义相对论中光速是宇宙速度的极限,没有任何物质的速度可以超越光速的理论相悖。正在学术界将信将疑之际,同年10月,欧洲
期刊
多亏这只名叫卡米拉的大猩猩,最后一种大型类人猿有了它完整的基因组序列。实验结果表明了人类与大猩猩之间的关键相似之处——它们是继黑猩猩后第二种与人类最为相似的近亲。  英国剑桥大学桑格学院的理查德·德宾带领着他的国际研究团队,通过几种不同的测序技术,将西部低地大猩猩的基因组拼凑了起来。这个基因组包含了超过30亿对DNA“字母”,几乎与人类的相同,并且还包含了大约21000个基因。  早些的分析表明,
期刊
一些研究人员曾预言:男性特有的Y染色体正呈现萎缩之势,上面的许多基因因为突变正在逐渐失去功能,Y染色体早晚可能消失,而男性也会随之灭绝。美国怀特海德研究所的科学家们认为,上述观点实在是“危言耸听”,并于近日在英国《自然》杂志上发表了相关驳文。  女性的性染色体为两条X,男性则具有一条X染色体和一条Y染色体。由于只有Y染色体是决定男性性别的染色体,因此它异常“脆弱”。  事实上,从人类诞生前的3亿年
期刊
邮差送信路迢迢,  鸿雁传书风萧萧,  电报还需隔几日,  即时消息快意聊。  Sound moves slower than light, this appears to some not right.  2000 years ago in war, armies communicated by using the sun - and more!  Sending light messages
期刊
对于每一位“绿色江河”志愿者来说,斑头雁守护行动的点点滴滴,都是一段又一段传奇、惊险而又有趣的回忆,它们共同组成了志愿者们为期49天的生活体验。盘点那段难忘的日日夜夜,让人不觉思绪飘飞,每一个瞬间都是那样历历在目……  扎营,守护行动开始  “我就预感到今天是个不靠谱的日子,所以随身藏了块巧克力。”一身红色冲锋衣的王闪边说边拿出一块德芙,自己掰了一块,把剩下的递给我们。彼时我们正在班德湖上方100
期刊
大乾头人  科学家们对细胞重编程的研究已持续了数十年。所谓细胞重编程,是指“已分化的特定细胞可以被重新编程为多功能的干细胞”。1962年,约翰·戈登在他的实验室里证明,已分化的动物体细胞在蛙卵中可以被重编程,从而发育成完整的个体,这样就证明了细胞的分化是可逆的。2006年,山中伸弥将戈登的这一成果推进了一大步,实现了细胞在体外的重编程,诱导出了具有多性的细胞(即诱导性多能干细胞,iPS细胞)。与胚
期刊
城市中的鸟儿鸣叫声的频率要高于林地鸟,这是因为城市中的鸟儿试图要将声音穿过一堵墙,而这堵墙就是由交通、机器、人类活动造成的噪音所形成的。但是,最近出版在《公共科学图书馆期刊》上的研究发现,建筑结构对生活在城市中鸟儿的叫声也有相当大的影响。  在城市景观中的噪音通常是由较低频率组成的。因此,有人会得出这样的结论:鸟儿通过超越城市噪音的鸣叫来分辨它们自己的叫声,这种做法是非常聪明的。但是,哥本哈根大学
期刊
美国宇航局(NASA)的开普勒太空望远镜又发现了一颗系外行星,该星球比我们的地球还要小。这是人们首次发现类地行星围绕着类日恒星旋转。2011年12月7日,科学家在“首届开普勒科学大会”上宣布了这一发现。科学家们的研究成果可能会在今年年初发表,在此之前他们不愿意透露该发现的详细情况。  尽管这颗被临时命名为“KOI-70.04”的新行星比较小,很像地球,但是它跟作为我们家园的地球相比仍然有些不同之处
期刊
我曾有机会在日本群马县高崎市研修一年。初到异国他乡,语言不通,风俗习惯也不同。刚到日本那几天,日方专门请老师给我们讲当地的历史、风俗习惯和生活常识,还专门拿出一天时间给我们讲解如何处理垃圾。  拿到培训时间表,我看到要用一天的时间讲述如何处理垃圾,忍不住笑了,心想日本人真是没事找事,倒垃圾这点小事也能讲一天。  培训那天,一位中年女教师来为我们上课,她简单介绍了本地区的垃圾分类,然后给我们放了一部
期刊