论文部分内容阅读
在生物学领域中,有许多的难题一直困扰着人们。比如,为什么糖尿病、高血压和精神病等复杂的疾病难以预测及治疗?为什么一个人患有癌症或抑郁症,而他(她)的同卵双胞胎依然非常健康?这些奥秘犹如上帝给人类出的谜题,吸引着一代又一代的科学家投身到这解谜游戏中。今年9月5日,世界各国的科学家们在《科学》(Science)、《自然》(Nature)等顶级杂志发表文章30余篇,将他们九年努力的成果展现在世人面前。这些成果是医学和科学上的重大突破,成为解开上帝谜语的重要线索,对人类健康有着巨大的影响。这些成果都来自于人类生物学上的又一个里程碑——“DNA元件百科全书计划”(Encyclopedia of DNA Elements, 略称ENCODE)。
重塑“垃圾DNA”的重要角色
你知道人类的基因组曾被认为是充满了“垃圾DNA”(即没有功能的DNA)的“垃圾场”吗?这样的观点持续了数十年之久。上世纪80年代末,世界各国的科学家启动了人类基因组计划(human genome project, HGP),目标是要揭开组成人体的30亿个碱基对的秘密,绘制出人类基因的谱图。当时一些研究人员曾经预测人类约有14万个基因,而当人类基因组测序完成后,人们惊讶地发现人类基因总数只有2.1万个左右,仅占整个基因组的2%以下,并且仅仅是线虫或果蝇基因数量的2倍。如此少的基因数目产生如此复杂的功能,是人们没有预料到的。更让人想不到的是,人类基因组98%的DNA是不编码蛋白的序列,难道这些没有任何生物学功能的DNA序列真的是“垃圾”吗?难道它们真如进化论者所说,是被淘汰了的基因“废料”吗?
为了更细致地鉴定人类基因组的所有功能组分,2003年美国国立人类基因组研究所启动了ENCODE计划。全世界11个国家80所科研机构的442名研究人员经过9年的努力,分析了超过15万亿字节的原始数据,对147个组织类型进行了分析统计,获得了迄今最详尽的人类基因组分析数据,其结果于今年9月5日正式发表在《自然》、《科学》、《基因组研究》(Genome Research)及《基因组生物学》(Genome Biology)杂志上。这项国际计划的研究结果正在改变科学家们对基因的认识。参与ENCODE计划的研究人员已经确认:基因组中超过80%的DNA在生物化学上都是活跃的,换句话说,它们都有某种确定的功能;其中包括7万多个负责与蛋白质结合控制基因表达的“启动子”区,以及近400万个基因开关,控制着基因是开还是关,以及蛋白何时何地生成。这一发现被认为是医学界和科学界的重大突破,因为很多复杂疾病的出现都是由于这数百万的基因开关的微小变异而引起的。
ENCODE计划还创建了一张图谱,用以展示所有不同碱基所扮演的角色。“这就像人类基因组的谷歌地图。” 美国国家人类基因组研究所项目主管埃利斯·范戈尔德说,“人类基因组计划就像从卫星上拍了一张地球的照片,而ENCODE计划则在这张照片上标出了河流和道路,你甚至可以找到交通信息以及饭店和医院的位置。”在ENCODE图谱中,人们能从染色体水平放大单个碱基并查看其功能。DNA元件百科全书计划使我们认识到,人类的基因组不是一群编码蛋白的基因漂浮在“垃圾DNA”的海洋中,而是由30亿个化学“字母”(碱基)组成的一个极为复杂的网络。基因、调控元件和其他DNA序列以一种人们尚未完全认识的三维重叠方式相互作用,共同控制人类的生理活动。如今,ENCODE计划使基因组“垃圾场”摇身一变成了“金矿”,过去认为是“垃圾”的DNA序列,恰恰是我们了解人类健康,寻找复杂疾病治疗方法的金钥匙。
打开疾病治疗的神秘之门
DNA百科全书的研究成果告诉我们,所谓的“垃圾DNA”实际上如同躲在幕后的舞台总监,它们像调节舞台光线一样调控着数以万计的基因何时何地登场,并决定一些基因的角色(比如控制一个细胞成长为肝细胞还是神经细胞),以及基因与蛋白间如何互动等等。如果没有这些开关的调控,基因将不能正常工作,而这些调控区域的微小变异也许会导致人类患上疾病。在同卵双胞胎的例子中,尽管两个个体拥有完全一致的遗传信息,但是假如二者生活在不同的环境中,基因调控区域发生微小变异导致基因表达的不同,就可能使双胞胎中的一个患上疾病,而另一个则完全健康。
在一篇发表在《自然》杂志的论文中,研究人员指出基因开关的调控功能与一系列人类疾病,如多发性硬化症、狼疮、类风湿关节炎、克罗恩病、麦胶性肠病,以及包括身高这样的体貌特征相关。过去,虽然科学家们已经知道人类DNA序列的微小变化会增加患病的风险,但由于许多微小变化都发生在“垃圾DNA”区域而被人们忽视。随着人类基因组详图的面世,人们才豁然开朗,原来基因虽未被改变,但调控基因的区域发生变异因而有可能产生复杂的疾病。美国斯坦福大学的研究人员迈克尔·斯奈德说:“大部分能导致疾病的碱基变异并不发生在编码蛋白的基因中间,而是出现在控制基因开关的DNA序列中。”
这个发现对癌症以及其他复杂疾病的研究有重要影响。美国康乃尔大学医学院的马克·鲁宾在前列腺癌的研究中发现,很多致病基因出现了耐药的突变,使新药的开发受阻。而基因开关的发现,特别是与癌症基因调控密切相关的区域的确定,能帮助科学家针对这些基因的关键元件设计新的药物靶点,或者针对不同个体易感基因上功能元件的多态性,设计个体化治疗方案,达到有的放矢的治疗目的。
点亮基因研究的黑暗角落
世界上第一部百科全书诞生在18世纪的法国,共有28卷,含7万多词条和近3000幅插图。当时编撰百科全书的著名法国学者狄德罗等人希望,这部书不仅要涵盖人类知识的全部,而且要以此来启蒙人类的思想向新文明迈进。DNA元件百科全书计划也一样,不仅详细地介绍了人类基因组“百科”知识,也为进一步理解基因变异与人类遗传缺陷和疾病创造了新的机遇,将重塑人类关于自身进化及生命复杂性的科学认知。
除了发现80%的基因组都有生物化学功能,并且大部分行使着基因开关的功能外,ENCODE计划还发现大约76%的基因组DNA都会被转录为RNA,并观察到当前已标注的RNA和上千个之前未标注的RNA的表达范围与水平、定位调节和修饰。这些观察结果表明,人们需要重新定义基因的概念。此外,转录起始位点和远端序列元件之间的相互作用,果蝇和人的转录因子结合位点变异分析,人基因组中与疾病相关的功能性SNP(single nucleotide polymorphism, 即单核苷酸多态性)以及不死的假基因等,都是ENCODE计划的研究内容和成果。也许人们需要花一些时间才能“消化”这些成果,但毫无疑问的是这些成果极大地鼓舞了生命、健康和疾病领域的基础研究。
如果说人类基因组计划只是确定了字典里的字,现在ENCODE计划等于为这些重要字词、句式加了注释,使我们能够解读人类基因组这本天书;如果说以前我们研究的基因是一张张的幻灯片,现在认识的基因组就是一部3D电影!ENCODE计划告诉我们,我们需要把眼光放得更远一些,而不是局限于基因组网络连接的线性结构。ENCODE计划目前正在进行第三阶段研究,最终将完成更详细的人类基因的指导手册,并提供更多的细节。随着下一阶段研究的展开,相信最后的20%“垃圾”DNA一定会悉数登场,展示它们的功能。人类基因组研究将带给我们更多颠覆性的惊喜。
重塑“垃圾DNA”的重要角色
你知道人类的基因组曾被认为是充满了“垃圾DNA”(即没有功能的DNA)的“垃圾场”吗?这样的观点持续了数十年之久。上世纪80年代末,世界各国的科学家启动了人类基因组计划(human genome project, HGP),目标是要揭开组成人体的30亿个碱基对的秘密,绘制出人类基因的谱图。当时一些研究人员曾经预测人类约有14万个基因,而当人类基因组测序完成后,人们惊讶地发现人类基因总数只有2.1万个左右,仅占整个基因组的2%以下,并且仅仅是线虫或果蝇基因数量的2倍。如此少的基因数目产生如此复杂的功能,是人们没有预料到的。更让人想不到的是,人类基因组98%的DNA是不编码蛋白的序列,难道这些没有任何生物学功能的DNA序列真的是“垃圾”吗?难道它们真如进化论者所说,是被淘汰了的基因“废料”吗?
为了更细致地鉴定人类基因组的所有功能组分,2003年美国国立人类基因组研究所启动了ENCODE计划。全世界11个国家80所科研机构的442名研究人员经过9年的努力,分析了超过15万亿字节的原始数据,对147个组织类型进行了分析统计,获得了迄今最详尽的人类基因组分析数据,其结果于今年9月5日正式发表在《自然》、《科学》、《基因组研究》(Genome Research)及《基因组生物学》(Genome Biology)杂志上。这项国际计划的研究结果正在改变科学家们对基因的认识。参与ENCODE计划的研究人员已经确认:基因组中超过80%的DNA在生物化学上都是活跃的,换句话说,它们都有某种确定的功能;其中包括7万多个负责与蛋白质结合控制基因表达的“启动子”区,以及近400万个基因开关,控制着基因是开还是关,以及蛋白何时何地生成。这一发现被认为是医学界和科学界的重大突破,因为很多复杂疾病的出现都是由于这数百万的基因开关的微小变异而引起的。
ENCODE计划还创建了一张图谱,用以展示所有不同碱基所扮演的角色。“这就像人类基因组的谷歌地图。” 美国国家人类基因组研究所项目主管埃利斯·范戈尔德说,“人类基因组计划就像从卫星上拍了一张地球的照片,而ENCODE计划则在这张照片上标出了河流和道路,你甚至可以找到交通信息以及饭店和医院的位置。”在ENCODE图谱中,人们能从染色体水平放大单个碱基并查看其功能。DNA元件百科全书计划使我们认识到,人类的基因组不是一群编码蛋白的基因漂浮在“垃圾DNA”的海洋中,而是由30亿个化学“字母”(碱基)组成的一个极为复杂的网络。基因、调控元件和其他DNA序列以一种人们尚未完全认识的三维重叠方式相互作用,共同控制人类的生理活动。如今,ENCODE计划使基因组“垃圾场”摇身一变成了“金矿”,过去认为是“垃圾”的DNA序列,恰恰是我们了解人类健康,寻找复杂疾病治疗方法的金钥匙。
打开疾病治疗的神秘之门
DNA百科全书的研究成果告诉我们,所谓的“垃圾DNA”实际上如同躲在幕后的舞台总监,它们像调节舞台光线一样调控着数以万计的基因何时何地登场,并决定一些基因的角色(比如控制一个细胞成长为肝细胞还是神经细胞),以及基因与蛋白间如何互动等等。如果没有这些开关的调控,基因将不能正常工作,而这些调控区域的微小变异也许会导致人类患上疾病。在同卵双胞胎的例子中,尽管两个个体拥有完全一致的遗传信息,但是假如二者生活在不同的环境中,基因调控区域发生微小变异导致基因表达的不同,就可能使双胞胎中的一个患上疾病,而另一个则完全健康。
在一篇发表在《自然》杂志的论文中,研究人员指出基因开关的调控功能与一系列人类疾病,如多发性硬化症、狼疮、类风湿关节炎、克罗恩病、麦胶性肠病,以及包括身高这样的体貌特征相关。过去,虽然科学家们已经知道人类DNA序列的微小变化会增加患病的风险,但由于许多微小变化都发生在“垃圾DNA”区域而被人们忽视。随着人类基因组详图的面世,人们才豁然开朗,原来基因虽未被改变,但调控基因的区域发生变异因而有可能产生复杂的疾病。美国斯坦福大学的研究人员迈克尔·斯奈德说:“大部分能导致疾病的碱基变异并不发生在编码蛋白的基因中间,而是出现在控制基因开关的DNA序列中。”
这个发现对癌症以及其他复杂疾病的研究有重要影响。美国康乃尔大学医学院的马克·鲁宾在前列腺癌的研究中发现,很多致病基因出现了耐药的突变,使新药的开发受阻。而基因开关的发现,特别是与癌症基因调控密切相关的区域的确定,能帮助科学家针对这些基因的关键元件设计新的药物靶点,或者针对不同个体易感基因上功能元件的多态性,设计个体化治疗方案,达到有的放矢的治疗目的。
点亮基因研究的黑暗角落
世界上第一部百科全书诞生在18世纪的法国,共有28卷,含7万多词条和近3000幅插图。当时编撰百科全书的著名法国学者狄德罗等人希望,这部书不仅要涵盖人类知识的全部,而且要以此来启蒙人类的思想向新文明迈进。DNA元件百科全书计划也一样,不仅详细地介绍了人类基因组“百科”知识,也为进一步理解基因变异与人类遗传缺陷和疾病创造了新的机遇,将重塑人类关于自身进化及生命复杂性的科学认知。
除了发现80%的基因组都有生物化学功能,并且大部分行使着基因开关的功能外,ENCODE计划还发现大约76%的基因组DNA都会被转录为RNA,并观察到当前已标注的RNA和上千个之前未标注的RNA的表达范围与水平、定位调节和修饰。这些观察结果表明,人们需要重新定义基因的概念。此外,转录起始位点和远端序列元件之间的相互作用,果蝇和人的转录因子结合位点变异分析,人基因组中与疾病相关的功能性SNP(single nucleotide polymorphism, 即单核苷酸多态性)以及不死的假基因等,都是ENCODE计划的研究内容和成果。也许人们需要花一些时间才能“消化”这些成果,但毫无疑问的是这些成果极大地鼓舞了生命、健康和疾病领域的基础研究。
如果说人类基因组计划只是确定了字典里的字,现在ENCODE计划等于为这些重要字词、句式加了注释,使我们能够解读人类基因组这本天书;如果说以前我们研究的基因是一张张的幻灯片,现在认识的基因组就是一部3D电影!ENCODE计划告诉我们,我们需要把眼光放得更远一些,而不是局限于基因组网络连接的线性结构。ENCODE计划目前正在进行第三阶段研究,最终将完成更详细的人类基因的指导手册,并提供更多的细节。随着下一阶段研究的展开,相信最后的20%“垃圾”DNA一定会悉数登场,展示它们的功能。人类基因组研究将带给我们更多颠覆性的惊喜。