基于microarray和RNA-Seq数据的嗜热四膜虫基因表达进化、基因网络构建、转录组分析及功能基因组数据库建设

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:khalista8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
四膜虫(Tetrahymena)是一种全球分布的、常见的原生动物,隶属于纤毛门(Cilipphora),寡膜纲(Oligohymenophprea),膜口目(Hymenostomatida)。其中嗜热四膜虫(T.thermophila)因其可在实验室纯培养且传代速度快、遗传背景清楚、分子遗传学技术成熟等特点而成为了一种优良的真核模式生物。以嗜热四膜虫为研究对象在基础研究领域里取得了一系列重要的成果,如核酶的发现、端粒与端粒酶的发现、组蛋白翻译后修饰功能和大核发育中DNA重整的RNAi模型等。随着2006年嗜热四膜虫大核基因组的发布和近年来组学及生物信息学技术方法的迅猛发展,嗜热四膜虫的研究进入了功能基因组学研究阶段。本研究针对利用基因芯片和转录组测序这两个高通量技术产生的大量嗜热四膜虫转录组数据,进行了全面的分析,取得了以下重要研究结果:   1)基因表达数据的一个重要作用是用于对基因表达进化和功能分化的分析。嗜热四膜虫细胞内参与感知(sensing)和应对(responding)环境变化的基因家族得到大量的扩增,如ABC转运蛋白(ATP-binding cassette transporters,ABC transporters)超基因家族。我们利用同源性搜索和实验验证,鉴定得到了165个嗜热四膜虫ABC转运蛋白基因;对其系统发育关系的分析结果显示,嗜热四膜虫中大量倍增的ABC转运蛋白基因是由相对近期的基因复制(geneduplication)产生,时间大约为61.5百万年-112.7百万年(Mya),发生在四膜虫与草履虫分化之后;结合系统发育和基因芯片表达数据,对嗜热四膜虫的ABC转运蛋白基因家族进行了表达进化分析,发现基因的表达分化已经在系统发育树的大部分进化枝内发生;进而综合祖先节点表达状态、同义突变率、正选择位点及毒物诱导情况下的基因表达情况等信息,对近期复制产生的两串连重复基因复制后在基因组中保留的原因进行考察,发现嗜热四膜虫中ABC转运蛋白基因复制后发生表达分化并在基因组中保留下来的模式更符合新功能化模型和剂量平衡模型。   2)基因芯片数据的另一个重要应用是用于构建基因网络。基于67个嗜热四膜虫基因芯片数据,我们利用三种方法(Pearson Correlation Coefficient,PCC;Spearman Correlation Coefficient,SCC;Context Likelihood of Relatedness,CLR)构建了四膜虫的基因网络。以酿酒酵母中的核糖体大亚基(cytoplasmicribosomal large subunit)、核糖体小亚基(cytoplasmic ribosomal smallsubunit)、20S蛋白水解酶体核心颗粒(20S proteasome core particle)和19S蛋白水解酶体调节颗粒(19S proteasome regulatory particle)四个蛋白复合体的相互作用关系为参照,对三种方法网络推断效果进行了评价,发现CLR方法无论准确性还是覆盖度方面均明显优于其他两种方法。通过确定CLR所构建网络的合适阈值,确定了最终的四膜虫基因网络(Tetrahymena gene network,TGN)。在此基础上,鉴定了四膜虫基因网络的模块(modules)并进行功能分析,其中模块-1涉及到嗜热四膜虫大核发育过程中的DNA重排过程,而模块-2则与能量代谢密切相关;对四膜虫基因网络的中心节点基因(hubs)进行了分析,发现其可以按表达模式分为6类,对这6类中心节点基因的功能分析表明其功能与表达模式显著相关。此外,我们还对在嗜热四膜虫中存在的、但酿酒酵母中缺失的、与人类疾病相关基因的直系同源基因的四膜虫基因网络进行了分析,结果表明嗜热四膜虫中某些直系同源基因可能在分子水平上具有与人类非常类似的功能,提示嗜热四膜虫可作为潜在的人类疾病相关基因研究的单细胞模式生物。   3)利用二代测序技术,对嗜热四膜虫生活史中的三个生理和发育阶段的6个RNA样品进行测序,得到了约14 Gb数据。通过与基因组数据的比较,发现嗜热四膜虫转录组大小约为57 Mb,覆盖了96%的四膜虫预测基因;对转录组数据鉴定得到的剪接位点分析的结果显示,超过7千个基因模型的预测有误;因此,转录测序的结果大大的提高了嗜热四膜虫的基因注释信息。利用转录组数据拼接的转录本考察了嗜热四膜虫基因的UTR长度,并鉴定得到一千多个新转录区域。对转录组数据分析的另一个重要发现是,嗜热四膜虫中存在1286个(5.2%)选择性剪接基因,是目前已报道单细胞真核生物中最多的;进一步分析发现其中约30%的选择性剪接能产生含提前终止密码子(premature termination codons,PTCs)的转录本,因此可能会被无义介导的mRNA降解(nonsense-mediated mRNAdecay,NMD)通路进行降解,从而实现对基因表达的转录后调控。另外,利用对两种不同交配型的转录组测序结果进行比较,鉴定得到了潜在的嗜热四膜虫交配型决定基因,为揭示嗜热四膜虫交配型决定机制奠定了坚实基础。   4)通过整合嗜热四膜虫基因芯片数据、转录组测序数据和基因网络数据,我们设计并建立了四膜虫功能基因组数据库(Tetrahymena functional genomicsdatabase,TetraFGD,http://tfgd.ihb.ac.cn/)。数据库设计了多种搜索途径,如基因ID、关键词、转录本ID、基因的位置信息和序列等。通过这些简单易用的搜索功能,为研究人员提供了嗜热四膜虫基因表达、基因模型与序列和基因间相互作用等重要的信息,TetraFGD已成为国际四膜虫研究的重要基因组数据资源。
其他文献
高等学校体育课已改称体育与健康课程,增加了健康文化的含量,甚至提出以“健康第一”为指导思想.因此,体育教育必须从传统的模式中走出来.体育教育改革不能简单地理解为教育
就高校冰上教学推广新式冰刀的可行性,对黑龙江体育院系速滑专业教师、速滑专修学生和普修学生、普通高校冰上共同课教师和有关专家、学者以问卷调查和座谈访问的形式进行调
分析我国高等体育专业教学目前存在的投入、建设、设置、方法、生源和就业等问题.研究加入WTO后我国高等体育专业教育将面临的机遇与挑战.提出对策:学习经验,树立新的办学思
土壤有机质分解是陆地生态系统碳循环的重要过程,对维持土壤碳库动态平衡起着重要作用。土壤有机碳矿化速率(微生物呼吸)及其温度敏感性(Q10)是研究土壤有机质分解的重要方面。
马铃薯疮痂病(potatoscab)是由植物病原链霉菌(Streptomyces)引起的一种世界性病害,主要危害马铃薯块茎,在其表面形成近圆形至不定形木栓化疮痂状淡褐色病斑或斑块。云南作为最早种
2002年9月黑龙江省教育厅转发了国家教育部制定的,对现行高校体育课程进行全面的改革.在学习和体验文件精神的基础上,对体育课程教学内容改革进行理论性探讨,就改革的指导思
ORGANIC matters in the ore-forming fluids are composed mainly of light hydrocarbons. Because of the small amount of hydrocarbons in fluid inclusions, it is qui
多年来,我们党和国家不断强化多项有效措施,加大反腐倡廉工作的力度,取得了一个又一个阶段性成果,但当前腐败现象依然屡禁不止,反腐倡廉工作面临的形势依然十分严峻。这就使
对福建省9个设区市、75个县中青年干部参加体育锻炼的目的、项目、方式及场所等问题进行了问卷调查,结果表明:福建省中青年干部参加体育锻炼的目的明确;球类、跑步为其首选的
观光木(TsoongidendronodorumChun)是木兰科单种属植物,同时也是我国的特有物种,其分布范围广泛,但居群通常都非常小,加之近年来人类干扰的影响,其分布区的生态环境受到了较大的破