论文部分内容阅读
表观遗传(epigenetics)是指在不改变DNA序列的情况下,却可以使基因表达发生可遗传的改变。DNA甲基化是植物最重要和最基础的表观遗传方式,参与完成生命周期以及适应环境变化。但是,DNA甲基化的诸如可变性、稳定性以及发生规律等一些基础性科学问题尚没有完全清楚。我们利用生物信息学的手段,分析北半球不同拟南芥地理种群甲基化组差异信息,研究不同甲基化状态下基因功能特点、基因甲基化水平和表达关系、基因甲基化水平和数量性状关系和代谢及信号通路中基因甲基化变异特点等,以期阐明基因甲基化多样性发生的一般规律及其在基因调控中的作用,为DNA甲基化研究提供数据和信息。各甲基化特征基因筛选和功能聚类分析基因甲基化通过调节基因表达,参与生物和非生物环境刺激的感受和应答,影响自然种群的生物多样性,但是,基因甲基化的规律和分布特点尚没有完全明了。本研究比较分析哥伦比亚型拟南芥及75个其他生态型种群的全基因组甲基化组信息,统计基因启动子和基因体(gene body)甲基化程度、甲基化变异度,并对筛选到的基因进行功能聚类分析,明确基因甲基化规律。结果表明,哥伦比亚型基因体和启动子区域分别有37%和47%基因完全未被甲基化,随种群数量增加到76个时未被甲基化基因下降到4%和2%。但是,基因体甲基化程度达到1%以上的基因数比例,无论哥伦比亚型单种群或76个种群均占31%,启动子区甲基化程度达到1%以上的基因数比例分别占33%(哥伦比亚型)和32%(76个种群),合并区域甲基化程度达到1%以上的基因数比例分别占36%和34%。考虑到基因的甲基化程度对基因调节的影响,只有达到1%以上时被认为高潜受甲基化调节,显然,仅有大约三分之一的拟南芥基因可能具有生物学意义的甲基化。对筛选到的高潜受甲基化调节的约5000个高甲基化变异的基因进行了相应的聚类分析,其潜在对多种群性状及环境应激差异的贡献大,可以作为候选基因集合做进一步研究。甲基化水平与表达量水平相关分析为了揭示基因甲基化和基因表达的关系以及拟受甲基化调控基因比例,首先获得全体基因甲基化信息和表达量信息,然后利用线性相关模型,分析基因表达量和基因甲基化水平的相关性,将具有显著相关性的基因筛选出来,并对此类基因进行功能聚类分析以探索拟受甲基化调控基因在功能上的偏好性。结果表明基因体甲基化水平和表达量水平相关的基因有1926个,正负相关基因分别为1299和627个。启动子区甲基化水平和表达量水平存在相关性的基因有1679个,正负相关基因分别为961和718个。这些拟受基因体甲基化调控基因和拟受启动子区甲基化调控基因在数量上包含438个共有基因,而如果对基因体和启动子区合并后做相关分析,正负相关基因分别是1547和871个。不同甲基化调控模式基因的功能偏好性分析结果表明,拟受基因体甲基化调控基因具有显著性的基因功能聚类结果,这些基因主要富集于细胞死亡和蛋白质氨基酸脂化,在功能上是一些抗病性蛋白。拟受启动子区甲基化调控基因没有显著的功能聚类结果。合并区拟受甲基化调控基因聚类词条包括信号转导、免疫反应、和细胞死亡及凋亡。甲基化水平与数量性状相关分析相信基因甲基化与植物性状的可塑性具有密切关系,但其作用的方式尚缺乏深入的了解。为了解基因甲基化变异在植物性状可塑性中扮演的角色,研究以线性相关模型分析甲基化组数据和收集的拟南芥多种群的表皮毛密度、钠元素含量、幼苗生长速率和角果长度等45个数量性状数据,筛选甲基化水平和数量性状大小之间存在相关性的基因。并对这些筛选到的基因结果进行了基因本体(Gene ontology,GO)功能富集分析,对具有显著功能聚类结果且功能与相应性状相符的功能基因进行了进一步的分析。结果显示,每个性状都筛选到一定数量的相关基因,聚类结果显著与否在不同数量性状之间有所不同。进一步,以角果长度、钠离子含量及表皮毛为例进行了较为深入的研究,特别是分析了表皮毛密度和基因表达量相关性,筛选到的相关的基因功能十分符合前人对表皮毛的功能研究结果并且包含直接与表皮毛发育相关的功能基因。由此,可以根据多种群数量性状差异、基因表达差异和基因甲基化相关性筛选功能基因。生物代谢及信号通路基因甲基化变异研究利用京都基因与基因组百科全书KEGG(Kyoto Encyclopedia of Genes and Genomes)通路数据库中拟南芥的 120 条代谢通路,分析各通路中参与基因的甲基化变异及甲基化程度情况,明确各通路中高甲基化变异度基因、不被甲基化基因、较高甲基化程度基因和高甲基化程度基因,并根据甲基化高变异基因含有比例的大小分析通路的组成基因,结合通路的功能从新的角度来评估甲基化起到调节基因表达的可能性。对120条代谢通路中基因启动子及基因体合并区域甲基化情况研究表明:除2条通路之外,所有118条通路均含有较高甲基化程度(>1%)基因;32条通路含有1至4个高甲基化程度(>5%)的基因;除7条通路外,113条通路都或多或少含有高甲基化变异度基因,其中,有20条含有高比例的高变异度基因,达到了每条通路总基因的30%以上。因此,通过此研究可以推论出上述代谢通路普遍受到差异甲基化的调控,可能对种群间代谢及信号通路调节有所贡献;而各通路中高甲基化变异度基因比例不同而且差异很大,说明不同代谢功能受甲基化调节是具有偏好性的,与通路参与的生物过程可能有关;通路中含有极个别高甲基化程度的基因可能在某一代谢步骤中,由甲基化行使基因开关功能,进行关键步骤的调节。