论文部分内容阅读
转录组是某个物种或特定细胞在某一功能状态下产生的所有RNA的总和,对于不同样本中转录组差异的研究不仅可以了解特定时间和空间条件下疾病的发生发展状态,同时也能够作为发现疾病诊断和预后的标志物的重要研究手段。对于芯片或者高通量测序产生的海量转录组数据,如何解读其中蕴含的生命规律和特征,生物信息学方法显得尤为重要。差异转录组的分析大致可以分为以下几个方面:(1)表达差异;(2)lncRNA-靶基因;(3)表观修饰调控;(4)顺反调控等生物信息学分析过程及后续的一些实验验证。我们首先建立了差异转录组的生物信息学研究体系,利用RNA-seq对镉中毒后小鼠睾丸转录组进行研究,通过利用该体系对获得的原始数据的分析,成功的研究了镉中毒后小鼠睾丸转录组的变化和调控机制,并筛选到一些潜在的生物标志物。随后,将该体系用于我们实验室得到的人心脏组织的RNA-seq数据,并整合公共数据库中的转录组和表观基因组高通量数据,我们成功研究了人类心脏发育过程中的动态变化规律。第一部分差异转录组生物信息学研究体系的建立转录组的研究能够深刻的理解基因组的功能,并且了解某种细胞或组织的分子组成,最终为发育和疾病的研究提供重要的依据。此外,对于转录组的研究也是疾病诊断和预后的标志物的发现与鉴定的重要手段。目前,RNA-seq已经成为转录组研究中最为常见的手段。针对于RNA-seq数据的分析,开发了许多基于不同算法和统计模型的软件以应用于数据比对、转录组重构、转录本表达定量、差异表达分析以及下游的功能注释和调控分析等过程。因此,从如此丰富的软件资源中选择出合适的一系列软件,构建出一套完整的差异转录组研究体系,对于基于RNA-seq技术的转录组研究,尤其是从海量的数据中读出其生物学规律、理解疾病的发生发展过程和生物标志物的开发是十分重要的。本研究结合现有的生物信息学公共软件包,以及通过设定合适的参数以及我们的一些脚本程序,建立了差异转录组的生物信息研究体系,以用于转录组数据分析的各个环节。第二部分慢性镉暴露小鼠睾丸转录组差异研究镉是一种常见的有毒重金属,其毒性靶器官很多,包括肺,肝,肾,骨组织,以及心脏,免疫系统和生殖系统等等,从而给人体造成多种严重疾病甚至癌症。严重的镉暴露会造成睾丸组织的病理学改变,精子数量减少等一系列生殖毒性损伤。尽管有一些研究揭示了不同组织在镉处理后所引起的转录水平的变化,但雄性生殖系统在镉暴露后所引起的基因变化及其分子机制尚不清楚。本研究用不同剂量的镉添加到食物中饲喂小鼠六个月,以构建慢性镉中毒小鼠模型,观测到慢性镉暴露导致小鼠血清睾酮含量的下降。接着,本研究用RNA-seq研究镉暴露小鼠睾丸的转录组变化,以全面研究镉生殖毒性的分子机制。结果,利用建立的差异转录组的生物信息学研究体系,发现在不同镉剂量处理的小鼠睾丸中,共有830个转录本差异表达,并且其表达模式在三个组中不同。对差异基因进行功能注释分析发现,它们涉及了包括细胞周期,毒性,氧化反应、代谢相关、转录调控等一系列生物学过程以及9条KEGG信号通路。尤其值得注意的是,本研究发现了其中一些参与激素调控、配子发生以及生殖相关的生物学过程的差异表达基因。其中,与睾酮合成相关的三个基因Star、Cypllal和Cypl7a1的表达被镉所抑制。而涉及配子发生和生殖相关功能的基因有16个,其中Fndc3a、Daz1、Kit1、Tex15和Zfx表达下调。通过基因相互作用分析发现差异基因之间可能存在相互作用,其中一些基因构成的模块与激素和生殖过程相关。为了更好的理解镉暴露导致的基因表达差异的机制,本研究继续分析了这些基因启动子区的转录因子结合位点与3’UTR区域microRNA结合位点。结果表明这些基因可能受多个转录因子的调控,这些转录因子参与的生物学过程也涉及了激素水平调节以及生殖相关过程。同时microRNA预测发现这些差异基因可能存在10个microRNA的结合位点。最后,本研究首次发现了镉暴露可以导致小鼠睾丸中长非编码RNA(lncRNA)的表达异常。以上结果表明,镉暴露导致的生殖毒性涉及到一个多层次的基因异常转录以及多个生物学通路改变的结果。第三部分人类心脏发育相关的转录组差异研究心脏是哺乳动物胚胎发育过程中的第一个功能器官,心脏从胚胎期至出生后再到成年过程中的正常发育和维持正常的功能对人类健康尤为重要。胚胎期心脏的发育异常可导致各类先天性心脏疾病,而出生后如果受到环境或者其他因素刺激,也会导致各种心脏疾病,因此,理解心脏发育过程中的基因表达调控对理解人类心脏发育、先天性心脏病以及其他一些心脏病的机制和治疗十分必要。虽然有研究利用分化系统将干细胞诱导分化为心肌细胞,并研究了在此一系列分化过程中不同细胞类型的基因表达差异以及转录调控机制,还有研究以小鼠为模型,研究了胚胎期和成年期小鼠心脏的基因和长非编码RNA的表达谱。但目前为止,还未见直接的人类正常胎儿心脏和成年人心脏之间转录调控的相关研究。本研究直接利用从人类正常胎儿心脏和成年人正常心脏组织中获得的RNA-seq数据来比较两者之间的转录图谱,利用我们建立的差异转录组的生物信息学研究体系,从中鉴定了6104个有表达的lncRNA和1581个表达相对活跃的lncRNA。通过差异表达分析,发现胎儿心脏和成年人心脏中有2692个mRNA和306个lncRNA差异表达,并且两者的表达模式均有时期特异性。通过对差异表达的mRNA和lncRNA进行功能注释,发现它们所涉及的生物学过程以及参与的信号通路都与心脏发育和正常生理功能密切相关。对胎儿心脏和成年人心脏的组蛋白修饰和DNA甲基化分析发现,这些表观修饰同样具有时期特异性,并且能够协同调控基因的转录。接着,本研究利用全基因组范围组蛋白修饰定位的方法预测了胎儿心脏和成年人心脏的远端增强子位点,并发现这些增强子序列存在与心脏和肌肉功能相关的转录因子结合基序。最后,分析发现心脏中存在不同类型的活性和平衡状态增强子,对其进行功能分析发现胎儿心脏和成年人心脏中平衡状态增强子功能相近,而与活性增强子功能有所区别。同时,这些增强子位点中的变异可能与多种疾病表型相关。综上所述,本研究全面的整合分析了人类胎儿心脏组织和成年人心脏组织中的转录组、表观基因组以及远端增强子元件及其功能。这些发现对于理解人类心脏发育、先天性心脏病以及其他一些心脏病的机制和治疗、理解和研究心脏再生提供了重要的理论依据。