论文部分内容阅读
本研究围绕植物转录组调控这一领域,基于高通量的测序数据,利用生物信息学手段挖掘了两类植物内源性转录本:自然反义转录本和竞争性内源转录本,同时深入分析了拟南芥自然反义转录本并发现了自然反义转录本的一系列特征。主要内容及结果可以概括为以下几点:1,自然反义转录本(NATs),作为调控RNA的一种,在植物基因组中普遍存在;其在植物抗压过程中起着十分重要的作用。本研究构建了一个包含70种植物,大约两百万个NAT对的植物NAT数据库(PlantNATsDB)。PlantNATsDB还整合了简单的NATs的生物学功能分析,比如:GO注释和小RNA序列映射。PlantNATsDB提供了多种友好的网络界面来更好地展示NATs,并且整合网络图形来展示由不同NATs形成的复杂网络。此外,PlantNATsDB还提供了基因集的功能富集分析。PlantNATsDB是现有的关于植物NATs最全面的资源库,其可以作为研究NATs调控功能的参考数据库。PlantNATsDB可以通过http://bis.zju.edu.cn/pnatdb/访问。2,以模式植物拟南芥为对象,详细研究了自然反义转录本的特征。发现蛋白编码基因(PCs)和非蛋白编码基因(NPCs)分别倾向于产生cis-NATs和trans-NATs。本研究从拟南芥的全基因组中鉴定了4,080个cis-NATs和2,491个trans-NATs。并从小RNA测序数据中挖掘到5,385个NAT-siRNAs。发现NAT-siRNAs通常由21个核苷酸或者24个核苷酸组成;21nt长的NAT-siRNAs由Dicer-like 1 (DCL1)/DCL2和RDR6产生,并且在表观遗传学激活状态中起重要作用;24nt长的NAT-siRNAs的生成依赖于DCL3和RDR2,常常在应激条件下产生。NAT-siRNAs显著地来源于trans-NATs的PC/PC对和cis-NATs的NPC/NPC对。此外,NAT对基因通常具有相似的表观遗传学状态。Cis-NATs倾向于被常染色质修饰标记,而trans-NATs则倾向于被异染色质修饰标记。3,竞争性内源RNAs(competing endogenous RNAs, ceRNAs)的调控是一种全新的基因表达调控模式,转录本通过miRNA应答元件(miRNA response elements, MREs)竞争结合相同的miRNA来调控彼此的表达水平,从而影响细胞的功能。尽管最早的ceRNA对是在拟南芥中报道的,而之后在动物中也有相关介绍,但是还没有一个全面的植物ceRNA的数据库。本文开发了一个综合的植物ceRNA数据库(PceRBase),其包括了26种植物中,67万个潜在的target-target对和16万个target-mimic对。此数据库还展示了miRNAs和其靶转录本之间的互补结合的二级结构,ceRNA对在不同样本中的表达水平和相关转录本的GO注释等;同时用户可以很方便地通过网络界面来浏览或搜索感兴趣的基因。用户还可以通过数据库中的工具来分析基因集的富集性和ceRNA构成的复杂网络。此外,PceRBase还提供了一个网络工具来帮助用户从自己的数据中预测ceRNA对。PceRBase可以通过http://bis.zju.edu.cn/pcernadb/访问。通过以上研究,希望能够拓展目前人们对植物转录组的认识,为后续研究转录组中复杂的调控关系打下基础。