小鼠胚胎干细胞高置信度lincRNAs的预测及其调控模式的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kanebbsxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
lincRNAs在新陈代谢、生长发育,以及疾病等方面发挥功能,并在各个层面调控基因表达。作为关键的调控因子,lincRNAs在小鼠ES细胞中发挥重要的调节作用。本课题将利用高通量数据RNA-Seq识别在小鼠ES细胞中表达的未经注释的高置信度lincRNAs转录本,完善lincRNAs的基因组注释。并识别增强子相关lincRNAs与启动子相关lincRNAs的特征调控模式,以及elincRNAs与启动子互作的识别,研究lincRNAs对基因的表达调控作用。本论文整合多套小鼠ES细胞,以及早期胚胎、全胚胎等RNA-Seq数据,识别了6 701个小鼠ES细胞表达的新lincRNAs。RNA-Seq读段的覆盖率和CAGE进行转录本完整性评估的结果表明,基于RNA-Seq识别的新lincRNAs是5′端缺失的不完整的转录本。已知lincRNAs和蛋白质编码转录本的TSS区域的分析结果表明lincRNAs具有特异的基因组与表观基因组特征。预测模型十倍交叉验证和独立的检验集进行评估结果表明,整合基因组与表观基因组特征的lincRNA转录本TSS区域预测模型效能最优。在小鼠全基因组范围内进行lincRNA转录本TSS区域的预测,并修正了1 293个新lincRNAs的TSS区域。利用CAGE以及活性染色质修饰对修正前后的lincRNA转录本TSS区域进行评估,结果表明基于预测的TSS区域在小鼠ES细胞中获得了相对完整的lincRNA转录本。对新lincRNAs进行基因组的分布分析以及基因组与表观基因组表征,新lincRNAs与已知lincRNAs特征相似,具有比蛋白质编码转录本相对少的外显子个数、相对短的转录本长度,以及相对低的保守性等特征,并富集重复元件;并且lincRNAs的表观遗传修饰模型显著地区别于蛋白质编码转录本。利用RT-PCR检测新lincRNAs在不同细胞系和小鼠不同发育阶段的不同组织的表达水平,结果表明新lincRNAs的组织/细胞特异性表达。进一步利用RACE实验对TCONS00041333转录本全长进行鉴定,结果表明该lincRNAs包含两个转录本,长度分别为656 bp和571 bp。核心启动子元件的结合区域的分析表明,在其TSS上游存在TATA-box、GC-box、CCAAT-box和Initiator的结合区域,并富集H3K4me1和H3K27ac组蛋白修饰。按照染色质状态可以将lincRNAs分为elincRNAs(enhancer associated lincRNAs)和plincRNAs(promoter associated lincRNAs)。基于小鼠ES细胞已知lincRNA转录本TSS区域的H3K4me1/H3K4me3富集比率识别了包含224个elincRNAs与112个plincRNAs的高置信度集合。整合基因组与表观基因组特征,利用正则化的罗杰斯特回归模型识别显著调控elincRNAs与plincRNAs的特征,elincRNAs与TSS区域的DNA甲基化,以及基因体区域的DNA甲基化和H3K122ac的调控相关;plincRNAs与TSS区域的H3K9ac,以及基因体区域的H3K36me3的调控相关。并且基于预测模型识别了3 729个elincRNAs和1 392个plincRNAs。对elincRNAs和plincRNAs进行基因组与表观基因组表征,elincRNAs具有比plincRNAs相对较少的外显子个数、相对短的转录本长度、相对低的表达水平和序列保守性,以及差异的染色质修饰模式等特征。基于组蛋白修饰模式和转录因子富集模式分析小鼠ES细胞elincRNAs与启动子互作的调控模式,结果表明,elincRNAs与启动子间的互作更倾向于受转录因子的调控。并通过小鼠ES细胞elincRNAs与启动子高置信度互作集合的评价表明,基于转录因子斯皮尔曼相关性识别的elincRNAs与启动子互作是最优的预测集合。构建基于elincRNAs与启动子互作高置信度集合的互作网络,以及基于转录因子相关性的互作子网络,网络拓扑特征的分析结果表明,子网络的网络特性与互作网络相似,elincRNAs特异靶向一些启动子,而非广泛地调控。对互作子网络进行模块挖掘以及功能富集分析,一些模块富集在RNA聚合酶Ⅱ结合的转录激活的转录因子的功能,并ES细胞和胚胎发育相关功能。因此,elincRNAs可能参与靶基因转录的激活作用。综上所述,本研究识别一组小鼠ES细胞中表达的转录本边界相对完整的lincRNAs集合,并基于机器学习模型识别elincRNAs与plincRNAs的调控特征,在小鼠ES细胞中识别elincRNAs与其靶向启动子的互作关系。本研究不仅发现并研究小鼠发育过程中重要的lincRNAs,对于系统研究早期胚胎发育lincRNAs对基因表达的调控也具有重要意义。
其他文献
文章根据"数据库系统原理及应用"课程的特点,分析了目前该门课程教学存在的问题,并从整合教学内容、创新教学方法与变革考核方式等方面提出了"数据库系统原理及应用"教学改革
本文主要分析了焦化化工产品产率的影响因素以及提高措施,重点介绍了多种焦化化工产品产率的措施与方法,这些方法不仅能够克服现有焦化化工产品生产的缺点,而且具有多种特有
The“praise ballad”is a specific type of local folk literature handed down from generation to generation in traditional agricultural and fishing societies by m
该文对上海中心城现状进行分析,提出优化上海中心城整体空间景观的原则和措施,为营造上海良好的城市景观提出了建议。
【摘 要】园林绿化工程包括水景、园路、假山、给排水、造地型、绿化栽植等多项内容,无论那一项工程,从设计到施工都要着眼于完工后的景观效果,营造良好的园林景观。由于园林工程有多项内容,在施工过程中往往由多个施工单位建造,因此,若在施工组织、施工配合、成本控制上出现问题则会影响施工进度,拖延工期,影响工程质量。因此,要注重做好园林绿化工程施工管理工作。  【关键词】园林绿化;工程;管理  一、施工组织 
抽水蓄能电站通常采用地下厂房,洞群繁多,相对于其他事故事件,抽水蓄能电站水淹厂房具有损失大、影响面广、持续时间长、修复重建难度大、恢复投产周期长等特点.一旦发生水淹
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
小于胎龄儿(SGA)体格发育障碍的发生率较适于胎龄儿高,而且其经常并发围生期窒息,所以常可能导致一些神经系统后遗症。SGA的发生主要与母体因素有关,包括妊娠妇女的人口特征
一、激励与激励机制的概念激励是组织通过设计适当的外部奖酬形式和工作环境.以一定的行为规范和惩罚性措施,借助信息沟通,来激发、引导、保持和规划组织成员的行为,以有效地实现