小干涉RNA沉默效率预测和长非编码RNA表观调控研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:SleepOrWake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ENCODE计划揭示整个人类基因组的大部分会被转录,而其中编码蛋白的转录本只占很少一部分,大多数转录本是非编码RNA,如rRNA、tRNA、siRNA、 miRNA、piRNA、IncRNA等。它们构成了复杂的调控网络,可以精细地调控基因的表达。对这些非编码RNA的研究重新定义了“基因”的概念。本文以siRNA和IncRNA为研究对象,研究了影响siRNA的沉默基因效率的因素,分析了表观遗传修饰与IncRNA基因表达的相关性。RNA干涉是通过沉默特定基因研究基因功能的有力工具,并广泛应用于靶向药物设计,为基因治疗提供了新方向。对于小干涉RNA (siRNA)的设计而言,并不是针对靶基因的每个位点都具有同样的抑制效率。所以一个成功的RNA干涉实验,选择最佳沉默效率的小干涉RNA是最关键的一步。许多研究者已经总结了一些筛选原则,并利用各种机器学习算法优化siRNA的设计,但仍然未达到令人满意的效果。预测精度的限制主要来源于对分子机制缺乏完整的理解。目前所知:siRNA与Argonaute蛋白的结合是其行使功能的关键。在上游过程中,核苷酸组分和siRNA热力学稳定性影响着RISC沉默复合体的组装,进而决定siRNA的沉默效率。而下游过程中,对靶mRNA的可及性是否影响沉默效率还存有争议。Reynolds等人的实验证明siRNA的沉默效率不依赖于靶mRNA的特征属性,更倾向于受siRNA小分子固有属性影响。而Luo和Heale有着不同见解,他们认为靶mRNA的二级结构是沉默效率高低的决定因素,并将其应用到siRNA沉默效率的预测中。与此同时,有几个实验室的实验结果也支持他们的观点。尽管实验研究已经表明RNAi是依赖于ATP水解能的多蛋白参与的复杂过程,但一些细节还很模糊,比如RISC是如何寻找靶基因的?寻靶过程是否依赖结合位点上下文环境?所以发现一些潜在的影响因素是一项重要的任务近来,已有实验研究证明当miRNA结合位点处于AU-rich的上下文环境中,能够帮助miRNA与靶的结合;Sun等人认为在miRNA结合位点上游区域包含一些AU-rich motif,比如ARE(AU-rich elements)的核心序列‘’AUUUA",可以增加其抑制蛋白翻译的效率;Kertesz提出了一个包含侧翼序列信息的miRNA靶位点识别模型。但目前还没有针对siRNA结合位点上下文环境的研究。鉴于siRNA与miRNA分子机制的相似性,本文重点探讨siRNA结合位点两侧序列是否影响其沉默效率。这需要大量随机设计的siRNA作为统计样本,一个针对34个基因随机设计的2431个siRNA的数据库为我们的研究提供了可能。通过统计siRNA靶位点侧翼序列核苷酸分布特征发现:相对而言,高效率siRNA结合位点侧翼序列更富含AU核苷酸。进一步利用二项式分布算法统计6联体motif的偏好性,发现在高效siRNA结合位点上下文环境中偏好出现一些AU-rich motif,同样包含了"AUUUA"序列。综合所有影响因素(核苷酸组分、5’端与3’端稳定性差异、靶mRNA的可及性、侧翼序列核苷酸分布特征与AU-rich motif偏好性等),我们提出了一个新颖的两步算法用于预测siRNA效率。这一算法结合随机森林和支持向量机建立训练模型,去除冗余的信息,选择最佳特征子集,并能给出每个特征的贡献重要性指标。在独立测试集上预测的结果显示皮尔逊相关性达到0.721,而国际知名预测算法Biopredsi、i-score、DSIR和ThermoComposition21分别为0.671、0.668、0.645、0.680。对特征的相关性分析表明,靶可及性是最重要的指标之一。另外,当引入靶位点侧翼序列特征后,预测率得到显著提高。这说明siRNA与靶mRNA的相互作用不仅在结合位点区域需要合适的序列组分和结构状态,而且受到更宽泛的区域的影响,甚至可能有更多的RNA结合蛋白参与此过程。作为生命调控的新层面,长非编码RNA近年来受到广泛的关注,它的越来越多的功能也被发现,比如在基因组印迹、X染色体失活等表观遗传修饰通路中起到关键作用。但表观遗传修饰对IncRNA表达影响的研究相对较少,我们重点分析了11种组蛋白修饰(H3K4me1、H3K4me2、H3K4me3、H3K9me1、 H3K9me3、H3K27me3、H3K36me3、H3K79me2、H4K20me1、H3K9ac、H3K27ac)和一种组蛋白变体H2A.Z以及DNaseI高敏位点等染色质特征与IncRNA基因表达的关系。发现IncRNA与蛋白编码基因有着相似的规律:在TSS附近,组蛋白修饰H3K9ac、H3K27ac、H3K79me2、H3K4me2、H3K4me3、H2A.Z激活和增强基因的表达;3种组蛋白修饰H3K27me3、H3K9me3、H4K20mel抑制基因表达。
其他文献
目的:研究碱性成纤维生长因子(basic fibroblast growth factor, bFGF)单克隆抗体MabF7与替吉奥(S-1)单独及联合应用体外抑制小鼠Lewis肺癌细胞(LLC)增殖和诱导凋亡的作用;观察
[课标要求]用实例说明高技术产业在工业发展中的作用。[设计思路]创设情景人物——彤彤,一位科技爱好者。通过一家三代生活条件的巨大变化,使彤彤意识到科技进步的重要性。科
[目的]探讨不同养殖规模的牧场养殖效益情况及养殖效益差异的影响因素。[方法]以陕西省铜川、宝鸡、咸阳、渭南、延安及商洛6个地市共计63家肉牛场为研究对象,调查内容包括养
无论从教师教育课程改革前沿进展来看,还是就当前儿童严峻的媒体文化生活现状而言,均需要课程学者和其他教师教育工作者重视发展"儿童媒体文化研究",并将其列为教师教育新课
在公路工程的施工过程中,相比较于热拌沥青路面施工,温拌沥青路面由于施工温度较低、碾压温度范围区间更广,因此更加常用于公路工程的施工之中。对于温拌沥青路面施工,不仅能
在工程建设的设计、施工和管理各阶段中进行测量工作的理论、方法和技术,称为工程测量。工程测量是工程建设勘察、设计、施工、竣工验收、运行监测及管理等工序的基础,没有测
<正>曾问过许多成年人,中学语文课本中有没有现在还想重读的课文,许多人说还想再读读《项链》,可见《项链》的魅力。《项链》的魅力不仅在于作者塑造了一位颇具特色的女主人
通过实验模态测试与有限元理论分析相结合的方法,对金刚石圆盘锯的模态特性进行了研究,分别获取了金刚石圆盘锯的各阶固有频率,并用模态测试的实验数据验证、修正了有限元分析的
<正> 人民陪审制度是指从公民中产生人民陪审员参加法院审判案件的制度。它是否适应形势发展需要?笔者日前对重庆市沙坪坝区、永川市、江北县等5区(市)9县执行人民陪审制度的
为了解决大跨度、大空间现浇厚楼板的缺点,在楼板内永久放置BZS模盒,形成空腔。该工艺不但能提高楼板保温和隔音效果,而且可减轻结构自重,节省材料,提高抗震性能。本文介绍了内置B