不同表达水平基因内含子与mRNA序列的匹配特征

来源 :内蒙古农业大学 | 被引量 : 0次 | 上传用户:JK0803_lichunfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全基因组高通量测序工作的完成,人们已经获得了大量的基因序列信息,通过对基因序列分析发现整个基因序列的绝大部分都是非编码序列。这些非编码序列对真核生物基因表达及调控的复杂性和完善性极为重要。内含子作为一类特别的非编码RNA(non-coding RNA,nc RNA)与编码序列一起转录,转录共剪接形成成熟mRNA后,内含子与mRNA脱离。剪切后的内含子具有复杂多样的生物学功能。前期研究表明,内含子与相应mRNA序列之间存在相互作用,对基因表达发挥重要意义。基于这一思路,本论文主要采用改进的Smith-Waterman局域比对方法,研究了不同表达水平基因内含子在mRNA序列及功能位点区域的分布规律,并对二者相互作用机制进行了较为详实的探讨。主要研究结果如下:(1)内含子在前体mRNA中普遍存在,它们能够调控基因的表达。我们主要研究了线虫不同表达水平基因内含子与mRNA序列之间的匹配特征。所有基因内含子在mRNA序列上的相对匹配频率分布恰好位于高表达基因和低表达基因之间,表明高表达基因和低表达基因中的内含子可能分别扮演着不同的角色。高表达基因内含子序列与mRNA序列的匹配强度高于低表达基因,尤其在低GC匹配片段3’UTR区的相对匹配频率差异显著。不同表达水平基因内含子在编码序列上存在多个匹配的偏好区域和非偏好区域,尤其在高表达基因中显著。在高表达基因和低表达基因的翻译起始位点和翻译终止位点附近功能区,相对匹配频率分布存在明显差异。含有Cp G岛的mRNA序列相对匹配频率高于无Cp G岛的序列,尤其在高表达基因的3’UTR区显著。此外,我们还发现最佳匹配片段的序列特征与mi RNA功能类似,属于新的一类RNA功能片段。不同表达基因的内含子有助于识别翻译起始位点和翻译终止位点。(2)在真核生物中,外显子连接复合体(Exon junction complex,EJC)在mRNA中外显子-外显子连接上游的特定位置剪接后组装。基于对线虫高表达基因和低表达基因中外显子连接序列与相应内含子序列之间最佳匹配片段的分析。本研究得出最佳匹配片段在高GC含量、高CG二核苷含量和高Cp G含量三种情况下,低表达基因长内含子更易于结合EJC蛋白。同时,最佳匹配片段只有在高Cp G含量中,低表达基因高密度内含子与EJC结合才最显著。然而,在只包含一个CG二核苷和中Cp G含量中,高表达基因的长内含子更易于结合其它蛋白。结果表明高表达基因和低表达基因内含子序列、结合蛋白和编码序列分别形成各自相互作用网络,它们之间都存在相互竞争和相互协作的关系,通过相互作用共同完成基因表达的调控。高表达基因和低表达基因内含子与外显子连接序列相互作用可能为我们提供一个有效预测EJC结合区域和其它蛋白区域的方法。(3)以8种模式生物的高表达基因和低表达基因作为研究对象,探讨各物种不同表达基因内含子在mRNA序列上相对匹配频率的分布。所有物种在mRNA序列上的相对匹配频率分布呈现高度的普适性,内含子与UTR区的匹配强度远远高于编码区。高表达基因内含子在UTR区的相对匹配频率分布高于低表达基因,特别是线虫在3’UTR区相对匹配频率差异显著,而拟南芥在5’UTR区相对匹配频率差异显著。所有物种在低GC片段下,内含子在UTR区匹配强度最高,而在CDS区匹配强度最低。脊椎动物和植物在高GC片段下,高表达基因内含子在5’UTR区匹配强度显著高于低表达基因。高表达基因内含子与UTR序列之间有较强的相互作用,进而推测通过它们之间的相互作用可以达到基因调控的目的,才能使内含子与UTR这两类序列进化具有趋同性,这种趋同性在高表达基因中更显著。高表达基因和低表达基因内含子与mRNA序列之间潜在的匹配关系存在显著的差异,我们的结果暗示它们之间的匹配强度与内含子增强基因表达能力相关。(4)分析了高表达基因和低表达基因最佳匹配片段的序列特征。最佳匹配片段的配对率分布遵循普适性规律,主要分布在55%~90%之间,这也反映了配对率的保守性。高表达基因最可几长度比低表达基因长,脊椎动物最可几长度比其他两类物种长。信息熵结果暗示高表达基因相邻碱基之间的关联更强或序列的结构序更强。大部分物种高表达基因GC含量的峰值都高于低表达基因。最佳匹配片段GC含量分布的范围最广,其中脊椎动物最佳匹配片段的分布比其他两类物种范围广。我们推测最佳匹配片段属于第三类功能RNA片段,高表达基因和低表达基因这类RNA片段分别执行不同的生物功能。
其他文献
河套灌区是国家重要商品粮油生产基地,但水资源短缺、土壤盐渍化和面源污染严重制约其农牧业发展。为了积极响应国家和地区农牧业高质量发展政策,实施了稳农增畜的产业结构调整,盐渍化土地资源发展牧草产业成为首选。紫花苜蓿作为一种优质的豆科牧草,产量高、营养价值好,能快速恢复改善农田生态系统。然而,在盐渍化浅地下水地区,水盐胁迫对苜蓿水氮利用及生理特性的影响机制尚不清晰,影响了盐渍化地区苜蓿的推广和高质量生产
学位
土壤盐渍化是制约河套灌区农业可持续发展和生态环境的重要因素,近年来,随着灌区引黄水量指令性减少和节水改造工程的实施,导致灌区作物种植结构、地下水位以及土壤盐分分布等均发生明显变化,特别是土壤盐渍化时空演变对不同外界因素的响应机制,以及节水条件下区域土地类型空间布局和土壤水盐变化趋势仍不清,而揭示其节水条件下区域盐渍化演变机制,并精准预测其未来发展趋势是制定有效的盐渍化防治措施的前提,同时也是实施大
学位
由于气候变化和人类活动,大气中二氧化碳(Carbon dioxide,CO2)含量排放增加严重。森林土壤是森林生态系统碳循环的主要碳库,其土壤有机碳密度和碳储量反映了森林生态系统的碳汇能力。提高森林土壤有机碳密度和碳储量是从人为排放中吸收CO2的有效途径。大兴安岭(Greater Khingan Mountains,GKM)林区是我国最大且集中连片的国有林区,土壤有机碳储量巨大,对气候变化敏感。研
学位
木材在生物进化过程中形成了独特的分子结构及细胞壁结构,是具有形状记忆效应的聚合物基天然高分子智能材料,可以通过压缩或弯曲等方法固定成临时形状,然后在水热响应下恢复到其原始形状。本论文提出一个全面、简单的描述木材形状记忆效应结构原理的模型。在这个模型中,木材被简化成具有“网络节点”和“可逆开关”部分的键合结构。本文通过研究负责控制木材在水热响应下形状固定和恢复的开关单元(switch units),
学位
河套灌区的土壤盐渍化问题是影响其农业可持续发展的主要原因,由于限制性引水政策和节水改造工程的持续推行,灌区农业水文过程发生了显著变化。引排水量的减少以及灌排系统不配套导致引入的盐分无法顺利排出,大量盐分滞留在灌区内部并进行着重分布,而这一过程主要发生在耕荒地之间。本文选择河套灌区典型斗渠尺度灌排单元为研究对象,明晰其农业水文过程,优化干排盐系统,即科学配置耕地与荒地规模布局,使区域内部累积的盐分合
学位
以大渡河枕头坝水电站为例,依据齐口裂腹鱼的洄游水力学特性,通过RNGκ-ε紊流模型和VOF自由液面处理的三维紊流数值模拟来研究不同工况下的流态。基于齐口裂腹鱼对不同流态的响应关系,预测了近坝区的上溯洄游路线。结果表明,枕头坝下游齐口裂腹鱼的洄游路线在两种典型工况下各有左右岸2条,两种工况下鱼类均能顺利的洄游到坝前位置,鱼道进口位置均处在两种工况下的洄游路线1上;#1和#2鱼道进口水流紊动过大,建议
期刊
减少和限制碳排放是缓解全球气候变化的战略需求,森林固碳是实现碳中和目标经济高效的可行途径;水作为森林中最活跃、影响最广泛的因子,直接影响森林生态系统的生产力。全面、系统地探讨森林生态系统碳水交换过程与互作机理,对于森林生态系统碳汇能力的科学评估、森林生态系统的可持续经营管理和缓解全球气候变化风险具有重要的意义。为了更好地理解寒温带森林生态系统碳水循环的关键过程和机理,本研究在内蒙古大兴安岭森林生态
学位
及时有效的提高近地表土壤水分的估算精度及空间分辨率,对内蒙古草原干旱灾害的防灾减灾能力建设和筑牢北疆生态安全屏障具有重要的意义。本文首先利用多源遥感数据、野外实测土壤水分数据、气象站点实测数据、土壤水分产品数据等,从乌审旗县域、内蒙古区域以及内蒙古草原区域等多个尺度,优化与改进光学遥感土壤水分反演模型,建立微波三角土壤水分指数,采用机器学习技术构建了光学微波多源遥感土壤水分模型。其次利用不同降尺度
学位
土壤盐渍化一直困扰内蒙古河套灌区农业生产的发展,灌区肥料利用效率低,导致肥料流失严重,对灌区农田环境造成严重面源污染。土壤盐渍化与面源污染问题已成为制约灌区粮食安全与环境安全的重要因素。乌梁素海作为我国北方地区重要的生态安全屏障,多年来面临着湖泊水环境污染、水生态退化等问题,科学开展湖泊水环境综合治理首先要解决灌区内农业面源污染问题。本文利用Landsat8 OLI 30m分辨率遥感影像对耕地作物
学位
在流动沙丘上铺设沙柳机械沙障,是一种防风固沙效益优良的工程治沙技术措施,为我国荒漠化防治筑牢了坚实的根基。目前,沙柳机械沙障的劣化问题容易使其防风固沙效益减弱和丧失,已成为制约沙柳机械沙障使用年限的主要因素之一。在研究生态防护效益的同时也要侧重考虑沙柳机械沙障资源的可持续利用,因此了解长期沙漠环境中沙柳机械沙障的劣化过程及性能退化机理具有重要意义。本研究选择内蒙古库布齐沙漠已铺设1年至9年的暴露大
学位