基于序列信息预测选择性剪接位点和盒式外显子

来源 :内蒙古大学 | 被引量 : 4次 | 上传用户:qlj403740087
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核生物基因序列包括编码的外显子序列和不编码的内含子序列,在转录过程中内含子被切除,外显子将有序的拼接在一起形成mRNA。而选择性剪接使得一个基因序列有多种剪接方式,并能产生不同的mRNA,进而编码多种蛋白质,选择性剪接是蛋白质多样性的重要来源。选择性剪接普遍存在于真核生物基因组中,人类基因组中一半以上基因存在选择性剪接,而且选择性剪接存在于不同组织细胞和不同发育阶段,贯穿整个生命过程,并与疾病密切相关。ESTS和微阵列实验是目前确定选择性剪接事件的主要来源,但这些实验方法操作复杂,并有很多不足之处。如何用理论和计算的方法识别和预测选择性剪接是目前生物信息学研究工作的重要任务。本文将基于基因组局部序列信息,用WebLogo、序列信息参量Mni和统计检验方法分析序列,并提取序列特征;用位置权重矩阵、离散增量、支持向量机和马氏距离判别式对选择性剪接事件进行了预测;并对剪接位点竞争机制和回文序列等选择性剪接有关机制进行了进一步研究。论文主要研究内容如下:1.首次运用位置权重矩阵和离散增量结合支持向量机的方法,基于序列信息预测分类了选择性5′╱3′剪接位点和假剪接位点。结果显示,我们的方法特异性为85.62%(81.19%)时,能预测88.74%(90.86%)的选择性5′(3′)剪接位点。2.基于剪接位点竞争机制,以序列特征为参数,用位置权重矩阵和离散增量结合支持向量机的方法预测了人类和小鼠的选择性5′/3′剪接位点和组成性剪接位点。我们的方法可以对67.88%(71.63%)的人类供体(受体)位点进行正确分类。供体位点的预测成功率接近目前最好的预测方法,受体位点的预测成功率高于目前最好的预测方法4~5%。并且我们的方法对小鼠选择性5′/3′剪接位点预测成功率可达到72%,可知我们的方法预测性能好,并具有一定的普适性和推广能力。3.以位置权重矩阵打分函数值来表示剪接位点强度,以打分函数相减值来表示剪接位点竞争机制,并基于剪接位点竞争机制,以打分函数相减值为唯一参数,预测了选择性5′/3′剪接位点。预测成功率与目前最好的预测结果相当。预测结果证明我们找到了表示剪接位点竞争机制的一个最佳参数:打分函数相减值。4.统计分析了盒式外显子和组成性外显子的序列长度、长度被3整除序列的比例、两侧剪接位点保守性等序列特征。用t检验方法统计计算了左侧内含子序列、右侧内含子序列和外显子序列的三联体组分信息,得到了CCT等差异显著的三联体。并基于上述序列特征用位置权重矩阵和离散增量结合支持向量机的方法,位置权重矩阵和离散增量结合马氏距离的二次判别方法对盒式外显子进行了预测。两种预测方法均约为60%。5.统计了盒式外显子两侧序列中的回文序列和两侧序列相互之间形成的回文序列,并与组成性外显子和随机序列的回文特征进行了比较。发现组成性外显子回文密度高于盒式外显子回文密度,并高于随机序列回文密度2~3倍。此统计比较结果为选择性剪接来源于组成性剪接的理论提供了又一个依据。6.本文还统计了肿瘤特异性剪接位点的序列特征,运用位置权重矩阵和离散增量结合支持向量机的方法预测了肿瘤特异性剪接位点,其成功率为62%,高于其它文献的结果。7.本文中首次把不同的选择性剪接模式产生的选择性供体(受体)位点归为一类,即把剪接位点分成选择性供体位点、选择性受体位点、组成性供体位点和组成性受体位点四个大类,进行了分析和预测。基于线虫选择性剪接数据的预测结果显示,把剪接位点分为四大类是可行的,这对今后的选择性剪接位点研究工作提供了一个新思路。
其他文献
心房颤动(房颤)是临床十分常见的心律失常,随着年龄增长发病率进行性增加。房颤的治疗有电复律治疗、药物治疗及介入射频消融治疗[1],前两种治疗效果不明显,且复律后维持时间短
与环境、健康或安全问题相关的问题已经迫使我们的从化学研究中寻求解决方案。离子液体(ILs)是一种新型的溶剂,由于其流动性和可设计性在科学和工程研究等许多领域都具有巨大的潜力。而有关离子液体基础性质的探究及其指导的潜在应用的相关研究也十分重要。近年来,为改善离子液体粘度大的缺点,很多学者做出尝试,将离子液体与有机溶剂或者其他的液体混合形成混合体系以提高离子液体的综合性质,并获得了显著的成果。本文通过
对腾格里沙漠东南缘沙坡头地区1989年建植人工植被区优势固沙灌木柠条(Caragana korshinskii)和半灌木油蒿(Artemisia ordosica)树干茎流及穿透雨的pH值,以及灌丛基部、灌丛
对中国各地的3237份食用豆类种质资源进行了抗旱性鉴定。利用甘肃省敦煌市的自然干旱条件,以株高、单株荚数、子粒产量3个性状的抗旱指数作为综合评定抗旱性指标。鉴定出1级抗旱资源
根据我国铁路旅客运输的特点,阐述在各种可选的铁路车票制式下,车票制票技术的发展和实现方法,对它们的核心技术和使用中的优缺点进行分析,在结合铁路客运专线售票对制票机的要求
交通网络系统对区域旅游经济发展至关重要,高速公路网络在交通系统中又扮演着重要的角色,对旅游目的地可进入性以及游客流量流向具有重要影响,而区域旅游经济发展又对高速公
硬茬复播田杂草种类达15科27种。采用除草剂JNH-1,JNH-2或JNH-3进行苗前土壤处理,对已出苗和未出苗的杂草皆有极显著防效,一次用药不仅可保证作物苗期免遭草害,而且对作物生育后期的杂草也可达到有效
马铃薯(Solanum tuberosum L.)是一种重要的粮食作物和经济作物。马铃薯脱毒种薯生产需要培养试管薯。马铃薯试管结薯能力主要受环境因素、内源激素水平和遗传因子的影响。DN
红脂大小蠹在吕梁地区主要以老熟幼虫,成虫,少量蛹在油松根部越冬,1年发生1代,主要以幼虫,其次是成虫取食韧皮部后,切断树木水分和养分通道而致树木死亡,越冬成虫于5月中旬进入扬飞
山区沟坝川地小麦套玉米“六二”式条带种植方式,把玉米套种时间提早了20天,有效积温增加300℃,小麦播期提早一个节令,冬前积温增加200℃,较好地协调了小麦,玉米高产生长发育规律需求,达到小