真核基因剪接位点预测的新方法

来源 :北京大学 | 被引量 : 0次 | 上传用户:mhouwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核基因剪接位点预测方法的研究,无论对基因组大规模和高质量的计算注释,还是对剪接机制及其进化过程的分析理解,都具有十分重要的意义. 本文的第一部分(第一、二章)首先基于GenBank(第150.0版)构造了人类基因组成性剪接位点数据集HSSData;基于数据集HSSData,对当前常用的剪接位点预测方法GeneSplicer,DGSplicer,SpliceScan和SpliceMachine的预测精度进行了评测,并对它们进行结合使用的效果进行了评价.结果表明,对剪接位点附近序列提供的信息进行充分利用,是提高剪接位点预测精度的关键. 本文的第二部分(第三、四章)综合运用熵密度分布距离、权重数组、Kappa检验等方法,建立了描述剪接位点相关的剪接信号的模型;同时基于一种无监督自学习基序检测算法建立了剪接调节元件的统计模型,在此基础上设计了基于多层次支持向量机的剪接位点预测新方法,并对其预测结果进行了全面的评测和讨论.对人类基因组剪接位点数据的大规模测试结果表明,本文提出的预测方法能够有效地预测人类基因组中的剪接位点,预测精度不仅全面高于基于剪接信号的传统预测方法GeneSplicer,而且在总体预测精度上达到并大部分超过基于调节元件信号的预测方法SpliceScan.对于假阳性剪接位点含量较多的低GC含量的基因序列,本文方法的预测精度明显高于其他两种方法.这说明本文方法具有应用于实际序列分析的良好前景.特别地,本文的无监督自学习基序检测算法所检测出的调节元件,与实验确认的ESE/ISE调节元件保持了相当程度的一致性. 剪接位点预测工具链SSPred是对本文方法的实现.可从http://mech.ctb.pku.edu.cn/sspred/下载.
其他文献
随着中国国民经济的飞速发展,城市人口的不断增加,人民生活结构和生活方式的改变,城市垃圾的增长逐渐加快,而城市垃圾中的废旧塑料带来了越来越明显的危害.如何找到一条正确
连铸保护渣是影响连铸坯质量的重要因素之一,到目前为止,世界上几乎所有的板坯连铸机和大方坯连铸机都采用了结晶器的保护浇铸工艺.该课题研究以保护渣化学成分与其理化性质
随着社会的发展,科技的进步,使临床诊断迫切需要建立各种快速分析方法,传统的分析方法以化学法为主,常常包括一系列繁琐的操作过程,而且周期较长,远不能适应实际需要。生物传感器应
期刊
期刊
该文首先研究了吹氩后钢包内钢液流动的现象,并对流场特性进行了充分的分析.通过对江阴钢厂的精炼过程进行夹杂取样,分析了夹杂物在搅拌条件下长大的现象.随后建立了钢包水平
鳄鱼是一种古老的爬行动物,在进化史上处于重要的地位。日本科学家Kiyoshi Nagai发现,鳄鱼血红蛋白的氨基酸链有着非常奇特的球形构造,这种构造使鳄鱼血红蛋白的携氧量超过其
滑板是连铸系统中重要的功能元件,随着冶炼条件的不断变化和多炉连铸工艺的发展要求,滑板的操作条件更加苛刻.本文分析讨论了滑板的结合、增韧机理及损毁机理,利用XRD和光学
期刊
本文通过低倍组织观察,实验室升温氧化实验,加速腐蚀、电化学等腐蚀测试,并配合扫描电镜、X射线衍射等手段研究了稀土对430铁素体不锈钢的凝固组织、抗高温氧化性能和耐腐蚀性能