基于马尔科夫模型的蛋白质亚细胞位点预测方法

来源 :上海师范大学 | 被引量 : 1次 | 上传用户:xuru69
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,生命科学的研究重点从生物数据的获取与整理转移到其生物功能注释上,包括基因、蛋白质的功能与结构的注释,大规模基因表达谱中的基因表达模式分析等.其中,蛋白质亚细胞位点的识别是蛋白质功能注释的重要步骤,它对于开展生物大分子结构模拟和药物设计等都具有重要的意义.目前确定蛋白质亚细胞位点实验方法主要有,细胞分馏法,电子显微镜分析和荧光显微镜法,但它们普遍存在着主观性强,耗时等缺陷.因此,开发有效的计算预测方法具有重要的实际意义.在亚细胞位点方面,人们已经展开了广泛的研究,并且取得了一系列很有意义的成果,从而为研究蛋白质功能奠定了基础.目前存在的预测亚细胞位点的方法有很多种,但是每种方法都有其局限性,因此找到一种有效的可信度高的预测蛋白质位点的方法是很必要的.   本文第一章介绍了生物信息学的产生背景和主要研究内容.在第二章介绍了预测亚细胞位点的几种常用分类器和特征提取方法.在第三章,我们提出了一种基于马尔科夫模型的改进的预测方法.首先,对于一条给定的蛋白质序列,通过计算其在马尔科夫模型下20个氨基酸残基的状态转移矩阵,建立一个420维的特征向量,然后利用支持向量机进行训练和预测,最后通过央克刀检验,该方法的预测精度与以前的马尔科夫模型相比得到了一定的提高.  
其他文献
本文利用最近这些年非常流行的L1/2正则化方法研究BP神经网络的结构稀疏化。我们在传统的平方误差函数中引入L1/2正则项并且在训练过程中对连接输入层和隐层节点的权值向量的
本文研究的主要内容是积分区间在模糊集合上的积分研究,以文献[37]中模糊集合的划分为突破口,建立模糊集合上的s值函数为基础,进一步研究了实值可测函数在模糊集合上的积分,
本文首先对图像修复作了简要的介绍,对常用的图像修复模型进行了分析。针对整体变分(TV)模型在图像修复过程中对参数的选取比较敏感,而且运算量较大的缺点,本文考虑了待修复区域
钢铁工业的发展反映了国家综合国力的强弱和经济水平的高低。我国已成为了钢铁生产和消费的大国,但钢铁生产技术还亟需进步以满足钢铁工业持续快速发展的需要,也是成为钢铁强国
设AG(n,Fq)表示n维仿射空间,"(k,n)表示AG(n,Fq)中所有k-面构成的集合,设非空集族F(?)μ(k,n),若对于任意两个面F1∈T,均有dim(F1∩F2)≥t(n≥k≤t),则称F为一个t-相交族.设W1,W2,…,Wm是μ(k,n)中若干t-相交族,如果μ(k,n)中任一k-面属于且仅属于一个t-相交族Wi,则称集合{W1,W2,…,Wm}为n维仿射空间AG(n,Fq)中μ(
学位
学位
Markov链在概率论、排队论、Monte Carlo的算法研究、随机动力系统、迭代函数系统以及统计物理学的研究中有着重要的应用。Markov链的遍历理论是研究Markov链的渐近性态的理