基于图能量的蛋白质图形表示及应用研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:aolade
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的顺利实施,海量的基因和蛋白质数据随之产生,再加上互联网的发展与普及,生物信息学在近些年来得到了迅猛发展。DNA是遗传信息的携带者,蛋白质是生物体的基本构件,是生命活动的重要物质基础。生物体的一切生命活动都要通过蛋白质的结构和功能体现出来。研究发现蛋白质的功能是由其内在结构决定的,蛋白质的一级序列决定其高级结构,蛋白质序列分析是生物信息学中一个非常重要的基础性问题。本文从编码20中氨基酸的密码子出发,利用数学工具与方法,计算氨基酸的图能量(Graph Energy)和拉普拉斯能量(Laplacian Energy),构建模型对蛋白质序列进行数值刻画,进而对蛋白质序列进行相似性分析以及亚细胞定位预测。本论文的主要研究工作以及创新点如下:  (1)首先从编码20种氨基酸的密码子出发,基于一种新颖的DNA序列的二维图形表示,构造了20中氨基酸的图形表示。应用图论知识引入了20种氨基酸的图能量和拉普拉斯能量。首次将图能量和拉普拉斯能量引入蛋白质序列的研究中来,并提出一种蛋白质序列的新颖的二维图形表示。事实证明,本文提出的蛋白质序列的图形表示方法是简单的、有效可行的:无重叠和交叉、未丢失序列信息、视觉效果直观。  (2)基于本文提出的氨基酸的图能量,提出了蛋白质序列的图能量的概念,并给出了计算方法,进一步定义了蛋白质序列图能量增益的概念及计算方法。进而提出了一种依赖于数据集中蛋白质序列的相似性分析模型。通过分析ND5和36条蛋白质序列两个数据集,建立了相似性分析模型。为验证模型的有效性,将模型应用到24条转铁蛋白和27条抗冻蛋白两个数据集上,均得到了与现有算法一致甚至更好的结果。  (3)在建立蛋白质序列用二维图形表示之后,采用离散小波变换的方法构建每条蛋白质序列的特征向量。这样把蛋白质序列转换为相应的特征向量,再应用支持向量机进行蛋白质亚细胞定位预测。本文比较分析了凋亡蛋白数据集CL317、ZD98和ZW225,在Jackknife检验下总体的分类精确度分别达到99.4%、99.0%和98.7%。较以前的方法有了更高的准确率,分类性能也有了很大的优化,并且新算法更为简洁、容易实现。另外,将本文提出的方法(DWT_SVM)应用到由有一个或多个亚细胞位点的蛋白质组成的真核基准蛋白数据集iLoc8897上,得到了理想的结果:较高的整体准确率和平均正确率,尤其对某些细胞器的预测结果达到前所未有的高度。  事实证明,本文提出的20种氨基酸的图能量和拉普拉斯能量在一定程度上能很好的表征20种氨基酸,基于此提出的蛋白质序列的新的二维图形表示方法是简单的、有效可行的。在此基础上,本文提出蛋白质相似性分析模型和蛋白质亚细胞定位预测模型有效可行的、易于实现的。
其他文献
经典的ADF检验和P-P检验方法解决了误差为弱平稳或强混合平稳的时间序列数据的单位根检验,在这些检验中都假设时间序列过程的单位根是确定性的,但实际的金融时间序列数据分析表
无线脉冲序列首先是由Chu和Colbourn在[5]里面提出的.无线脉冲序列的提出是为了研究带有非调制跳时机制的超宽带无线射频序列或信号的.同时,应用于无线通信中的超宽带系统近来
白噪声分析理论由T.Hida于1975年开创,该理论本质上是一种无穷维的Schwartz广义函数论,有着深刻的物理背景,近年来得到了数学物理界的广泛关注。Hida首先把Brown运动轨道泛函看
据报载:大贪污犯、原沈阳市市长慕绥新的辩护律师事后感慨:贪官们之所以猖獗,是因为我国现行权力监督机制存在三个误区,即上级监督不到,同级监督不了,下级监督无用。不破三
在科学技术飞速发展的时代,教育改革已成为世界教育的潮流。教育改革注重学生的全面发展,注重学生素质的提升,以使新时代的学生能适应未来社会发展的需要。江泽民同志曾指出:
本文主要研究了扩散方程在非匹配扭曲四边形网格上的单调有限体积格式。首先,在非匹配扭曲四边形网格上建立辅助网格即建立多边形的单元节点控制体,该格式的未知量定义在单元节
党的十六届四中全体现了一个重要想,就是要以提高党政能力为重点,全面党的建设新的伟大工按照不断提高党执政“五种能力”的要求,工作要着重围绕“突强党的执政能力建设主线,
我们党的思想政治工作,无疑是用马列主义、毛泽东思想,用无产阶级的高尚情操和优良传统去宣传人、教育人、启迪人、诱导人,使人们在总的目标召唤下统一认识、统一思想、统一
在研究图的相关性质及应用的很多文章中用相关的多项式不变量来刻画图类,如特征多项式,匹配多项式,色多项式,多色多项式,Tutte多项式,亏格分布多项式,全嵌入分布多项式等,如何求出图
本文在广泛查阅国内外有关基于内容的图像检索技术CBIR资料的基础上,针对基于内容的图像检索系统特点,重点在图像检索技术、图像数据库设计、图像相似性匹配算法及相关性反馈检