基于氨基酸理化性质和位置特征的蛋白质序列比较及其应用

来源 :山东大学 | 被引量 : 0次 | 上传用户:tianjinajun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术和高通量生物实验技术的大力发展使得生物信息学迅猛发展,大量生物分子序列被获得。如何有效地从这些生物分子序列中提取信息,研究序列之间的关系,是揭示生命发展的重要基础。蛋白质是生命体的物质基础,细胞中的多种功能都是由蛋白质控制和调节的,因此,研究蛋白质序列很是有价值的课题。本文考虑氨基酸的理化性质信息以及每种氨基酸在序列中的相对位置信息,结合图能量理论,提出了新颖的方法将蛋白质字符序列转换成数值向量,利用MATLAB软件对蛋白质序列作相似性分析以及功能性蛋白的预测,结果证实该模型具有可行性。主要内容及创新点:(1)基于氨基酸的理化性质和20种氨基酸在蛋白质序列中的相对位置信息构建01稀疏矩阵,得到数值向量。首先根据两种重要的氨基酸理化性质的实验数据以及数值权重得到氨基酸的排列顺序。然后,根据此顺序搜索蛋白质序列得到位置稀疏矩阵。最后根据得到的稀疏矩阵画出序列的二分图,通过计算二分图的能量,将蛋白质序列转化成数值向量。(2)本文将得到的数值向量调整为概率分布向量,同时修改相对熵距离为对称的相对熵距离。然后应用对称的相对熵距离计算蛋白质序列两两间的距离得到距离矩阵,并用得到的距离矩阵构建系统发生树对结果作分析。(3)根据本文提出的蛋白质序列数值转换模型进行序列比较。为了证实提出方法的高效性和可行性,本文将该方法应用到9个物种的ND5数据集、转铁蛋白数据集、抗冻蛋白数据集和50个物种的β珠蛋白数据集上。与已有的算法比较以及与经典的比对算法Clustal W构建的蛋白质聚类树比较,实验结果几乎一致甚至更加合理。(4)在建立的蛋白质序列数值转换模型的基础上,再融合氨基酸的组分动量向量和加权的组分特征,构建一种新的蛋白质序列特征提取方式。将样本的特征向量输入到支持向量机(SVM)分类器中进行预测,并用5折交叉验证法确定模型的参数。用4个经典评价指标作预测性能评价,在抗癌多肽、过敏性肽、细菌黏附素、真核细胞毒蛋白和HIV蛋白等多个数据集上证实了该模型的预测性能非常好且具有普适性。本文提出的根据氨基酸理化性质和氨基酸相对位置特征的数值转换模型在蛋白质序列相似性分析和功能性蛋白预测方面都是非常合理有效的,该方法对药靶相互作用研究、疫苗的研发、疾病的治疗有一定的帮助。
其他文献
当代工程观反映了当代工程科学和工程技术与社会、经济、文化、生态交叉融合、协调构建的新趋势,对于开展工程教育和培养中国现代化建设的工程人才有重要意义。文章分析了在当
在中国现代美术当中,红色革命题材的创作是非常有特色的。沈尧伊先生作为一位坚持表现红色革命题材的艺术家,其作品表现着一种正气、一种大气、一种民族感与文化感,以及以美、以
报纸
从某种角度而言,公共关系可以说是商品经济高度发展过程中的产物,不仅能够有效帮助企业和公众沟通、相互协调,以及缓和亦或是化解两者之间存在的诸多矛盾。从而获得公众对企
近日,百度CEO李彦宏在2019年百度AI大会上被观众泼水的事件,引起广大网友关注。评论区里,诸如“怎么不用开水”、“干得漂亮”、“这样的勇士应该更多一点”成为被点赞最多的言
报纸
母猪繁殖性能是影响养猪场经济效益的直接因素,因此.养殖人员必须注重提高母猪繁殖性能。本文主要分析了影响母猪繁殖性能的营养因素.并针对不同阶段的营养调控措施进行探讨。
为了对大型舰艇编队通信指挥的效能进行评估,根据层次分析法原理建立了一套大型舰艇编队通信指挥效能的评估指标体系,采用基于层次分析和模糊综合评判的方法对大型舰艇编队通
目的:探讨中药汤剂熏洗联合外用药膏治疗慢性手足湿疹的,临床疗效。方法:随机选择148例慢性手足湿疹患者分为治疗组与对照组。治疗组80例给予祛湿汤熏洗。同时配合药膏外用。对
<正>《犯罪与改造研究》月刊是由司法部主管、司法部预防犯罪研究所主办,经国家新闻出版广电总局批准出版的专业性理论期刊。创办31年来,已经成为我国预防犯罪、监狱、强制戒
机械基础楚机械类专业的专业基础课,铰链四杆机构这一章是本书的重点,而《铰链四杆机构的演化》这一课则是本章的难点。文章通过精心的教学设计,给学生带来了截然不同的课堂效果
领导创新事关领导主体自身的得失成败,更事关领导客体的切身利益和现实命运,对于提高领导水平和执政水平、不断增强所在组织和领域的综合实力与竞争力,更好地赢得未来成功,具