基于序列多信息融合的蛋白质亚细胞定位预测方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:hanwenjun07
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质的亚细胞定位与其功能密切相关。研究细胞中蛋白质定位的机制和规律,预测蛋白质的亚细胞定位,对于了解蛋白质之间的相互作用和功能具有重要意义。尽管传统的生物化学实验能够预测蛋白质的亚细胞定位,但是这种方法既耗时,成本又高。因此,我们迫切需要一些自动的、高效准确的蛋白质亚细胞定位预测方法。本文主要围绕这一主题,针对蛋白质序列的编码方法和分类预测算法两方面进行了研究,并在不同的数据集上分别进行了测试和分析。本文的主要创新工作概括如下:本文基于氨基酸的物理化学属性提出了一种新的蛋白质序列特征提取方法。该方法将一条蛋白序列转化为146维的特征向量,其中包含20维的氨基酸基本组成和126维的三肽组分。为了评价预测性能,我们采用支持向量机作为分类方法,分别在三个不同数据集上进行自检验和刀切法检验。实验结果表明,此方法对蛋白质亚细胞定位预测是有效的。为了进一步挖掘蛋白质序列中所包含的结构和功能信息,本文融合了氨基酸位置权重组分、二肽组成、氨基酸折射率相关系数三种特征,提出了一种新颖的蛋白质序列特征提取方法。该方法试图加入氨基酸的位置信息、局部顺序信息以及氨基酸残基之间的长程相关性。然后我们分别利用支持向量机和最近邻算法对凋亡蛋白和革兰氏阴性菌蛋白进行亚细胞定位预测。在刀切法检验下,两种分类算法都取得了较高的预测准确率。
其他文献
如今,随着信息技术的发展,Internet从最初仅有4个节点,主要用于军事目的的网络发展到今天能沟通一百多个国家,包含数百万个网络,连接数亿台主机,覆盖数十亿用户的全球性网络,
博客作为互联网上一种较新的传播形态,已经成为网络舆论传播的重要场所。以现代网络技术和通信技术为支撑,博客正越来越广泛的成为政府、企业、部门和团队之间的沟通工具。在对
访问控制通过对用户访问系统资源进行安全控制来保护系统资源。基于角色的访问控制模型适合对各种访问控制需求进行建模而且能够简化访问控制管理,基于角色的访问控制模型作为
随着改革开放的日益深入和交通、电信等相关产业的快速发展,在全球化迅猛发展的今天,商务和休闲旅游等跨区域移动外出活动日益频繁,仅以旅游为例,2010年我国境内旅游人数就高
网络技术日新月异的发展给人们的生活和工作带来了乐趣和便利,越来越多的人使用网络来处理各类事宜,网络的上的信息遍布各个领域,因此网络成为了黑客们攻击和入侵的沃土,他们
随着社会的进步,各行各业的流程日趋规范。从高校、税务局、工商管理部门等非盈利性机构,到餐饮、装备制造等盈利性组织,都遵循“按流程办事”的准则。信息化时代为流程的自
随着信息数字化的快速发展与生产力的突飞猛进,当今企业对信息的存储需求也在飞速增长。尽管存储设备的销售价格在不断地下降,但远远赶不上企业内部产生和需要保存数据的攀升
许多工业应用都涉及多孔介质内流体运动的问题,比如低渗透和特低渗透油气田开发、地下水的利用、煤气层的开采、以及金属材料的制备等等。建立一套软件,能够精确地对多孔介质
作为一个经典的NP难问题,车辆路径问题有着很高的研究价值。在现实中,良好的路径规划有助于节约资源耗费,降低成本,在中国物流行业快速发展的今天,对车辆路径问题的研究越来越重要
计算机网络技术的迅速发展,高带宽长时延的网络开始不断的涌现。信息化的高效和普及,高速网络越来越多的渗透到更宽广的研究领域中。现在一些应用如科学协作、远程医疗诊断、