基于重复信息测定与卷积神经网络的蛋白质亚细胞定位研究

来源 :济南大学 | 被引量 : 1次 | 上传用户:angyer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细胞由细胞膜、细胞核、内质网等被称为“亚细胞”的各部分组成,亚细胞的功能由位于其中的蛋白质执行。蛋白质的亚细胞结构被叫做蛋白质的“亚细胞位置”。蛋白质必须被运送到适当的亚细胞位置才能正常发挥功能,否则会产生机体功能紊乱和疾病,因而准确的了解亚细胞定位信息对于深入了解蛋白质的功能、细胞生命活动等具有重要意义。同时,蛋白质数据本身的海量、多模态、关联性、不完整等特征,使蛋白质亚细胞定位问题成为生物信息学领域具有挑战性的研究热点。蛋白质亚细胞定位问题一般分为三个步骤,分别为特征提取、分类预测和算法评估。特征提取是最关键的一步。通过对蛋白质序列进行分析,提取主要特征,建立特征向量;分类预测是将特征提取的特征作为分类算法的输入送到不同的分类器中;算法评估是评估分类结果,判定特征提取方法和分类算法的优劣。本文围绕蛋白质亚细胞定位问题,主要进行特征提取方法和分类算法两个方面的研究。论文工作如下:(1)针对传统特征提取方法上的不足,本文提出三种新的基于重复信息测定的特征提取方法,分别为R-Dipeptide、I-PseAAC、PseAAC2。其中,R-Dipeptide通过窗口移动测定关键信息,并通过增加关键重复信息提取二肽特征;I-PseAAC在R-Dipeptide的基础上,计算了每个残基与其之后残基的理化性质之间的差异,与传统的PseAAC方法相比,在提取蛋白质位置信息上做出了调整;PseAAC2则在R-Dipeptide的基础上,计算了每个残基的整体理化性质、每个残基与其他残基整体理化性质的乘积来反映不同残基之间的特征差异。实验结果证明,本文的特征提取方法在增加关键重复信息、提取不同的位置信息和比较残基间的整体理化性质差异等方面优于传统特征提取方法。(2)引入卷积神经网络进行蛋白质亚细胞定位。卷积神经网络具有特征的自动提取和归纳能力,基于前文涉及的特征提取方法,本文利用卷积神经网络对蛋白质亚细胞定位特征进行二次提取,进一步精炼特征,提高分类精度。与不同分类器进行实验比较,卷积神经网络算法在预测精度上优于多标签K近邻算法和支持向量机算法。(3)对卷积神经网络的一阶梯度下降训练算法进行了改进。实验结果显示,使用二阶算法的卷积神经网络均方误差的下降速度快于使用一阶算法的卷积神经网络。本文通过特征提取方法与分类算法两方面的研究,有效提高了蛋白质亚细胞定位问题的预测精度。
其他文献
以“一带一路”建设、智能航运等新形势发展为背景,分析港航人才培养的现状与不足,从三个不同层面分析新形势、新业态对港航管理人才提出的新要求——“学习型”管理人才、“
目的以一磷酸胞嘧啶核苷为例建立快速溶剂萃取仪萃取婴幼儿配方乳粉中核苷酸的方法并探讨其使用价值。方法在底部已经放好乙酸铵、乙酸钠、乙二胺-N-丙基硅烷(PSA)的萃取池中加
本齐格酒庄(BenzigerFamilyWinery)位于美国加利福尼亚州索诺玛县葡萄酒产区.该酒庄在葡萄园放牧绵羊已有十多年的历史,这不仅使土壤质地得到了改善,也使酒庄具有了与众不同的
期刊
以贵州省药用植物香薷新鲜地上部分为原料,采用水蒸气蒸馏法提取挥发油,采用水溶液法制备香薷挥发油β-环糊精包合物,利用星点设计-效应面法对其包合工艺进行优化,结果表明,
作为一名教师在改学生作业时写的评语既是一种作业批阅的方式,又能便于学生更清楚地了解自己作业中的优缺点,还可加强师生间的交流,促进学生各方面和谐统一的进步。$$对于数学作
报纸
自2011年以来,随着我国小微企业融资发展步入“新常态”,“三农”问题也进入了新的历史发展时期。十九大报告提出实施乡村振兴战略,这是我国很重要的一个战略选择,提出了“产业兴旺、生态宜居、乡风文明、治理有效、生活富裕”其中产业兴旺是乡村振兴最为关键的内容,如何实现产业兴旺也是舟山特色农业发展的关键点。精准扶贫思想是一个行动理论,其提出有实践和理论渊源,目标是到2020年现行标准下贫困人口全部脱贫。随
公丁香为桃金娘科植物丁香Eugenia caryophyllata的干燥花蕾.原植物系常绿乔木,主产于桑给巴尔、马达加斯加、斯里兰卡、印度尼西亚等地,我国南方已大量引种.作为中药,公丁香
网络媒体不同于广播、报纸、电视的最大特点就是交互性,它不仅单向地传播信息,还可以接受受众的反馈,适时调整、时时更新,为广大受众提供多样化、个性化的媒介交流资源,以满足受众
2015年,并购尤其是跨境并购有望大面积发酵。$$  如果说2014年下半年并购政策的松绑是温热并购市场的“第一把火”,近期证监会关于并购融资的进一步解绑则是“第二把火”。异
报纸
薯类食品是指以薯类为主要原料,经过加工制作而成的食品。包括马铃薯、甘薯(红薯)等加工食品。薯类除了可加工为淀粉产品,如粉丝、粉条、粉皮、凉粉、木薯粉虾片之外,还可加工