机器学习方法在无序蛋白质预测上的研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:zhouyueying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
固有无序蛋白自身结构的松散性使得它可以与多种生物大分子结合,在细胞功能调节与信号传导中占据重要的角色,与许多人类重大疾病存在着密切关系,成为当前研究热点。然而由于无序蛋白自身结构的松散性,在自然状态下无法形成一个稳定的三维结构,使得它通过生物实验方法测定变得十分困难,通过计算方法进行预测成为无序蛋白研究中的有效途径。为此,本文引入深度学习算法,与传统机器学习算法进行比较,为固有无序蛋白的预测方法研究提供有效途径。本文首先基于Disprot无序蛋白数据库完成了数据集的构建和特征值提取,在此基础上通过对已有预测算法使用的特征集的优化组合,选取了进化保守性矩阵PSSM、氨基酸的物理化学性质与氨基酸的组成三种特征,构建了无序的组合特征编码模型。通过对传统机器学习算法(逻辑斯特回归、线性判别分析、K最近邻、朴素贝叶斯、决策树与支持向量机)和深度学习算法(卷积神经网络与循环神经网络)在无序蛋白预测算法中的应用进行了对比分析,基于不同的数据集应用不同的特征组合进行无序蛋白的预测实验,结果表明深度学习算法的准确度要明显优于传统机器学习算法,相较于支持向量机则有着更好的效率,可应用于无序蛋白的分类预测。论文最后基于包括深度学习在内的机器学习算法,给出了固有无序蛋白预测系统的设计与实现,为固有无序蛋白预测方法的进一步研究提供相应服务。
其他文献
对蛋白质二级结构进行预测,有助于理解蛋白质的三级结构,进而理解蛋白质的生物功能和蛋白质分子之间的相互作用关系。围绕蛋白质二级结构预测问题,涌现出了大量的计算生物学
回顾5.12汶川大地震医院志愿者在地震伤员救治中的作用及医院对志愿者的组织、管理,探讨大型灾害应急中医院志愿者的队伍建设及制度建设。
目的探讨舒适护理模式应用于口腔科患者的临床效果。方法选取208例门诊行口腔疾病治疗的患者,按就诊先后顺序随机分为观察组和对照组,每组104例;对照组采用常规护理,观察组在常规
极低出生体重儿(VLBW)的体格生长情况日益受到重视,有研究表明极低出生体重儿在系统保健监测下,生后2~3年内可表现出良好的追赶生长趋势,体格生长各项指标均达到正常范围,也有资料表
传统工艺作为我国优秀传统文化的重要内容,与人民群众生产生活密切相关,具有带动贫困地区群众就近就业、居家就业的独特优势,是助力精准扶贫的重要抓手。桂西地区是我国“十三五”扶贫攻坚主战场和传统工艺资源聚集区,该区域包括百色、河池、崇左所辖的30个县,其中国家级贫困县占全区总数的63.0%,该区域精准扶贫成效很大程度上关系到广西乃至国家脱贫攻坚的进展。近年来,我国高度重视传统工艺振兴助力精准扶贫工作的实