基于卷积神经网络的蛋白质二级结构预测

来源 :齐鲁工业大学 | 被引量 : 4次 | 上传用户:Coolbear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质主宰着生命活动,使生命体呈现如今复杂多变的状态,在生命系统的构建中起了重要的作用。蛋白质二级结构是蛋白质形成稳定构象的重要基础,是研究蛋白质三维结构的重要前提。二级结构的研究可以为研究蛋白质的功能以及序列之间的相互作用模式提供基础,有助于理解生物的活动以及各类生物性状,有利于新药的研发。所以,从大量的蛋白质序列中提取出有用的生物信息是目前的重要工作。本文针对氨基酸提出来一种新的编码方式,即基团编码方式,这种编码方式是依据氨基酸内部形成稳定分子官能团定义的编码方式,42个官能团构成了基团编码方式。并且通过深度学习中的卷积神经网络和自动编码器进行特征提取。(1)基于新的基团编码方式的预测将基团编码与传统的正交编码方式用支持向量机(Support Vector Machine,SVM)进行分类预测,将得到的预测结果进行比较,选取的实验数据为CB513和25PDB。实验中设置2个实验,实验1:对基团编码和正交编码通过支持向量机进行结果对比,通过结果可以发现本文提出的基团编码比正交编码结果要高出1.08%。实验2:对基团编码和正交编码都选取两种不同划分格式的验证,即G、H、I是H,B、E是E,其它都是C以及H是H,E是E,其它都是C的划分格式。可以发现本文中选取的G、H、I是H,B、E是E,其它都是C的划分结构是所有结构中最难的,得到的准确率是最低的。(2)基于卷积神经网络的二级结构预测基于基团编码方式与位置特异性打分矩阵(position specific scoring matrix,PSSM)组合数据的特征提取,用卷积神经网络(Convolutional Neural Network,CNN)对组合数据进行特征提取后送入贝叶斯分类器中得到分类预测结果。用卷积神经网络提取特征后送入贝叶斯分类器中得到的结果要比直接送入贝叶斯分类器的结果高出5%。(3)基于自动编码器的二级结构预测将基团编码方式与位置特异性打分矩阵(PSSM)组合,分别采用单层和两层的自动编码器来进行特征提取,之后送入贝叶斯分类器中得到分类预测结果,可以发现含有两个隐含层的堆叠自动编码器的准确率是最高的,比单隐含层自动编码器高出1.04%,比贝叶斯分类器结果高出2.69%。
其他文献
本文在参考国内外文献资料的基础上,简要介绍了中国公路自然区划的研究现状,对中国公路自然区划研究的地统计分析模型需求进行了详细分析。本文论述了地统计模型建立的理论基
目的探讨颈动脉彩超检查在脑梗死患者中的临床应用价值。方法选取2013年5月—2015年12月收治的110例老年脑梗死患者作为观察组,同期选择健康体检者110例作为对照组。均采用彩
2012年3月在浙江丽水市龙泉市兰巨乡仙仁村土地整理后种植1年生油茶(Camelliaoleifera)嫁接苗,2015年5月分别套种落花生(Arachishypogaea)、大豆(Glycinemax)和稻(Oryzasativa)。7月起
分析实际工作中CT机经常会出现的故障及故障现象,提出维修方法。 Analysis of the actual work of CT machines often appear in the failure and failure phenomenon, prop
目的 通过与传统指腹静脉动脉化再植比较,探讨指侧方静脉动脉化重建供血再植末节断指的可行性及疗效.方法 将2006年3月至2013年1月巢湖紫晨手外科医院手外科中心收治并符合选
传统的前级DC/DC,后级DC/AC的两级式单相逆变器,由于交直流功率耦合,直流侧母线电压存在大量二倍输出电压频率的纹波电压。该二次纹波电压使交流输出侧的低次谐波含量增加,总
DNA甲基化是一种非常重要的表观遗传调控方式,参与细胞多种生理活动,在基因印迹、X染色体失活、染色质修饰及调控基因表达中发挥重要的作用。近年来发现的Pet (ten-eleven tr
融资功能是股票市场的基本功能之一,是股票市场与实体经济联系的重要机制,通过发行股票能够丰富企业融资渠道、更好地满足企业融资需求、优化企业资本结构、促进企业发展壮大,发
报纸
[目的]评价医源性抽血对初次单侧全膝关节置换术(total knee arthroplasty, TKA)围术期贫血的影响。[方法]回顾性分析2017年8月~2018年1月于四川大学华西医院关节外科行初次单
<正> 高射炮是一种比飞机诞生还早的防空武器,曾在防空作战史上写下过辉煌的篇章,但随着飞机性能的不断发展,飞行高度越来越高,飞行速度越来越快,加上精度更高的防空导弹的出