基于神经网络的蛋白质分类

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:clhsmith001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质被认为是生命中的基本要素,具有维持生命的各种功能,这也使得蛋白质组学成为现代生物信息学中非常重要的研究领域。由于蛋白质根据其功能可以分为不同的类别,而同一类别的蛋白质具有相似的结构,同时,它们也具有相似的性质,因此,研究蛋白质的分类对确定其功能有着重要的意义。而随着生物技术的发展,大量的蛋白质被发现,其中只有少部分通过实验分析确定了它们的结构以及相应的生物功能,对于快速增长的蛋白质数据,采用实验的方法分析需要耗费大量的人力和时间。因此,通过计算技术对蛋白质进行分类并研究其功能以更好地理解生命周期背后的理论变得越来越重要。如今,机器学习和神经网络技术被广泛地应用于生物信息学问题当中,其利用学习的方式从大量的数据中提取知识,进而分析其背后的规律。而在许多问题中,这些数据可以由图、网络、树或序列的离散结构自然地表示。本文以蛋白质为研究对象,将蛋白质转化为图结构模型,通过提出的VES(Vertex Edge Similarity)图核函数对蛋白质图结构提取特征,并结合DNN(Deep Neural Networks)构建出对蛋白质分类的VES-DNN模型。通过实验结果验证,VES-DNN模型的分类效果优于其他图核。另外,在此基础上,本文利用多核进行集成学习,提出MultiKernel-Stacking(Multiple Kernel Stacking)蛋白质分类模型,并通过实验结果可以得到,该分类模型优于VES-DNN模型。本文主要的研究内容如下:1.提出了VES图核函数。首先,将图的赋权邻接矩阵中的每一行作为对应顶点的向量,通过比较两图中顶点向量的相似性来度量两图的相似性,并根据两图顶点的最大相似度来确定核值。2.提出了基于VES图核函数的VES-DNN蛋白质分类模型。根据VES图核函数得到关于蛋白质图结构样本的核矩阵,将核矩阵中的每一行作为神经网络的输入特征向量,得到分类结果。通过实验结果表明该模型可以有效的提高蛋白质的分类效果。3.提出了MultiKernel-Stacking蛋白质分类模型。该模型通过Stacking集成学习的方法,将多个图核函数的VES-DNN模型分类结果组成的向量作为神经网络的输入,得到MultiKernel-Stacking模型的分类结果。通过实验结果分析并与VES-DNN模型比较,该模型进一步提高了蛋白质的分类效果。
其他文献
第29届奥运会乒乓球男单决赛是我国的两位直拍运动员马琳和王皓的对决,马琳采用的是中国传统直板快攻型打法,王皓采用的是直板快攻结合弧圈打法,结果是马琳以4:1战胜王皓.依据三段
晕动片为抗晕动药物。每片含氢溴酸东莨菪碱0.2mg,硫酸阿托品0.15mg,苯巴比妥30mg,主要通过东莨菪碱对前庭神经内耳功能、大脑皮层和胃肠道运动的抑制而起抗晕动作用,苯巴比
分子印迹技术(molecular imprinting technique,MIT)指的是将模板分子与功能单体在一定的条件下通过共价或者非共价作用形成孔状聚合物的一门技术。分子印迹聚合物在空间结构
目的探讨自体大隐静脉上肢移植内瘘的建立方法,观察其临床应用价值。方法选择北京市海淀医院肾内科12名终末期肾脏病患者,经超声检查证实上肢无合适血管建立动静脉内瘘,且超
陶瓷行业是佛山地区的传统知名行业,拥有数量众多而且配套齐全的陶瓷生产企业,大部分陶瓷企业是高耗能的用电大户。笔者通过对陶瓷企业专变电力用户(以下简称陶瓷企业)无功补偿设
<正> 快乐教学是以人为本,以学生为主体的教学,也是以培养学生创造性思维为核心的教学。创造性思维是学生学习必不可少的心理因素或条件,是学生今后立足社会、成才创业必备的
<正> 教学目标: 赶超组 1、把课文读准确、流畅、有感情。 2、理清作者的游览顺序。 3、通过语言文字,弄清景物特点,并能用自己的话把某一景点介绍给别人。
孔子云:"工欲善其事,必先利其器。"思想政治课教学,也需要有合适的"利器"。合适、有效的教学方法,就是突破教学难点的"利器"。《生活与哲学》中哲学概念、原理的概括性和抽象性,增加
<正> 众所周知,教学是一门科学,同时也是一门艺术。历来所谓“教无定法,贵在得法”,其精髓也就在这个活字上。那么,如何让数学课堂活起来呢? 一、唱好课始“开讲”曲 这是激
目前,以导学稿为载体的“教学合一”和“小组合作”教学模式正在很多学校中施行,这两种教学模式都十分强调“课前预习”,或称“前置学习”,但笔者发现,在科学探究中进行“前置学习