基于深度神经网络及集成学习的蛋白质相互作用预测研究

来源 :西京学院 | 被引量 : 0次 | 上传用户:peper127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是许多生命的物质基础,蛋白质之间的相互作用是大部分生物功能实现的前提。同时,研究蛋白质相互作用有利于药物和疾病的发现以及推动药物研究,蛋白质相互作用的研究也因此成为当代的研究热点之一。现有的预测蛋白质相互作用主要分为两种方法:传统的高通量实验方法和计算生物学方法。传统的实验方法由于其开销大、时间成本高成为阻碍其发展的主要因素。因此开发高效的蛋白质相互作用预测计算方法也日益迫切。本文提出两种计算方法,一种是基于深度神经网络,另一种是基于集成学习进行蛋白质相互作用预测。主要研究内容如下:(1)本文提出一种基于结构深度网络嵌入和随机森林的蛋白质相互作用预测方法。首先利用堆栈自编码器获得大分子的属性特征,其次利用结构深度网络嵌入方法在分子异构网络上获得另一种特征向量行为特征,在结合属性特征和行为特征后,利用随机森林分类器来预测蛋白质相互作用。在预测蛋白质相互作用时,得到结果的平均准确率、精确度、敏感度、特异性和MCC分别为83.12%、84.58%、81.02%、85.22%和66.30%。并且将所提出的方法与多种单一分类器进行比较,综合实验结果说明了本文所提出的方法可以有效的预测蛋白质之间的相互作用。(2)以蛋白质序列的方式来预测蛋白质相互作用。本文提出一种基于局部最优定向模式和旋转森林的蛋白质相互作用预测方法。首先将一维的蛋白质序列通过位置特异性打分矩阵转化成二维的矩阵形式,其次使用局部最优定向模式从所得的打分矩阵中提取特征向量,减少噪声对最终结果的影响。最后利用旋转森林对蛋白质相互作用进行预测。在预测酵母菌、人类和幽门螺杆菌时,所提出的方法平均准确率分别达到了90.48%、94.14%和94.89%。并且为更好的评估所提出方法的有效性,将本文所提出的方法和多种分类器进行了结果比较,并且与前人所提出的方法进行比较。经过大量实验表明,本文所提出的基于局部最优定向模式和旋转森林的蛋白质相互作用预测方法能够有效的预测蛋白质相互作用。
其他文献
为实现煤矿井下主动、全面、可靠的感知,本文将信息物理系统应用在煤矿井下,构建了煤矿信息物理系统体系架构,并从煤矿井下人环物感知方法、感知数据处理方法、感知系统的构建等几个方面对其感知层进行了研究。针对传统煤矿井下人员定位算法定位精度低且消耗的锚节点较多的缺点,本文提出了一种基于RSSI的迭代加权质心定位算法。该算法将RSSI测距算法与迭代质心算法与相结合,首先设置阈值来判断节点类型,之后在迭代过程
《朗读者》作为近年来我国最成功的综艺节目之一,以兼具文学性和娱乐性的节目内容,在受众群体中获得了广泛的关注和较高的口碑。对《朗读者》的内容生产进行深入探究,能够为
农业生物技术的发展历经传统农业时期的成形阶段、初步发展阶段到现代农业生物技术的腾飞时期,生物技术在农业生产中具有越来越重要的作用。传统农业时期,生物技术的应用始终以自然规律为客观指导,遵循人与自然和谐的生态伦理观,通过人工栽培与选择培育出更适于自然环境的作物。随着农业生产实践活动的不断深入,科学技术的快速发展,现代农业开始依赖技术、机械以及大量的资源消耗,人类由依附、顺从自然转变为对自然的控制和驾
随着我国经济与世界的接轨,政府对控制环境污染的力度越来越大,而火电厂是制造空气中的粉尘污染、氮氧化物、二氧化碳等污染物质的重要来源,因此燃煤火电厂对锅炉风量测量提出更高的要求。本文研究的AX公司火电风量设备属于工业品,对于传统的消费品市场营销与工业品的市场营销完全不同,它们各自市场营销的客户群有所不同,传统消费品的对象很多,而对于工业品的服务客户则相对更加固定。随着国内生产技术水平不断改进,火电风
高熵合金由于其独特的合金设计理念,具有较高的强度、硬度、韧性以及较好的耐磨损性能。热喷涂技术是表面工程领域内赋予材料表面新功能最有效的技术之一,将等离子喷涂技术与高熵合金材料结合,研究其微观组织与性能之间的关联,这对高熵合金涂层的制备技术、合金组织及性能研究具有很高的研究价值,并且对推进高摘合金在工业领域应用具有重要的指导意义。本文采用等离子喷涂技术制备FeCoNiCr系高熵合金涂层作为研究对象,
近年来,随着图像迁移领域的发展,人脸表情迁移在人脸伪造、人脸表情数据库生成,人脸编辑等领域有着较为广泛的应用。现有的人脸表情迁移网络进行表情迁移时往往存在以下三个问题:第一,人脸表情迁移网络大多基于生成对抗网络,生成对抗网络中存在的不稳定问题导致人脸迁移图像质量不高;第二,现有人脸表情迁移网络对于面部细节重建能力不足,导致迁移图像产生局部模糊,逼真度差;第三,传统人脸表情迁移网络捕捉不到人脸图像中
20世纪90年代开始在全球范围内兴起的社会责任运动使得越来越多中国企业对CSR的重视日益提升。证券企业作为我国金融领域的重要组成部分,在我国经济发展新常态的当下,成为国家供给侧改革等发展战略的坚强后盾,更被赋予了支持实体经济发展,提高全社会融资效率的重要使命,我国证券企业不可推卸地承担着重大社会责任。HY证券作为全国领先的上市金融集团,虽然在国内率先发布CSR报告并在CSR履行中取得了一定的成绩,
目前来说,国内使用的《合同法》一方面涵盖了英美法律体系中的预期违约机制,另一方面又涵盖了大陆法律体系中的不安抗辩权,目的是为了减少守约人因为对方当事人的预期违约行为产生的不必要的损失承担,实现合同双方之间的利益平衡。认定预期违约的成立需要一定的证据予以支撑,然则我国在该项制度的法律移植中存在着整合不当的问题,对法律的适用造成了一定的冲突。因此,有必要研究我国预期违约制度司法适用中存在的争议问题,提
绩效考核体系的完善和发展经历了较长的时期,在绩效考核早期对指标的考量十分有限,随着绩效考核研究的深入和发展,企业的企业绩效考核在指标构建、覆盖等方面实现了很大的变化并且越来越完善。水泥生产企业在市场竞争过程中面临着更加开放的环境,大型国有企业、合资企业在市场竞争通过提升产品技术含量、加强产品售后服务、完善上下游产品链条、实施市场营销战略不断的抢占有限的水泥销售市场。近年来,受国家对商品房销售政策紧
在抽样调查中,随着当前经济社会的变化和发展,调查对象及其目标总体的范围和结构日益复杂,基于单个调查总体构建单一的抽样框进行随机抽样的传统调查方式往往存在较大问题,比如单个调查总体的抽样框覆盖不全,单一抽样框的更新和维护成本又过高。本文认为,基于交叉子总体开展抽样设计及估计具有覆盖全、成本低、效率高、操作简单的优点,是解决上述难题的有效方法。为了充分利用辅助信息提高交叉子总体抽样的估计精度,本文在总