基于拓扑特征和表示学习的蛋白质复合物识别

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:zhangshuai824
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生物个体的重要组成部分,参与了细胞内所有的生命活动。研究发现,在细胞中蛋白质通常都不是单独存在的,它们往往是和其他蛋白质形成一个整体,即以复合物的方式参与细胞内的多种生命过程。因此,准确识别蛋白质复合物能够帮助生物学家更全面、更深入地了解细胞组成和生命过程。近年来,得益于高通量技术的广泛推广,大量的蛋白质-蛋白质相互作用(PPI)网络数据相继被发现。生物学家根据蛋白质数据间的关系构建了多种PPI网络并将其公开,这为蛋白质复合物识别研究提供了重要的数据支撑。本文首先对蛋白质复合物识别算法的研究背景及意义、国内外研究现状和相关知识与评价指标等内容进行了系统综述。系统分析了当前蛋白质复合物识别算法中存在的主要问题,重点研究如何针对蛋白质复合物识别任务构建高质量的拓扑特征和如何基于表示学习方法缓解蛋白质相互作用网络中的噪音影响。1)提出了一种基于监督学习和拓扑信息的蛋白质复合物识别方法。该方法依据蛋白质间的拓扑关系和基因本体衡量蛋白质间的可信程度,构建加权PPI网络;然后,构建16个具有代表性的PPI网络拓扑结构特征组成复合物的特征向量;最后,基于监督学习框架训练复合物识别模型,实现从PPI网络中高效识别蛋白质复合物,并通过实验分析了不同拓扑特征对于蛋白质复合物识别任务的重要性。实验结果表明,该方法基于监督学习框架,采用构建的PPI网络拓扑特征,能够有效提升蛋白质复合物识别的性能。2)提出了一种基于网络表示学习的蛋白质复合物识别方法。网络表示学习方法对于复杂网络具有深度表示建模能力,能够通过获取网络全局表示信息,从而一定程度地缓解网络中噪音数据的影响。该方法基于蛋白质相互作用网络和网络表示学习方法,生成蛋白质向量表示以及蛋白质复合物的向量表示;然后,采用监督学习框架训练得到随机森林模型,从候选蛋白质复合物中有效识别最终复合物。实验结果表明,引入网络表示学习方法能够高效地挖掘PPI网络中的拓扑结构信息,并有效缓解PPI网络中的噪音数据影响,从而提升后续蛋白质复合物识别的性能。
其他文献
近年来,为应对日益严峻的能源危机与海洋污染问题,推动航运业节能减排,引入光伏、蓄电池等分布式电源补充和逐步取代传统柴油机发电的新能源混合动力船舶受到广泛关注。并网变换器作为新能源并网发电的重要端口,对控制交、直流侧能量的双向流动和维持直流母线电压稳定起着关键作用。船舶直流微电网因缺少惯性和阻尼且接入大量闭环控制的恒功率负载,母线电压易出现低频扰动型波动和高频振荡型波动,危害系统的稳定运行。针对上述
学位
近些年,以永磁同步电机(Permanent-Magnet Synchronous Machine,PMSM)作为推进电机的船舶直流推进系统备受关注。在船舶直流推进系统的结构中,电解电容因其寿命短、故障率高等缺点被认为是其中最脆弱的部分之一。目前,采用高可靠性的薄膜电容已逐渐成为趋势,但是低容量的薄膜电容易造成直流环节电压振荡。针对这个问题,利用模型预测控制能够同时处理多目标优化的优点,将直流环节电
学位
轮机模拟器是海事院校和航运公司教学培训的重要设备之一。现有的轮机模拟器主推进装置的主机型号主要为MAN公司的MC和ME型柴油机,控制系统采用Auto Chief 4或ACC20等主机遥控系统。随着RT-flex船用柴油机的广泛应用,模拟器培训内容也在不断扩大,同时,主机遥控系统的训练深度也在不断的提高,现有的轮机模拟器已无法满足多机型、多系统的培训要求。为完善现有轮机模拟器功能,实现不同机型、不同
学位
甲烷水合物是一种由甲烷与水在一定条件下形成的可燃的、非化学计量的、笼型结晶化合物。船舶运输有着长距离、低成本的优点,是国际上进行甲烷运输的主要方法之一。利用甲烷水合物的方式来进行运输有着良好的应用前景。表面活性剂在甲烷水合物的高效合成中起着非常重要的作用。本论文系统研究了表面活性剂木质素磺酸钠对甲烷水合物合成的促进作用。研究了木质素磺酸钠的浓度、反应温度和初始压力对甲烷水合物合成的影响。建立了基于
学位
浮式液化天然气生产储泄装置(Liquid Natural Gas Floating Production Storage and of Floating Unit,FLNG),由于其具有投资成本低、建造周期短和安全性高等优点被广泛应用于海洋天然气开采中。但FLNG上甲板可燃气体泄漏扩散与燃爆事故是FLNG主要风险之一,一旦发生将对船员生命、海洋环境和公司财产等造成毁灭性破坏。因此,为使工作人员快速
学位
一直以来,快速且准确地润滑油液的金属颗粒进行检测与分离不仅可以清理润滑油液,并且对船舶动力系统进行有效地预测性维护。由于表面张力的存在,微颗粒极易被双液相界面吸附从而造成一定的富集效果,这使得双液相系统在颗粒的检测、分离以及回收等方面有着良好的应用前景。本文采用数值方法研究了附着在双液相界面颗粒的电动运动规律,揭示了界面弯曲、双液相界面双电层分布等因素对颗粒的电动运动的影响机理。主要研究内容如下:
学位
随着双燃料动力船舶在海洋天然气运输中应用越来越广泛,天然气燃爆事故也成为双燃料动力船舶运输作业中重要的风险之一。事故一旦发生,事故中产生的冲击波超压会造成重大的人员伤亡和财产损失。为保证双燃料动力船舶甲烷燃料的安全使用,必须考虑到火灾、爆炸事故可能带来的后果,进而采取快速有效的消防行动,这依赖于对整个事故过程危险性的准确评估,因而需开发一种快速预测方法对双燃料船舶可燃气体燃爆事故后果进行预测。在燃
学位
随着我国“一带一路”战略的实施,航运事业持续蓬勃发展。船舶油液作为船舶机械工作介质对维持船舶机械设备正常运转具有重要意义。船舶油液通常指船用液压油和润滑油,对船舶油液进行健康状态监测可以有效预防机械故障,同时也是故障诊断的重要技术问题。船舶油液中存在水分和空气会严重影响机械设备的运行,但目前对于油液中水分和空气的检测采用传统的平行板式电容传感器的办法,其在检测精度和通量等方面存在局限性。本文提出了
学位
船舶柴油机废气中含有大量的氮氧化物,对人类健康和生态环境造成了严重的危害。作为一种成熟的脱硝方法,NH3-SCR技术已被成功地用于解决船舶柴油机尾气脱硝问题。当前,船舶SCR脱硝技术普遍采用钒(V)基催化剂(V2O5-WO3(Mo O3)/Ti O2)。然而,V基催化剂存在低温活性差、活性温度窗口窄(300~400°C)、活性组分(V2O5)有毒性等问题。近年来,锰(Mn)基催化剂被认为是一种极具
学位
广泛分布的海洋传感节点是海洋物联网技术的基础,然而这些节点供电方式主要以电池供电为主,其面临电池寿命有限、更换成本高等问题,亟需研究环境能量收集技术,以实现海洋传感节点的自供能。海洋波浪能作为一种可再生能源,具有分布广泛、能源密度高等优势,是一种理想的传感器能量供给来源。为此,本文利用新兴的摩擦纳米发电原理,创新性地提出了一种多轨道式摩擦纳米发电机(Multi-tunnel triboelectr
学位