基于图网络的蛋白质复合物识别研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:anxbbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生物中各类细胞和组织的重要组成部分,在各项生命活动中,起到关键作用。蛋白质在生物机体内发挥作用时,大部分时候是以多个蛋白质的共同参与为基础的。这些共同参与的蛋白质所组成的功能模块,也被称作蛋白质复合物。实验方法识别蛋白质复合物,存在成本高等问题,因此有必要使用计算方法识别蛋白质复合物。在计算方法识别蛋白质复合物的领域中,之前已经提出了许多成功的方法来检测蛋白质相互作用网络中的蛋白质复合物,各种算法各自存在优势,但也存在可优化和改进的空间。在本文中,分别就动态蛋白质网络和静态蛋白质网络提出两种识别算法和策略,并通过实验证明算法的有效性。蛋白质相互作用网络,作为标准的图结构,因其具有非欧几里特性,使用传统的各种数据分析方法,往往因运算量较大,效率较低。随着图网络理论和技术的发展,图嵌入算法作为有效的图分析算法,被引入蛋白质复合物的识别中。图嵌入算法将原始的图网络进行降维,得到低维的向量表示并保留其中的关键信息。图嵌入算法主要包括四大类方法:基于矩阵分解、随机步进、神经网络、自编码器的嵌入方法。本文中尝试引入多种图嵌入算法来融合相应的生物信息,以增强图的表示能力。本文的主要研究内容如下:(1)基于动态蛋白质网络,提出一种包含变分自编码器的核附属蛋白质复合物识别DVCA算法。DVCA算法中,首先由静态蛋白质网络和基因表达数据,生成动态蛋白质相互作用网络。之后,对动态蛋白质网络进行数据清洗筛选后,由动态蛋白质作用网络生成加权蛋白质相互作用网络。然后将加权网络和基于基因本体论生成的属性网络,输入到变分图自编码器中,输出含有节点向量的节点矩阵。最后,根据节点矩阵生成蛋白质复合物的核心和附属,并对生成的蛋白质复合物的各项参数进行评估。(2)基于DVCA算法进行进一步优化,提出MEA算法,进一步提升蛋白质复合物的识别效率和识别能力。首先,提出一种全新简洁的数据清洗和优化算法,降低算法复杂度。其次,提出在变分自编码器的基础上,加入加速属性网络嵌入方法,进一步与图中蛋白质节点的生物属性相结合,优化网络的表达能力。最后,融入一种全新的核附属识别算法,扩大蛋白质复合物核心识别的识别范围,提升附属蛋白质的识别准确度。本文提出的两种蛋白质复合物识别算法在多个蛋白质相互作用网络数据集上进行了大量实验。实验结果表明,本文提出的DVCA和MEA算法均取得了优良的识别效果,与一些高精度识别算法相比,DVCA算法和MEA算法识别精度更高,运行效率更好。同时在构建动态网络、结合生物属性、网络数据清洗、网络嵌入、核附属识别算法等方面,对其他蛋白质复合物识别算法具有一定的参考价值,也可考虑将算法推广到其他网络中解决更多网络问题。
其他文献
《新能源汽车产业发展规划(2021-2025)》指出新能源汽车产业要以创新驱动为原则,建立政府参与下产学研合作的技术协同创新体系,合力实现重大核心技术攻关。这表明政产学研合作创新是实现我国新能源汽车“三电”技术突破的关键途径。然而,目前我国新能源汽车产业政产学研合作创新参与度小、持续性短、积极性低且创新带动关系弱,尚未形成全面的合作创新关系。为探究我国新能源汽车产业政产学研合作创新的影响机制,分别
学位
为对养心殿后殿(下称“后殿”)消防工作提供数据支撑,为国内木结构古建筑消防安全管理工作提供有益指导,对后殿固定火灾荷载进行统计,利用FDS软件模拟分析其在不同致灾因素时的热释放速率、火灾蔓延、温度、能见度、烟气和有毒有害气体浓度等参数变化。结果表明,后殿固定火灾荷载值为11 096.85 MJ·m-2;其在火灾场景下发生轰燃时间短,过程中会发生二次轰燃,屋顶部位受火灾威胁最大,火场内温度和有毒有害
期刊
交通出行逐渐成为人们日常生活的必要组成部分,城市交通事故频发,正在威胁着人们的生命财产安全,交通事故中发生在交叉路口的比重很大。交叉路口作为多条道路的连接区域,路况更为复杂,车辆左转是影响交叉路口通行效率的关键,因此左转辅助不仅能降低事故的发生同时也能提高通行效率。交叉路口的相关预警算法相较于单一道路行驶的预警算法要更加复杂,车辆的行为有着更多的可能性,交通流繁杂且实时变化,因此交叉路口算法需要更
学位
建筑业是我国最重要的实体经济之一,作为传统产业,其高污染、高耗能的问题一直很突出,技术创新是建筑业高质量发展和结构化升级的核心驱动力。21世纪,面对全球生态环境的持续恶化和信息技术的高速发展,建筑业技术创新发展面临全新的挑战。目前我国建筑业技术创新发展缓慢,且存在很大的地区差异性。需要构建一套与我国建筑业技术创新发展现状相适应的评价指标体系,对我国建筑业技术创新水平做出准确的测度,并制定符合各区域
学位
在关节疾病中,膝骨关节炎(Osteoarthritis,OA)常常危害到中老年人的身体健康,主要表现为软骨的退行性病变,因此对骨关节炎采取一种精确高效的诊断方法非常重要。膝关节磁共振成像依靠高对比度、高分辨率和无创性的优势,能够诊断软骨的退化,而软骨的准确分割对医生诊断病情和术前规划具有重要影响。手动分割软骨存在效率低、主观干预多等缺点;由于软骨的个体差异和病理形态的不同,传统的影像分割方法在软骨
学位
在线评论作为产品使用反馈信息,不仅可帮助消费者了解产品特征质量,也为商家与生产商提供服务与产品的改进方向。后疫情时代,健康空调需求量逆势增长,用户健康消费意识崛起,为提高产品用户满意度,深入挖掘用户对产品特征、服务的主观情感与侧重点等有价值信息十分必要。然而面对增长迅速、形式多样的海量健康空调在线评论,仅仅依靠人工方式分析处理效率低下,无法解决大数据时代文本处理与快速决策之间的矛盾。如何通过有效的
学位
随着科学技术的发展,建筑施工企业的工程技术和安全设备都得到了进一步地完善,“人因”成为导致安全事故的主要原因。建筑施工现场中班组长作为建筑工人的直接领导,对建筑工人的施工工作行为的具有直接重要影响。因此,深入探析班组长安全领导力对建筑工人的安全行为的影响,不仅有利于减少建筑工人的不安全行为,还对降低安全事故发生率具有重要意义。基于事故因果连锁理论、SOR理论和社会学习理论,引入安全意识和安全自我效
学位
以某高校宿舍建筑物为研究对象,利用FDS火灾模拟软件并通过定性分析和动态模拟结合的方法研究了不同排烟速率和火源功率下的宿舍火灾过程,从烟气扩散规律、能见度和CO浓度分布等不同角度研究高校宿舍发生火灾时的环境参数的变化规律。结果表明,不同火源功率下,烟气蔓延扩散规律大致相同;相同火源功率下,安装机械排烟装置可以明显减少烟气量,延缓烟气的扩散,有助于人员的安全疏散。可根据火灾风险分布特征,在宿舍等多层
期刊
近几年,随着建筑信息建模(BIM)、物联网、大数据等数字技术在提升建筑业生产效率、保障建筑业质量和增强建筑业竞争力等方面显示出越来越重要的作用,建筑业数字化转型已成为一种必然的发展趋势。因此,能否率先实现数字化转型也成为建筑企业寻找新的发展模式,实现高质量发展的重要驱动力。推动建筑业数字化转型,需要持续增强BIM、云计算、物联网等数字技术在建筑项目中的集成应用,不断提升建筑业在精细管理、集约管理、
学位
目的 促进带状疱疹疫苗接种管理水平的提高。方法 将问询记录的109例带状疱疹疫苗接种者相关的A组数据与卜哲妮等《2020—2021年广东省带状疱疹疫苗疑似预防接种异常反应监测分析》报道中的有关的B组数据进行对比分析。结果 A、B两组AEFI发生率分别为68.81%(75/109)和0.20%(87/44 242),两组AEFI主要为一般反应(均大于85.00%)、AEFI发生率女性高于男性、AEF
期刊