基于Transformer和图注意力网络的多类型蛋白质相互作用预测

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:jdalian1417
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质与蛋白质相互作用(PPI)网络和转录调控网络对于调节细胞及其信号很重要。对PPI的透彻了解可以更深入地了解正常和疾病状态下的细胞生理学。虽然目前有许多方法来预测PPI,但是由于未知蛋白间相互作用预测难度大,导致预测方法性能不佳。本文考虑未知蛋白质间的相互作用和数据特性,对多类型PPI预测进行研究,主要工作如下:(1)在特征输入方面,根据蛋白质的序列信息和PPI信息,本文构建了蛋白质序列特征和PPI图。其中,蛋白质序列特征除了氨基酸共现相似性编码和氨基酸间静电性和疏水性相似性的分类one-hot编码构成以外,本文还添加了ESM-1b编码特征作为输入特征。PPI图以蛋白质为节点,7种蛋白质相互作用为边,构建了7种PPI图作为邻接矩阵输入到图注意力网络中。(2)在网络框架方面,本文结合了两种注意力机制的网络框架集成了一种新的网络模型框架AFTGnet,用来预测多类型PPI。该框架使用包含Attention Free Transformer(AFT)模块的Transformer编码器来提取蛋白质序列特征,之后将提取的蛋白质序列特征作为PPI图节点特征,与构造好的PPI图一同输入图注意力网络(Graph Attention Network)来提取蛋白质对的关系特征。每个蛋白质节点根据多头自注意力机制和邻接节点信息不断更新自身信息。最后使用全连接层(FC)作为分类器进行多标签PPI预测。(3)为了体现本文模型的性能,本文通过在PPI网络中使用广度优先搜索(BFS)、深度优先搜索(DFS)和随机方式构建测试集进行评估。本文的方法在SHS27K和SHS148K数据集上通过上述三种划分测试集方法分别与三种机器学习方法和四种深度学习方法进行比较。实验结果显示本文的模型在SHS27K和SHS148K数据集的三种划分方式的Micro-F1分别为0.6845、0.7113、0.8666和0.7452、0.8189、0.9196,高于其他方法。为了进一步说明本文方法对于未知蛋白质间相互作用预测的优势,本文使用SHS27K和SHS148K作为训练集,STRING作为测试集进行比较,实验结果表明本文的模型在STRING数据集的三种划分方式都优于之前的方法。最后,本文对多类型蛋白质相互作用预测的研究工作进行了总结,并对今后的工作进行展望。
其他文献
近年来,随着“高精尖”技术不断发展,各个领域对位移测量技术也提出了更高的需求。在各类位移测量技术中,具有测量范围大、测量精度高等优点的激光干涉位移测量技术已被广泛应用。然而激光波长极易受到环境空气折射率波动影响,造成激光干涉位移测量结果的偏差。因此,准确测量环境空气折射率值是提高以波长为基准的激光干涉位移测量技术精度的关键因素之一。针对当前空气折射率测量中PTF公式法测量精度受限于传感器精度、真空
学位
碳酸钙是一种造价低廉、无毒无害、应用广泛的固体粉末,其作为聚酰胺湿法涂层的常用填料可提高涂层材料的蓬松度、白度以及质感等。但目前碳酸钙涂层织物仍然存在着一系列问题,例如吸墨性能不强、酸碱稳定性不佳、功能单一等。本论文利用乙烯基三甲氧基硅烷(A171),乙烯基甲基二甲氧基硅烷(WD23)两种硅烷偶联剂与9,10-二氢-9-氧杂-10-磷杂菲-10-氧化物(DOPO)合成了改性剂DOPO-Si,通过水
学位
H新创传媒公司是一家成立四年,从事文化传媒行业的新创公司,其主营业务为影视制作、品牌推广和新媒体服务、户外媒体投资经营、城市LED户外彩屏投资经营等。在渡过初创期的艰难生存时期后,公司快速发展,但是在成立后的第三四年,从公司业务量和财务状况等数据可以得知H新创传媒公司面临着市场饱和、开拓新市场难等一系列问题。例如面对政府补贴到期以及新创企业优惠政策缩进,H新创传媒公司的净收益仍未到达理想状态,以及
学位
随着信息技术的飞速发展,会议在学校和公司等场所开展得愈发频繁。如果不能对会议进行清晰、准确的音视频解析,那么对于后期查询会议上与会人员的发言记录以及对会议的复盘将无法顺利进行。虽然声纹识别技术的出现改善了传统会议音视频解析效率低、易出错等局限性,但是现有的会议系统仍缺少对音视频的结构化整理,无法实现对会议音视频数据的有效解析。本文基于角色语音分割和声纹识别技术改进现有的会议音视频解析处理方式,以多
学位
摆式地震计是振动信号采集的重要设备,地震计测控系统作为地震计的辅助系统,为地震计提供了调试、测试、安全运输、数据存储、数据处理和设备管理等功能。传统的地震计测控系统在调试、运输、部署和测量过程中存在以下问题:(1)设备自适应能力不高,机械摆固有频率无法调整,且对机械摆的保护性不高;(2)测控系统对网络接入设备不具备通用性,且系统和设备的故障定位不明确;(3)数据存储无法同时兼容本地和远程存储;(4
学位
永磁同步电机具有传动效率高、噪声小、节能环保等优点,在乘客电梯中的应用比例已经达到了80%以上。永磁同步电机在长期工作过程中,恶劣的工作环境会使电机发生轴承磨损、退磁、转子偏心等现象,从而降低电机运行的可靠性和安全性。目前,关于永磁同步电机状态监测方法,主要从电流、振动、转速等信号中提取出特征参数,通过观测特征参数变化实现状态监测。本文为了提高永磁同步电机状态监测结果的准确性,提出了一种通过融合电
学位
随着工业生产工艺流程的日益复杂,液力透平的传输介质已不满足于纯液相,更多的往气液两相混合介质发展。由于传输介质中气体的存在将会使液力透平的内部流动结构改变,影响其运行稳定性,因此,有必要对气液两相工况下的液力透平进行深入研究,探究含气量对液力透平内部流场的影响机制以及能量损失机理,为液力透平在含气工况下流动改善及实际运行调控提供改进依据。为此,本文基于双流体模型对气液两相工况下液力透平的内部流动及
学位
架空历史网络剧是指在一定程度上借鉴历史,以网络视频平台为主要传播渠道,依据互联网传播特点进行制作的剧集,其既是消费商品也是文化载具。作为消费商品的架空历史网络剧凭借新奇的叙事手段收获众多受众的喜爱,作为文化传承的架空历史网络剧在一定程度上承担着传播历史文化的作用。从架空历史网络剧的播出情况来看,该题材作品在网络剧行业占据着重要地位,其具有庞大的受众基础,是网络视频平台与影视生产方的重要盈利工具。然
学位
随着人工智能和新能源汽车等技术的突破,产品能耗日益增加,高能量密度电池的需求也日益增大。高比容量锂金属作为负极代替石墨的锂电池有望彻底解决能量密度低的瓶颈。但锂金属电池(LMB)仍面临诸多问题,如锂枝晶的生长、充放电过程中的体积变化和差的倍率性能等。为了克服上述问题,本文基于聚乙烯亚胺(PEI)的独特结构,制备了CNT@PP膜和PPCM复合膜,并用以保护锂金属负极,抑制枝晶生长,提升LMB的稳定性
学位
单像素成像是一种新型的成像技术,该成像技术通过预调制的激光散斑进行主动照明,通过算法解算出重构目标的图像信息,由于单像素成像的非定域性、高抗干扰等特性,它已成为计算成像领域的一个研究热点。然而,成像效率和成像质量一直是掣肘单像素成像实用化进程的难题,为了获得高质量的成像结果,需要进行大量的测量,再采用重构算法进行强度像的解算,因此成像帧频难以达到实际应用的要求。本文主要围绕傅立叶单像素成像技术开展
学位