NOBEL:一种基于拓扑信息与监督学习的蛋白质复合物识别方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:yyaizy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质复合物对于生物学家有效了解细胞组织和功能具有重要意义,如何通过计算方法从蛋白质-蛋白质相互作用(PPI)网络中识别复合物是当前研究热点之一.然而,由于PPI网络中存在大量假阴性和假阳性噪声数据且现有已知蛋白质复合物并不完整,使得如何克服PPI网络的噪声问题,以及更好地利用已知蛋白质复合物,成为蛋白质复合物识别亟待解决的关键问题.为此,该文提出一种基于蛋白质复合物拓扑信息,利用监督学习进行蛋白质复合物识别的算法(NOBEL).首先,NOBEL根据蛋白质的生物信息和拓扑信息构建加权PPI网络,降低了网络中的噪声问题;然后,通过加权PPI网络和未加权PPI网络提取复合物拓扑信息作为特征,并根据提取的特征训练监督学习模型,使得监督学习模型能有效学习复合物蕴含的信息;最后,将训练好的模型应用于PPI网络识别蛋白质复合物.作者在四种真实PPI网络上进行了实验,实验结果表明,NOBEL与其他七种蛋白质复合物识别算法相比,在F-measure方面分别至少提高了4.39%(Gavin)、1.32%(DIP)、2.39%(WI-PHI_core)和2.34%(WI-PHI_extend).
其他文献
预训练技术当前在自然语言处理领域占有举足轻重的位置.尤其近两年提出的ELMo、GTP、BERT、XL-Net、T5、GTP-3等预训练模型的成功,进一步将预训练技术推向了研究高潮.该文从语言模型、特征抽取器、上下文表征、词表征四个方面对现存的主要预训练技术进行了分析和分类,并分析了当前自然语言处理中的预训练技术面临的主要问题和发展趋势.
机器阅读理解是自然语言处理领域中的一项重要研究任务,高考阅读理解自动答题是近年来阅读理解任务中的又一挑战.目前高考语文阅读理解任务中真题和模拟题的数量相对较少,基于深度学习的方法受到实验数据规模较小的限制,所得的实验结果相比传统方法无明显优势.基于此,该文探索了面向高考语文阅读理解的数据增强方法,结合传统的EDA数据增强思路提出了适应于高考阅读理解的EDA策略,针对阅读材料普遍较长的特征提出了基于滑动窗口的材料动态裁剪方式,围绕材料中不同句子的重要性差异明显的问题,提出了基于相似度计算的材料句质量评价方法
本发明涉及一种轮滑鞋,属轮滑鞋与新能源技术领域.主要包括鞋体、轮架、转轮和轮轴,转轮内嵌有动电极,轮轴由阶梯轴、轮盘和定电极构成,定电极由两个极环及一组极梁构成;定电极嵌在轮盘上,轮体套在轮盘上,两个挡板装在阶梯轴上并分别顶靠在轮盘两侧,转轮位于两挡板之间;阶梯轴装在轮架立壁上,挡板上设有电极环和辅助电极,电极环压接在极环上,电极环和辅助电极经导线与电路板上的电控单元相连并构成回路;轮轴和转轮相对转动过程中定电极和轮盘与轮体的接触面间产生异种摩擦电荷,动电极上产生感应电荷,轮轴和转轮相对转动使动电极和定电
期刊
SKU占比rn在2021年4月的男鞋TOP 100中,白色与黑色作为基础经典色依旧占据较大的比重,其他色调则以秋季色调为主,整体饱和度较低;色彩不同于春夏的鲜亮,整体更加倾向于高级灰.TOP20的品牌中,国际大牌的关注度较高,Gucci、Louis Vuitton等;款式风格上,运动款型几乎占领主要市场.
期刊
综述rn2021年4月童鞋TOP100色彩中粉色系以强势之姿占据大头,甚至超过基础黑白色系;白色与蓝色其次.蓝色系中,深蓝和浅蓝占比分别为16%和11%.品牌浏览人数以及下载人数集中表现在国潮运动品牌 LI-NING、大牌 Dior 等,Anta、Fila等紧随其后.TOP100款型集中在运动单鞋上,占比91%.其次为凉鞋款,占比11%.
期刊
该研究采用事件相关电位(ERP)观察了被试在识别积极、中性和消极的脸部情绪时,在大脑颞枕部电极点上引发的N170效应,来探索阅读严肃文学小说是否会影响人对他人情绪的反应.阅读组被试在两次脸部情绪识别测试之间阅读严肃文学小说,而对照组没有.第二次测试相比第一次测试,N170的幅度增大,但是阅读严肃文学小说会抑制N170幅度增益,且对情绪越积极的刺激图片抑制越大.据此,阅读对他人脸部情绪的识别确有影响.研究推测阅读可能抑制大脑中的脸部情绪特异性,进而可能提高对脸部情绪的感知力.
现有多轮对话生成的Encoder-Decoder模型容易产生单一的响应,虽然使用条件自动编码器(CVAE)可以有效改善响应的多样性问题,但是基于CVAE的模型大多不能够捕捉上下文中较长的依赖.同时,现有的模型也无法显式处理上下文话语和源语句之间的差异.该文将Transformer与CVAE结合,通过Transformer捕捉对话中的长依赖,使潜在变量可以学习到更丰富的对话分布.通过分离上下文语句的编码实现上下文的信息流向源语句,并使用门控机制来控制上下文话语和源语句的信息融合,捕捉对话中对响应影响更大的信
近年来,Hashtag推荐任务吸引了很多研究者的关注.目前,大部分深度学习方法把这个任务看作是一个多标签分类问题,将Hashtag看作为微博的类别.但是这些方法的输出空间固定,在没有进行重新训练的情况下,不能处理训练不可见的Hashtag.然而,实际上Hashtag会随着时事热点不断快速更新.为了解决这一问题,该文提出将Hashtag推荐任务建模成小样本学习任务.同时,结合用户使用Hashtag的偏好降低推荐的复杂度.在真实的推特数据集上的实验表明,与目前最优方法相比,该模型不仅可以取得更好的推荐结果,而
SKU占比rn4月女鞋TOP100色彩上,中性色作为主色的明度提升,除开中性色的占比外,辅色的色系和饱和度较上季有所增加,色调占比均匀;TOP20的品牌中,多数品牌的运动款持续受关注,Jimmy Choo、Gucci 等仍是重点品牌,国内运动品牌Xtep也成为重要关注方向,奢侈品牌中运动款型推出引发关注;款式风格上,4月运动款型几乎涵括所有市场,少量商务和时尚类经典款存在,市场关注较小.
期刊
译文质量估计技术是指在无参考译文的情况下对机器译文进行评价的方法.近年来,深度学习技术取得了重大突破,融合深度学习技术的神经译文质量估计方法逐渐取代了传统的译文质量估计方法成为主流.神经译文质量估计模型具有一定的隐式学习源语言句法结构的能力,但无法从语言学的角度有效地捕捉句子内部的句法关系.该文提出了一种将源语句的句法关系信息显式融入神经译文质量估计的方法,在源语言的依存句法关系和译文质量之间建立联系.实验结果表明,该文提出的句法关系特征能够提高译文质量估计模型的准确性.同时还提取了多个层面的语言学特征,