基于未标记样本信息的蛋白质相互作用位点半监督预测

来源 :安徽工业大学 | 被引量 : 0次 | 上传用户:happyyearer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质相互作用位点的识别在药物设计方面具有不可替代的意义。然而在实际情况下,由于目前只有小部分的蛋白质相互作用能够被实验方法鉴别出来,所以蛋白质序列上的大多数位点不能被定义为界面位点或非界面位点,这将导致蛋白质相互作用位点的预测缺乏准确性和泛化能力。本文主要通过未标记出来的蛋白质位点信息来对相互作用位点进行预测。在数据处理部分,首先删减冗余的蛋白质链,通过预处理得到91条蛋白质链用于实验。接着对残基进行定义,并基于氨基酸的进化保守性,从HSSP数据库与Consurf Server中提取了五种特征:残基空间序列谱、残基序列信息熵与相对熵、残基序列保守权重以及残基进化速率。将这五种保守性特征加以融合并重新编码,得到的数据集将用于之后的实验。在位点预测部分,本文充分利用了大量未标记样本,并提出了三种半监督支持向量机模型对蛋白质相互作用位点进行预测。首先,结合标签均值和自训练思想,提出了基于多核学习的标签均值自训练半监督支持向量机(Means3vm-mkl)和基于迭代优化的标签均值自训练半监督支持向量机(Means3vm-iter)。然后我们对上述模型进行了优化,使用一种安全的半监督支持向量机(S4VM)来防止性能下降。从最终的预测结果可以得出,使用未标记样本极大提高了预测的准确性,相比于只利用标记样本的分类模型在准确率上提高了12%。三种半监督SVM模型都能实现对相互作用位点的预测,其中S4VM表现最佳,正确率达到70.7%,灵敏度以及特异度分别为62.67%,78.72%。相较于传统的实验以及计算方法而言,分类效果得到较大提升。
其他文献
目前,与多智能体系统相结合的分布式凸优化问题受到许多研究者的关注.此问题经常与多智能体理论中的一致性算法以及凸优化理论中的梯度算法相联系.本文主要围绕分布式凸优化算法进行研究.目前处理约束优化问题所使用的分布式算法,大多需要用到非线性投影,这使得问题很难分析.为了避免计算投影梯度,本文利用镜面上升/下降设计出新的连续时间分布式凸优化算法.最终设计的新的动力系统,是在primal-dual动力系统框
目的 本研究通过临床观察,研究养阴益气活血方对原发性干燥综合征(primary Sjogren’s syndrome,pSS)患者病情、生活质量以及焦虑抑郁状态的改善作用,以期为临床治疗本病合并
研究目的:观察针刺治疗阿片类药物相关性便秘的临床效果及治疗后对患者生活质量的改善情况。研究方法:将符合纳入标准的70例病例,随机分为试验组(针刺组)和对照组(乳果糖组)
目 的:胰腺癌因其进展迅速、易转移已成为预后最差的消化系统肿瘤。特异性核基质蛋白1(SATB1)在多种实体肿瘤中呈高表达水平,与肿瘤预后相关。既往研究发现SATB1通过调控下游
目的:胞吐(exocytosis)是囊泡运输的一种形式,往往限制于质膜的特定区域。包裹分泌物的囊泡从供体膜上脱落,穿过细胞质到达受体膜附近,被束缚并融合到受体膜,运输的分泌物释
目的:单核巨噬细胞系统是机体重要的免疫防御屏障,由单核细胞、各组织中的巨噬细胞以及原单核和幼单核细胞组成,这些细胞均属单核细胞系列,来自骨髓的造血干细胞。巨噬细胞是该系统的效应细胞,随所在部位不同而命名各异,如:肝内的Kupffer细胞、脑内的小胶质细胞等。巨噬细胞具有吞噬作用、杀伤肿瘤细胞作用、特异性免疫应答中抗原提呈作用、激活和调节免疫应答等各种功能。上皮-间质转化(EMT)是上皮细胞经历表型
自动引导小车(AGV)的有效路径规划对于智能仓库、无人码头和自动化工厂等工业场景具有重要意义。近年来,尤其随着电子商务的发展,网上购物越来越受欢迎。为了加速消费者的递
目的通过1-磷酸鞘氨醇(sphingosine-1-phosphate,S1P)诱导人脐静脉内皮细胞(Human umbilical vein endothelial cells,HUVECs),建立血管内皮高通透性模型,观察麝香乌龙丸提取
夜间微光探测技术应用是近年研究热点之一,对夜间天气监测、模式预报、人类活动研究等具有重要意义。论文首先介绍了研究背景和研究现状,详细对比了微光遥感器DMSP/OLS和VIIR
本文在L1空间上研究了一般边界条件下具结构化的细菌种群模型。首先给出了这类模型相应的迁移算子生成正C0半群,并且证明了该正C0半群是不可约的。其次讨论了这类迁移算子生成的正C0半群的Dyson-Phillips展开式的9阶余项的弱紧性和它的谱分析,得到了这类迁移算子的谱在右半平面上仅由有限个具有限代数重数的离散本征值组成等。最后给出了该模型相应的迁移方程解的渐近行为和异步生长特性等结果。