基于子图扩展的抗原表位发现

来源 :广西大学 | 被引量 : 0次 | 上传用户:xueyanli122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
子图扩展就是对子图进行重叠聚类的过程,这是为了解决传统聚类算法无法聚出重叠聚簇的缺陷而提出。本文利用网络中子图的结构特征以及子图的点边属性,对传统非重叠图聚类算法的非重叠聚簇进行再扩展,使得最终的聚类结果具有重叠性质。基于以上思路,本文先后提出两个子图扩展模型Glep和GKCE,其中Glep首先通过构建非重叠聚簇的14维图属性特征来近似描述一个子图的结构信息,然后使用词频-逆文本技术来优化这14维特征的权重。最后在经过优化的14维特征基础上,基于14维特征的稳定性完成对非重叠聚簇的重叠扩展。而GKCE不仅利用了子图的结构特征,更进一步地结合了子图的点边属性,通过图核技术分析了扩展过程中子图之间的相似程度,完成对非重叠聚簇的重叠扩展,最终得到具有重叠性质的聚类结果。抗原表位是抗原上被抗体接触的部分氨基酸残基,抗原表位的发现即是定位那些位于抗原链上被抗体链接触的氨基酸残基位置。对于一条抗原链而言,根据其上的抗原表位的数量差异和位置关系这两方面信息,可将抗原表位划分为单个分开,多个分开和多个重叠这三种情况。目前大部分抗原表位预测模型集中在单个抗原表位的预测上,很少有模型能实现对多个分开抗原表位的预测,至于能实现对多个重叠抗原表位预测的模型就更少了。目前的研究已经表明抗原表位在抗原链的空间结构上具有特异性,表面化,聚集性和重叠性这四个特性,这些特性使得目前基于结构的预测模型是抗原表位预测研究领域的热门方向。本文从抗原链上氨基酸残基的结构网络入手,设计了两个重叠子图聚类模型,从不同的角度分析抗原链上的抗原表位,很好地解决目前大多数抗原表位预测模型预测情况单一、预测效果不佳这两大问题。实验结果显示,相比较目前最好的同类模型,本文表现最好的重叠子图聚类模型GKCE的Fl分数平均值在单个抗原表位,多个分开抗原表位和多个重叠抗原表位上有67%,81%,37%的提升。
其他文献
地震灾害风险监测通常是在地震灾害承灾体—工程结构上布设观测系统,进而研究工程结构破坏状态和评估地震灾害风险,国际上十分重视此项工作。基于结构强震观测系统,如何量化
在诸多的风力机控制算法中,滑模控制方法凭借其在解决系统参数不确定性,风速扰动影响等问题上的优势,因而在最大功率点跟踪控制(maximum power point tracking,MPPT)阶段得到
钙钛矿太阳电池(PSCs)由于其易于生产、材料成本低和理想的光电性,日益受到人们的关注。最近一段时间,钙钛矿太阳电池的光电转换效率提高到22%,这一点在其作为光伏领域新兴竞争者的重要性方面显而易见.它在能量转换材料科学领域的兴起可以归因于最近在成分工程、溶剂工程、化学计量校准和新的制备方法等方面的进步。尽管近年来钙钛矿太阳电池的功率转换效率有了很大的提高,但由于钙钛矿在高温下的退火时间较长且稳定性
【研究背景】肝细胞癌(Hepatocellular carcinoma,HCC)是最常见的原发性肝癌,约占肝癌病例总数的70%,是一种严重危害人体身体健康的癌症之一。肝癌的治疗方法有很多种,比如手
氮肥作为农业系统最重要的生产资料,在农业生产中具有举足轻重作用。然而近年来研究发现,氮肥施用也带来一系列环境问题,其中施用铵态氮肥发生的硝化作用导致土壤酸化是比较
近年来随着通信技术的进步,移动设备的计算能力高速发展。同时设备的成本也在迅速下降,智能移动设备已经触及了我们生活的每一个角落。伴随着硬件的普及,越来越多的移动众包(
近年来,城市轨道工程不断发展,城市地铁建设日新月异。同时城市建筑物密集,大型建筑物附近常伴随地铁车站与地铁线路,建筑物基坑的开挖带来土方的卸载,会导致周边土体应力重
湖南省郴州市桂东县是湖南省四大林区之一,在碳汇过程中起着重要作用。准确估计地上生物量的变化对于理解森林碳循环和促进减缓气候变化至关重要。在区域森林地上生物量遥感
模式动物中存在多种多样的突变体,为人类疾病的研究及发现基因的新功能创造了条件。利用动物疾病模型来研究人类疾病,对于各种疾病的发生、发展规律和防治疗效的机理认识等带来了极大方便。在西南大学家蚕基因库中有一种特殊的体形突变体——短体蚕Sq,其典型特征是,杂合体幼虫躯体显著比野生型短且肥胖,纯合体胚胎期致死。本课题组前期利用分子定位等手段,确定Sq突变的基因组中有一大片段缺失,缺失片段包含了4个基因:B
目的:通过本次蒙药朱岗-25对肺热病的治疗效果提供参考的数据。方法:1.受试对象为2018.11-2019.11在内蒙古民族大学附属医院蒙医呼吸内科病房收治符合肺热证及痰培养+药敏试