基于排序方法的蛋白质远同源性检测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:tastgaoyan1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着测序技术的发展,蛋白质序列迅猛增长但其功能结构未知。为了检测未知蛋白质的功能结构,虽然一些预测方法已经被提出,但它们的检测性能仍然有限。作为蛋白质序列分析中最重要的基本问题之一,蛋白质远程同源性检测对理论研究(蛋白质结构和功能研究)和现实应用(药物设计)都至关重要。在本研究中,蛋白质远程同源性检测被视为检索任务,旨在找到与未知查询蛋白高度相关的已知功能结构的蛋白质序列,进而推断未知蛋白质的功能结构。鉴于对比方法之间存在互补性,排序融合策略能够有效的提高检索的性能。本文提出了匹配融合模型,设计了3种代价度量策略来衡量某一序列处于某一位置的代价,这3种代价度量结合Kuhn-Munkres算法构建了三种匹配融合模型。在SCOP标准数据集上进行测试,实验结果表明匹配融合策略能够有效地提高排序的性能,且预测性能优于现有多数方法。针对匹配模型存在的不足和现有排序学习模型未考虑蛋白质序列特征的问题,本文提出了排序学习模型和蛋白质特征结合的方法。2种判别力强的基于序列谱的特征(Top-n-gram,ACC),以4种方式嵌入到排序学习模型中,构建了4个预测模型ProtDec-LTR(ED),ProtDec-LTR(CS),ProtDec-LTR(PC)和ProtDec-LTR3.0,这四个模型因进化信息的引入,有效地提高了排序的性能。ProtDec-LTR3.0通过更细粒度地考虑蛋白质的相关性,进一步提升了预测性能,且预测性能优于现有最佳方法。基于匹配方法和排序学习方法都是排序融合模型,但排序融合模型依赖多个比对工具的信息,代价较大。为此,网络传播模型被采用以提高单个模型的性能。为了解决已有网络传播模型通过工具比对构建相似性网络不准确的问题,在本文中,真实同源关系被利用以构建更准确的相似性网络。6种序列比对方法结合2种网络传播模型(PageRank和HITS)构建了12种预测器,其性能均高于基方法。为了进一步提高排序的性能,PageRank和HITS相结合,作用在最好的基方法HHblits上,构建了HITS-PR-HHblits预测器。在SCOP和SCOPe数据集上测试,HITS-PR-HHblits在标准数据集上表现最优。最后,本文提出的相关方法在独立测试集上验证,实验表明各方法均在独立测试集上取得了稳定的性能。
其他文献
本文以某钢厂生产线的冷轧态高强IF钢为研究对象,采用高温激光共聚焦显微镜(HT-LSCM)对实验钢进行模拟连续退火,对再结晶过程中组织演变进行原位研究。并结合金相显微镜、电子背散射衍射(EBSD)技术和维氏硬度计进行金相组织观察、再结晶晶粒测量和显微硬度测定,探究了原位观察技术在研究再结晶组织演变中的应用,并研究了不同退火工艺对IF钢再结晶组织和性能的影响。结论如下:(1)LSCM观察下亮色界面和
滑坡危害影响深远,开展边坡稳定性分析研究具有重要意义。非饱和土坡稳定性分析需考虑渗流场和应力场的耦合作用,模型具有高度非线性的特点,一般采用数值方法模拟。基于现场监测数据进行岩土体参数反演是研究岩土工程不确定性问题的有效方法,但数值模型计算量大已成为概率反演的重要制约因素。为提高边坡稳定性随机反分析计算效率,本文提出一种基于随机多项式展开(PCE)的参数概率反演方法,通过非饱和土坡数值试验验证所提
毛细管放电泵浦46.9 nm软X射线激光是一种短波长激光,具有诸多普通波长激光所不具备的特性,比如高亮度、高相干性、单脉冲能量高和穿透能力强等。随着毛细管放电泵浦激光的迅速发展,46.9 nm激光在等离子体诊断、纳米成像等重要领域的应用前景十分广阔。已获得的类氖氩激光包括46.9 nm、69.8 nm和72.6 nm三个波长。其中,国际上对46.9 nm波长的激光的研究比较多。本文主要从理论数值模
当今已进入能源快速发展时代,非水或着有机锂离子能源系统,包括锂离子电池(LIBs),锂空气或Li-O_2电池,锂硫电池,锂离子电容器(LICs),双离子电池(DIBs)等,已被考虑作为一类非常重要的可再生和绿色能源资源,来解决日益严重的燃烧化石燃料的问题。文中合成了两种新型钙钛矿氟化物电极材料分别是镍-钴氟化物和锌-锰氟化物,将其用作储能器件以研究其电化学性能。具体工作和内容如下:1.实验用溶剂热
过渡金属氧化物具备多种优异的物理化学性质,如铁电、铁磁、半导体性等,有可能在下一代柔性电子技术革命中扮演重要角色。而作为柔性电子技术发展的基石,柔性氧化物薄膜在制备方面仍然面临巨大挑战。传统的做法是在刚性衬底上外延目标薄膜然后腐蚀掉牺牲层,但严格的晶格匹配使得衬底和牺牲层的选择极为苛刻,这限制了它的应用。而范德华外延不需要严格的晶格匹配,薄膜在衬底表面通过分子间微弱的范德华力外延生长,这为材料的制
历史震害资料表明,一次主震后通常伴有大量余震的发生。由于主震和余震的发震时间间隔较短,使得主震损坏结构在短时间内很难得到有效的修复,因此,主震损伤结构在经历余震时会产生二次损伤,甚至造成结构倒塌。现有的各国抗震设计规范中仅考虑一次地震作用,而忽略了余震的潜在危险。因此,有必要对结构在主、余震联合作用下的破坏势进行评估。而要评估主、余震联合作用的潜在破坏势,需要对主余震序列强度与结构损伤之间的相关性
随着航天事业的发展,小型化放射性同位素温差电池大有可为,但是目前同位素温差电池普遍体积质量较大。所以本研究采用电化学沉积方法制备碲化铋基热电薄膜材料,并利用这种材料制备了新型扇形结构放射性同位素温差电池,从材料和电池器件两方面进行了制备与性能优化研究。主要研究内容概括如下:1)采用电化学沉积方法制备了n型Bi-Te基热电薄膜材料。探究沉积电位和退火温度对n型薄膜的微观形态、结晶性能以及薄膜组成的影
当前,我国的基础教育课程改革已经开始走进一个新的历史阶段。2018年初教育部的《普通高中生物学课程标准(2017版)》中提出了生物学核心素养,如何选择国内外的优秀教学方式,培养普通高中学生的生物学核心素养,以适应社会发展的需求颁布,是每个教育工作者应该考虑的问题。2019年中共中央印发《关于深化教育教学改革全面提高义务教育质量的意见》中指出要切实提高课堂教学质量,探索基于学科的研究型、项目化、合作
金属有机骨架(MOFs)材料具有孔隙率高、比表面积大、孔尺寸可调等优点,可作为催化剂及负载型催化剂的载体,具有重要应用前景。本论文将金属有机骨架材料与贵金属纳米颗粒相结合,采用辐照技术制备了多种贵金属纳米粒子修饰金属有机骨架材料,对其微观形貌和结构进行了表征,重点对其催化性能进行了测试分析。本论文的主要研究内容和结果如下:(1)以粒径适中且具有规则晶体结构的ZIF-8 MOFs作为载体,采用γ射线
以2月龄黑鲷幼鱼[体质量(0.7-16.7g),体长(4-9cm)]为实验对象,将同池养殖随机选取的3000尾黑鲷幼鱼逐一称重按照正态分布趋势以5%,20.6%,48.3%,21.0%,5.2%降序分为A(6.8-16.7g)、B(4