多肽鉴定问题基于分类的非凸优化算法研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:ieuieuieu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从数据库搜索引擎给出的大量多肽谱匹配(PSM)中鉴定出正确匹配称为多肽鉴定。它是目前基于高通量串联质谱平台鉴定蛋白质的关键步骤。尽管已经提出多种方法来提高多肽鉴定的准确性,由于搜索引擎输出的大量匹配是不正确,研究具有稳定性能的多肽鉴定算法仍是重要的研究课题。CRanker算法是一种基于核的分类方法,具有较强的分类性能。与基准算法相比,在多肽鉴定中显示出其优越性。但CRanker在小规模数据集训练过程中容易发生过拟合以及鉴定性能不稳定的问题。针对上述问题,本文对CRanker模型进行了改进,并设计有效的优化算法。CRanker与标准SVM分类器一样,在所有PSM数据样本上使用相同的损失函数及权重。实际上,目标PSM样本中大量标签是不正确的。这是在小型数据集上发生过拟合的重要原因。第二章在CRanker模型中进行改进,对于诱骗样本和目标样本引起的经验损失分别采用不同的权重参数。并在理论上分析了模型参数的作用。现有的优化问题解决非凸规划模型时很容易在较差的局部最优值终止,特别是在小数据集上,导致分类表现不稳定。第三章结合改进的CRanker模型与自步长学习算法提出了新的多肽鉴定算法,SPL-CRanker。新提出的算法用自步长学习方法代替了原有的训练方式,通过增大自步长学习参数实现了从可信样本到不可信样本的自动提取和分析过程。实验结果表明SPL-CRanker方法克服了CRanker在正确多肽谱匹配比例较小的数据集上鉴定性能不稳定的缺陷,使得在测试数据集上可得到稳定的多肽谱匹配鉴定结果。SPL-CRanker在相同FDR水平下鉴别目标PSM的数目,ROC指标等方面的表现均超过了主流多肽鉴定方法PeptideProphet和Percolator。第四章将CRanker模型重建为内嵌支持向量机的DC优化模型,运用CCCP算法进行求解。实验结果表明新方法与两种基准方法相比,在多个数据集上均可得较好的鉴定结果且在测试集上具有良好的推广性能。为后续设计大规模PSM数据集的多肽鉴定算法奠定了基础。
其他文献
目的探讨米诺环素软膏联合替硝唑对慢性牙周炎患者的临床疗效。方法选择本院2013年11月至2015年6月收治的104例慢性牙周炎患者作为研究对象,所有患者随机选择1颗患牙进行研究
目的分析个性化健康教育对小儿腹泻的防治作用,为临床提供参考。方法以本院2013年3月至2014年2月治疗的腹泻患儿196例为观察对象,根据护理方式分为观察组与对照组,各98例。两组
人工全髋关节置换术的康复护理至关重要,它关系病人术后生活的质量.我科自2000-05~2004-10进行人工全髋关节置换术162例.对以上患者进行了有计划的康复护理,取得了良好的效果,
智能三相电网缺相保护器,是一种通过检测和分析三相电网内部多种电量后确定出更加科学的负载缺相保护参考数据的装置。智能三相电网缺相保护器的研发背景、工作原理及保护器研
目的总结分析呼吸机相关性肺炎(VAP)的危险因素和病原菌分布及耐药性情况。方法选择2012年6月至2015年10月期间在本院接受机械通气治疗的120例患者为研究对象,回顾分析这类患者
通过丹佛斯FC302变频器在中央空调风机和水环式真空泵中的驱动实例,介绍变频器的选型策略,提供了变频器前端接入无源滤波器之后变频器参数设定的2个经验,对变频器的正确应用
重庆市轨道交通六号线二期中梁山隧道在施工过程中发生的突水涌砂事故的基本情况,并综合运用地质超前预报和超前探孔的方法,分析其事故发生的机理,在此基础上提出相关的治理措施
2018 年,吉林省被国家确定为农村集体产权制度改革整省试点。按照农业农村部批复的整省试点方案,全省正在扎实推进整省试点工作。按照试点先行、有序推进的要求,吉林省农村集
汽车保有量的预测是城市交通规划的一项基础性工作,是制定各种交通需求管理措施的重要依据。分析影响城市汽车保有量的因素,将城市划分成不同的交通小区,并建立相应的评价模型对
现代潜艇防护能力大大提高,传统水下武器难以对其形成致命打击,而采用聚能型战斗部鱼雷可提高鱼雷在水下的毁伤威力。因此开展水下EFP成型及其终点效应的研究对推动弹药技术的发展具有重要意义。首先介绍了国内外相关内容的研究现状,其次在考虑静水压力条件下利用LS-DYNA对EFP在水下运动成型过程及其对目标靶的作用过程进行了大量数值仿真计算,研究分析了EFP在水下运动成型规律以及其对双壳体潜艇毁伤规律。最后