基于半监督学习的交联二肽鉴定算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zyhhappy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,化学交联质谱技术已成为研究蛋白质结构与蛋白间相互作用的主流技术。虽然近几年交联质谱技术有了很大的发展,但由于交联二肽的搜索空间巨大,在计算方法方面的研究相对滞后,在大规模数据库下鉴定交联蛋白质仍然存在精度低、速度慢的问题。本文主要研究如何提高交联蛋白质鉴定的精度与速度。主要工作包括如下三个方面。  第一,设计并实现了一种基于半监督学习的多谱排序算法,数据测试表明,在大规模数据库下可显著提升质谱鉴定的灵敏度。在BS3标注集上,使用该算法本文新开发的pLink2.1软件在混合入库的数据库上获得了95.3%的灵敏度,与pLink1.0相比,提升了20.9%。  第二,设计并实现了针对可碎裂交联剂的搜索流程,拓展了pLink2.1软件的应用范围。在Heck实验室的入库数据集上,pLink2.1比XLinkX软件鉴定速度快50倍左右,鉴定结果能够覆盖XLinkX鉴定肽段的97.5%,比XLinkX鉴定到的肽段数目多20%。  第三,为了对交联二肽鉴定算法的精度和速度进行评测,本文设计了模拟理论谱图的生成流程,并利用该流程对Kojak和Protein Prospector两个软件的蛋白内交联的假发现率公式进行了评价比较。  本文通过对大规模数据库下交联蛋白鉴定中的精度与速度问题的研究,采用半监督学习的方法显著提升了鉴定的灵敏度,并在可碎裂交联剂的搜索中显著提升了速度,为交联质谱的鉴定提供了pLink2.1软件工具。
其他文献
学位
学位
学位
随着物联网概念的快速发展,作为物联网最底层的交互单位——智能物件,越来越受到关注和研究。智能物件作为可以独立感知和执行的个体,在物端协同、信息物理系统等方面发挥着重要
视觉障碍给盲人和视障患者的日常生活带来极大的不便,由于缺乏对周围场景的了解和视觉感知,盲人的行走存在安全隐患。为了帮助盲人安全行走,国内外研发了基于超声波、激光、红外
随着web技术的快速发展,网站的交互性越来越强。人们开始从单纯的信息接收者,转变为信息的生产方。网络上存在着大量的文本数据,并且每天都在不断增加。比如facebook等社交媒体
学位
随着现代计算机技术的飞速发展,数控技术也日趋成熟。为数控产品设计并实现零件加工库是提高生产效率和产品质量的一种有效方法。零件加工库能有效缩短产品的设计和生产周期,提
学位
随着Web的发展和Web复杂性的提高,越来越多的用户开始遇到诸如Web页面加载缓慢的Web性能问题。Web性能的好坏直接影响着业务的成败,对于提供商企业和用户都十分重要,因而有必要