基于规模化质谱数据的肽鉴定方法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:slim_ning
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于质谱数据的蛋白质鉴定已经成为蛋白质组学的基础技术。规模化的蛋白质鉴定通常采用“鸟枪法”,其基本思路是将生物样品中的蛋白质酶切成肽段,经过色谱分离进入质谱仪,质谱仪对某个时间点的全部肽段离子即母离子进行检测生成一级质谱,在一级质谱上选择强度高的母离子进行碎裂,对生成的碎片离子进行检测形成二级质谱,通过二级质谱图及其母离子质量鉴定肽段,然后推断蛋白质。   肽段母离子一般呈现为一个复杂的同位素谱峰系列,质谱仪的数据处理软件常常没有导出正确的母离予电荷或单同位素峰质量,导致给出的母离子质量产生很大偏差,正确肽段进入不了候选,从而无法得到正确鉴定结果。如果能通过质谱仪或者计算方法获得非常小的母离子质量误差,则可以极大减少候选肽段的数目,从而提高肽段鉴定的速度。所以准确检测母离子,包括正确的单同位素峰和较小的质量误差,将会提高规模化质谱数据的肽段鉴定效率。本文考虑了碎裂窗口内噪音和共洗脱肽段的影响,利用同位素峰簇中最高峰的位置和质量的关系判断谱峰的重叠,重构色谱峰去掉噪音,通过特征提取和排序,最后输出碎裂窗口内可能的单同位素峰。在标注集上,我们的方法pParse的准确率超过了98%,比常用数据处理软件BioWorks、MaxOuant都高。   肽段共洗脱是“鸟枪法”技术中的普遍现象,会造成多个肽段碎裂到一张二级质谱中,即混合谱。通过pParse容易识别混合谱,但鉴定混合谱比鉴定单肽段谱图要困难,原因是混合谱中每个肽段的碎裂都相互受到了影响。如果碎裂不好,利用肽段局部信息的打分算法效果也不好,比如利用二级质谱中碎片离子的连续性、匹配谱峰计数等算法。本文从肽段全局信息的角度,借鉴特征谱峰的概念,设计了新的打分算法。所谓特征谱峰,就是可以唯一确定所属肽段离子的谱峰组合。即使肽段碎裂不好,只要特征谱峰存在,还是可以鉴定肽段。首先通过母离子获得候选肽段,计算每个肽段的碎片离子对在所有肽段中出现的频率。如果只出现一次,则这对离子就是对应肽段的特征谱峰。把每个肽段的特征峰和非特征峰找出来,根据它们的强度和频率打分,称为UIS打分。在酵母数据上,UIS打分鉴定的共洗脱母离子是利用连续性打分引擎pFind的两倍。另外,还可以结合一二级谱各自的特点设计新的流程进一步提高混合谱的鉴定率,称为pParse+。在酵母数据上,pParse+比pParse的母离子鉴定数提高10%。   母离子质量校准只是蛋白质鉴定的一个环节,蛋白质鉴定的环节有很多,比如数据库处理、谱图处理、肽谱匹配打分、肽鉴定结果评价、肽段定量,还有蛋白质鉴定、评价和定量等。每一步又有很多选择,如何合理的把各个环节组装起来以适应各种需求,是一个值得研究的问题。我们提出了三种不同需求下的流程:简单的批处理流程——pBatch、智能的分析流程——哪吒、分条件的分析流程——pFlow。通过流程实用化,达到了提高数据分析的速度、自动分析数据中的参数和深度解析质谱数据的目的。
其他文献
随着21世纪的到来,软件行业飞速发展,传统模式的软件越来越受到费用及软硬件环境的制约,SaaS应运而生,并迅速受到大众的接受。使用SaaS应用提供的服务,用户不必花费大量金钱
计划调度评审技术(ProgramEvaluationandReviewTechnique,PERT)是系统工程中对潜在任务进行分析的一种方法,是一种科学的组织管理技术,其建立的目的是为了简化大而复杂项目的计划
在聚变实验的数据分析中,分析等离子体行为往往需要查找某些波形的相似波形。目前寻找相似波的方式为研究人员利用可视化数据访问工具逐个查看波形的结构形状。但是随着实验数
图像变形是指初始物体(数字图像、曲线、曲面、网格等)到目标物体的连续、光滑、自然的过渡。在图像或图形上设置有限个数的控制点,通过对这些控制点的约束以及过程设计,从而使整
无论是巨型的超级计算机,还是飞速发展的移动终端,功耗都成为了衡量处理器优劣的一项重要指标。从处理器功耗的统计结果可以看出,在功耗被广泛重视之前,通用处理器的功耗密度
智能电视同步内容服务是指通过对电视节目状态进行监控,智能地向观众提供同步于所观看节目(包括电视节目和广告)的扩展内容。相应系统可以丰富用户获取的信息,大大提升用户的
作为具有极大潜力的计算硬件设备,GPU正越来越多的被用于科学计算领域,对具有大量并行性的高吞叶量计算等应用进行计算加速。但在GPU上运行的通用计算程序的编写和优化往往较
代理移动IPv6(Proxy Mobile Internet Protocol Version 6,PMIPv6)协议是一个基于网络的本地移动管理协议。在移动管理协议的信令交互中,基于网络的移动管理协议不需要移动节点
随着半导体芯片技术的快速发展,处理器芯片的集成度和性能越来越高,而体积越来越小。这直接导致处理器单位面积功耗呈指数级增加,能耗问题日益突出。尤其在嵌入式实时系统领域,实
软件即服务(Software as a Service)的出现将软件商业模式从商品供需模式转换为服务供需模式,这符合行业发展的潮流,必将成为软件行业未来发展的方向。多租户是SAAS的核心技术,