基于质谱数据的蛋白质水平质量控制工具的分析研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:z306075045
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来蛋白质组学的持续热度带来了实验方法和仪器技术的革命性进步,也带来了数据规模的高速增长,在各大数据托管平台中已经累积了数量可观的数据集,其广度、深度已经进入了大数据的范畴,这也对相匹配的数据质量提出了更高的要求。蛋白质组学数据主要来自于质谱仪产出的谱图,相较于基因组数据的稳定性,常用的鸟枪法质谱技术的特性使得谱图映射到肽段再到蛋白时存在非常大的不确定性。然而,用于验证、校正质谱数据及后续分析结果的质量控制工具并没有像实验技术那样完善。由于后续的知识发现的可信度完全取决于前置数据集的准确性,随着蛋白质组学数据量的急剧扩增,数据的可靠性问题日渐凸显。本文探究了蛋白质组学分析各个流程的质量控制方法,并与蛋白质组学实验室合作整理出了质谱数据处理的基本流程与合适的质控工具,基于Galaxy框架整合了Mascot、Percolator等主流的质谱数据处理工具与质量控制方法,构建了自动化、高通量的工作流,提高了数据分析的效率,使得数据处理速度可以跟上数据产出的速度,为蛋白质组学实验室的日常分析提供了极大的便利。同时,为了更好地利用自建的Galaxy工作流,本研究结合两款已发表的蛋白质质控软件(IDPicker和MAYU)的思想编写了名为IDM的质控程序并嵌入到工作流中。本文选取了一批高质量的胃癌数据集,使用自建工作流进行了预处理,并在蛋白鉴定环节使用IDM以及另外三种已发表的质控工具分别对该数据集进行了质量控制。通过分析质控后的蛋白质鉴定结果以及最终生物学结论的差异,我们发现IDM是更理想的蛋白质水平质量控制方法。总的来说本研究设计的工作流及质控方法可为质谱数据在蛋白质层面的质控研究提供相应参考,在一定程度上促进蛋白质组学的发展。
其他文献
金属有机框架作为一种新型的多孔基材料,由于其确定的结构以及功能的多样性,在不对称催化、气体储存、光催化分解水方面具有广泛的应用前景。金属有机框架是由具有空轨道的金
大数据时代,各类数据都在快速增长.然而不是所有的数据都有价值,或者说存在一些垃圾信息,这给数据分析和决策带来一定的困难.因此需要从大量的数据中提取有用的信息,特征选择
液晶共聚酯的发现以及高模量低收缩(HMLS)型涤纶工业丝纤维作为一种新型高性能纤维的成功开发,掀起了PET聚酯改性研究的热潮,而纳米改性PET共聚酯复合材料的研究也一直受到学术
多金属氧酸盐是一类具有氧化还原性质的多金属氧簇化合物,在催化氧化、检测重金属离子、检测染料、电化学析氢和电化学析氧等领域有许多应用。按照文献,本文制备了K2Na18[Fe2
简述了论文的研究背景及意义,综述了智能注水工具的国内外发展现状,提出了论文的研究内容。分析了智能配注工具的结构和原理,了解了井下分层注水工艺,进而提出了智能配注工具
六价铬[Cr(Ⅵ)]在水环境中具有溶解度高、流动性强和毒性大等特点,已经引起了全世界的关注。去除水体中Cr(Ⅵ)的常用方法为吸附法,但吸附剂一般多选用有机物,且仅仅是将水溶液中
他拉哈断地区松辽盆地北部大庆长垣西部,是近几年外围油田主要的产能建设区块。他拉哈断裂带具有悠久漫长的发展历史,繁复的构造形成过程和活动频次大,是松辽盆地中浅层系油
城市商业综合体是城市中涵盖多元功能的建筑形式,包含了商业、住宅、办公、休闲娱乐、旅店、展览、餐饮、等业态功能,可将其概括为一个多功能、高效率、复杂而统一的有机组合体。随着社会经济快速发展,人们生活水平的日益提升,城市综合体在城市中所承载的职能越来越丰富,其公共空间的开放性逐渐承担起反哺城市空间不足的作用。在城市宏观叙事化建设被精细化设计逐渐取代的当下,城市商业综合体的规划建设也伴随着城市建设,出现
铁基非晶/纳米晶软磁合金因同时具备较高的磁导率、饱和磁感应强度以及较低的矫顽力和高频损耗等优异的软磁性能,在电力电子、信息技术等高新领域具有广阔的应用前景。然而,为了实现电子元器件向高频、小型化、片式化方向发展,对铁基非晶/纳米晶材料的性能提出了更高的要求。因此,自20世纪80年代以来,开发出同时具有较高非晶形成能力和优异软磁性能的铁基非晶/纳米晶软磁合金逐渐成为国内外材料学者研究的重点。本文在高
烯键还原酶(enoate reductases,ERs)是一种具有潜在应用价值的酶类,属于“老黄酶”家族(“old yellow enzyme”family),广泛分布于微生物和植物中。它能够选择性地还原α,β-