论文部分内容阅读
质谱是蛋白质组学研究的重要分析技术,许多研究利用基质辅助激光吸附离子化质谱和表面增强激光吸附离子化质谱分析疾病和正常两类样本中的血清或血浆中蛋白质表达的差异,获得生物学标记以区分疾病与正常样本。但是,目前关于同种疾病的不同研究报道的生物学标记之间的重复性不高。
在本文中,我们首先采用三种常用的预处理方法(SpecAlign、PROcess和Cromwell)分析一套前列腺癌和一套乳腺癌质谱数据,以研究不同预处理方法对于蛋白质表达谱所包含的质荷比的重复性的影响,结果发现不同预处理方法得到的表达谱所包含的质荷比的一致性很低,以致生物学标记(差异质荷比)的重复性很低。因此,在不同的研究中采用不同的预处理方法可能是造成生物学标记识别重复性低的一个重要原因。然后,分别基于前列腺癌和乳腺癌的重复检测数据,我们研究了每种预处理方法的重复性表现,结果显示各预处理方法在两套数据集中检测到的峰(peak)和差异质荷比具有很高的一致性。最后,我们基于同一种预处理方法探究关于卵巢癌、乳腺癌和前列腺癌多次实验的差异列表的重复性,结果显示采用三种预处理方法找到的差异质荷比的重复性均很高。该结果提示,不同于转录水平mRNA表达谱,由蛋白质数据获得的差异表达标志具有相对稳定的特性。