利用半随机抽样模型进行蛋白质概率计算方法的评估等质谱信息学研究

来源 :中国人民解放军军事医学科学院 解放军军事医学科学院 | 被引量 : 0次 | 上传用户:zxj3510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Shotgun技术是大规模蛋白质鉴定的重要方法,能在一次实验中获得大量的数据,而这些数据的可靠性是蛋白鉴定的一个重要问题。当前关于鉴定结果质量控制的研究主要集中在肽段水平上,而对于蛋白质水平上的鉴定结果可靠性研究比较少,且这些研究中的评估方法所用的数据量都比较小,不足以说明方法的有效性。 在对现有shotgun蛋白质鉴定过程充分理解的基础上,建立了一个半随机抽样模型模拟大量数据搜索后鉴定结果,以期用该模型评估蛋白质概率计算过程中可能涉及到的影响因素,同时评估现有的蛋白质概率计算方法。 为了验证所建立的半随机抽样模型的可靠性,对一批标准蛋白质数据进行模拟,比较不同肽段数上的模拟的和真实的蛋白质或肽段数,发现两种结果基本相似,证明了该模型能基本代表真实的蛋白质鉴定过程。 基于一批人肝脏的数据,利用半随机抽样模型模拟的34批数据,对鉴定结果的数据量大小、搜索数据库大小和去高丰度蛋白质等影响蛋白质概率计算的因素进行了评估,发现随着数据库和数据量的增大蛋白质的总体阳性率都会下降,而去除高丰度的蛋白质在一定程度上能够提高蛋白质的真阳性率。同时,利用这些模拟数据,对目前常用的4种蛋白质概率计算方法进行了评估,发现PROT_PROBE能较好地区分鉴定结果中假阳性和真阳性蛋白质;ProteinProphet计算的蛋白质概率高于真实结果且区分度不佳;取双肽段以上(≥2个非冗余肽段)蛋白质的方法效果较好,但会受到数据库和数据量大小的影响:HPPP所采用的泊松模型在一定程度上能较准确地计算假阳性蛋白质鉴定数,但这种方法强烈依赖于单肽段的假阳性率。因此,总体而言,现有的各种方法在部分解决蛋白质水平质量控制的同时,都存在着各自的缺陷,至今尚无较成熟可靠的方法。 另外,随着蛋白质组学的发展,以及系统生物学研究的逐渐开展,需要高通量地进行蛋白质的相对定量。我们在目前所用的无标记定量方法的基础上,用EM算法进行了方法的改进,并利用已有研究发表的数据进行验证。结果表明,改进后的质谱数和蛋白质丰度的相关性比改进前有一定的提高。同时,利用这些数据对主要的几种基于鉴定蛋白质的质谱数定量模型进行比较,发现PAI模型最好,SpS模型次之,emPAI模型效果最差。 最后,本论文还进行了一个实用软件AutoMascot的开发研究,该软件能自动批量提交图谱数据进行Mascot搜索。AutoMascot不仅包括了Mascot的web服务方式和MascotDaemon的常用功能,也增加了远程访问Mascot搜索引擎、批量提交数据文件或文件夹、多种搜索结果文件格式和输出结果的展示等功能。
其他文献
低氧影响动物的学习记忆行为,当低氧强度过大或时间过长时这种影响往往是一种损伤,而适度的低氧对学习记忆产生促进作用。有人认为这是因为低氧激活HPA轴,诱导糖皮质激素(glucoc
齿鲸(Odontoceti)的发声机制及其栖息地的水声环境特性是海洋生物声学(marine bioacoustics)研究中的两个重要内容。对于理解齿鲸的发声机制而言,齿鲸头部组织的声学参数,包括
半胱氨酸蛋白酶是生物体内蛋白水解的主要参与者,参与了生物体的细胞凋亡、组织降解、免疫防御等过程。家蚕半胱氨酸蛋白酶抑制剂(BmCPI)作为家蚕半胱氨酸蛋白酶(BCP)的专性抑
乌头Aconitum carmichaeli Debx为毛茛科乌头属Aconitum植物,附子Radix Aconiti Lateralis Preparata为乌头栽培种的侧根,是一种“回阳救逆”的名贵中药,道地产地为四川江油
MPEG-4 AAC编码标准是由ISO/IEC运动图像专家组为进一步提高音频编码压缩性能而制定的新一代音频编码标准,是MPEG-4音频编码标准的核心。MPEG-4 AAC编码标准是目前所有感知音
体绘制技术是一种重要的科学计算可视化方法,它可以通过抽取体数据集中内在的本质信息,并采用计算机图形图像处理技术直观地展现出来。该技术适合生成原始数据集的整体图像,
水声图像具有直观和可视化等优点,目前已经获得了广泛的应用,但是如果要进一步应用水声成像迫切需要解决一些关键技术。论文围绕基于角域滤波水声成像的关键技术这一主题,开展了
该文在对基于语义和基于声纹的说话人识别技术研究的基础上,提出在分段线性映射的基础上将不同技术统一到一个相同的框架下,分阶段利用语义信息确认技术来增强文本无关声纹确
脊椎动物的中枢神经系统(CNS)是非常复杂并具有高度组织性的系统,细胞的多样性是神经系统的显著特征之一。尽管神经元和胶质细胞都具有重要功能,但目前对其发育和分化的具体机
SDH体制具有传输容量大、组网灵活、长途传输质量高等优点,因而其应用日益广泛,不仅可用于光纤传输系统,而且在微波传输系统中也被大量采用。高效高速的多电平正交幅度调制(M