pSite:肽段从头测序结果中氨基酸层次假发现率的控制方法研究

被引量 : 0次 | 上传用户:chenyun120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于质谱数据的蛋白质鉴定算法主要分为两类:数据库搜索和肽段从头测序。肽段从头测序方法不依赖于数据库信息,直接根据谱图中谱峰信息推断肽段序列。尽管该方法已经成为基于质谱数据的蛋白质鉴定的主流方法之一,目前仍然缺乏假发现率的质量控制手段。前人研究表明[1],从头测序方法得到的高分结果,其全长序列正确率不足70%。由于缺乏数据库信息,从头测序方法无法借助反库序列来模拟随机匹配,从而无法基于目标诱饵库的策略[2]来估计并控制FDR(false discoveryrate)。实际上,从头测序得到的结果往往存在部分氨基酸正确、部分错误的情况,所以我们进一步需要去估计氨基酸层次的假发现率(FAR, false amino-acid rate),FAR的概念是由本文第一次提出,其定义为超过某打分阈值的错误氨基酸数目除以所有氨基酸数目。本文提出了一种新的评估方法 p Site,可以估计从头测序结果中每个氨基酸的可信度,从而估计FAR。p Site针对待估计的氨基酸,将其领域氨基酸组成的序列标签进行全枚举,得到质量近似等于原始序列标签的背景序列标签,然后与剩余氨基酸连接得到背景肽段,计算原始肽段与打分最好的背景肽段间的打分分差作为特征,使用机器学习方法 SVM[3]对待估计氨基酸进行可信度的打分(如图1)。对于所有氨基酸的打分分布,使用两个Gamma分布去分别拟合正确、错误氨基酸的打分分布,并且使用EM算法[4]估计分布的参数,从而可以估计任意打分阈值之上的FAR。
其他文献
奇瑞重工从注册至今仅仅3年多,首台农机整机下线也就两年,确已牢牢占据国内前三强,业内不禁有人惊叹他的快速崛起。走进奇瑞重工,去感受他的成长。进厂房看产品,来总部聊发展,记者
报纸
<正>对比高超的授课技能、丰富的知识和丰硕的科研成果,情怀是一名优秀的大学教师更重要的素质。教师的情怀是他(她)对学生的关注和爱护,是无处不在的职业责任感,不会被环境
会议
自石墨烯被发现以来,以层间范德华力结合的二维材料获得了极大的关注。二维材料所展示出的奇异物理性能及潜在的重要应用,被认为是后摩尔时代关键材料之一,有望发展成为具有
对我院门诊麻醉药品和第一类精神药品使用情况汇总,分析医院对特殊药品使用的规范性及合理性。调取我院2015-2019年目标药品的用药信息,计算不同药物的销售总金额、构成比、
过氧化氢(H2O2,又名双氧水)是一种重要的绿色化工原料,2018年我国过氧化氢产能已达到1373万吨,其作为强氧化剂、漂白剂、消毒剂等在化工、纺织、造纸、国防、电子、医疗、环境保护等行业中有着广泛的应用。蒽醌法具备低成本、易控制、可循环等优点,是当前大规模生产过氧化氢的唯一方法。在蔥醌法制过氧化氢工艺中,蒽醌工作液扮演着核心角色,其包含2-乙基蒽醌(2-EAQ)工作载体和溶解2-乙基蒽醌及其加氢
本文采用高效液相色谱法测定阿卡波糖原料中的有关物质。方法:采用高效液相色谱法,色谱柱为氨丙基硅烷键合硅胶色谱柱(150mm× 4.6mm,3μm);流动相为磷酸盐缓冲液-乙腈(22:78
目的:观察皮肤软组织扩张技术联合自体肋软骨移植方法,在矫正小耳先天畸形全耳再造术中的临床应用效果及价值。方法:选取2018年4月~2019年4月我院接收的60例(60耳)先天性小耳
本文考察了不同结构的USY、ZSM-5、ZSM-12、Hβ沸石分子筛催化剂在催化2-(4’-乙基苯甲酰基)苯甲酸(BE酸)的脱水闭环反应中的催化性能,筛选出性能最佳的Hβ沸石催化剂,并对H
“以学为中心,促进学生有效学习”理念,引发教师对思想品德课应讲什么、解决什么问题进行了再思考。在课堂教学中,我们发现形式花哨有之,浅尝辄止有之,环节繁杂有之,不知所云
传统化石燃料的过度开发和使用不仅会造成资源的迅速枯竭,而且还会带来严重的环境污染,因此急需寻找一种可以替代的清洁能源。氢能能量密度高,燃烧无污染,是最理想的清洁能源