非依赖采集型蛋白质质谱鉴定结果重排序算法研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:luckyphilip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据非依赖采集(DIA)是蛋白质组学领域近年来快速发展的质谱采集技术,其通过无偏碎裂隔离窗口内的所有母离子采集二级谱图,理论上可实现蛋白质样品的深度覆盖,同时具有高通量、高重现性和高灵敏度的优点。然而,由于DIA数据采集得到的二级谱图高度复杂,对肽段可靠鉴定造成困难,现阶段一个主要研究方向是提高DIA数据的肽段解析率。其中,DIA重排序算法通过衡量肽段谱图匹配结果的可信度,并构建诱饵库作为额外的负例,进行半监督分类学习,将正确肽谱匹配排到前面,经过可信度评估后能够进一步提高鉴定结果数目。然而,目前的DIA重排序算法大多依赖先验知识进行人工特征提取并结合机器学习算法实现重排序,没有充分利用原始数据的深层特征,制约了DIA数据的高通量分析。针对这一问题,本文提出了一种基于多模态融合学习的DIA重排序算法Re-DIA。基于多模态融合学习的DIA重排序算法的核心思想是将DIA数据中的肽段表征为多种模态下的特征向量,利用多个维度上的特征表示模型提高区分正确和错误肽段的能力,进一步提高鉴定结果数目。在Re-DIA中,使用基于图像识别、时间序列信号和基于经验的人工特征来表示单个肽段结果,图像识别深度学习的重排序算法是将肽段3维数据结构与图像识别深度学习结合,利用基于注意力机制的Res Net残差网络模型学习肽段的深层特征,时间序列深度学习的重排序算法是将肽段在保留时间维度上信号强度变换对应数据结构与双向长短时记忆网络LSTM模型结合,人工特征基于经验的打分设计进行计算,使用深度学习的高维表征能力和人工特征共同学习肽段的深层信息,区分结果集合中的正误结果,实现对DIA鉴定结果的重排序。与基于机器学习算法的常用DIA软件方法相比,Re-DIA在传统的基于先验知识的人工特征提取基础上,利用深度学习建模肽段数据结构,自动学习正确和错误的鉴定肽段在数据中的深层特征,同时也支持了对多个软件的鉴定结果读取,对其鉴定结果实现重排序,进一步提高各软件的鉴定能力。本文对比了DIA-NN和Dream DIA两类DIA软件,采用多个数据集实验对比各重排序算法报告的鉴定结果数目。实验结果表明,Re-DIA重排序结果在肽段母离子水平上报告的可信鉴定结果数目较DIA-NN平均高出10.6个百分点,比Dream DIA平均高出10.4个百分点。
其他文献
细菌感染和创伤后大量出血严重威胁着人类的生命健康,现有抗菌和止血医用材料/器械的性能仍难以满足临床需求。医用材料/器械与生物体相互作用以实现目标生物医学功能的过程中,材料表面结构与性能常发挥着关键作用。因此,新型高性能抗菌止血器械开发中,如何对现有医用材料进行有效的功能化表面改性,在不改变原有医学功能和应用场景的基础上满足临床需求是一项需解决的关键科技问题。此外,在新型医用涂层研究中,涂覆工艺简便
高压气瓶的快速放气过程广泛存在于能源、化工、航天等领域。放气过程的动态特性是相关系统设计的重要基础。针对高压气瓶的快速放气过程进行了分析,基于实际物理过程并进行部分简化后,建立了理论模型,推导了高压气瓶和低压容器腔内压力随时间变化函数。同时,开展了高压气瓶快速放气的验证试验,对放气过程中的动态参数(包括温度、压力等)进行了测量。理论模型的计算结果与试验结果较为吻合,验证了模型的准确性。最后,基于理
大学英语课程兼具工具性和人文性,课时较长、覆盖面广,具有课程思政的天然优势。智慧教学模式助力传统课堂,是互联网+时代发展的必然趋势。在大学英语教学中,依托智慧教学平台,从教师、教材、教法三方面入手,通过提高教师课程思政和技术能力、深挖教材的思政元素和智慧资源、建构大学英语思政智慧教学体系实施大学英语课程思政建设,可以使知识传授与价值引领同向同行,最终实现全程育人、全员育人和全方位育人的“三全育人”
玉米是重要的经济作物,也是当前畜牧业、养殖业、水产养殖业的重要饲料来源,在食品、医疗、工业领域都有着很高的应用价值。立夏之后播种的玉米称为夏玉米,在我国种植分布广,产量较高。文章结合夏玉米高产栽培技术,从良种选择、播种方法、田间管理以及病虫害防治等方面进行了综合分析,探索了夏玉米高产增收技术管理措施。
期刊
为了高效、准确地模拟高维多元Cahn-Hilliard (C-H)方程描述的复杂相分离过程,该文发展了一种基于纯无网格改进有限点集法(corrected finite pointset method, CFPM)和CPU-GPU异构的快速并行算法(简称为CFPMGPU).CFPM-GPU的构造过程为:(1)基于Taylor展开和加权最小二乘思想,采用Wendland权函数推导出空间一/二阶导数的有
本篇口译实践报告以顺应论为指导,在译员以第十一届全球医疗保健论坛为对象进行模拟韩中交替传译的基础上撰写完成。在新冠疫情仍在全球蔓延的形势下,健康成为热议话题。本次论坛针对增强免疫力的战略进行探讨,紧贴当前病毒成为新常态的时代趋势。因此,选取该论坛进行模拟韩中交替传译具有实际意义。Verschueren的顺应论虽是语用学领域较为新颖的理论,但对口译同样具有很强的指导作用,值得探究其在口译过程中的实践
最终接头止水工艺的效果决定了最终接头工艺的成败。通过研究大连湾海底隧道工程隧道最终接头模型试验、最终接头结构形式、止水构造、止水构造安装工艺和止水构造保护措施,探索出新型最终接头止水带安装工艺及保护措施,分析了止水带安装操作优缺点,在总结施工经验的基础上优化了施工工艺。通过模拟安装验证了此止水带安装工艺及保护措施的可行性,同时也证明了在高纬度寒冷地区,此种安装工艺和保护措施具有良好的可实施性和易操