N-糖链质谱数据仿真算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xqd2cd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
糖组学是对糖链组成及其功能研究的一门学科,主要研究糖与糖、糖与蛋白质之间的联系和相互作用。质谱技术具有较高的灵敏度和选择性,是进行糖组学分析的主流工具之一。随着质谱技术的发展,质谱仪结合适当的样本制备技术能够在短时间内产生海量的糖链质谱数据,同时研究人员也设计出许多糖链质谱分析方法,试图鉴定出质谱数据对应的糖链结构。鉴定出的糖链结构的正确性非常重要,若鉴定结果没有正确性保证,就会误导研究人员后续对糖链功能的研究。其次质谱仪器具有不同的指标,使得真实质谱数据多种多样,但是不同的质谱分析方法能够适应的质谱数据类型比较单一,这对不同方法的评估造成一定困难。若提供一种基准数据作为不同分析方法的输入,就可以有效对不同方法的性能进行评估,同时促进新方法的研究。因此本文提出一种N-糖链质谱数据仿真GlycanMSSim算法,对N-糖链质谱数据进行仿真,主要研究内容如下:1.本文提出了一种N-糖链质谱数据仿真算法GlycanMSSim。首先提出了一种标记回溯方法,用于计算N-糖链的Y离子理论质谱;然后基于理论质谱,提出了带噪声质谱数据仿真的方法,分别是:对五糖核心谱峰后的所有谱峰进行质量随机漂移、在五糖核心谱峰之后随机添加和随机删除若干谱峰,同时对所有谱峰进行丰度波动处理,从而实现带噪声质谱数据的仿真。2.本文提出了两种仿真质谱数据评价方案,以判断仿真质谱的有效性。方案一引入了可达单糖、单糖特性谱峰、广义单糖和支持度等概念,并将仿真质谱作为N-糖链结构鉴定方法的输入,根据鉴定结果判断仿真质谱的有效性;方案二提出了两种目标-诱饵策略,通过构建诱饵数据库对方案一中的鉴定结果进行FDR评估,进一步验证仿真质谱的有效性。3.本文设计了N-糖链质谱数据仿真软件N-GlycoSimulation v1.0,搭载标记回溯方法实现了N-糖链编码解析功能,并结合本文提出的带噪声质谱数据仿真方法,实现了噪声类型选择和仿真结果绘制等功能。本文将GlycanMSSim算法应用于729个N-糖链,得到理论质谱和三种带噪声质谱数据,通过对四种仿真质谱数据进行鉴定分析,分别得到729、729、721、717个有效仿真质谱。通过构建500个新的N-糖链编码,与GlycoBCNovo中的仿真方法进行对比,结果表明本文提出的方法不仅运行时间上优于对比方法,且每种仿真质谱的有效质谱的数目多于对比方法。
其他文献
智能算法的开发与使用是智能矿山建设的重要组成部分。随着煤矿智能化的发展,煤矿产业中智能算法的应用规模逐渐扩大,智能算法在煤矿业务中产生的作用也逐渐显著。经过研究发现,煤矿产业中的智能算法的开发工作主要由对煤矿业务熟悉的煤矿工作者承担,其主要从事煤矿专业研究工作,往往对算法的复杂开发方式掌握不到位。并且,现有煤矿智能化产业不具备获取相关煤矿数据集的便捷手段,这也使应用于煤矿产业的算法的开发工作更加困
学位
深度伪造是一种利用深度生成网络制作逼真的伪造人脸图像或视频的技术,人脸视频鉴伪是对深度伪造技术制作的人脸视频的真伪性进行鉴别。随着人工智能技术的普及,深度伪造被应用在众多领域,但虚假媒体信息给社会带来了严重的安全威胁。随着伪造技术的不断升级,现有方法逐渐失效,找到高效、准确的人脸视频鉴伪方法迫在眉睫,因此本文针对人脸视频鉴伪问题进行了深入研究。本文的主要工作如下:本文设计了一种融合跨层时空特征的人
学位
远缘杂交是创制新物种及新品种的有效手段,已广泛应用于我国的水稻育种实践中,但是尚缺乏理论基础和可信的试验证据。本研究以膜荚黄芪(父本)和水稻(母本)的远缘杂种一代(F1)及其构建的远缘杂种后代红米自交系为材料,分析了水稻的远缘杂种后代中是否存导入了外源DNA,比较了红米和受体亲本(白米)的抗氧化活性和相关成分,并研究了红米种皮为红色的分子依据。结果表明在检测的42株F1代植株中有一株植株含有黄芪物
学位
现代安防领域普遍装有安防监控并基于人工监控的方式提供安全防护。随着“十四五”规划的提出,人工智能大力发展,目标检测算法赋予了安防监控智能属性,可有效抑制人工监控的不可靠因素。然而基于传统云计算的实现方式对于网络带宽、吞吐、安全隐私、实时性等问题无法解决,边缘计算可在数据源头一侧对数据进行及时处理,契合实时产生大量数据的智能安防应用。虽然NPU、TPU等技术的快速发展带动了边缘端嵌入式AI算力的提升
学位
近年来网络信息技术蓬勃发展,在各个领域都形成了海量的数据,而机器学习作为一种智能信息处理技术为人们挖掘数据中有用的信息和知识提供了高效的技术手段。现实世界中的数据往往呈现出不平衡分布的特点,这种现象广泛存在于医疗诊断、工业、金融等领域。因此,研究不平衡数据分类问题具有重要的现实意义。本文从算法层面提出了两种解决思路并进行了算法实现,主要工作有:第一,本文提出了一种基于形心自监督损失的不平衡数据分类
学位
膜荚黄芪(Astragalus membranaceus(Fisch.)Bunge)是常用的中草药之一,毛蕊异黄酮葡萄糖苷是其主要的生物活性成分,具有多种药理作用,是评价黄芪质量的标记化合物之一。随着黄芪野生资源的枯竭,植物不定根培养成为获取其有效成分的可行途径之一,但膜荚黄芪不定根中毛蕊异黄酮葡萄糖苷含量较低,且尚不了解其积累机制。有研究表明,干旱胁迫可增加植物中次生代谢产物的含量,本研究以膜荚
学位
甘露醇(Mannitol)是一种功能性甜味剂,在食品、医药和化工领域得到了广泛的应用。随着人们对甘露醇认识的加深以及对健康饮食的追求,未来全球对甘露醇的需求量将不断增长。利用微生物发酵法生产甘露醇,条件温和,没有副产物山梨醇生成的同时,还能为食品带来附加营养价值,促进人体健康,具有广阔的前景。柠檬明串珠菌95-9是一株诱变菌株,已被证实具有很强的产甘露醇能力。在实际生产中,菌种随着保藏时间的延长或
学位
紫红参为人参的干燥根和根茎的深加工产物之一。紫红参产品外观呈现淡黑褐色或者黑茶褐色,所以紫红参又被称为黑红参或黑参(文中紫红参又记作“黑参”)。最近几年对紫红参的炮制方式、化学成分、药理作用和毒理研究等研究比较深入。紫红参与人参相比较,它的炮制工艺中包括了蒸制、晾晒等,这些工艺需要较长的时间,而在这一过程中许多人参固有的人参皂苷就会转化形成稀有人参皂苷,所以人参固有的治疗功能也会发生变化,由于加工
学位
随着集成电路工艺的不断进步,芯片的特征尺寸也进一步减少,10nm以下特征尺寸的集成电路芯片时代已经到来,然而最适合10nm节点芯片制造的极紫外光刻(Extreme Ultra-violet,简称EUV)技术并不成熟,且价格昂贵,因此需要一种可以代替的技术来实现先进工艺节点下芯片的制造。利用已经成熟的浸没式光刻技术,结合三重光刻工艺便可以实现这一目的。三重光刻工艺是先将原始版图上的版图图形分配到三个
学位
随着电子设备的日益更新换代以及制造工艺技术的不断进步,温度传感器在越来越复杂化的应用系统中的重要性越来越明显,保证系统工作在适当的温度中对于系统的可靠性至关重要。电子信息、工业控制以及医疗设备等领域中对高精度温度传感器的需求越来越大,在精度严格的系统中如果温度检测失误偏大,往往会造成不可修复的后果,产生极大的损失,而传统的温度传感器的精度与实时性等性能较差,在工业生产应用中所受局限性很大。相较于传
学位