质谱数据结构化存储及压缩问题研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:wobuwanlebuxingma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
质谱技术是蛋白质组学中用于蛋白质鉴定的一项支撑技术。质谱数据处理过程具有多策略、多处理步骤、多种处理软件的特点。目前使用质谱仪产出的实验数据格式极不统一,后续分析软件的输入数据格式也多种多样且对格式要求严格,这给数据交换和数据整合带来了很大的困难,对质谱分析平台和质谱数据库的建设提出了挑战。目前,研究人员在繁多的质谱数据分析方法的基础上已总结出了几种典型的数据分析流程,因此,现阶段的一个研究方向即是集成开发综合性的质谱数据分析平台。在归纳集成数据分析流程的同时,整理已有的质谱数据,建立质谱数据库存储当前公开发表的实验数据,也是当前蛋白质组学中的一项重要工作,而此项工作的开展又只能建立在公共质谱数据标准的基础之上。基于以上现状,本文的主要研究工作包括以下几个方面:(1)质谱数据综合分析平台中公共数据层实现课题组正在开发具有web用户界面的质谱数据综合分析平台,该平台主要由数据管理系统、工具管理系统、文档管理系统和用户界面系统组成,可以完成质谱数据的提交、查询、存储与共享,实现定制数据分析流程等功能。其中的公共数据层实现数据管理系统中数据格式(UDF)与工具管理系统中分析软件所需求数据格式的相互转换功能。(2)质谱数据综合分析平台中的统一数据格式结合质谱数据分析中质谱数据标准的研究进展情况,系统地梳理归纳目前分析方法中需要使用的全部数据信息,在已有数据标准的基础上,提出一个适用于质谱数据分析的统一数据格式(非标准),该格式将尽可能弥补基于XML的数据标准在数据分析中的不足,并能够适用于典型蛋白质鉴定的整个流程。(3)质谱数据压缩初步探究质谱实验本身的特性决定了需要使用多次重复试验的实验策略,又加之目前单次质谱实验中实验数据产出量巨大,随之而来的问题是需要存储海量的实验数据。在将实验产出数据转换成基于XML的数据标准后,文件的体积至少还会加倍地增长,因此,本文尝试有针对性地使用已有的文本数据压缩技术和XML数据压缩技术来缓解此问题,并结合对质谱数据的结构预处理,提出数据压缩的可行方案,比较了压缩效果。
其他文献
随着网络信息技术的快速发展,通信电源的设计思路越来越新颖,功能越来越完善,作为通信网络的基础性服务设施,通信电源发挥的作用和实践应用价值越来越突出。全球信息化发展的
以部分白灰代替白云石,提高炉渣三元碱度,提高炉温,可使[S]下降,合金质量基本稳定,炉况良好。
路由器设计中 ,IP地址的路由查找算法设计很重要 ,算法的性能将直接影响路由器的性能。本文对 Waldvogel等人提出的二分法查找 hash表算法进行了改进 ,使路由查找效率从至多
随着分布式电源的不断发展,其在大电网中渗入也越来越严重,给电网带来了严重的挑战和威胁。该文主要介绍采用虚拟同步发电机控制算法,将定子方程以及转子机械方程引入到光伏
<正>山、绵羊种质资源是养羊业持续发展的基石,在国民经济发展中具有重要的地位,对羊产业生产效率和效益的提高具有重要作用。优良的山、绵羊品种是优质、高产、高效养羊业的
针对真空平面静压气浮轴承性能分析的二维问题,对带有均压槽的真空平面静压气浮轴承的供气量、气膜厚度和刚度进行了数值分析和实验研究,提出了一种适用于粘性流、过渡流和分
庚子赔款是帝国主义豺狼吞噬中国人民膏血的一笔血债。帝国主义豺狼不仅用屠杀人民、劫掠财物的行动记录了历史上“八国联军”的罪恶,还以对殖民地国家所能施加的种种欺压勒
当前,实验教学不仅要培养学生的实践技能,而且要培养学生的创新能力,但传统的物理实验教学还存在着许多与创新教育不相适应的地方,这就要求我们越须大力推进实验教学改革,从教育观
日前,日本多木化学(Taki Chemical Co.,Ltd.)宣布成功研发了一种可用于全固态锂离子电池的铌氧化物溶胶(Nb-G6700),该产品由纳米级的铌氧化物和锂离子组成,将其涂敷于正极材
【正】 伟大作家曹雪芹在《红楼梦》这部政治历史小说中,以精湛的艺术笔触,深刻的历史内容,成功地塑造了晴雯、司棋、贾宝玉等一系列奴隶和叛逆者的典型,热情描绘了他们反对