论文部分内容阅读
随着遥感技术的快速发展,海量遥感影像数据的组织与管理日趋复杂。遥感影像元数据是描述遥感影像数据的数据,如何高效地对其组织与管理是遥感应用研究的一个重要问题。遥感影像包含各类目标对象较多,造成其元数据的描述条目众多,标签较为稠密。由于客观技术条件的限制,遥感影像及处理结果包含大量的不确定信息,故其对应的遥感元数据一般用模糊XML文档描述。随着遥感信息服务的不断普及,海量遥感元数据的存储与共享问题成为制约遥感信息处理系统性能的一个瓶颈。目前的遥感信息处理系统往往采用压缩技术以减少存储和传输开销,但是对遥感元数据的查询分析需要解压以后才能进行,这带来了额外的性能开销。研究不需要解压的模糊XML文档查询算法就显得十分的迫切。由于压缩文档的查询算法需要在特定的压缩数据结构上进行,因此遥感元数据的模糊XML文档的压缩与查询技术是一对关联问题需要同步研究。针对上述问题,本文首先设计了一种支持不解压查询的模糊XML文档压缩算法;在此基础上,提出了一种可直接在模糊XML压缩文档进行遥感元数据查询的关键字查询算法;并将该技术进一步应用到了国家民用空间基础设施陆地观测卫星共性应用支撑平台的遥感元数据存储与传输的功能模块中。本文的主要工作如下:1.提出了一种针对模糊XML文档的压缩算法FAPEr算法。算法对模糊XML文档中的重复标签和属性重新用短字节编码来提高压缩率。该算法是对前人提出的FAPE算法的改进。FAPE算法的压缩对象是精确XML文档。本文算法在其基础上加入了对模糊XML文档中模糊结构体的处理方法,以解决原算法不能处理模糊XML文档的问题。并设计了新的Linked Hash Map方法来减少节点更新时的计算过程,从而进一步提高算法的效率。实验表明,本算法的压缩率较为显著。2.提出了一种针对模糊XML文档的关键字查询算法BIndex算法。该算法能够在FAPEr算法的压缩文档上,进行关键字查询并返回相应的结果,解决了传统查询算法不能对压缩的模糊XML文档进行遥感元数据查询的问题。算法通过构造匹配结构体来快速查询SLCA节点,并采用自上向下的查询策略以忽略中间无效结果。实验表明,算法的查询效率有较大提升。3.设计并实现了一个遥感元数据存储与传输的功能模块。该功能模块能够对遥感元数据的模糊XML文档进行压缩和关键字查询。模块采用Java开发,以Java中jar包dom4j处理XML文档的Document类为基础,开发了一个Analysis.Xml包。包含Main Windows类、Xml Utils类和Standalone Writer类和11个方法。该包在国家民用空间基础设施陆地观测卫星共性应用支撑平台中被成功应用,能够成功实现遥感元数据的压缩和关键字查询。