论文部分内容阅读
随着信息科技的不断发展与完善,人们每天需要处理海量的信息数据.其中大部分信息数据均能抽象为图这种数据结构进行表示,当抽象出的图中顶点之间的连接包含属性信息时,每个属性值构成两个顶点之间的一条边,即两个顶点之间存在多条包含不同属性值的边,这样的数据称之为多维度图数据.对包含亿万个顶点和边的多维度图数据进行紧凑的表示和高效的操作,是海量多维度图数据领域研究的一个重要内容.紧凑的多维度图数据表示不仅能够在存储数据时减少空间的占用,而且还能够提供更加高效的操作,从而使数据的管理效率得到提高.为此,本文在kd树的基础上,引入多值决策图(Multi-valued Decision Diagram, MDD)技术,对多维度图数据的表示与管理进行研究.本文主要工作如下: (1)研究了多值决策图与多维度图数据表示之间的关系,给出了多维度图数据的紧凑表示方法kd-MDD的定义、形式化描述、性质以及构造算法.构造算法主要包括三个过程,对图中顶点和连接关系进行二进制编码,根据顶点和连接关系的编码进行边的编码,最后根据边的编码集合构造kd-MDD.在kd-MDD的构造过程中隐式的合并了kd树中的同构子树,消除冗余节点,使得多维度图数据的存储结构更加紧凑. (2)实现了多维度图数据的动态管理.研究多维度图数据的查询及编辑操作与MDD逻辑运算之间的关系与区别,给出了kd-MDD表示方法下多维度图的增加/删除边、增加/删除顶点等编辑操作的一系列算法,解决了kd树不适用于动态图的问题. (3)将kd-MDD方法应用于时序图数据、GIS数据以及RDF图数据等真实应用数据的表示与处理中,通过理论分析,并在MDT05等高程数据以enwikinews、epinions等时序图数据上进行了对比实验,证明了本文给出的kd-MDD方法的适用性和高效性,为多维度图数据的表示和处理提供新的方法和技术.