论文部分内容阅读
近几年来,随着移动设备的迅速发展,越来越多的用户使用移动设备获取数据。移动用户可以使用手机、PDA、平板电脑通过无线技术(例如WiFi等)下载感兴趣的数据。这些数据有股票信息、天气预报、交通信息等。数据广播是一种无线环境中有效的数据发布系统,具有节能、提高带宽利用率等特点,广播的数据可同时满足大量用户的需求,发送代价与接收者的数量无关。XML作为一种数据交换的标准格式,被广泛的应用在各个领域。随着互联网的迅速发展,网页类型这种具有XML规范的信息大量的涌入人们的生活。而一些大的IT公司,也将XML整合到他们的产品中。将XML格式的数据通过数据广播发布给移动用户,可以满足人们对XML数据的需求。XML无线数据广播技术也受到越来越多的研究者的关注本文主要研究XML无线数据广播的调度技术。传统数据广播的数据项具有原子性的特点,当移动用户请求该数据项时,数据项中的信息都满足用户的查询。而XML无线数据广播的数据项是XML文档片段,用户提交的查询为XPath查询,这意味着查询结果可能是XML文档的全部内容或部分内容。从用户的角度出发,其下载的XML数据包含两种冗余信息:无用信息冗余,即一部分XML分支不满足其查询;重复信息冗余:即下载的多个XML文档片段之间具有重复的信息。为了解决这两种冗余信息,本文提出了西种文档处理方法来消除冗余信息。针对无用信息冗余,本文研究了周期广播模式下,对于访问概率倾斜的XML数据的分片策略。提出了一种基于子树的广播模式,即以XML文档的一个子树为最小广播单元。根据数据的访问概率,提出了两种有效的分片算法:水平分片算法和阈值分片算法。分片后的XML数据,减少了片段间的冗余信息,并且可以很好的兼容已有的索引技术。针对重复信息冗余,本文提出了一种有效的文档合并算法,通过分析文档合并对广播性能的影响,得出一种有效的衡量文档间亲密度的标准。递归的将亲密度高的文档合并,减少文档间冗余信息,提高广播信道的利用率。实验表明,本文提出的XML文档分片和合并技术,可以有效减少冗余信息,提高总体的广播性能。