XML查询模式挖掘的研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:a429629261
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了挖掘XML频繁查询模式涉及的技术、方法,所做的主要工作如下: 首先,讨论挖掘XML查询模式相关的XML、XQuery、关联规则和聚类技术;分析和比较以关联规则为基础,挖掘XML频繁查询模式的各种算法的特点,总结它们的优缺点。 其次,对目前性能最好FastXMiner算法深入的研究,并实现了该算法。 然后,提出一种基于网格和密度的聚类算法。将XML数据有效的划分,根据密度的阈值和DTD引导寻找子空间,利用图的连通算法将单元格有效的连通,高密度的连通空间就是频繁查询模式。算法的优点是避免FastXMiner算法对候选有根子树的树的包含测试需要的时间开销。 最后,提出在线挖掘频繁查询模式算法的框架。针对XML流查询是连续的,查询处理所使用的内存远远小于数据流本身,查询处理过程中数据仅仅能够被扫描一遍等特点,挖掘频繁出现的共享路径并将其综合到一个结构中,从而避免重复操作。该算法能确保高速缓存在线挖掘的高效性,同时确定当前“热点”的查询模式,并且能捕捉查询流的更新趋势和模式达到提高查询效率的目的。
其他文献
Internet提供的互联性和开放性使信息的交换与共享成为现实,为社会带来了巨大的利益。一方面,网络经济飞速发展,企业日益扩张,分支机构分布愈发分散,合作伙伴日益增多,客户分布范围
移动机器人的研究是一个热门领域。对于该领域的研究人员而言,移动机器人的研究存在着无数的挑战,尤其是机器人导航问题。目前,机器人导航有较多的方法,而现存的方法都存在着一些
Agent技术被目前许多学者认为是构建下一代因特网的关键技术。和Agent相关的研究已经从诸如Agent的智能性、通讯机制、迁移机制和协作联盟等许多方面取得了一定的成果。
WebGIS是利用网络技术来扩展和完善地理信息系统的一项新技术,其基本思想是通过客户服务器之间的请求/应答机制,传输并在浏览器上显示多媒体数据,使得用户通过简单的交互操作
Ad Hoc 是一种自创造、自组织和自管理的网络。对于其研究在世界范围内已是方兴未艾。对于其研究在世界范围内已是方兴未艾,已经从无线通信领域中的一个小分支逐渐扩大到相对
本文对CWM的数据仓库调度方案设计进行了研究。文章深入研究了某电信企业统一经营信息服务系统(UnitedBusinessInformationSystem,UBIS)数据仓库建设的过程,分析了UBIS的实际环
当前多核处理器迅猛发展,但并行程序的设计却严重滞后,没有办法充分利用多核处理器的性能优势。在这种情况下,事务存储系统应运而生。事务存储技术让事务这一原子性程序块并
目前市场上大多数的防火墙产品虽然功能强大,但有一个致命缺点:防外不防内。因为它们基于下述假设:内部网是安全的,所有威胁来自网外。所以难以实现对企业内部局域网主机之间
连锁企业通过管理系统的设计,在提高企业管理基础素质的基础之上,实现其连锁经营管理系统的信息化,最终建立连锁企业物流、资金流、信息流、工作流为一体的现代综合管理决策
  本文首先根据数据中心的结构以及基础信息的分布制订出数据中心基础信息的权限与职责,然后从基础信息的一致性角度,给出了基础信息管理范围,并分析了数据中心间的管理联系。