XML查询模式挖掘的研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户：a429629261

【摘要】

：

本文主要研究了挖掘XML频繁查询模式涉及的技术、方法，所做的主要工作如下：首先，讨论挖掘XML查询模式相关的XML、XQuery、关联规则和聚类技术；分析和比较以关联规则为基础，挖

【作者】

：

艾鸿

【机构】

：

燕山大学

【出处】

：

燕山大学

【发表日期】

：

2005年期

【关键词】

：

数据挖掘 XML查询关联规则聚类频繁查询模式

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文主要研究了挖掘XML频繁查询模式涉及的技术、方法，所做的主要工作如下：首先，讨论挖掘XML查询模式相关的XML、XQuery、关联规则和聚类技术；分析和比较以关联规则为基础，挖掘XML频繁查询模式的各种算法的特点，总结它们的优缺点。其次，对目前性能最好FastXMiner算法深入的研究，并实现了该算法。然后，提出一种基于网格和密度的聚类算法。将XML数据有效的划分，根据密度的阈值和DTD引导寻找子空间，利用图的连通算法将单元格有效的连通，高密度的连通空间就是频繁查询模式。算法的优点是避免FastXMiner算法对候选有根子树的树的包含测试需要的时间开销。最后，提出在线挖掘频繁查询模式算法的框架。针对XML流查询是连续的，查询处理所使用的内存远远小于数据流本身，查询处理过程中数据仅仅能够被扫描一遍等特点，挖掘频繁出现的共享路径并将其综合到一个结构中，从而避免重复操作。该算法能确保高速缓存在线挖掘的高效性，同时确定当前“热点”的查询模式，并且能捕捉查询流的更新趋势和模式达到提高查询效率的目的。

其他文献

基于Linux与IPSec的嵌入式无线VPN网关

Internet提供的互联性和开放性使信息的交换与共享成为现实，为社会带来了巨大的利益。一方面，网络经济飞速发展，企业日益扩张，分支机构分布愈发分散，合作伙伴日益增多，客户分布范围

学位

网关无线虚拟专用网嵌入式系统协议模块加密速度

机器人路径规划利用人工势场多元回归搜寻

移动机器人的研究是一个热门领域。对于该领域的研究人员而言，移动机器人的研究存在着无数的挑战，尤其是机器人导航问题。目前，机器人导航有较多的方法，而现存的方法都存在着一些

学位

移动机器人路径规划人工势场法多元回归搜寻

J2EE下的Agent迁移机制研究

Agent技术被目前许多学者认为是构建下一代因特网的关键技术。和Agent相关的研究已经从诸如Agent的智能性、通讯机制、迁移机制和协作联盟等许多方面取得了一定的成果。

学位

J2EEAgent迁移机制设计模式

面向联机分析的WebGIS的设计与实现

WebGIS是利用网络技术来扩展和完善地理信息系统的一项新技术,其基本思想是通过客户服务器之间的请求/应答机制,传输并在浏览器上显示多媒体数据,使得用户通过简单的交互操作

学位

空间数据WebGIS联机分析处理数据仓库商业智能

热点分簇算法的研究

Ad Hoc 是一种自创造、自组织和自管理的网络。对于其研究在世界范围内已是方兴未艾。对于其研究在世界范围内已是方兴未艾,已经从无线通信领域中的一个小分支逐渐扩大到相对

学位

Ad Hoc 网络分簇算法CAS网络热点无运动控制

基于CWM的数据仓库调度方案设计

本文对CWM的数据仓库调度方案设计进行了研究。文章深入研究了某电信企业统一经营信息服务系统(UnitedBusinessInformationSystem，UBIS)数据仓库建设的过程，分析了UBIS的实际环

学位

数据仓库元数据数据调度工作流

面向多核的软件事务存储中的冲突管理策略的研究

当前多核处理器迅猛发展,但并行程序的设计却严重滞后,没有办法充分利用多核处理器的性能优势。在这种情况下,事务存储系统应运而生。事务存储技术让事务这一原子性程序块并

学位

多核事务存储冲突检测裁决

基于封包截获技术的个人防火墙的研究与实现

目前市场上大多数的防火墙产品虽然功能强大,但有一个致命缺点:防外不防内。因为它们基于下述假设:内部网是安全的,所有威胁来自网外。所以难以实现对企业内部局域网主机之间

学位

过滤驱动IRP分层Winsock 2 SPI注册表技术截获

基于J2EE架构的连锁便利店管理系统

连锁企业通过管理系统的设计,在提高企业管理基础素质的基础之上,实现其连锁经营管理系统的信息化,最终建立连锁企业物流、资金流、信息流、工作流为一体的现代综合管理决策

学位

便利店统一开发过程架构J2EE

铁路基础信息维护、发布、分发机制及其同步更新技术研究

　　本文首先根据数据中心的结构以及基础信息的分布制订出数据中心基础信息的权限与职责，然后从基础信息的一致性角度，给出了基础信息管理范围，并分析了数据中心间的管理联系。

学位

铁路基础信息同步更新数据中心多层次代理

XML查询模式挖掘的研究

与本文相关的学术论文