基于概念层次树的XML数据挖掘研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:wuzhen16885168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML以其可扩展、灵活、平台独立、简单和规范等特点使其在互联网中的应用越来越广泛,尤其是在网络领域表示数据方面也越来越重要。所以,迫切地需要寻找一些有效的方法以便从大量的以XML形式表示的数据中提取一些有价值的和潜在的信息与知识。可是在Web上众多的信息数据中以XML形式表示的数据不仅很复杂,而且没有特定模型来描述数据,那些数据都是半结构化的甚至是无结构的数据。因此,不同于传统数据库上的数据挖掘技术,面向XML的数据挖掘技术不仅要求更好的对半结构化数据进行集成与组织,同时对挖掘算法的性能也提出了新的挑战。本文在基于概念层次树的XML数据挖掘的研究背景和意义、国内外的研究现状、数据挖掘相关技术的基础上,结合XML的相关知识,包括XML的由来、XML文档的结构和相关技术标准、XML的特点和基于XML的数据挖掘分类,提出了一种基于概念层次树的XML数据挖掘系统框架,并按照该框架中的每一个步骤依次阐述了相关实现技术,主要包括数据预处理,数据存储,XML数据挖掘和知识存储与表示。在XML数据挖掘中结合概念层次树和关联规则的相关技术提出了一种基于概念层次树的XML数据挖掘算法,该算法通过概化操作,不仅提高了时间复杂度,并且挖掘出更容易被所理解和接受的规则,对基于XML数据的关联规则的挖掘具有一定的理论价值和实际意义。最后以股票数据挖掘为例,结合文中提出的数据挖掘系统框架,挖掘出股票走势之间的关联规则,为用户提供决策参考。
其他文献
目前动画技术已经深入渗透到众多领域。全过程计算机辅助动画自动生成是一个结合人工智能与现代多媒体技术的崭新课题,由中科院陆汝钤院士在国际上首次提出,并研制出原型系统《
序列模式挖掘主要研究如何从大规模数据库中寻找具有时空序列特征的频繁模式。由于在海量数据库中进行序列模式挖掘是项耗时的工作,因此利用并行计算技术来加快挖掘速度是一
无线传感器网络存在严重的能量约束问题,设计能量高效的路由协议以延长网络的存活时间,成为无线传感器网络面临的重要挑战。分簇路由技术利于提高无线传感器网络的能量利用及
随着计算机技术的发展和网络技术的推广,网络信息安全已经成为大众关注的热点。信息隐藏技术作为信息安全的新领域,在隐蔽通信和计算机网络取证方面发挥着越来越重要的作用,
尺度空间分析及其应用是当前图像理解研究领域的热点和难点。适应图像显示是一种视觉信息表达的过程,它通过根据场景与目标的参数信息,调整出适合人眼观看或观测的图像。自动
合成孔径雷达(Synthetic Aperture Radar)图像的相干斑噪声严重降低了图像的可解译度,影响了后续目标检测、分类和识别等应用。SAR图像的相干斑噪声是成像过程中出现的原理性
大规模海洋场景的真实感实时模拟是影视动画、虚拟现实及游戏设计等应用领域所共同的极具挑战性的研究课题。但是,目前各种海洋场景的建模与绘制方法各有优缺点,如何混合各不
锚杆是煤矿井下生产使用非常广泛的材料。矿用锚杆是一种安设在岩土层中的受力杆件,它的一端与工程建筑物相连,另一端锚固在岩土层中,必要时对其施加预引力,用以有效地承受结
随着网络技术的发展,“首都之窗”——北京市政务门户网站不断的完善,系统规模变的越来越大,用户如果要登录多个应用系统,不仅要面对多个登录界面,可能还要记忆不同的用户名
随着网络环境逐步向公共的、开放的、复杂的、大规模的网络环境发展,在这种新型的网络环境下开发的功能强大、需要大量资源的科学计算和协同应用也越来越复杂,具有时间、空间