基于复杂结构的数据挖掘技术研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:woNO111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结构挖掘(Structured Mining)是数据挖掘一个新的分支领域,是指对结构数据库中非显式存在的知识、关系或其他有意义的模式等的提取,包括树,图,分子,XML文档等结构的挖掘。具体而言是在结构数据库的基础上,综合利用统计学方法,人工智能方法,神经网络技术和科学计算可视化技术等相关信息技术,从海量的数据中吸取人们可信的,新颖的,感兴趣的,隐含的,事先未知的,潜在有用的,最终可理解的知识,从而实现知识的自动获取。结构数据挖掘在XML文档挖掘,网页流量挖掘,生物进化的分析,路由选择,生物信息学,生物计算,通讯系统,图像数据库,城镇规划等诸多领域发挥重要作用。由于结构数据库的海量,频繁子树的数量通常随树的大小指数增长,这种情况在事务间高度相关的数据库中尤为突出,这带来了两个问题:用户需要管理和使用大量的频繁子树;直接挖掘所有频繁子树的算法不能用于大型图形数据库。本课题在此背景下,主要对传统数据挖掘技术和结构挖掘技术进行了如下几个方面的研究:首先,研究了数据挖掘的概念与原理、数据的预处理技术、数据挖掘的任务和对象、数据挖掘的方法、数据挖掘的工具和步骤、数据挖掘中存在的问题,重点研究了Apriori算法和FP-growth算法的思想、实现过程,对两种算法的性能进行了比较。其次,研究了结构化与非结构化数据的基本概念、树结构挖掘的研究现状、现有树结构挖掘技术存在的问题、FreeTreeMiner算法及其基本思想,重点研究了Free树的规范化和预处理技术、封闭频繁子树和最大频繁子树的概念和性质、树结构的剪枝和生长技术、树结构的挖掘技术。最后,设计和实现了通用树结构挖掘原型系统以及系统的测试分析。通过原型系统的设计开发,从而将传统数据挖掘的方法和结构挖掘算法结合起来,改进了树结构的规范化和预处理技术、树结构的剪枝和生长技术、树结构的挖掘技术,有效地实现了系统设计目的。通过对原型系统的验证分析证明了挖掘算法的正确性和有效性。
其他文献
随着空间科技的发展,空间任务可视化技术的研究也受到越来越多的关注。软件开放机制是构建可扩展、可重用、灵活机动的可视化系统的基础,因此已经成为可视化领域的研究热点。
主动式防火墙技术旨在克服传统防火墙功能单一并且依赖于“内部网安全”的假设,可有效防御“数据驱动”的攻击方式。同时技术上采用了可以有效避免传统防火墙架构的性能障碍
随着数据存储量的飞速增长,传统的数据分析技术已经不能满足需求,于是将数据挖掘技术应用到工程领域,通过数据挖掘工具对实验数据进行关联规则挖掘,从而对相应的工艺参数进行
合成孔径雷达(Synthetic Aperture Radar,SAR)作为一种等效天线孔径的雷达,它根据雷达与目标的相对运动来把较小尺寸的真实天线孔径用数据处理的方法进行合成的。SAR图像不仅
随着监控系统的广泛应用,对系统有效性及实用性需求提出了越来越高的挑战。然而,由于监控系统大部分安装在户外,因此避免不了会受到天气的影响。即使在晴朗天气条件下,光线在
蠕虫在互联网内大量传播,严重的影响了网络系统的正常应用,造成了巨大的损失。有些蠕虫能在10几分钟内感染互联网中上万台漏洞主机。所以如何快速的检测、围堵、防御新蠕虫的传
目前,工作流(Workflow)技术为支持办公自动化领域的主要技术之一。随着应用领域需求的发展,传统的工作流越来越不能适应分布式的运行环境和松耦合、异构式信息分布的特点。针
随着计算机科学技术的飞速发展,计算机、互联网与人类日常生产生活的关系变得越来越紧密。人们一方面享受着技术发展带来的巨大便利,另一方面又遭受着恶意攻击的侵袭和困扰。
  本文首先针对邮政综合网网络管理中故障管理的需要,对SNMP协议体系结构、MIB信息库、SMI管理信息结构、JAVA语言、邮政综合网的网络结构、以及网络管理的方法进行了分析。
随着软件规模和复杂性的不断提高,软件危机愈加明显暴露出来。ERP 系统作为先进的企业资源规划软件其市场前景喜人,但是开发上存在周期长、稳定性较难保证、资金投入大等问题