特异规则及关系特异规则的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:liongliong516
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是当前计算机技术的研究热点之一,关联规则的研究是近几年研究较多的数据挖掘方法,在数据挖掘的各种方法中应用也最为广泛.较低支持度的项集在传统的关联规则挖掘中通常被忽略,而在这些被忽略的项集间蕴藏着有价值的知识.特异规则是关联规则的一种,特异规则是通过分析特异数据的相关性而从特异数据中发现的规则,特异数据代表了相对较少、与数据集中其它对象不同的对象所描述的特异实例.特异规则具有较低的支持度,通常被传统的关联规则挖掘算法所忽略,特异规则挖掘突破了传统命题级数据挖掘的框架,所以解决特异规则挖掘问题需要一些特殊的处理技术.关系数据挖掘发现关系数据库中涉及多个表的模式,而不需将数据合并到一个表中,克服了传统挖掘算法中需要多表合一的弊端.关系数据挖掘技术在归纳逻辑程序设计领域取得了较大的发展,从KDD的角度,ILP是关于关系数据挖掘技术和工具的发展,其本身就是多表学习.ILP是机器学习和逻辑程序设计的交叉学科,ILP系统不但能直接处理分布在多个表中的数据,并能运用逻辑程序表达有用的背景知识,同时还能运用强有力的逻辑语言来描述发现的模式.该文的工作是将关系数据挖掘技术与特异规则挖掘相结合,主要工作如下:一、目前关于特异规则的研究集中在特异数据的定义、识别,特异规则的学习仅仅是框架上的探讨和学习模型的定义,还没有实际可行的算法,该文将借助ILP技术实现特异规则的学习,完善了特异规则挖掘体系,并以中国统计年鉴数据库为基础,分析了房地产价格特异的原因.二、实体是组成世界的基本对象,对应于关系数据库表中的记录,属性是对实体集中每个成员的特性的描述.而特异规则从属性的角度考察实体某个属性特异的原因,没有分析实体整体的特异性和原因.该文以关系数据挖掘技术为基础,从分析实体整体的特异性出发,提出了关系特异规则,给出了特异实体的识别和关系特异规则的挖掘框架,实现了关系特异规则挖掘原型系统,并运用该系统分析了中国统计年鉴数据库中房地产实体的特异性.
其他文献
近年来,信息革命促使制造业向全球方向发展,使现代企业呈现集团化、多元化的发展趋势。这些企业需要及时了解各地分公司的生产经营状况,同一企业不同部门、不同地区的员工之间也
人脸识别技术是模式识别和机器视觉领域最富挑战性的研究课题之一,它在刑侦破案、证件验证、门禁系统、视频监视等领域中都有广泛的应用前景.该文主要研究静止图像的人脸识别
分布式计算是一种把需要进行大量计算的工程数据分割成小块,由多台计算机分别计算,在上传运算结果后再统一合并得出数据结论的科学.目前已有许多模型,如CORBA,DCOM;RMI;Web S
随着数据库技术的不断发展及其广泛应用,数据库中的数据量急剧增大,当大量数据不停地被收集和存储,业界人士对他们数据中项集之间的相关联系越来越感兴趣。这种数据中项集之间的
随着软件技术和网络技术的发展,基于构件的软件开发正成为当前分布式软件系统开发的主流.相应地,为服务器端构件提供运行时环境的应用服务器的地位和重要性也已经被迅速认可,
热点检测作为一种研究技术,被广泛地应用于环境犯罪学,生物学,传染病学,地理学和舆情学等领域。给定一系列基于空间位置的活动点,传统的热点检测方法能够检测出活动点密度较高的区
本论文针对企业复杂信息系统的集成支持环境及问题进行了分析和研究。本论文在深入讨论和分析了当前比较流行的企业信息系统集成支持技术Web Services和CORBA的基础上,提出了
数据挖掘(Data Mining,DM)和数据库中知识发现(Knowledge Discoveryin Database,KDD)是当今人工智能和数据库等研究领域中活跃的具有广阔应用前景的研究方向.它涉及到人工智
随着Internet的发展,XML越来越被广泛的应用,不仅被用作数据交换的标准,而且用来表示大多数的数据,广泛应用于分布式系统中.在使用XML文档时候,大多都是采用XML DOM的形式,使
目前,移动数据库技术的研究与应用是数据库领域和移动计算领域的一个研究热点,伴随着集成电路技术、移动通信技术等领域的发展,移动数据库产品具有巨大的用户需求。 移动数据