基于概念格模型关联规则挖掘的关键问题研究

被引量 : 0次 | 上传用户:shao402248950
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是数据挖掘领域的一个重要分支,在研究及应用方面已取得了很大的进展。然而,由于现实世界数据的海量、异构和数据类型的多样性、结构的复杂性等特点,对关联规则挖掘的研究提出了新的课题。本文将具有完备特性的概念格模型引入到关联规则挖掘的研究,针对关联规则挖掘的模型、方法以及数据归约等方面开展了研究,主要内容及创新工作如下:1.在研究概念格模型和频繁项目集关系的基础上,提出了基于概念格模型的项目集表示和求解方法。研究表明,每个项目集一定作为概念格中某个概念的内涵或内涵的子集出现,借助于概念之间的关系可从每个概念导出多个项目集。因此,概念格中概念的数量比事务数据库中项目集的实际数量有显著的减少,在不丢失有效信息的前提下,较利于实现更大规模的数据库中知识发现;通过删除概念格中非频繁项目集对应的概念而得到的剪枝概念格能有效地压缩数据库规模,进而为在大规模数据库中进行关联规则挖掘提供了有利的条件。2.研究了基于剪枝概念格的关联规则挖掘求解。提出顺序剪枝和同步剪枝概念格的构造算法。顺序剪枝概念格构造算法以插入记录方式的Godin概念格构造算法为基础,通过一遍扫描数据库来构造概念格,在构建完毕后,依据Apriori性质实现剪枝,得到剪枝概念格;同步剪枝概念格构造算法以插入属性方式动态地构造概念格,在插入属性构造概念格的过程中,依据Apriori性质实现剪枝,得到剪枝概念格。两种构造算法各有特点和适用性。基于剪枝概念格挖掘关联规则,减少相应的搜索空间,提高关联规则挖掘的效率。3.研究了多层、多属性的归纳。实际数据库中的属性值之间的层次差异较大,需要进行必要的数据归约。经典的属性归纳方法存在主观因素制约的问题,可能会影响到有价值模式的发现。为此,将概念格模型引入多层、多属性的归纳,提出了基于概念格的属性归纳,采用概念的爬升进行相应的泛化,并进行多层、多属性的归纳。与面向属性归纳AOI算法相比较,基于概念格的属性归纳不仅可实现AOI的单一属性归纳,也能进行多层、多属性的归纳,属性归纳的路径不惟一,并易于寻找合适的泛化路径和阈值,从而得到用户要求的、合理的属性归纳结果,以便挖掘合适颗粒度的关联规则。
其他文献
生态问题和经济社会的可持续发展已成为世界关注的焦点。经济全球化和贸易自由化使得关税壁垒和传统的非关税壁垒作为贸易保护手段的作用逐渐减弱,我国的主要贸易伙伴如欧盟、
本课题以黎锦熙语文教育思想为研究对象,采用内容分析法、比较分析法、文献研究法等研究方法,以黎锦熙的专著以及收录黎锦熙教育思想的专著和研究黎锦熙教育的论文为依据,对
管材塑性加工是以管材作毛坯,通过塑性加工手段,制造管材零件的加工技术。管塑性加工由于能容易达到对产品轻量化、强韧化和低消耗方面的要求,已成为先进塑性加工技术面向21
随着竞争的加剧,企业的成长将更多地依靠高效管理体系和制度所培育出的独特竞争力。如何加强企业内部管理,很多企业经理人的目光投向建立有效的绩效管理体系,以提高企业执行战略
电力为国民经济发展提供起飞的动力,为人民生活水准的提高奠定坚实的基础。电力与国计民生息息相关,是千家万户光明的希望。近年来,继电信的拆分改革后,以打破垄断、引入竞争
对媒体进行研究离不开与其相关的社会环境,以及连接媒体和社会的中间桥梁——广播电视节目主持人。当前随着社会改革的深入发展,工业化城镇化的推进,我国社会正处于一个加快转型
通过总结动物类药物的临床应用方法和使用要点,结合验案分析,介绍周仲瑛教授运用动物类药物治疗疑难杂症的临床经验。
居住建筑在城市建筑总量中占据绝大多数的比例。我国对传统建筑作系统的研究起步较晚,而对传统民居的系统研究直至20世纪50年代才开始。而且时断时续并且分散进行,因而成果还不
胡锦涛总书记在党的十七大的报告,主题鲜明、内涵丰富、思想深刻,是新时期29年来我们党治国理政实践经验的科学总结,是坚定不移地走中国特色社会主义伟大道路的政治宣言。一个时
普通混凝土路面板在外力因素的影响下会产生许多不规则裂缝,在施工时不得不设置很多横向接缝。此外,对接缝还需要做大量的养护工作,这不仅增加了施工的复杂性,而且降低了行车舒适