增量式关联规则更新算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:dangyuanq4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在关联规则挖掘的实际应用中,用于挖掘的数据常发生增加、减少和修改等数据更新,并且,用户为了得到感兴趣的关联规则也常调整最小支持度和最小置信度这两个阈值。此时,传统的做法是用新的数据集和阈值按原来的挖掘算法重新再做一次计算,这样,上一次的计算结果就白白浪费了。因此,关联规则的增量更新问题成为关联规则挖掘中的一个重要问题,它关心的是当原始数据库中的数据或者最小支持度、最小置信度发生变化时,如何充分利用以前的挖掘结果来高效的获得理想的关联规则。所以如果关联规则挖掘算法能充分利用前次挖掘结果来加速本次挖掘过程,而不是简单地将关联规则算法重新作用于整个事务数据库。那整个挖掘过程的效率可得到大幅度的提高,尤其对给定大型数据库中的海量数据,更可取的是增量式更新数据挖掘。应用增量式更新挖掘算法渐增地进行知识更新,修正和加强先前已经发现的知识可以说是一个诱人的目标。因此,研究增量式关联规则更新挖掘算法具有很重要的实用意义。本文就是针对增量式关联规则挖掘更新算法展开研究,其主要工作可以概括为:①综合前人的工作,根据相关的文献,综述了关联规则挖掘算法。重点研究了基本类型的经典关联规则挖掘算法,分析各自的优缺点;分析算法中频繁项集的搜索策略;总结了基于经典算法的各种改进优化策略。②分析了一种增量更新算法-NewQAIS算法,举例说明了该算法的使用。并把它与Apriori算法进行了分析比较。③针对NewQAIS算法的缺点,提出了改进优化策略。在此基础上提出了一种改进算法-OFIUA(Ordered Forst Incremental Updating Algorithm)。OFIUA算法引入了矩阵思想,通过一次扫描事务数据库将其转化为0-1矩阵,用向量的内积运算计算项集的支持数,大大提高了运算效率。分析NewQAIS算法中项集的构成特点,指出了算法中在生成项集和查找方面的不足,OFIUA算法引入了有序森林的数据结构。有序森林里的有序树相互独立,提高了利用Apriori算法的apriori-gen函数生成候选项集的速度。该算法适用于事务数据库事务增加或支持度阈值变化而引起的关联规则的更新。
其他文献
(一)1902年,少年毛泽东进韶山南岸私塾,启蒙老师是邹春培,在邹老师手下学了二年半。毛泽东读书很认真,肯动脑子,功课没有完,谁也拉不动他。他总是一句一句地默读,一笔一笔地
次级抵押贷款是美国众多金融创新产品之一,过去几年因有助于解决更多人的住房问题而受到市场热捧,然而今天,它却成为一场经济危机的导火索,并且造成了全球金融市场的振荡和投资者的恐慌。次级债危机不是一个偶然现象,它是风险积累到一定程度的反映。  主持人:次级债危机扑朔迷离,全球资本市场阴晴不定。过去一段时间,包括美联储、欧洲央行、日本央行以及韩国、加拿大等国的中央银行,纷纷向本国市场注射“强心剂”,然而,
本文在调研大量国内外文献的基础上,研究了软件资源信息挖掘的理论和方法,同时调研了软件逆向工程及软件切片的理论和技术,并将这两项技术应用于软件资源信息挖掘系统的设计和实
目的 分析注射炎琥宁对治疗小儿支气管肺炎的临床疗效.方法 选取2018年2月~2019年2月我院收治的46例肺炎患儿进行分析,按照随机数字表法的方式将其分为研究组和参照组,对两组
目前移动运营商正在从移动通信专家向移动信息专家转型,随着移动运营商角色策略的转变,整个增值业务市场也在转变,移动运营商已经开始对市场进行整合,同时开始自营业务的试探
在大范围的机会网络中,由于节点的移动性和活动区域的广泛性,节点和节点之间极少进行通信,造成网络处于分割状态。为了提高大范围机会网络的性能,放置固定中继节点成为一种可
面向服务的体系结构(SOA)是当今IT业内最热门的话题之一。面向服务的架构(SOA)具有驱动业务灵活性、业务流程活力、现有服务的重用、改进的连接性以及使IT与业务更加保持一致的潜
汉语基本短语的识别和分析是自然语言浅层句法分析的重要任务之一。基本短语的分析结果使句子层次比较清晰,为进一步的句法分析打下基础。在汉语的基本短语类型中,汉语名词短
随着计算机和互联网的普及,越来越多的科研项目使用志愿计算系统Volunteer Computing System, VCS)汇聚和利用广泛分布于互联网上的海量空闲计算资源,因此,志愿计算系统逐渐
基于双目立体视觉的深度信息提取是通过双目摄像机拍摄图像,并利用二维图像对计算深度信息进而恢复三维模型或测得空间物体到相机的距离。双目立体视觉有设备简单且价格低廉,