关联规则的冗余删除与聚类

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:eyeryonecheat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘常常会产生大量的规则,这使得用户分析和利用这些规则变得十分困难,尤其是数据库中属性高度相关时,问题更为突出.为了帮助用户做探索式分析,可以采用各种技术来有效地减少规则数量,如约束性关联规则挖掘、对规则进行聚类或泛化等技术.本文提出一种关联规则冗余删除算法ADRR和一种关联规则聚类算法ACAR.根据集合具有的性质,证明在挖掘到的关联规则中存在大量可以删除的冗余规则,从而提出了算法ADRR;算法ACAR采用一种新的用项目间的相关性来定义规则间距离的方法,结合DBSCAN算法的思想对关联规则进行聚类
其他文献
通过对影响钻孔弯曲的因素的分析,提出预防钻孔弯曲和纠斜的一些措施、做法。
关联规则是数据挖掘中一个重要课题.文章给出一种基于遗传算法和蚂蚁算法相结合的多维关联规则挖掘算法.新算法利用了遗传和蚂蚁算法共有的良好全局搜索能力,并克服了遗传算法局
针对端点自适应方法和基于静态配置代理的应用自适应方法无法满足大型视频组播扩展性、动态性和复杂性要求这一难点问题,提出了一个基于自组织代理的视频组播层次化自适应体
提出一种基于最大熵模型和投票法的汉语动词与动词搭配识别方法.该方法通过组合目标动词与候选搭配词的上下文词性信息以及关联程度的统计信息构成5种复合特征模板,然后利用最大熵方法获得它们对应搭配识别器,最后采用最好搭配识别器占优的投票法构造组合识别器.实验结果表明,同时包含上下文词性信息和统计信息的识别器优于单纯包含上下文词性信息或统计信息的识别器,但最好搭配识别器占优的组合识别器效果更佳.
SIP是一个基于文本的应用层控制协议.SIP协议本身不能保证SIP信令和媒体流安全地穿越NAT和防火墙,从而限制了其在广域网上的应用和发展.本文通过对现有SIP协议栈资源进行功能
在瞬变电磁测量中常出现瞬变接收到的信号符号反转现象,国外某些学者称之为激发极化效应(IP效应)。本文利用Cole—Cole模型进行考虑激电效应的中心回线一维层状大地瞬变电磁正反
征兆发现是指从大量的事件和环境信息中甄别征兆的非平凡过程,然而传统的基于高频模式的算法却很难找出某些重要事件的征兆,本文提出了一种新的征兆发现算法,将相关数据可视化并
新疆哈密市HS-38钨矿区的发现是继该区发现沙东大型钨矿后的又一突破,也证明该区具有巨大的找矿前景。随着地表工作程度的提高,急需探寻有利的方法组合,寻找隐伏矿体。本文通
提出无限大流场中多体运动计算的动态差分网格.无限大流场用充分大的人工边界模拟,而运动物体表面是流场的内边界.对于流场的差分网格,外边界(人工边界)点是固定的,内边界点
提出采用带根连通有向图来描述生物信息二级数据库的Web视图模型,以结合生物信息背景知识设计特定的生物信息Web视图及其问的相关关系.通过常量、静态和动态三类视图构成的Web