多值属性关联规则的研究与实现

被引量 : 0次 | 上传用户:maailin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息爆炸的时代,面对“人们被数据淹没,同时却仍然感到知识饥饿”的挑战,数据挖掘技术应运而生,并得以蓬勃发展。关联规则挖掘是一个重要的研究领域。目前对其的研究主要是集中在以支持-信任理论为基础对布尔型数据进行挖掘,并且已取得了一些研究成果,要从这些数据中挖掘潜在的规则,现有的布尔型关联规则方法就显得力不从心了。如何划分区段是实现多值属性关联规则问题到布尔型关联规则问题转变的关键。挖掘多值属性关联规则的关键步骤是把数值型属性所在的域分成多个区间。在划分区段方面,现有的方法多是把数值属性所在的域划分成等宽的或等深的区间,或者在一个(或一组)属性上使用聚类算法。虽然这些算法能很好的解决多值型的数据挖掘问题,但是不能避免最小支持度和最小可信度冲突的问题,而且有可能错过一些重要的规则。本文所提方法是,把一个交易作为一个n维向量,并且在多个n维向量上对所有属性使用迭代自组织的数据分析算法(ISODATA)进行聚类。由于ISODATA的试探特性,并且可以结合成人机交互的结构,使其能利用中间结果所取得的经验更好地进行分类。把聚类投影到数值型属性所在的区间形成可能重叠的区间,最后使用布尔型关联规则挖掘算法来挖掘关联规则。该算法既考虑了交易之间的距离,又考虑了属性之间的关系,而且能避免最小支持度和最小可信度之间的冲突。实验结果显示,该方法能有效地挖掘多值属性关联规则,而且能够发现可能被以前的算法错过的重要的规则。
其他文献
随着无线传感器网络应用研究的不断深入,通过实际传感器节点建立网络平台进行网络测试越来越受到人们的重视。本文对无线传感器网络测试技术和测试平台进行了探讨,并分别对搭
随着近年来高等教育规模的扩大,我国进入了高等教育的大众化发展阶段。同时带来了各种质量问题,逐渐引起人们对高等教育质量的关注。一方面,人们在对高等教育的基本需求得到
十二五期间,我国工程机械行业的迅速发展,为工程机械关键基础零部件企业提供了巨大的市场保证。纵观工程机械主机技术水平的提升,与关键基础零部件的技术水平和产品可靠性有
针对基于PCI等传统I/O总线的网络I/O方式中网络通信性能受到相应总线接口限制的问题,提出了直接内存通信技术DMC(Direct Memory Communication,DMC)。使用此技术的DMC网卡可
目的:噬菌体抗体库技术是应用基因克隆方法把全套抗体基因呈现在噬菌体表面,通过抗原的亲和力选择和噬菌体扩增获得特异性抗体基因。利用该技术可制备出多种特异性单克隆抗体
本文通过山苍子盆栽试验与大田试验,应用三元二次通用旋转组合设计,研究不同的施肥配比对山苍子生长状况的影响。通过建立数学模型,得出编码方程,对方程进行显著性检验和最优
介绍了我们研制的全球导航卫星系统(GNSS)自适应抗干扰软件研发平台的组成与功能。自适应抗干扰平台主要由数据源单元,抗干扰算法单元,软件接收机单元,定位结果显示单元组成
本文主要研究3种壳聚糖及其衍生物对绿芦笋病原菌镰孢菌的抑菌活性及抑菌机理。通过测定最小抑菌浓度(MIC)、最小杀菌浓度(MFC)、菌丝生长抑制和孢子萌发抑制实验测定羧甲基
随着三菱日联的世纪大并购,1.68万亿的全球第一大银行横空出世。
期刊
中国古代著名的思想家李贽,是晚明思想史上特立独行的“异端”人物。他在伦理纲常异常严酷的封建社会公然肯定私人利益的合理性、倡导“致一之理”的平等观和“任物情”的个