【摘 要】
:
随着大规模数据库的广泛使用和Internet的迅猛扩展,全球范围内数据库中存储的数据量迅速增大。海量的数据未能充分利用这一现象常常被描述为“数据丰富,但知识贫乏”。如何从
论文部分内容阅读
随着大规模数据库的广泛使用和Internet的迅猛扩展,全球范围内数据库中存储的数据量迅速增大。海量的数据未能充分利用这一现象常常被描述为“数据丰富,但知识贫乏”。如何从这些海量数据中发现知识,导致了数据挖掘领域的出现。20世纪80年代初由Z.Pawlak首次提出的粗糙集(Rough Set)理论适用于处理和提取含糊性和不精确性的知识,近年来由于在数据挖掘等领域得到了成功的应用而受到国际上广泛关注。基于粗糙集理论的属性约简和规则冗余值约简能够降低属性的维数,总结出适用于决策支持的知识规则,这是粗糙集理论在数据挖掘邻域最重要应用之一。如今,关联规则广泛应用于各个领域,而算法效率不高,规则冗余度较大,用户仅对一部分关联规则感兴趣是目前关联规则挖掘算法普遍存在的问题,因此,将粗糙集理论与关联规则提取这两种方法的综合,从大量的数据中迅速挖掘用户感兴趣的关联规则是有现实意义的,曾有人提出过这种构思,但无建模、实现等更深入的工作。本文对粗糙集理论和关联规则挖掘算法进行了深入而系统的研究,在总结现有方法的基础上,首先提出了一种基于差别矩阵的高效求核算法和基于差别矩阵的属性相对约简和规则提取方法,能够对知识系统进行处理,方便后面的决策规则提取,随后,在Apriori算法基础上提出了一种带结论域的关联规则挖掘模型,并提出了一种全新的挖掘正负关联规则的算法。接下来,深入分析了冗余规则产生的原因,提出了一种对频繁项集进行约束的算法,从而减少冗余规则的生成。最后,探讨了已有有效规则评判标准的利弊。其中,详细说明了各个改进后的算法的思想和步骤,并将基于粗糙集的关联规则挖掘原型系统作用于实验数据库,获得了较好的结果,证实了原型系统的有效性。
其他文献
冷挤压是加工齿形零件的一种重要方法,与传统的齿成形加工方法相比,可以提高原材料利用率和生产率,降低能耗,提高齿形零件的机械性能和使用寿命。尤其对于具有复杂形状的齿形零件
票据丧失是指持票人所持有的受票据法保护的票据非因票据权利人本意而脱离其合法占有,这种占有不仅局限于直接占有。票据丧失救济制度是保护失票人的票据权益的制度,大陆法系国
随着市场经济的发展,市场细分化日益加剧,个性化越来越明显的市场正在形成。企业只有快速地对市场做出相应反映,实行经营的多样化战略,才能降低企业经营风险。企业由过去单一经营
本文利用Pechini溶胶-凝胶法,以单分散SiO2为核合成了几种稀土离子掺杂的核-壳结构发光材料,包括SiO2@Y2O3:Eu3+,SiO2@YVO4:Dy3+/Sm3+体系。并研究了Eu3+,Dy3+,Sm3+等稀土离
本文进行了区域封锁机载布撒器时序抛撒子弹落点散布规律和计算机仿真技术研究。主要内容如下:(1)散布规律研究建立子弹抛撒后的6自由度外弹道模型方程组,应用VC++编制相应的仿
在我国事业单位是一种特殊的组织类型,主要是指国家和政府在充分利用国有资产的基础上设立的,并且从事科技、卫生、教育、文化等活动的社会服务组织机构。据相关统计资料显示,目
本文首先分析了J2EE的优势,然后总结J2EE有那些企业级Web应用结构,帮助企业选择最适合自身的开发方式,创造更多效益。
目前,中小学语文教学在功利性教育思想的束缚下,并没有完全步入素质教育的正确轨道。长期以来学生处于被动接受、机械训练、简单重复之中,缺乏对知识的体验,发现、思维、内化的过
由真菌尖孢镰刀菌(Fusarium oxysporum f.sp.Schl)引起的枯萎病是造成华南地区节瓜减产的重要原因之一。目前尚无特别有效的防治药剂。因此,培育抗病品种是解决节瓜枯萎病问题的
我国加入世贸组织后,随着关税的降低,农产品出口遇到的关税壁垒在一定程度上得以减轻,但技术壁垒却逐渐凸显出来,其中最重要的一个就是以环保和农药残留问题为中心的各种“绿色壁