【摘 要】
:
数据挖掘是知识发现(KDD)过程中的核心部分,数据挖掘是从大量数据中发现有趣模式,即从数据库海量的数据中找出隐含的、未知的、但却是非常有用的信息。关联规则是数据挖掘重
论文部分内容阅读
数据挖掘是知识发现(KDD)过程中的核心部分,数据挖掘是从大量数据中发现有趣模式,即从数据库海量的数据中找出隐含的、未知的、但却是非常有用的信息。关联规则是数据挖掘重要技术之一,本文对关联规则进行分析研究,主要包括以下内容:(1)对Apriori算法进行深入研究。分析算法思想,针对算法缺陷,本文分别给出改进算法。实例证明,改进后的算法能有效减少候选项集个数,提高执行效率;有效减少扫描数据库次数,减小I/O负担。(2)深入研究FP-Growth算法思想和FP-Tree存储结构。通过分析算法,得到影响FP-Tree大小的因素,建树的过程中确保压缩效果最好,从而减小I/O负担,提高算法效率。结合实例,比较了Apriori算法和FP-Growth算法性能。(3)对关联规则度量方法进行了深入研究。本文分别从数学和规则度量两个方面,重点分析了兴趣度度量存在的问题。针对现有度量标准存在的不足,结合规则有效性原则,提出一种度量改进方法。分析结果表明,该改进方法可有效屏蔽掉无效规则。最后给出了关联规则一个应用实例,将算法引入到银行客户信息系统中,实验结果表明,改进后的度量可以有效约束规则,改进效果较好。
其他文献
随着通讯和计算机技术的日益发展,人们生活质量的不断提高,在智能空间下实现家庭服务机器人与人更好的交互,依靠机器人自身的信息源和有限的检测空间,在许多情况下难以满足实
伴随着信息化时代的来到,保护信息的安全逐渐变成了当下最为重要的研究课题。信息中的语音是人与人之间相互交流的基础,对语音通信进行加密是防止语音信息被窃取的重要手段。
随着我国水泥工业的发展,新型干法水泥生产已得到广泛应用。而水泥回转窑烧成系统是新型干法水泥生产线上重要的工艺环节,它的运行状况直接影响到水泥生产的产量、质量、能耗
在工业生产中,工业射线实时成像技术是射线无损检测的新技术和发展方向。从目前无损检测技术在生产中的应用来看,射线检测约占40%,可见射线检测占有十分重要的地位。传统的射
说话人识别又被称作声纹识别,是生物识别研究的一个重要方向。近年来,随着生物技术和信息技术的高速发展,语音识别技术也日渐成熟并逐步得到普及,使得用语音与计算机之间的交
研制导轨式残障人运送升降机综合性能试验台是国家科技支撑计划“室内移动辅具关键技术与目标产品研发”课题中的一项试制任务。目的是为课题的目标产品轨道式残障人运送升降
由于采用了功率管和储能元件等非线性器件,开关功率变换器具有很强的非线性特性,不仅给电力系统注入大量谐波,而且使系统出现了丰富的不稳定现象,如次谐波振荡、快时标分岔和混沌
当今社会,交通拥塞问题已成为影响社会发展和人民生活的主要因素之一。2010年上海市又将迎来世博会这一重大活动,对上海市的交通提出了新的挑战。本报告以国家科技支撑计划项目
臭氧因其独特的物理性质被广泛的应用于生活、工业生产、医疗保健等众多领域。臭氧的产生主要有电解法、紫外线照射法、放射化学法和介质阻挡放电法,其中介质阻挡放电法因其独特的优势被现代科研工作人员广泛的采纳。现阶段,DBD型臭氧发生器的供电电源大多采用串并联谐振式逆变电源,通过调节施加在臭氧发生器上的正弦或准正弦激励的幅值和频率来调节发生器的放电功率,进而调节臭氧发生器的产量。但DBD型臭氧发生器放电的效
工业发酵是在密闭的容器中进行,利用夹套进行加热和冷却,其温度控制具有很大的应用价值。但这种被控对象往往存在严重的积分纯滞后现象,采用常规的控制算法难以达到所要求的控制