数据挖掘中关联规则及应用的研究

被引量 : 14次 | 上传用户:mddh9666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究关联规则挖掘理论及其算法模型在粗糙集知识表中的应用。首先,在文中系统介绍了数据挖掘的定义、方法、发展方向,针对其中的关联规则挖掘,讨论了各类关联规则算法。由于关联规则挖掘方法会产生大量规则,为了挖掘出用户感兴趣的规则,本文提出一种利润约束的关联规则挖掘算法。此外,借鉴关联规则算法模型的思想,提出一种获取缺省规则的新方法MDRBapriori,从决策表中提取具有一定支持度和可信度阈值的不确定规则。在本文中,主要做了以下工作: (1)给出了关联规则的定义,说明了挖掘关联规则的意义,研究了关联规则挖掘的步骤,并且探讨了关联规则挖掘存在的问题及发展方向。 (2)针对关联规则算法存在的一些问题,详细分析了目前提出的有关关联规则兴趣度的各种主观和客观评价方法。本文引入企业关注的领域知识——利润,提出基于利润约束的关联规则挖掘方法,以增强规则的有趣性,提高规则挖掘的针对性。 挖掘出的关联规则,加上利润度量,就可以分析出哪些商品的搭配可以获得最大的利益。一般的关联规则只是单纯的项目与项目之间的一种关系,典型的就是买A的同时会买B的可能性的一种趋势分析。而我们加入量化参数利润分析关联规则,拓宽了关联规则的表达能力,让决策者对于关联规则的意义有更进一步的认识,并从中找出能使销售利润最大化的最佳商品促销方案。 在关联规则算法的“支持度——置信度”框架中,是从“大处”着眼,关注的是出现频数较高的项目集,要挖掘符合用户预期的利润要求的模式,不得不从“小处”着眼,这是因为存在着“20%的业务带来80%的利润”这样的领域知识。本文利用相对支持度的概念来挖掘稀有数据,再进一步结合利润量参数作为约束条件,这样就可以求出零售事务数据库中所有满足用户利润要求的关联规则,不论其支持度的高低,都可以运用本文的算法挖掘出来。 (3)简要介绍了粗糙集的基本概念以及一般的属性约简方法,着重分析了Mollestad和Skowron提出的缺省规则的发现算法——投影算法的算法框架及性能。 (4)针对投影算法的一些不足,扩展了缺省规则的定义,提出一种获取缺省规则的新算法——MDRBapriori算法。本文通过对投影算法和关联规则算法模型的详细分析,发现它们求解问题的实质是相同的,因而具有一种方法被另一种方法替代的可能性。因此,基于Apriori算法提出缺省规则挖掘的新算法MDRBapriori算法,它是独立于粗糙集方法但可以获取大致相同的规则的一种方
其他文献
知识共享是知识管理的核心,实现设计知识的共享是航空发动机设计知识管理成功实施的关键。在发动机设计组织推行知识共享,有利于提升组织学习能力,增加组织知识资本总量,丰富
研究马来酸酐接枝乙烯-辛烯共聚物弹性体(POE-g-MAH)和热塑性树脂(PC)协同增韧聚对苯二甲酸丁二酯的脆韧转变,借助扫描电镜(SEM)观察分析增韧体系的相形态和断口形貌,并对增
目的:探讨全中枢神经系统放射治疗更加合理、实用的新技术。方法:应用放疗计划系统针对成人和儿童患者分别制定四种不同照射方法的放疗计划,并比较各放疗计划的剂量分布指标。结
国家级名老中医尤松鑫教授,临床经验丰富,善从"通"字立法治疗胃食管反流病。尤老认为本病因肝郁脾虚、肺闭肾虚、肠燥津枯等"不通"致"邪在胆,逆在胃",故治疗以利胆和胃为主,佐以疏
<正>"十二五"时期是辽宁新闻出版业深化改革、加快发展和产业格局调整与升级的关键时期,深入研究分析新闻出版业面临的形势,对制定科学的发展目标规划、推进辽宁新闻出版业大
<正>2月15日,以"望得见山水,记得住乡愁"为主题的第七届中国国土区域城市经济学家新春论坛在北京市召开。本届论坛由中国国土经济学会主办,中国区域经济学会、中国城市经济学
铝锭连续浇注生产线是生产重熔用铝锭的自动化生产线,该生产线的主要机械部件有铸造机、冷却运输机、堆垛机、成品运输机,而冷却运输机是其中一个很重要的组成部分,但是目前
目的:探究空气压力治疗仪对于预防脑外科长期昏迷患者的凝血功能以及D-二聚体影响的临床使用价值。方法:回顾分析2016年1月~2017年1月在本院接受治疗的脑外科长期昏迷患者100
随着我国基础教育改革的不断深入,语文课程资源的开发与利用显得越来越重要。国家教育部2001年颁布的《基础教育课程改革纲要(实验)》中,第一次把“课程资源”作为一个重要的
本文以辩证唯物主义和历史唯物主义为基本立场,以信息技术与教育的关系为视角,兼容了多种文化学说与传播学理论、媒介理论,对信息化教育这一崭新的教育实践系统工程进行了全