论文部分内容阅读
数据挖掘就是从大量数据中提取一部分有价值信息的一个过程,关联规则作为数据挖掘研究的一个重要分支,在数据挖掘的知识模式中是比较重要的一种,关联规则挖掘可以发现大量数据项之间有趣的关联和相关联系,通过大量商务事务记录中发现有趣的关联关系,可以帮助许多商务决策的制定。由于关联规则形式简洁、易于解释和理解并可以有效的捕捉数据间的重要关系,从大型数据库中挖掘关联规则的问题己经成为近年来数据挖掘研究领域中的一个热点,也取得了可喜的进步,探索出了许多独具特色的理论体系。本文旨在将关联规则理论作为有价值的技术应用于真实世界数据中,来解决现实商业问题。它首先介绍了关联规则挖掘研究的现状以及研究的目的和意义,并给出数据挖掘的体系结构和运行过程。接着详细描述了关联规则挖掘的基本理论和经典关联规则挖掘算法Apriori算法,通过分析和说明,导出了关联规则的支持度和信任度这两个阈值,采用经典的Apriori方法来挖掘有价值的规则。最后从电影评分分析领域以一组电影评分数据集为基础,通过数据的预处理和对数据挖掘软件工具的选择,对关联规则的挖掘在商业决策中的应用做了一定的研究,这个研究主要就是通过分析顾客的评分行为,从顾客看过且评分较高的的电影与电影之间、顾客与电影之间两个方面来挖掘关联关系,再对挖掘出来的规则做解释并为商业决策提供一些指导性建议,从而将信息转化为知识接着进一步转化成为利润。