基于粗糙集理论的零售业数据挖掘研究

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:yuhua_ly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,零售企业积累了大量的历史数据,商业企业意识到如何利用这些信息对企业的发展来说是至关重要的。因为想要在未来的市场占有举足轻重的地位,必须拥有消费者、竞争对手、本公司的财务情况等信息,从中获取可靠、准确、及时的信息来进行正确的决策是商家的迫切需求。本文研究的正是如何将数据挖掘技术应用在零售业领域。 本文首先论述零售业数据挖掘现状和零售业数据挖掘目的,以及零售业业务特点和当前国内零售业数据挖掘面临的困难;接着介绍粗糙集理论和它在数据挖掘中的应用。在上述研究的基础上,本文提出了一个基于粗糙集理论的零售业数据挖掘体系结构,设计了与此配套的相关数据挖掘算法;最后通过一个实例验证研究结果的有效性。 本论文提出的零售业数据挖掘系统体系结构由三个层次构成:数据准备层、数据预处理层、挖掘评价层。它能够有效地从数据库中提取出有用的知识并经过评价系统进行反馈校正,建立业务知识库,给决策者提供高质量的决策信息和决策支持。其数据挖掘过程中的大部分任务,均由基于粗糙集理论的算法来承担和完成。 在数据准备层,主要工作是数据收集、数据确认和数据筛选。数据收集是将分布在传统业务模型基础上的数据经过面向决策的数据加工和精练,转移到数据仓库中。数据确认主要是对销售数据、商品数据、客户数据进行定义。数据筛选主要是清除噪声和无关数据。在数据预处理层,本论文通过对基于信息熵的连续属性离散化算法的研究,提出一个改进的算法,增加一个控制阕值。克服了原算法对大数据集的过度适应性。数据完备化使用基于量化容差关系的数据完备化算法实现对遗失数据的填充。本算法中的容差关系矩阵计算对象之间的相似度,并将其量化,提高了缺失对象的补齐能力。经过预处理后形成可供规则提取算法使用的完备信息系统。在挖掘评价层,通过基于近似集的属性约简算法,在完备信息系统上提取最佳约简集,进行属性规约。引入置信度和支持度的概念,设计增量学习式规则提取算法。规则提取分为三个阶段:初始规则库生成、规则更新、规则评价。该算法能适应数据的动态增加,并根据置信度和支持度阕值来对规则进行评价。 本文最后给出一个商场客户行为特征分析的实例,使用本文设计的数据挖掘系统算法,挖掘出购买不同种类羽绒服的顾客特征,验证了本系统的实用性和有效性。
其他文献
本研究以产销联盟理论为基础,对我国大型综合超市与供应商联盟关系进行了实证研究,目的是为了找到双方产销联盟关系的影响因素及影响程度,从而帮助生产企业与大型综合超市提
尽管我国所实行的低保政策与西方福利政策有一定的差别,但学术界就我国是否也存在福利依赖的意见并不统一.与过去主要从经济学角度分析福利依赖问题不同,文章利用2016年"佛山
陀螺仪是一种用来测量旋转物体角速率的惯性传感器。微机电系统(MEMS)技术的日益成熟给惯性传感器领域带来了革命性的发展。MEMS陀螺仪具有体积小、质量轻、功耗低、抗过载能
出口退税是当前国家尤其是财税实务界比较关注的问题,它是一项公共性很强的鼓励出口的政策,对我国经济运行意义重大。目前,出口退税制度已经成为我国税收法律制度的重要组成
图式是一种记忆结构。图式理论与英语词汇联想记忆有密切的关系。本文拟从认知心理学的角度来探讨现代图式理论与英语词汇联想记忆的关系,提出英语词汇联想记忆的策略,以帮助
针对哈尔滨工业大学《同义词词林》扩展版的层次结构不能有效反映词语之间信息内容含量差异性的问题进行了研究,进行了《同义词词林》作为词语相似度计算本体的结构改造,增加
针对化工废水不易降解的特点,采用Fenton试剂法对其进行处理.进行单因素实验,确定了处理该废水的最佳工艺条件.结果表明:在V(H2O2)/V(Fe2+)为2,PH值为4,双氧水的投加量为4ml,
"负责任主权"是当前国际关系主权理论面对的新议题,这是主权理论在时间与空间维度上嬗变的必然结果。它一方面源于主权概念之历史逻辑与内在的"正当性"要求,另一方面也是国家
20世纪90年代以来,随着改革开放的深入,中国逐步放开了外商投资商业流通领域的限制。国际零售巨头纷纷抢滩中国,普遍采用大型综合超市(GMS)作为渗透中国消费市场的强大武器。外
随着我国加入WTO,国外的关税壁垒对我国的影响正逐步缩小,而非关税壁垒特别是技术性壁垒的作用正日益加强。但由于技术性贸易壁垒是在近几年才开始特别突出的,所以我国政府和