浅析数据挖掘之关联规则挖掘的应用

来源 :世界家苑·学术 | 被引量 : 0次 | 上传用户:oswaldhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:关联规则发现交易数据库中不同商品及其交易记录之间的联系,这些规则可以反映顾客的购买行为模式,本文基于STAR-IP管理系统探讨了数据挖掘之关联规则挖掘的应用。
  关键词:关联规则;支持度;可信度
  关联规则挖掘是一项非常重要的数据挖掘技术,关联规则挖掘主要是面向大型的数据仓库而言的,它在商业中的用途极其广泛。
  1.基本概念
  关联规则中最重要的概念就是“支持度”和“可信度”。
  设I={i1,i2,…,im}是二进制文字的集合,其中的元素称为项(item)。记D为交易(transaction)T的集合,这里交易T是项的集合,并且T?I。对应每一个交易有唯一的标识,如交易号,记作TID。设X是一个I中项的集合,如果X?T,那么称交易T包含X。
  一个关联规则是形如X?Y的蕴涵式,这里X?I,Y?I,并且X?Y=F。规则X?Y在交易数据库D中的支持度(support)是交易集中包含X和Y的交易数与所有交易数之比,记为support(X?Y),即:
  support(X?Y)=|{T:X?Y?T,T?D}|/|D|
  规则X?Y在交易集中的可信度(confidence)是指包含X和Y的交易数与包含X的交易数之比,记为confidence(X?Y),即:
  confidence(X?Y)=|{T:X?Y?T,T?D}|/|{T:X?T,T?D}|
  给定一个交易集D,挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度(minsupp)和最小可信度(minconf)的关联规则。
  2.在STAR-IP系统中挖掘关联规则
  本文在利用关联规则分析STAR-IP系统的数据库时所使用的数据并非是该系统在实际运行中的所得到的数据,而是模拟的数据。
  对客户的分析大致可以分为三种情况:客户的地区分布、客户的类型分布和客户的消费习惯,由于2004年以来大大增加了发行量,而且所发行的IP卡都已经销售出去了,这段时间内用户注册的数量大大增加,而且也出现了小面额IP卡的用户注册信息,不过小面额卡的用户注册信息中仍然只有学生用户,其他用户注册信息仍然只限于大面额卡的购买者。
  对学生用户群体的注册资料进一步分析,我们可以发现不同地区的学生用户群体对不同面额的IP卡的需求不一样:20元、30元、50元和100元四种面额东部地区人数分别是11、13、28和55,南部地区人数分别是10、15、28和59,西部地区人数分别是5、6、33和8,北部地区人数分别是4、6、31和8。
  同样对其他用户群体的注册资料也作进一步地分析,我们也可以发现不同地区的其他用户群体对不同面额的IP卡的需求也不一样,详细情况:50元和100元两种面额东部地区人数分别是10、29,南部地区人数分别是31、35,西部地区人数分别是4、5,北部地区人数分别是6、11。
  进一步分析,挖掘出与学生用户群体相关的关联规则。
  在表1中,每个地区的用户都购买了两种用途的卡,所以最小可信度定为40%,地区对应用途总共有8种情况,所以将最小支持度定为8%;同样在表2中,每个地区的用户都购买了四种面额的卡,所以最小可信度定为20%,地区对应面额总共有16种情况,所以将最小支持度定为4%。
  3.结论与展望
  任何与销售相关的一家公司都会积累大量的交易数据,在这些交易数据中详细地记载着历年以来公司对应用户和产品的业务数据,发现这些信息、知识和规律并利用得到的结论来对公司的决策作辅助支持就成了非常有前景的研究领域。对于关联规则挖掘技术的未来趋势以及前景,从总体现状来看还是比较乐观的。
  参考文献
  [1]程继华.多层次关联规则的有效挖掘算法.软件学报,1998,8(9):937-941
  [2]陈栋,徐洁磐.一个通用知识挖掘工具.计算机研究与发展,1998,6(35):338-343
  [3]周欣,沙朝鋒.兴趣度:关联规则的又一个阈值.计算机研究与发展,2000,9(37):627-633
  (作者单位:台州职业技术学院)
其他文献
摘 要:本文主要介绍了数字图书馆个性化信息服务的含义、服务模式、关键技术以及国内国外的发展状况,以便读者更加清晰的了解和掌握数字图书馆个性化信息。  关键词:数字图书馆;个性化信息服务  一、引言  随着我国科学技术水平的提高,我国的数字图书馆建设以及网络通讯技术也得到的快速的发展,出现了越来越多的数字信息,但是人们对资源的需求量日益减少,使用者所需要的资源更加的专业化、垂直化,导致数字图书馆信息
期刊
摘 要:随着经济的的快速发展,近年用电信息采集系统的建设任务更加繁重,按照“三全”的思路、紧紧围绕供电公司的建设方案和要求开展工作,建设用电信息采集系统,进而实现计量装置在线监测和用户负荷、电量、电压等重要信息的实时采集,为营销业务应用系统及时、完整、准确地提供电力用户实时用电信息数据。就此,本文通过分析用电信息采集工程的作用、效益及重要性,对提高县供电公司电力营销现代化和计量标准化水平,构建智能
期刊
摘 要:通过对于资本配置效应、市场接近效应、市场拥挤效应以及所得税效应等转移支付政策的理论进行详细分析,从而进一步研究转移支付对于区域经济发展的重要作用。一方面,通过转移支付政策,能够补贴欠发达地区的企业经营利润,从而吸引发达地区的经济活动不断转移向发达地区。另一方面,通过转移支付不能扩大欠发达地区的总体收入和市场规模,所以能够实现区域经济的福利水平相对公平。但是对于国民总体福利水平必然造成影响。
期刊
摘 要:建筑工程招投标管理比较特殊,根据现有管理方式和实际要求可知,如何做好后续管理工作是重点。在招投标管理中给所有施工单位提供一个公平竞争的机会,通过适当的管理后,能减少贪污腐败事件的发生。本次研究中以建筑经济招投标管理重要性为基础,对如何做好管理工作进行分析。  关键词:建筑经济;招投标;管理要点  建筑工程招投标管理是当前交易工程的重要表现形式,根据管理机制和其他要求,如何做好公平、公正管理
期刊
摘 要:测谎结论作为一种诉讼证据,以电子工程学、认知神经科学和实验心理学等现代科学为基础而产生,被广泛应用于司法实践中。然而,由于现行三大诉讼法均未明确规定将测谎结论作为证据种类单列,近年来围绕测谎结论的科学性和有效性争议颇多,众说纷纭。因此,文章首先阐述了测谎结论的原理,并分析了测谎结论的证据属性和表现形式,在此基础上探讨了如何提高和完善测谎结论的证据有效性策略,以期明晰测谎结论的证据有效性和实
期刊
摘 要:近年来我国已经逐渐迎来了信息网络时代,人们生活方方面面都应用到了各种先进的网络技术、信息技术和电子技术等,使人们的生活质量得到提高,我国社会经济水平得到提高,同时还实现了跨境电子商务,促进了我国国际贸易发展,使我们在国际竞争中的地位得到提高。因此,加强新时期跨境电商实践与拓展是必要和重要的,理应得到重视。  关键词:新时期;跨境电商;实践与拓展;路径分析  现时代,信息技术及网络技术已经被
期刊
摘 要:近年来,我国经济发展进入新常态,但在新常态背景下,经济下行发展压力相对较大。为了能够切实解决这一问题,中央推出一系列的改革举措,直接扩散各级地方政府方面。PPP模式能促进政府转变职能,是发挥市场资源配置效应的有效途径。但PPP模式的应用需要适宜的“土壤”和“气侯”,因此要因地制宜采取措施,推动PPP模式建设项目有效实施。基于此,本文主要对新常态下PPP模式应用存在的问题及对策进行分析探讨。
期刊
摘 要:师资队伍是开展创新创业教育的关键所在,是高校培养创新创业人才的重要保证,是形成“大众创业、万众创新”的强有力推动。目前我国高校创新创业教师队伍存在着创新创业理念不强、师资队伍不稳定、师资水平不高、管理机制不健全、创业师资绩效评价不科学等问题,制约着高校创业教育师资队伍的建设,制约着创业教育教学质量的提高。  关键词:“互联网+”;创新创业能力;教师队伍  2010年5月,教育部在《关于大力
期刊
摘 要:大学生手机依赖现象普遍,不仅危害自身的身心健康,也对正常的课堂教学产生不良的影响。将智能手机应用于大学课堂,变堵为疏,最大限度减少大学生手机依赖对课堂教学的不良影响,使之为课堂教学服务。  关键词:智能手机;课堂教学;蓝墨云班课  随着科学技术的发展,智能手机的使用越来越普及,几乎已成为我们日常生活中不可或缺的一部,也成为大学生日常生活的必需品,已经达到人手一部,甚至部分家庭条件优越的学生
期刊
摘 要:空调制冷系统的效率受到很多因素的影响,目前我国主要就是根据这些影响因素进行研究,找到优化空调制冷系统的措施,使城市建筑中的空调在节能的基础上加强制冷效果,更加智能化地调节室内温度。  关键词:制冷机组;制冷效率;措施  1、空调不制冷常见原因  1.1 制冷剂不足  1.1.1 查漏  檢漏方法:在湿毛巾上倒些肥皂水,涂在需要检查的地方,观察该处是否向外吹泡泡,吹泡泡说明该部位有漏点,没有
期刊