含有负项值的高效用项集挖掘算法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:asd010asd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高效用项集挖掘是通过效用值来衡量项集的重要性、反应用户的兴趣度,能较好的解决用户的问题,是数据挖掘研究领域的一个热门话题。高效用项集挖掘算法研究相对比较成熟,其效用值是正值,但随着处理实际问题的应用研究的深入,发现现实生活中存在负项值的情形,例如,商场时常推出的买赠活动,赠送的商品获得的利润值为负值。又例如,一些商品在商场中由于季度等原因可能会频繁地上架下架等问题,因此,考虑含有负项值、on-shelf时间段的高效用项集挖掘更具有现实意义,而传统的高效用项集挖掘算法无法解决该类问题。本文从提升含有负项值的高效用项集挖掘性能的角度出发,主要研究了含有负项值的高效用项集挖掘和含有负项值的on-shelf效用项集挖掘两个问题,主要的工作有:(1)研究了如何有效提高含有负项值的高效用项集挖掘的挖掘效率。处理含有负项值的高效用项集挖掘的算法在剪枝过程中考虑了正项而忽略了负项,影响剪枝效果。为此,提出了高效的挖掘算法EHINM。EHINM算法提出一种改进的效用列表结构来保存事务数据库的效用信息。这种效用列表结构为三元组结构,与以往含有负项值的高效用项集挖掘算法中使用的四元组效用列表结构不同,其考虑了负项进而将四元组结构中存储的信息进行了压缩,既减少了存储空间,又能根据结构中存储的信息对搜索空间进一步的缩减。算法根据重新定义的剪枝上界和改进的效用列表结构提出了三种剪枝策略。同时,提出了负项的扩展性质用于减少对搜索空间的遍历。实验结果表明,EHINM算法能够有效地提升项集挖掘效率。(2)研究了含有负项值的on-shelf效用项集并行挖掘问题。On-shelf效用项集挖掘和高效用项集挖掘一样,面临着指数级的搜索空间,因而如何有效地提高挖掘效率是其亟需解决的问题。算法并行化是提高算法效率的一种有效途径,为此,提出了含有负项值的on-shelf效用项集并行挖掘算法DTP-Houn。DTP-Houn算法基于MapReduce框架,充分利用on-shelf时间段因素,将原始事务数据库按照时间段进行分片。算法将挖掘过程转化为MapReduce工作,Map阶段在分片数据库中挖掘候选项集,Reduce阶段并行计算候选项集的on-shelf效用值。实验结果表明,DTP-Houn算法取得了较高的挖掘效率。
其他文献
随着科技的发展和互联网的进步,各种数据呈现剧增的趋势,图像作为一种直观表达数据的形式,早已渗透到社会的各行各业中。面对当前海量的图像数据,如何利用有效的分类技术对其
程序切片是一种传统的程序分析方法:通过去除程序中的无关代码,获取可能影响到程序中某行代码的代码子集。程序切片在程序理解、软件测试以及程序调试等诸多软件工程领域有着广泛应用。随着互联网技术的发展,JavaScript语言得到广泛应用,但针对该语言的程序切片方法和工具却非常有限。JavaScript语言是动态类型解释执行的语言,函数的传递使函数的调用关系难以分析其语言的闭包特性让函数使用外部变量的场景
随着通信和计算技术的进步,移动互联网获得了空前巨大的发展,移动互联网快速的发展使得无线通信技术面临着前所未有的挑战。一方面,如何设计安全高效的无线传输技术来增加无
选择性催化还原技术(SCR)以其独特的优势广泛用于烟气脱硝系统中。其中,喷氨量的控制占据重要的位置,其控制效果的好坏直接影响着NO_x排放浓度及生产效率。但喷氨量控制中存
目标跟踪是计算机视觉领域中的一个研究热点,在实际生活中有着广泛的应用前景。在目标跟踪领域中相关滤波是当前主流的研究框架之一,在该框架下,许多学者提出了很多优秀的跟踪算法,解决了目标跟踪的基本问题,同时也具备较好的精确性。但是在实际应用中,仍会面临很多挑战,比如光照变化、目标遮挡、尺度变化等。针对这些挑战,本文主要在前人工作之上,从特征提取和模板更新这两个模块入手对跟踪器进行改进。论文主要工作如下:
自2013年《塔林网络战国际法手册》(即《塔林手册1.0版》)问世以来,围绕着该手册关于规范网络战争的规则引发了学界争论。对于第一版手册中存在的争议性问题,2017年国际专家组再次进行了修订,即《网络行动国际法塔林手册2.0版》。在这一书中,首先明确了国家主权适用于网络空间,其次对于网络行动规则进行了重新论述。但国家在网络空间中的自卫权行使仍然具有相当大的争议,本文在结合《塔林手册2.0版》中最新
学位
根据中国残疾人联合会2010年末公布的统计数据显示我国残疾人总人数8502万,其中下肢截肢的残疾人数是120多万。患者在截肢后为了能够站立起来进行正常的生活,一般会选择安装
紫外光电探测器广泛应用在民用和军事领域,包括环境监测、化学和生物分析、火焰探测、远程控制和安全的空对空通信。由于出色的化学,物理和光学特性,一维二氧化钛纳米结构(纳
传统相干光接收机可支持高阶调制格式解调和链路损伤补偿,在高速率、长距离光通信中得到广泛应用。新近出现的Kramers-Kronig(KK)光接收机通过数字信号处理(DSP)技术结合单个光探测器即可实现信号光场重建,具有成本低、功耗小的优点,是目前的研究热点之一。本论文围绕KK光接收机实时DSP系统的设计与实现开展了相关工作,主要内容包括:(1)研究了KK光接收机的系统结构和工作原理,设计了相应的D
艾里光束因其无衍射性和自弯曲性,在粒子捕获,显微镜成像,等离子体,大气湍流等领域有广泛的应用,近年来引起了很多研究人员的关注,并取得了一系列研究成果。但有关粒子对一维