基于矩阵压缩和时间衰减的加权频繁项集挖掘算法

来源 :南宁师范大学 | 被引量 : 0次 | 上传用户:lockin025
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
加权关联规则挖掘是一种通过赋予项目权重从而挖掘关联规则的技术,权重可以表示用户感兴趣的程度、项目在数据集中的重要性等。加权关联规则相比于传统的关联规则更符合用户的需求。但加权关联规则挖掘也有一些局限性。例如,随着时间的推移用户感兴趣的程度可能已经下降,导致过时的加权关联规则对现在的用户来说并不具备指导性。相比于过时的加权关联规则,近期挖掘的加权关联规则才是用户真正需要的。在加权关联规则挖掘过程中,最主要的步骤是挖掘加权频繁项集。RWFIM-PE算法是一种包含时间衰减约束的加权频繁项集挖掘算法。以使用时间衰减因子计算得到的近期度(Recency)来标记事务发生的时间点与数据集时间终点的距离。这些事务包含的项目不仅受权重的影响,也受到事务的近期度的影响。这使得最后挖掘得到的是包含近期度属性的加权频繁项集,即近期加权频繁项集(RWFI)。用近期加权频繁项集生成的关联规则,从时间上来说对用户更有指导意义。但RWFIM-PE算法存在着一些不足之处。该算法遵循Apriori算法的思想,在生成(k+1)-项集时需要大量的连接操作,算法执行时间开销较大,占用内存较大。针对RWFIM-PE算法存在的问题,本文提出了两个基于矩阵压缩和时间衰减的加权频繁项集挖掘算法。本文主要完成了以下3方面的工作:(1)提出基于矩阵压缩的近期加权频繁项集挖掘算法RWFIM-M。RWFIM-M算法使用矩阵运算的思想,优化了迭代搜索候选项集的过程;使用矩阵压缩的方法缩小了事务数据集的搜索空间,优化了搜索RWFI的过程,提高了挖掘RWFI的效率。(2)提出基于投影矩阵的近期加权频繁项集挖掘算法RWFIM-PM。将含有相同前缀的近期事务权重频繁2-项集所包含的项目的列复制到一个矩阵中,组成投影矩阵,进一步压缩矩阵,压缩数据集的搜索空间,提高挖掘RWFI的效率。(3)对于提出的算法,使用3个数据集,从多个角度进行对比实验。分析实验结果,证明所提出的RWFIM-M算法、RWFIM-PM算法的性能良好。
其他文献
在互联网迅猛发展的同时,人类所获得的信息资源的数量也在急剧增长。面对这个信息过载的互联网时代,为了帮助人类快速有效地筛选出有用的信息数据,推荐系统应运而生。推荐系统的核心是推荐算法。在众多的推荐算法中,协同过滤(Collaborative filtering,CF)算法是目前推荐系统经常使用的算法之一。CF算法首先通过搜集用户的过去行为数据来发现用户的个人喜好,然后根据用户喜好的不同对用户进行分组
玉米作为世界三大作物之一,也是我国主要的粮食作物和饲料作物,其种植面积和总产量仅次于水稻和小麦。近年来,玉米病害的发生越发严重,其中,玉米大斑病作为危害玉米生产的主
回转窑广泛应用于建材、冶金等行业,其中在水泥工业中应用最多。回转窑是水泥厂的核心设备,它主要由筒体、支承部件和传动部件组成。窑长期在高温、重载的恶劣环境下运转,经常发生筒体热弯曲变形和窑中心线偏移等故障。若不能及时发现这些窑的早期故障,将导致故障程度加深而发生窑停产事故,给企业带来巨大经济损失。目前,国内水泥厂缺乏对回转窑早期故障诊断的技术,还停留在故障严重时的事后检测阶段,不仅影响窑的正常生产,
金色蓝素蛋白(Auracyanin,Ac)是丝状不产氧光合细菌中发现的一类蓝铜蛋白,介导其循环电子传递链中替代复合物Ⅲ和反应中心之间的电子传递。本课题从光合玫瑰菌中提取并纯化出空
随着科技的发展,光束偏转装置被越来越广泛地使用到众多领域,如光束平滑、高速光开关、雷达扫描等。铌酸锂晶体具有较低的传输损耗(0.2d B/cm)和较高的光电系数(30.8pm/V),具有工艺完善、器件易于集成等优点,是优质的电光材料。现已研制并封装以带有锯齿电极的APE铌酸锂波导(或简称APE波导)为核心的电光光束偏转光芯片,并通过各项光学实验测试和改进该芯片的性能。针对实验过程中产生的大数据实时
本研究中国新疆塔克拉玛干沙漠分离纯化的5株沙漠藻进行培养,观察藻细胞显微结构进行形态学分类,再利用16S rDNA序列分析与16S-23S rDNA间隔ITS区序列系统发育分析进行分子生物学分类鉴定。再进一步对沙漠蓝藻mcy基因进行了分析,探讨沙漠蓝藻微囊藻毒素基因与淡水蓝藻微囊藻毒素基因之间的同源关系。本研究不仅为沙漠蓝藻的遗传多样性奠定基础,而且首次对沙漠蓝藻微囊藻毒素基因进行系统进化分析,并
推荐系统基于用户历史行为数据建模用户兴趣偏好,从海量数据中获取有价值的信息。协同过滤算法因仅使用评分数据,简单高效,而被广泛应用,但是却存在评分数据稀疏和冷启动问题。引入深度学习技术到推荐系统中为解决上述问题带来了新的研究方向。深度学习可通过构建一种深层次非线性网络结构,从多源信息中提取用户和物品的非线性特征,具备强大的挖掘样本集潜在特征的能力。现如今,基于深度学习的推荐算法在一定程度上取得了不错
碳量子点也称碳点(Carbon dots,CDs),是一种新型的零维碳纳米材料,尺寸在10 nm以下。由于CDs具有优异的光学特性、良好的生物相容性和简单的合成路线,CDs已被广泛应用于生物
预制装配式结构符合国家提出的绿色、环保、节能的建筑概念,顺应“建筑工业化、住宅产业化”的行业发展趋势,是未来建筑发展的方向之一。本文在课题组已有的带竖向接缝和水平接缝的全装配式剪力墙的研究基础上,改进原有的水平接缝连接,提出一种新的竖向接缝连接方式(采用钢边柱、竖向连接件及高强螺栓连接全装配式剪力墙的竖向接缝),并进行试验研究、理论分析,具体的研究工作及结论如下:设计并制作了5个1/2缩尺的试件,
伴随着我国市场经济的发展进入新常态,为了盘活市场,激发经济的新动能和持续性增长活力,中小企业逐渐成为国家重点帮助和扶持的对象。到2018年底,我国小微企业在法人数量上超过3000万,其中个体工商户的数量约6200万户,其中中小微企业(包含个体工商户)在市场主体中的比重超过90%,贡献了超出50%的税收、60%以上的GDP以及70%以上的技术创新,为城镇提供了超过80%的就业岗位。小微企业在协助调整