面向效用的模式挖掘算法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:henrychan168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网高速的发展,信息交互越来越便捷,产生的数据也随之增多,这些数据往往能产生巨大的价值,如何对海量的数据进行挖掘和分析在各行各业中变得愈发重要。其中关联规则在数据挖掘中发挥着重要的作用,但关联规则只考虑模式出现的次数,往往导致一些频繁度低,效用高的模式不能被挖掘出来。高效用模式挖掘算法的出现解决了这样的问题。近年来效用模式的挖掘成为数据挖掘中重要的研究方向之一。模式的种类很多,从最初的布尔型关联规则基础上,模式得到了广泛的扩展。模式加上时间属性或者其它一定顺序的属性就产生序列模式的形式。本文就一般模式和序列模式,主要研究了基于粒子群优化的高效用模式挖掘算法和在数据集为序列的情况下的高效用序列模式挖掘算法。创新性研究成果如下:在传统数据集加上效用信息的情况下,本文提出了基于粒子群优化的高效用模式挖掘算法HUPMSUPT-PSO,该算法设计出SUP-Tree结构,保存了效用上界值的信息,该结构对模式剪枝起到重要的作用,并且在评价粒子阶段前,对粒子进行预评价,大大提升了算法的效率。实验证明HUPMSUPT-PSO算法比目前基于粒子群的高效用挖掘中效率较高的算法HUIM-BPSO+更加高效,且在相同情况下挖掘的模式数量更多。数据库中的事务在以序列形式存在的情况下,又引申出高效用序列模式挖掘问题。序列模式的搜索空间比一般模式的大,所以计算复杂度比高效用模式挖掘要高。目前对高效用序列模式算法研究比较少,且都没有考虑序列数据库中项的外部效用值为负的情况。面对含负项的外部效用值,本文提出了含负项的高效用序列模式挖掘算法EHUSN,该算法提出1-2-UM和2-2-UM结构模型,结合效用信息列表能快速剪枝非候选序列,从而使挖掘算法在时空效率上的得到提升。
其他文献
随着深亚微米技术的日渐成熟和纳米工艺的发展及应用,超大规模集成(Very Large Scale Integrated,VLSI)电路已经越来越广泛地应用到了生活的方方面面,对国民经济的发展和科学
投资作为公司获取投资收益、实现财务目标的重要基础,投资决策就是企业所有决策中最为关键、最为重要的决策,通常将对企业未来的现金流量产生重大影响,影响着企业实现自身目
无线通信技术的快速发展使人们对频谱资源的需求大大增加,而现今的频谱分配政策又造成大部分可用频段的利用率较低。认知无线电技术能感知周围频谱环境,并机会性地接入空闲频
目前,我国教育部门对中职院校办学水平和教学质量的评估工作非常重视,社会各界也给予了极大的关注,这使得中职办学水平的评估工作成为摆在中职院校发展过程中的头等大事。办
当前无线网络对传输速率成百倍的需求增长与日益殆尽的频谱资源成为了一对急需解决的矛盾。认知无线电具备学习能力,能够通过频谱感知利用空闲频谱资源,大幅提高频谱利用率。
二十世纪九十年代以来,我国开始积极发展高等职业教育,郑州财税金融职业学院抓住了发展的机会,2013年学校由普通中等职业学校“郑州市财税学校”升格为高等职业院校“郑州财
近年来,随着社交网络的推广以及智能设备的普及,数据的增长速度也在不断加快。Hadoop,作为MapReduce的开源实现,在工业界和学术界的地位正变得越来越重要,大数据技术已经对社
随着信息与网络通信技术的飞速发展,企业信息化建设进程不断加快,企业信息网络的结构性能与信息资源的安全管理变的尤为重要。分布式结构的网络是指采用分布控制,各个结点间
日益增长的视频业务给移动终端带来了巨大的能耗压力。并且,视频业务在用户体验上还无法满足用户的高要求。为有效的保障无线通信中移动终端的节能以及视频业务的QoE,本文针
IMT-Advanced是ITU为了满足未来10年全球移动通信应用需求而启动的具有超过IMT-2000性能移动通信系统。LIE-Advanced作为LTE(Long Term Evolution,长期演进)的增强技术,是ITU