超期望模式挖掘技术研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:wergsdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(DM)是一种以从存储在数据库、数据仓库或其它信息仓库中的大量数据中高效地发现有价值信息为目标而得到研究和发展的方法学和技术主题。这种有价值的信息包括模式、关联、变化、异常和重要意义的结构。数据挖掘试图去表示、分析和实现有助于从数据中抽取有意义信息和知识这一最基本的归纳过程。 在数据挖掘领域中已取得巨大的发展,同时对这种工作有很多很严格的制约。这部分地表现在数据挖掘研究停留在肤浅统计意义分析和分组这个焦点上。我们使用关联规则(频繁模式)发现来阐明这种工作。 关联规则挖掘是数据挖掘中的一个重要研究课题。它是搜索强相关项集的一个过程。运用现有的频繁模式挖掘算法挖掘市场购物数据集时,尽管“苹果”的支持度(200kg)远小于它的期望(300kg),同其它模式一样只被当作一种频繁模式看待,因为“苹果”是日常食品且每天被频繁地销售。和“苹果”相比,“腰果”是昂贵的食品且很少被销售;尽管“腰果”的支持度(20kg)远大于它的期望(5kg),它却不能作为频繁模式被发现。从市场角度来看,频繁项集‘苹果’是常识,但‘腰果’的销售增长趋势才是所渴望的模式, 因而它是一个超期望值模式。同样,‘苹果’的销售减少趋势也是一个超期望值模式,把它作为频繁项集更为有趣。这种超期望模式在预测下一时段产品的买卖很有帮助。 挖掘超期望模式是以前未曾开发的。这是因为超期望模式(1)在识别关联规则可能被剪枝掉;(2)也可能本质不同于传统频繁模式和关联规则。该论文主要目标是(1)表示和建模有趣的超期望模式;(2)开发算法挖掘这种模式;(3)通过实验评估我们方法。
其他文献
能源作为经济增长和社会发展的根本动力,在国际上具有十分重要的地位。在中国经济对能源日渐依赖的背景之下,能源问题早已经成为了人们日渐关注的问题。其中,能源价格问题是整个
多代理调度是拥有独立工件集的代理根据各自优化目标竞争使用共享资源,带有学习效应和退化工件的多代理单机调度是近几年新出现的研究问题,但由于多代理下的工件交替加工而导致
Internet和Web技术的发展为现代办公自动化系统提供了新的管理理念和技术支持。基于J2EE的柔性办公自动化系统通过构建一个开放性的办公环境,克服了传统办公系统功能单一、难
移动数据业务发展到今天,历经“蛮荒期”、“规范期”后,最终要进入到“成熟期”。如何以用户为中心,为用户提供优质的数据业务服务,催生了数据业务深度运营的管理需求。对移动数
高等学校多年来的教学和管理中积累了大量的数据,目前这些数据还没有得到有效地利用,只是一个待开发的“宝藏”。数据挖掘可以从大量的数据中提取隐藏在数据背后的有价值信息
如今,手持设备的硬件水平逐步提高,多种功能的传感器都可搭载在智能手机终端上,这使得以手机设备为主的移动感知技术逐渐升温,进而演变出了一种新型的数据信息社会化生产模式
手势是人们生活当中一种自然而直观的人际交流模式,随着人机交互逐渐向以人为中心转移,对手势识别的研究也逐渐成为人们研究的热点。它为使用者提供了虚拟环境之间进行自然交
随着医学成像技术的发展,医学图像数据量剧增,数字成像设备之间的互联的需求越来越紧迫,为此需要建立医学影像存储与通信系统PACS和放射科信息系统RIS。它是旨在全面解决医学图
心血管疾病多年来一直严重危害着人类的健康,它常常是由冠状动脉狭窄和堵塞引起的。随着冠状动脉CT造影(Coronary Computed Tomographic Angiography,CCTA)技术的发展,通过人工
工作流是在计算机辅助下全部或部分自动执行的工作过程。Internet的发展对工作流的发展起了极大的促进作用,使计算机支持的分布式、协同工作的工作流系统在企、事业单位中得