数据库中的快速关联规则挖掘

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:coolfish150
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘算法使用格理论中的组合特性来将原始问题分解为许多更小的互相独立的问题.最有名的和最有影响力的算法包括Apriori算法和FP-growth算法.这些算法在所有的最大频繁项目集都很短时性能很好.然而,如果存在长的最大频繁项目集,算法性能将会急剧下降.长的最大频繁项目集容易出现在项目之问相关性很高的应用场合.SegFree是针对此问题提出的一个算法.SegFree将数据库分为许多个分段并在每个分段中挖掘free项目集.Free项目集是一种精简集,数据库分成的分段数越多,每个分段中的free项目集将会越少.SegFree算法能显著的减少项目集模式匹配的时间,比以往的算法效率都高.先对数据库做扫描以获得一些辅助信息能够有效的优化挖掘过程.提出ARSC算法就是用来生成分段信息表以达到这一目的的.分段信息表耗用内存不大,容易生成但加速的效果很好.它能与很多种算法协同工作,还可以使用在不局限于关联规则挖掘的其他数据挖掘任务中.在现代计算机系统中入侵检测系统已经变成了一个很重要的组成部分.入侵检测系统首先使用数据挖掘算法来对审计数据查找频繁模式,析取特征,然后使用分类算法建立入侵检测模型.这其中最重要的步骤是判别字段间的关联和相关性以构造特征.提出了一种新的想法是在入侵检测系统中标准关联规则的描述能力不够,应该使用带否定和带支持度约束的关联规则来取得更好的效果.
其他文献
信息过滤(Infonnation Filtering)是一种个性化的、主动的信息服务机制,是对传统信息检索服务的有益的补充。信息过滤包括许多内容,如声音、图像和文本等等,在本文中,我们主要指
随着Internet/Intranet技术的发展与壮大,企业业务运作模式发生相应的变化,计算机应用系统也由单机模式向网络模式发展。分布式多层结构模式正是在这种环境下产生并发展的。与传
随着越来越多的商用程序移植到Internet上,提供高可用性服务就变的日益重要。群集系统的一大优点就是它具有软、硬件的冗余。高可用性通过侦测结点或幽灵程序的失败情况以及重
针对数字博物馆中的多媒体信息版权保护和安全问题,本文主要在视频数字水印技术的以下几个方面开展研究: 1.提出一种应用于原始视频的纹理分块数字水印算法。通过纹理自相关
身份认证技术是网络安全和信息系统安全的第一道屏障,它是在信息安全时代备受关注的一个研究领域,而基于密码体制的身份认证,一直是人们研究的重点,有着广泛的应用前景。 本文
作为模拟自然景物时普遍采用的重要手段,粒子系统有着它独特且不可替代的优势。虽然近年来它在人们的关注下发展得比较成熟,尤其是在一些商用游戏和影视制作中用到的粒子编辑器
嵌入式网络计算中,多服务代理技术的优势就是通过服务代理之间的协作,完成单个服务代理不能完成的任务或以更高的效率完成任务。一方面,嵌入式网络设备由于计算资源严格受限,随着
随着企业信息系统的普及和整个社会电子商务的发展,现代企业的运作日益依赖于信息技术.数据的高可用性、安全性对企业来说至关重要.同时许多企业和机构要求保证业务的连续性,
随着社会分工越来越细,单位的业务也越来越多样化,单一的信息系统已经无法满足和适应多方面的需求,使得一个单位往往是同时使用多个信息系统.而这些系统由于开发商或者采用的
随着ICAI(Intelligence Computer Assisted Instruction)技术的不断发展,其在许多学科领域已得到了广泛的应用。比如,在数学方面有著名的Geometry Tutor、BUGGY系统、张景中的