基于间隔事件的时间模式挖掘算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kel002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了有时间间隔的事件的挖掘问题。假设原始数据库由事件序列集构成,其中事件发生在时间间隔内,我们的目的是挖掘出数据库中频繁发生的间隔事件间的时间关联规则。之所以进行这项工作是因为我们观察到在实际生活中,很多事件并不是瞬时发生的,而是发生在一段时期内。因此,许多诸如网络监测,交易记录和医疗数据库的分析等实际应用都需要挖掘出间隔事件之间的关系。  本文改进了现有的被称为EMEMISP(Extending of MEMory Indexing for Sequential Pattern mining)的算法,该算法用来从间隔事件数据中挖掘时间关联规则。在序列模式挖掘领域,MEMISP算法比其他诸如GSP和PrefixSpan等算法更高效,因此EMEMISP算法选择了扩展该算法,使其应用于基于间隔事件的时间关联规则挖掘领域。和EMEMISP算法相比,改进后的算法主要做了两个方面的提高。首先,在挖掘过程中,我们基于Apriori算法原理应用了剪枝策略,这将有效的降低算法的计算量。其次,和EMEMISP算法将每个模式中涉及的所有事件间的关系全部存储起来不同,我们只存储频繁2-模式中事件间的关系,在存储其他的n-模式时(n>2),通过增加相应的指针来指向对应的频繁2-模式。  类似于EMEMISP算法,改进后的算法同样要求首先扫描数据库,并且不需要生成候选模式集和数据库映射。在得到所有的频繁模式后,应用相应的算法得到我们感兴趣的时间关联规则。  除了改进EMEMISP算法外,本文还在此基础上研究了一些诸如最小支持度,最大时间差等关键参数对时间模式挖掘算法的影响。
其他文献
巷道是地下采矿时,为采矿提升、运输、通风、排水、动力供应等而掘进的通道,是矿山生产和施工的主要研究对象。巷道设计的优劣与矿山生产、运输、通风、安全等方面有直接影响
格基密码学作为后量子密码的典型代表,是一类备受关注的抗量子计算攻击的公钥密码体制,对其研究越来越具有积极的理论意义和紧迫的现实意义。格密码的发展大体分为两条主线:一
个性化推荐技术是根据用户的个人喜好以及消费记录,推荐其喜爱的商品或者信息的一种技术,近年来逐渐成为研究的热点。它普遍应用于影视、电子商务、社交平台、网络电台、音乐
随着地理信息系统的应用越来越普遍,对空间数据库的设计和响应速率的要求也越来也高。地理信息系统的开发少不了空间数据库的支持,目前空间数据库的设计与建设主要是以Arc SD
生物特征识别技术近几年取得了飞速的发展,利用人体的生物特征来鉴别个人身份成为安全验证的重要方式。对人脸识别方法和技术的研究已经是国内外模式识别领域的研究热点。目
随着数字图像处理技术的发展,医学图像处理和分析技术在医学诊断领域发挥着越来越重要的作用,比如在对大脑图像进行分割时,可以利用机器学习的方法判断老年痴呆病发的可能性;
众所周知,随着网络技术的迅猛发展,网络上多媒体资源已越来越多。在音乐检索方面,单纯的文字输入检索已经不能满足用户的需求,尤其是网络上的音乐多媒体爆炸式增长的情况下。
随着互联网技术的飞速发展,不同领域网络信息的种类和组成形式愈加复杂,每个网站节点都具有复杂的分类体系结构,并且包含丰富的文本信息,如何将大量的文本信息标注到对应正确
人脸识别由于具有自然性和友好性的特点,因此成为生物特征识别领域中的一个热点研究问题。通过采用人脸识别技术,可以准确的识别出人的身份信息,进而保证信息安全。由于这个
服务计算(SOC)和服务构架(SOA)的兴起和发展,促使通过实现服务协同来构建虚拟组织(Vos, Virtual Organizations),成为革新Internet计算环境下应用软件系统的主流方式。然而,