序列模式发现模型的研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:sketchupbim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的日新月异使得各个领域的数据量激增,在此背景下诞生的知识发现和数据挖掘给人们提供了一种新的认识数据、理解数据的智能手段。序列模式发现是其中的一个重要研究课题。本文针对目前序列模式发现研究中的一些问题展开研究,主要研究工作如下:(1)详细讨论了序列模式的基本模型以及经典的发现方法,展现了序列模式发现研究领域的应用前景及所面临的挑战。(2)提出了以图结构表示序列数据库的模型,并在此基础上提出了一种基于图结构发现序列模式的新算法GBSPM。传统的算法需要多次扫描数据库,I/O开销大,导致时间性能不佳。本文提出一种图结构模型用于表示数据库中的序列信息,仅需扫描一次数据库,即可将与挖掘任务相关的信息映射在图中。基于这一结构的序列模式发现算法GBSPM克服了传统方法中反复扫描原始数据库的弊端,又可以充分利用图中表示的项目之间次序关系,提高了频繁序列的生成效率,更能方便地发现带有时间约束的序列模式,从而提高挖掘的质量和效率。实验证明,该算法较传统的序列模式发现算法在时间上具有优越性。(3)提出了一种利用已发现序列模式对数据库中的客户序列进行聚类的方法。该方法利用发现的序列模式描述客户序列的特征,在此基础上定义了客户序列之间相似度函数和客户序列分组的平均值,使得经典的聚类方法可以应用于序列型数据,实现了对包含相似模式的客户序列进行划分。理论分析和实验表明,与已有的序列聚类方法相比,本文所提出的方法不仅可以得到更加优化的聚类,而且效率更高。
其他文献
随着组件式软件开发技术和GIS的日益发展,组件技术广泛应用于GIS平台,继而本文通过分析电网规划的研究现状,提出将组件式GIS技术应用于电网规划的思路。本文采用组件技术,遵循组件设计的规则,实现了变电站和输电线路组件的开发,并利用MapX控件,在VB开发的图形用户界面和Oracle 9.0数据库环境下,验证了该组件的独立性和应用环境的适用性。为电网规划人员提供了一种新的规划方法,极大方便了电网设计
本文研究专利信息检索系统的推送与数据挖掘的应用问题,目的是在当今网络信息资源迅速膨胀的情况下,改变用户传统的通过主动搜索来获取信息的方式,主动向其推送需要的信息,从
昆虫是动物界中一个十分庞大的类群,所包含的种数比所有动物类群的总和还要多,已经记载和命名的昆虫大约就有一百万种。将中国目前已经发现和命名的昆虫的分类资料数字化,建
当越来越多的企业将其核心业务搬上Web,以Web服务的形式部署之后,如何有效的自动组合Web服务来完成复杂的功能成为当前研究的热点。通过研究语义Web服务的自动组合技术,建立
计算机技术的飞速发展使嵌入式系统得到了广泛的应用,板级支持包(BSP:Board Support Packet)作为嵌入式系统开发和调试的重要工具,其通信功能尤其重要。随着板级支持包通信方
目前,电子商务最常用的身份认证方法是由权威认证中心CA(Certificate Authority)负责为客户颁发表明其身份的数字证书。然而,基于PKI(Public Key Infrastructure)的数字证书
多媒体实时教学系统是指在计算机网络环境下,借助现代化的多媒体技术进行教学的计算机辅助教学系统。在网络多媒体教学系统中,允许不同时空上的学生共享学习资源,通过协同对
近年来,分布式拒绝服务攻击(DDoS, Distributed Denial of Service)严重影响着Internet安全,给Internet的应用和发展带来了极大危害。目前,网络流量的自相似性、时间序列分析
学位
计算机网络技术的发展和应用便利了社会、生活的方方面面,而无纸化考试更作为一个具有广泛前景的应用领域变革了传统的考试方式。随着无纸化考试系统的研究与发展,以互联网技