数据挖掘在主动数据库规则设计中的应用

来源 :南开大学 | 被引量 : 0次 | 上传用户:ssbbe1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主动数据库系统支持的主动机制,使它能自动监测发生在数据库内部或外部的事件,并对所关注的情况及时做出反应。主动数据库需要借助很多复杂的规则来指定系统的主动行为,这些规则通常由事件、条件和动作三部分组成,因此常称为事件一条件一动作规则,或ECA规则。主动规则是系统主动机制的基础,决定了系统主动行为的正确性,因此设计主动规则对主动数据库系统的实现来说很重要。但是,主动规则设计中遇到的一些问题,无法直接用传统的数据库设计方法解决。 本文通过分析主动规则的特点,将主动规则的设计看作一个完整的过程,研究了主动规则设计过程中存在的问题,并创造性地将数据挖掘技术应用到主动规则设计的三个重要环节:规则提取、规则分析、规则更新中,利用数据挖掘自动获取知识的能力,解决主动规则设中遇到的问题。主要工作包括: [1]为了确定应用领域中适合表达为规则应用语义,本文提出基于数据挖掘的主动语义获取,将数据挖掘技术应用于主动规则的提取。讨论了利用数据挖掘获取主动语义的优势,利用数据挖掘可以获得的各类规律性知识和各种“感兴趣”的事件,在更高概念层次上提炼领域知识;分析了挖掘结果使用中会遇到的困难,提出利用分层组织方式管理和表达发现的规则,解决了大规则集难于理解的问题;并介绍了如何利用数据挖掘得到的各类知识,如各种模式规则、感兴趣事件、非规则型挖掘结果等,辅助主动规则的设计。 [2]将数据挖掘技术应用于主动规则的终止分析,利用数据挖掘和静态分析相结合的方法,提高终止分析的正确性和准确性。由于静态分析方法一般太保守,动态分析方法不能仿真所有可能规则触发情况,本文将数据挖掘得到结果作为已知知识(如分类规则、序列规则等)应用于触发图分析方法中,在分析规则间触发关系时,即考虑了事件和条件的满足情况,又降低了评价分析的主观性。 [3]提出数据挖掘支持的主动规则更新。主动规则应及时反映系统中主动需求的变化,因此需要不断更新。为了解决新的主语义的自动识别与准确确定需要更新规则的问题,本文利用孤立点挖掘与自适应的新类识别等技术,自动发现系统主动语义的变化,获取新的语义知识;通过分析新挖掘出知识与原有规则的相似度,确定需要更新规则,淘汰“过时”规则,避免为同一语义定义冗余的规则。本文最后还介绍了依据上述研究成果设计的一个简单的基于数据挖掘的主动数据库原型系统的结构,以及关键部件的实现策略。
其他文献
随着互联网技术和多媒体技术的快速发展,作为多媒体数据源之一的图像的资源量剧增,并且深刻影响着人们生产生活的各个领域,因此,如何高效地获取和使用图像信息,成为了当前学术界和
本文结合自行研制的新型短波监测设备,对短波传播理论、无线电测向技术、数字信号处理理论和软件无线电理论等进行了深入研究,并将其应用于设备中。首先,对无线电测向理论进
本文以企业银行住房公积金信息系统开发为例,阐述了利用基于MVC模式的Struts框架实现B/S应用系统的技术要点。 文中首先在充分分析了公积金缴存系统的用户需求之后,给出了基
本文以基因表达数据为研究对象。由于基因表达数据存在局部相似和时间延迟的特点,直接应用传统的相似度计算方法难以准确发现表达相似的基因。本文中,我们试图通过计算满足一定
随着信息社会的发展,越来越多的信息被数字化,尤其是伴随着Internet的发展,数字化的信息呈爆炸式增长。因而在未来几年里,如何存储和管理这些数据将成为人们关注的焦点。七、
当今,互联网已成为人类有史以来资源最多、品种最全、规模最大的信息库。作为网上最主要的信息检索工具,搜索引擎发挥着非常重要的作用。传统的搜索引擎大都是基于HTML的搜索引
随着人类基因组和许多其它物种基因组序列测序计划的成功完成,不断增长的基因组序列数据提供了数百万条蛋白质的编码信息。实验证明蛋白质相互作用主要依赖相互作用界面上的少
成像测井的定量计算一直是人们关注的重点,本文针对阿特拉斯声电成像测井资料进行了裂缝和孔洞相关参数的定量计算方法的研究。实现了裂缝和孔洞的计算机自动识别。 文章首
PDM 是近年来软件工业中发展最快的技术之一,是一门管理产品生命周期内所有与产品相关信息和过程的技术。产品结构与配置管理是 PDM 系统的重要组成部分,横跨产品生命周期,主
与手动配置相反,自动配置是指网络终端为了从一个或者多个网络管理域中得到配置信息而自动发生的动作。自动配置管理避免了用户为了使用某种服务而不得不手动的配置一些信息,其