论文部分内容阅读
主动数据库系统支持的主动机制,使它能自动监测发生在数据库内部或外部的事件,并对所关注的情况及时做出反应。主动数据库需要借助很多复杂的规则来指定系统的主动行为,这些规则通常由事件、条件和动作三部分组成,因此常称为事件一条件一动作规则,或ECA规则。主动规则是系统主动机制的基础,决定了系统主动行为的正确性,因此设计主动规则对主动数据库系统的实现来说很重要。但是,主动规则设计中遇到的一些问题,无法直接用传统的数据库设计方法解决。
本文通过分析主动规则的特点,将主动规则的设计看作一个完整的过程,研究了主动规则设计过程中存在的问题,并创造性地将数据挖掘技术应用到主动规则设计的三个重要环节:规则提取、规则分析、规则更新中,利用数据挖掘自动获取知识的能力,解决主动规则设中遇到的问题。主要工作包括:
[1]为了确定应用领域中适合表达为规则应用语义,本文提出基于数据挖掘的主动语义获取,将数据挖掘技术应用于主动规则的提取。讨论了利用数据挖掘获取主动语义的优势,利用数据挖掘可以获得的各类规律性知识和各种“感兴趣”的事件,在更高概念层次上提炼领域知识;分析了挖掘结果使用中会遇到的困难,提出利用分层组织方式管理和表达发现的规则,解决了大规则集难于理解的问题;并介绍了如何利用数据挖掘得到的各类知识,如各种模式规则、感兴趣事件、非规则型挖掘结果等,辅助主动规则的设计。
[2]将数据挖掘技术应用于主动规则的终止分析,利用数据挖掘和静态分析相结合的方法,提高终止分析的正确性和准确性。由于静态分析方法一般太保守,动态分析方法不能仿真所有可能规则触发情况,本文将数据挖掘得到结果作为已知知识(如分类规则、序列规则等)应用于触发图分析方法中,在分析规则间触发关系时,即考虑了事件和条件的满足情况,又降低了评价分析的主观性。
[3]提出数据挖掘支持的主动规则更新。主动规则应及时反映系统中主动需求的变化,因此需要不断更新。为了解决新的主语义的自动识别与准确确定需要更新规则的问题,本文利用孤立点挖掘与自适应的新类识别等技术,自动发现系统主动语义的变化,获取新的语义知识;通过分析新挖掘出知识与原有规则的相似度,确定需要更新规则,淘汰“过时”规则,避免为同一语义定义冗余的规则。本文最后还介绍了依据上述研究成果设计的一个简单的基于数据挖掘的主动数据库原型系统的结构,以及关键部件的实现策略。