论文部分内容阅读
知识发现是商务智能领域的核心问题,其目标即为如何有效地在海量数据中发现潜在有用的知识以支持管理决策。知识的形式有很多,其中关联(Associations)以其概念的简单直观性,语义的丰富性,以及广泛的适用性得到了大量的研究和应用。关联中有两种重要知识形式是:关联规则(AssociationRules)和依赖关联(DependencyAssociations)。
由于现实世界中普遍存在着不确定性,使得知识发现的问题建模、方法构造、算法实现以及结果评价都需要从不同角度来引入不确定性。特别在关联挖掘的问题中,“陡峭边界”问题、“模糊概念表达”问题以及“噪音引起的部分知识表达”问题都使得有必要对不确定性关联知识的表达以及有效发现方法进行研究。具体而言,不确定关联知识包括两类十分重要的方面,一类是模糊关联规则,另一类是部分成立的依赖关联。本文就分别从这两类关联知识着手,进行了相关的理论分析和方法研究。
在对模糊关联规则的研究上,本文给出了基于模糊分类层次结构的广义关联规则问题的扩展,并给出了相应的挖掘方法。在此基础上,进一步引入了语言修饰词,从而使得所得到的模糊关联规则能够表达更加丰富的语义和更加具有自然语言特点的知识。特别是对相应的算法已经了详尽的分析和优化。
在对部分成立的依赖关联的研究上,本文给出了带有满意度的依赖关联的概念。该概念能够容纳噪音的影响,并表达出带有部分成立程度的知识。通过其性质得到相应的语义策略、推导策略以及剪枝策略,能构造出相应的有效的挖掘方法。更进一步,本文还构造出带有满意度的依赖关联的类Armstrong公理体系,并给出了相应的没有语义冗余的最小集概念。基于此概念,可以构造出基于模糊矩阵操作的优化方法来得到合格依赖关联最小集。数据实验的结果也和理论分析相符合。
在本文最后一章,对工作的创新点进行了归纳,并对知识发现的提出了几点思考,列出了一些下一步的研究方向和重点。