商务智能领域中不确定性关联知识发现的理论与方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:yinhuali
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识发现是商务智能领域的核心问题,其目标即为如何有效地在海量数据中发现潜在有用的知识以支持管理决策。知识的形式有很多,其中关联(Associations)以其概念的简单直观性,语义的丰富性,以及广泛的适用性得到了大量的研究和应用。关联中有两种重要知识形式是:关联规则(AssociationRules)和依赖关联(DependencyAssociations)。 由于现实世界中普遍存在着不确定性,使得知识发现的问题建模、方法构造、算法实现以及结果评价都需要从不同角度来引入不确定性。特别在关联挖掘的问题中,“陡峭边界”问题、“模糊概念表达”问题以及“噪音引起的部分知识表达”问题都使得有必要对不确定性关联知识的表达以及有效发现方法进行研究。具体而言,不确定关联知识包括两类十分重要的方面,一类是模糊关联规则,另一类是部分成立的依赖关联。本文就分别从这两类关联知识着手,进行了相关的理论分析和方法研究。 在对模糊关联规则的研究上,本文给出了基于模糊分类层次结构的广义关联规则问题的扩展,并给出了相应的挖掘方法。在此基础上,进一步引入了语言修饰词,从而使得所得到的模糊关联规则能够表达更加丰富的语义和更加具有自然语言特点的知识。特别是对相应的算法已经了详尽的分析和优化。 在对部分成立的依赖关联的研究上,本文给出了带有满意度的依赖关联的概念。该概念能够容纳噪音的影响,并表达出带有部分成立程度的知识。通过其性质得到相应的语义策略、推导策略以及剪枝策略,能构造出相应的有效的挖掘方法。更进一步,本文还构造出带有满意度的依赖关联的类Armstrong公理体系,并给出了相应的没有语义冗余的最小集概念。基于此概念,可以构造出基于模糊矩阵操作的优化方法来得到合格依赖关联最小集。数据实验的结果也和理论分析相符合。 在本文最后一章,对工作的创新点进行了归纳,并对知识发现的提出了几点思考,列出了一些下一步的研究方向和重点。
其他文献
随着我国汽车工业的快速发展,汽车保有量大幅攀升,产品更新换代的步伐加快,产生大量的报废汽车以及废旧零部件。发展报废汽车逆向物流能有效解决环境资源问题,实现循环经济。然而
本文通过对各种绩效考核方法和理论的对比和研究,分析了各种考核方法和考核主体的优缺点及适用范围.在深入调研两家国内外优秀企业的绩效考核体系的基础上,借鉴其先进经验.对
由于人们高度重视软件质量,人们普遍关注软件测试这一确保软件质量的一种重要手段.本文通过对软件测试基本概念的简要分析,探讨软件质量保证和软件测试两者关系,剖析三种软件
国内现有的大型炼厂基本上是由六、七十年代的老厂不断扩容改造而成的.在炼厂扩容改造后,其热力系统往往会出现了能耗和生产成本过高、运行可靠性下降等问题.在对某些炼厂热
该文在对企业技术创新进行了系统分析的基础上,借鉴国内较为成熟的"基于过程管理的企业技术创新系统模型".模型中包括对企业发展战略、外部环境、企业技术创新能力和创新活动
战略联盟作为"20世纪20年代以来最重要的组织创新"正日益显现出它的生命力.虽然大企业战略联盟是战略联盟这个市场大舞台的主角,但近年来,中小企业战略联盟逐渐成为一股新兴
现代化医院的高效运行离不开信息系统的支撑,做好对其的维护工作意义重大.本文从硬件、软件以及安全三个方面对医院信息系统的维护进行了详细探讨,并且就如何提升信息系统维
金融危机在二十世纪八十年代和九十年代接连爆发,使得国际金融领域和各国政府对信用风险管理高度重视,中国政府和金融机构从2002年开始也将全民信用管理体制的建立纳入议事日
在BIM与GIS的整合应用中,结合物联网技术,建设智慧园区GIS系统,实现对园区实时监控、管理等业务的可视化、智能化.
地下管线数据是组成地下管线系统的最基础的数据,也是最核心的数据,如何保证数据的准确性、完整性关系到系统建设的成败,基于工作实际对管线数据检查、处理、建库方面进行了