论文部分内容阅读
面对大量复杂的信息,人们希望从中发现有用的知识。数据挖掘的重要任务之一是从大量数据中发现知识、模式和规则,因而数据挖掘特别是关联规则挖掘显得尤为重要。而人类在面对和处理大量复杂信息问题时,由于能力有限,把大量复杂信息按其各自的特征和性能将其划分成为若干较简单的块——信息粒进行分析和处理。信息粒化使得用“粒”看待、处理问题成为必然,因而将粒计算应用于数据挖据,特别是关联规则挖掘具有重要的现实意义。数据挖掘的目的是发现知识,而运用知识进行推理是另一个重要的应用。由于现实世界信息的不精确、不确定、不完整和模糊性使得在不确定性推理中的应用更为重要。粒计算符合人类求解问题的客观规律,并且可以涵盖模糊集理论、粗糙集理论等领域,因而在处理模糊、不确定性知识和用知识进行推理方面,粒计算有其优势和潜力。本文在分析粒计算理论的国内外研究现状基础上,介绍了粗糙集与粒计算的基本理论知识。本文的特色和主要工作在于:(1)从信息粒的角度出发,基于粒计算中概念的有序对对关联规则挖掘中的项目、项目集以及项目集的支持度重新进行了认识,在此基础上提出了一种基于粒和二进制运算的关联规则挖掘算法——GLIG。此算法只扫描一遍数据库,并且二进制数的位运算速度比候选集与事务记录的比较运算速度要快得多。(2)结合可信度和粗集理论知识,提出了一种无噪声情况下基于粒计算的推理方法;当决策表信息不全或干扰时,本文基于概念颗粒内涵匹配度,提出了一种有噪声情况下基于粒计算的近似推理方法;最后综合前面两个方法给出了基于粒计算的不确定性推理算法的描述,此算法对决策表有、无噪声情况下基于粒计算的推理都适用。本文提出的粒计算在规则挖掘上的应用为规则挖掘提供了新的视角,并对粒计算理论运用到不确定性推理领域做了有益探索。