论文部分内容阅读
当今,随着电子存储设备的发展,使得各个领域的数据和信息急剧增加(信息爆炸),而且随着时间的推移这些数据和信息将以指数级的速度增加。因而如何从这些数据中挖掘潜在的、有利用价值的信息就给人类的智能信息处理的能力提出了一个很大的挑战。为了有效地维护和利用这些丰富的信息资源,人类就需要研究一些能够自动处理这些问题的方法。由此产生了人工智能研究的一个崭新领域——数据挖掘(DM)和数据库知识发现(DKK)。
在DM与DKK诸多方法中,粗集理论与方法不失为一种较为有效的方法。在过去的十年中,粗集理论已经引起了众多研究人员的关注,并且被广泛的应用到各个领域。给定一个具有离散属性值的数据集合,利用粗集的方法就能够找到初始属性集合的一个子集,并且这个子集保留了原始数据集合最多的信息,因此将属性集合中的其它属性删除后,数据集合所包含的信息不会丢失,从而实现对数据集合的数据约简。
然而,在实际应用中,数据集合的属性值通常是实数值。此时,粗集理论就不能够判断两个属性值是否相似还是在某种程度上是相同的。这就是传统的粗集理论需要面对的问题。
解决这个问题的一种方法可以事先将数据集合离散化,生成一个具有离散属性值的数据集合。然而,这种方法通常是不合适的,因为方法在实现过程中忽略了属性值对于离散属性的隶属度,从而导致了数据集合信息的丢失。鉴于此,就需要改进这些方法,寻找一种适用于实值数据集合数据约简的的方法。事实上模糊粗集理论就是其中一种方法。
模糊粗集理论最早是由D.Dubios与H.Prade提出的,模糊粗集理论将由知识中的不确定性产生的模糊性与粗糙性这两个相关却又不同的两个概念有机地结合在了一起。
另外一种方法就是利用函数粗集理论。函数粗集理论将数据集合里的对象及其属性值看作是对象关于属性的函数,从而将对象的整体特征作为函数规律来挖掘。本文正是基于上述两种粗集的推广理论,给出了研究与讨论。本文共分六章。主要研究内容与创新成果如下:
1.研究内容
1.针对模糊粗集,提出了属性的顺次迁移函数族,的概念,并在此基础上给出了等价类的j阶分解类及j阶还原类等定义;当属性集合存在迁移函数时,等价类就会发生变化,相应的对于待识别模糊对象的模糊粗集也就随之发生变化,对于其变化形式做了研究;同时讨论了迁移函数作用前后,待识别模糊对象所对应的模糊粗集的结构变化特征;最后讨论了模糊粗集(模糊集合)与模糊粗集上、下近似的λ-截集(经典集合)之间的关系。
2.研究在多agent信息传递的系统中,当传递的对象是一个模糊概念,该如何定义对象在传递过程中的形式;被传递的对象信息在传递过程中是不断变化的,如何衡量对象信息的变化量;同时讨论了如何衡量对象信息在传递过程中的可靠性问题。当同一个模糊对象在多agent间传递时,可能会有两种情况出现:一种是每一个agent只有一个分辨知识;另一种是某些agent可能含有不止一个的分辨知识。在第一种情况,我们该如何安排各个agent的接收顺序才能使得对象信息在传递过程中的可靠度最大。同样在第二种情况下,所有可能的信息流路构成了一个信息流网络,我们又该如何选择一条可靠度最大的信息流路。针对这两种情况,本文在相关章节中分别建立了寻找最优传递路线的数学模型,同时讨论了所建模型的求解方法。
3.研究了函数等价类基于区间属性的分解形式以及函数粗集基于区间属性的分解形式,讨论在连续意义下Z.Pawlak粗集与函数粗集之间的关系。
4.函数粗集理论中,初始函数等价类如何给出以及函数粗集定义中的严格的包含关系及交运算限制了其在实际问题中的应用。为了解决这个问题,研究了函数论域上的模糊相似关系,在此基础上给出了ε-函数粗集的概念及其性质定理,同时讨论了投资系统中如何确定投资组合的问题。提出了时序信息系统的概念,利用ε-函数粗集理论给出了时序信息系统上的属性约简及规则提取的方法。最后建立了连续信息系统上的不可分辨关系,给出连续信息系统属性约简的思路。
5.对本文的讨论进行总结。
1.1.本文的创新点创新点
1.针对模糊粗集,提出了属性的顺次迁移函数族(F,F)的概念,并在此基础上给出了等价类的j阶分解类及j阶还原类等定义;给出了模糊粗集的F-分解与F-还原定理;给出了模糊粗集与模糊粗集上、下近似的λ截集之间的关,进而给出了模糊粗集的,一并分解定理。
创新点1列于第2章中。
创新点2.将.Amin Mousavi提出的粗交流的概念做了推广,提出了模糊粗交流的概念。定义了模糊对象在从agentl到agentn的模糊粗交流传递过程中的平均损失信息量,I<,A>(A,A)与总体可靠度p(A)。并且在只有一个传递对象,多agent,每个agent只有一个分辨知识或某些agent可能不止一个分辨知识两种情形下,建立了寻找最优传递线路的数学模型,并给出了模型的求解算法,同时给出的算例证明了算法的有效性。
创新点2列于第3章中。
创新点3.基于区间属性讨论了函数等价类函数粗集的分解形式,从而在连续意义下得到了:函数粗集是Z.Pawlak粗集的一般形式,Z.Pawlak粗集是函数粗集的特例这个结论。
创新点3列于第4章中。
创新点4.给出了函数论域上函数模糊相似度的概念,并在此基础上将函数粗集做了推广,提出了一函数粗集,从而使得推广后的函数粗集在处理实际问题上具有更强的适用性。讨论了规律集合的相对可识别性,同时给出了规律集合的可辨别阈值定理。利用ε-函数粗集作为工具建立了如何选择投资组合问题的数学模型并给出了相应的模型求解过程。首次提出了时序信息系统的概念,并给出了利用占ε-函数粗集理论对时序信息系统进行属性约简及规则提取的方法,讨论了对偶规则集合的特征,并指出了对偶规则的应用背景;同时给出了利用ε-函数粗集方法对连续信息系统进行属性约简的思路。
创新点4列于第5章中。