论文部分内容阅读
粗糙集理论是上世纪80年代初由波兰数学家Z.Pawlak首先提出的关于数据分析的数学理论.自上世纪90年代起,该理论日益受到到重视,并成为国际学术界的研究热点之一. 本文分别从理论和应用两方面对粗糙集中若干问题进行了研究. 在粗糙集理论方面,本文主要研究了粗糙近似算子在格理论中的推广.在完备布尔格的框架下,引入一个从格的普通元素普通元素的映射,并通过此映射定义了更为抽象的下近似算子▼和上近似算子▲.在一般情况下(定义的映射没有限制)以及映射满足某些特点时,研究了相应的上下近似算子的性质.其次从子集的角度定义了第二种粗糙近似算子,对于其在一般映射下的性质我们也给出了相应的结论.最后证明了当格映射为外展的和内缩时,上述所定义的两种粗糙近似算子是等价的. 在粗糙集应用领域,运用粗糙集理论处理决策表时,要求决策表中各属性值用离散值表达.如果某些条件属性或决策属性的值域为连续型,则在处理前必须经过离散化.连续属性的离散化,不仅可以缩减运算量,还能在一定程度上抑制噪声.连续属性离散化属于NP问题.本文针对上述问题,提出了一种基于属性重要性的启发式遗传算法,求解决策系统的离散化问题.在算法中以属性重要性来构造适应度函数,从而将粗糙集中的问题始终以粗糙集的知识来求解,所得的结果比较客观.这不同于其它的算法.并通过数值实验证明了该算法的有效性. 示例学习是解决智能系统知识获取瓶颈问题的重要手段,其关键是属性子集的选择.最优属性子集的选择属于NP问题,由于模拟退火的全局优化能力,因此可以考虑将模拟退火算法应用到此问题的求解过程中,从而得到全局最优的属性.但由于模拟退火算法属于随机搜索算法,因此其在运行时间上要多于一般算法.本文针对此问题提出了一种改进的基于模拟退火的最优属性选择算法,一方面克服了一般算法无法取得全局最优解的缺点,保证了最优解的完备性.另一方面,改进的温度衰减因子减少了算法运行时间,因此具有很好的可行性.数值实验证明了该算法的有效性.