论文部分内容阅读
粗糙集理论自1982年由Pawlak教授提出以来,得到了广泛的重视和发展。目前已被应用于属性选择、分类器设计等问题的研究中。但经典粗糙集理论定义在等价关系基础上,只能处理名义型数据,对数值型数据必须通过离散化后才能处理。这就给直接应用带来了不便。连续数据经过离散化处理可能会丢失重要信息,并且不同的离散化策略会影响最终的处理效果。为此,人们引入了邻域粗糙集模型来进行数值属性约简和分类器构造。基于经典粗糙集正域、互信息和属性重要度的属性选择得到了广泛研究,并产生了很多算法和快速算法。这些算法是结合经典粗糙集下粒化特点完成的,无法应用于邻域模型下的快速计算。如文,通过简化决策表、样本排序,来减小搜索空间,提高搜索速度,这些策略在邻域粗糙集模型下是无法实现的。由于要通过计算距离来确定样本间的相邻关系,邻域模型下的计算量要比经典离散空间下的大得多。本文利用这一性质指导属性选择算法,并用实验验证这一性质对提高运算速度的有效性。