论文部分内容阅读
粗糙集(RoughSet)理论是20世纪发展起来的一种新的处理含糊性和不确定性问题的数学工具,求取高效、快捷的属性约简算法是当前该理论研究的主要课题之一。约简算法是信息系统分析、数据挖掘等领域的一种主要方法,有广泛的应用前景,对它的研究具有重要的理论意义和实用价值。
本文简明地介绍了粗糙集理论的研究现状、主要特点和应用领域;全面、系统地介绍了粗糙集理论的基本概念、基本知识和基本方法;重点讨论了连续属性的离散化、对象的聚类处理、粗糙集的约简和规则发现算法等粗糙集理论的一些主要方法和关键技术。在深入分析、研究的基础上,提出了一类新的基于Mahalanobis距离的最近邻中心聚类算法,该算法不仅解决了各属性间的彼此依赖关系和量纲不同对聚类和离散化带来的干扰,而且聚类过程不需要预先设定阈值和聚类数目而自动完成,减少了人的主观因素影响,具有较高的智能性;同时,在对现行粗糙集约简算法进行系统分析和比较的基础上,提出了一种基于属性频率函数的HORAFA-B算法。该算法对每个属性建立自己的区分矩阵,用属性频率函数作为约简条件,直接对区分能力矩阵进行处理,并充分利用属性的有关信息,有效地避免了具有重复信息属性的再选择问题,不仅使HORAFA算法能够找到最优约简,同时直接使用矩阵运算,较大地提高了运行效率。最后,在粗糙集理论应用于证券分析系统、建立规则库等方面进行了一些探索,为粗糙集理论用于实际积累了一些经验。