论文部分内容阅读
随着计算机的发展、采集数据的工具的成熟以及数据库存储海量数据能力的增强,许多大型企业已经积累了大量的数据.这就迫使人们尽快地开发出一套切实可行的技术方法来智能的、自动的从这些海量数据当中提取出人们感兴趣的知识.二十世纪八十年代初波兰数学家Pawlak,Z.提出了粗糙集理论.它是一种处理含糊和不确定性的新型数学工具.该文着重地对粗糙集理论研究的基本问题之一——决策表的约简方法进行研究.提出了基于可选择度的属性约简算法和一种新的值约简算法,并将其应用于银行系统个人信用评估研究.该文的主要工作如下:1)介绍Rough set理论的基本情况,包括简介Rough set理论产生和发展(背景、研究对象、应用现状);接着简述了Rough set理论的基本问题、应用前景;2)介绍粗糙集理论的一些基本概念.并着重的围绕该文研究的基本问题(决策表的约简)的一些相关概念进行具体介绍;3)对决策表约简过程中的属性约简问题进行研究.提出了一个新的约简算法——基于可选择度的算法.该算法定义了在约简过程中属性的可选择度,并利用它作为启发信息,来对决策表的属性进行约简.理论和实践证明,它能克服其它基于信息熵的约简算法的很多缺点.随后,该文对算法的完备性进行了证明.4)在对值约简进行研究后,该文提出一种新的值约简算法.它首先基于粗糙集理论相对正域的概念,求得决策表的属性值的值核,随后使用条件属性与决策属性的条件熵作为启发式信息,来选择恰当的属性加入到每条记录的值核中,使该条记录能够被正确分类.在每次提取一条规则后,将满足此规则的后续记录全部删除,以此来减少算法的计算量.5)将该文对粗糙集的决策表约简方法研究的相关算法,应用于银行系统的个人信用评估的研究.之后,将它与其它方法(如神经网络方法)进行比较.