论文部分内容阅读
随着数据库技术的发展和信息时代的来临,各行各业存储的数据量急剧增加,使得自动从数据库中获取有用的知识以提供决策支持已成为人们日益迫切的需要。粗糙集理论(Rough Set,RS)就是在这样的背景下不断发展起来的一种用于不精确、不确定数据挖掘与处理的新型数学理论。
本文以粗糙集理论用于决策支持技术的实现步骤为线索,对粗糙集理论中的数据离散化、属性约简和决策规则提取进行了研究,主要内容如下:
(1)提出了一种改进的连续属性离散化方法,在生成初始断点基础上,利用决策属性的支持度作为反馈信息,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化。该算法能在保证决策表原始分类能力不变的前提下,提高约简效率。并提出了一种简单的启发式决策规则获取算法,对决策规则的获取给出了实例。
(2)针对粗糙集属性约简的NP问题,提出将蚁群优化算法用于属性约简中。针对蚁群算法的一些缺陷,引入了免疫系统的疫苗接种、抗体多样性和克隆删除的思想对蚁群算法进行了改进,在收敛速度和防止早熟之间取得了平衡,具有较强的发现最优解的能力,并利用TSP问题对该算法的有效性进行了验证。
(3)利用上面的改进型蚁群算法,提出了一种基于免疫蚁群算法的粗糙集属性约简算法,搜索过程中根据蚂蚁找到的约简集大小和对决策属性的支持度来更新信息素,实现属性约简。并将此算法应用于某公司的客户关系管理中,通过提取出的决策规则,了解对产品通讯作出回应的客户特征,以便在将来的管理活动中改善服务,提高客户满意度,从而提高公司的利润水平。