基于粗糙集的决策树算法研究及在CRM中的应用

来源 :广西大学 | 被引量 : 0次 | 上传用户:selions
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一种能够从海量数据中提取有价值信息的技术。它可用于发现隐藏在数据中的聚类模式、关联模式、分类模式等,以辅助人们决策。其中,分类是数据挖掘的一项重要任务,而决策树就是一种能有效用于数据分类的方法。决策树结构简单、容易产生规则、易于理解,在实际中应用极为广泛。 首先,本文基于粗糙集理论改进决策树算法。先利用粗糙集理论进行决策表的属性约简,再进行基于粗糙集的决策树构建。经典粗糙集存在着处理噪声数据能力差的不足。为此,本文基于变精度粗糙集的思想对蒋芸博士等(2004)提出的决策树算法进行改进,提出变精度加权平均粗糙度的决策树构造算法。实验结果表明改进后算法构造的决策树结构简洁,泛化能力更强。 其次,本文还将提出基于属性区分度的决策树构造算法。其主要思想是决策树的每一次分枝都尽可能使属于不同决策类的数据分开,而使属于同一决策类的数据集中在一起。同样,仿真实验结果表明该算法在多数数据集上构造的决策树比经典的ID3算法要好。 最后,本文以电信业客户关系管理(CRM)为背景,基于数据挖掘的基本流程,在一个电信客户流失数据集上分别以ID3算法以及本文改进和提出的决策树算法构建一个客户流失预警模型。模型结果比较表明后两者构建的模型均优于前者。
其他文献
近几年来,新华日报在新闻改革的锣鼓声中,开辟了以短,快、活为其特点的“今日快讯”专栏,受到了广大读者的欢 In recent years, Xinhua Daily in the news reform gongs an
理查德·舒斯特曼所定义的“身体美学”是其对于某一身体,塑造了一个作为感觉审美欣赏和包含创造性自我的场所,这个当中的身体,不是毫无感觉、缺乏生命力的肉体,并非单纯的物
电子商务平台上商家的竞争日趋激烈,由于产品本身的趋同化,客户服务成为商家的核心竞争力。电商商家的多平台运营、多产品线销售、多环节服务的特点要求了客户服务的多样化,也必
国有企业,特别是中央企业在我国具有重要地位,中央深化国企改革必将对国有企业产生一系列影响。国有企业大多身处一些重要行业,肩负更大的社会责任。国企人员的稳定,尤其是核心员
定襄县神山公社卫村大队,地处北纬38度25分,平均无霜期164天。土壤粘重,含有盐碱,全盐量为0.3%左右,虽能灌溉,但不是保浇水地。去年全大队共种棉815亩,占耕地面积的36%。在特
[记者手记]  和范建军聊天很有意思。他几乎不谈自己,更多的是说长辈、家庭和师傅。 “鲍志强大师是自己一生读不完的书,比喻为‘博大精深’也不过份。”他感慨的。说“尤其在书法、篆刻方面的学养和修炼,自己受到的影响太大了!”  他说祖母承杏珍是紫砂老艺人,非常了不起,壶艺超群。母亲半个世纪前就进入东域书院读书,尔后一门心思和祖母学艺,得到许多秘不示人的家传,都是祖母做主教授的。  母亲更是自己的楷模
冬虫夏草亦称虫草,是我国的传统名贵中药材,具有安神宁心、健脾和胃作用,可用于失眠、身体虚弱、神经衰弱等病症的治疗。过去,冬虫夏草较为稀少,全部为自然生长,对其有效成
近来,新闻摄影队伍里越来越多的同志谈论起基本功来,并在实践中努力加强基本功的锻炼,或者打算在这方面下一番功夫。但是基本功的含义如何,包括那些内容,怎样上提高?对于这
我办报和当新闻记者,再加编刊物,前后共十四年。我从事文学活动主要是在报刊编辑工作之余挤时间写的。因此要我在《作家寄语》栏里,给从事记者、编辑工作的青年朋友们,讲一
棉花F_2群体具有广泛的遗传变异,是杂交育种进行单株选择的最好世代。但是,棉花主要经济性状大都属多基因控制的数量性状,由于基因的连锁和多效性,使不同性状间存在不同程度