基于粗糙集的分类知识发现方法及其应用研究

被引量 : 15次 | 上传用户:huyanlongbad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为知识发现的重要研究分支,数据分类在商务决策中发挥着日益重要的作用,本文从知识发现的角度对基于特定的准则对现有数据、信息进行分类研究的方法作了大致概括与评价,介绍了当前知识发现、分类研究及粗糙集的分类研究的主要成果及研究现状,并在此基础上按照决策表分类知识发现的步骤展开全文基于粗糙集的分类知识发现的研究。本文将数据预处理工作单列一章进行讨论,主要包括信息系统的决策表表示方式,原始决策表中的冗余与不一致数据的清理以及连续数据的离散化等数据预处理技术.将支持度的思想引入粗糙集等价矩阵的定义当中,构造增广等价矩阵,并基于此增广等价矩阵分别针对决策表中的冗余对象和不相容对象设计了两个数据净化算法,在提高数据清理的有效性的同时最大限度地降低数据清理对决策表的破坏,避免原始决策表重要信息丢失;其次,将基于信息熵的属性重要性引入粗糙集的可辨别矩阵构造过程,针对含有多个连续属性值的决策表给出精确离散化算法,充分保留决策表的一致性。同时,为克服精确离散化切点对不同训练子集的选取和不同的离散化技术过于敏感的难题,在精确离散的基础上给出了利用精确切点区间分别构造精确离散区间和模糊离散区间的算法。在决策表的条件属性约简方面,本文区分对待决策表对象较少与较多两种情形提出两种改进的粗糙集的属性约简的方法。针对较少对象的一般决策表,由决策表的核开始,给出了的基于信息熵和相对可辨别矩阵的属性约简的启发式搜索算法,达到缩小搜索空间,减少计算量的目的,利用信息熵和近似分类质量的特点,充分考虑条件属性间的联系;其次,针对大数据集决策表,即决策表中对象过多时,本文将基于扩张矩阵决策表属性约简问题转化为规划问题,并提出免疫算法进行规划模型的求解方法,具体方法是以基于信息熵的属性重要性和粗糙集的近似分类质量求出决策表的核与扩张矩阵,然后以基于离差的免疫算法代替通常的基于信息熵的免疫算法,求出规划问题的解,即决策表的属性约简结果,用于降低分类知识发现中决策表中的冗余与不相关的属性对挖掘质量的破坏,减少要处理的数据量,简化分类器,从而减轻数据噪声的影响,提高泛化性能。在决策表的规则获取方面,改进了粗糙集视野下的一般规则获取,提出了连续型条件属性的规则合并,探讨了分类的概率规则获取以及决策解释等内容。首先,给出基于决策类核属性的值约简的包装算法和基于等价矩阵的两种改进的分类规则获取算法,其中,基于决策类核属性的分类规则获取的值约简算法,保证了生成的规则形式整齐,层次分明,便于检索;其次,对于具有连续的数值型取值的条件属性,在不降低精确度的前提下,提出针对决策类的分类规则合并算法,在具有相同类标号的规则集合中合并连续条件属性区间,这样一方面不会导致矛盾规则的出现,保证了产生分类规则的精度,另一方面避开了后续的反复约简及合并工作,简化了计算,提高分类能力;另外,还探讨了边界区域的分类的概率规则获取问题,以条件概率给出规则的置信度、覆盖度、支持度定义,利用Bayes理论进行决策解释,提出基于粗糙集Bayes理论的决策建议的解释算法,并通过供应链需求集成分析应用案例分析,以计算结果对比证明了本文算法的有效性。将本文给出的分类知识发现方法应用到供应链管理的实践操作当中,主要探讨基于分类方法的供应链需求趋势预测问题,把基于改进的粗糙集的分类方法引入供应链需求预测过程,从供应链企业以往需求预测经验中挖掘出其需求趋势变化与当时的经济、社会、文化等背景之间关系的“预测知识”,并以此知识指导未来的需求预测。针对条件属性层次性较强的情形,本文还提出一种条件属性的合并方法,用来代替通常的决策表属性约简,以突变级数评价法改进粗糙集在属性约简方面的弊端,以基于支持度与可信度的等价矩阵法获取知识,充分利用粗糙集等软计算强大的知识发现能力,将需求预测由经验、技术层面提升到知识层面,使成员充分共享整条供应链上的各个企业的预测知识,改进自身预测精度,提高整条敏捷供应链的运作效率。
其他文献
司徒雷登是一位出生在中国的美国人,在华生活了50年,其间就任燕京大学校长近30年。他接受了中西文化的熏陶,筚路蓝缕,创建了美仑美奂的燕园,为建设中国一流的燕京大学,奠定了
论文对“海燕”号高速客轮的喷水推进系统及其液压系统进行了细致介绍,针对目前安全评估中经常应用的几种评估方法,指出故障模式影响分析(FMEA)方法适用于高速客滚轮安全评估的
通过探讨贵州民族地区水资源保护的现状分析,总结了民族地区水资源保护的立法情况,指出了水资源保护方面立法的不足,并对不足之处进行了原因分析,为改善水环境和实现水资源可
目的:比较卡氏肺孢子虫的染色效果.方法:给SD大鼠皮下注射地塞米松.制作肺泡灌洗液的涂片和肺组织印片,采用姬氏染液、甲苯胺蓝和六亚甲基四胺银进行染色,油镜观察.结果:姬氏
简述了激光全息照相的原理,设计出全息照相的拍摄光路,探索出能成功拍出全息图的方法以及能实现白光再现的实验参数。总结出拍摄反射全息的条件,并能了解全息照相与普通照相
选用丙烯酸、马来酸酐和聚乙二醇单烯丙基醚为聚合单体,采用一步法合成了一种聚羧酸系高性能陶瓷减水剂(CA-100)。比较了CA-100、三聚磷酸钠、水玻璃三种减水剂的应用性能。
国内外针对公路建设前噪声预测、控制措施进行了广泛的研究,形成了比较完善的公路噪声污染预测、评价方法,防范、防治方法和控制措施。随着路边噪声污染的日益严重,噪声防护
房地产投资是一项综合性、专业性、技术性极强的活动同时也是一个高投入、高回报和高风险的事业。本文根据房地产开发不同于一般工业项目的特点,对房地产开发过程中的盈亏平
论文首先综述了光纤光栅在WDM高速全光通信和传感领域的应用,总结了目前光纤光栅制作方法以及传输特性理论分析方法的进展,并在现有耦合模理论和实验基础上对光纤布拉格光栅(
经历了2003年SARS风暴后,人们普遍认同居住环境与健康密切相关,健康住宅已成为建筑界、房地产界乃至公众关注的焦点。健康住宅是一项很广博的课题,笔者选择空中绿化这一角度