基于粗糙集的不完备信息系统的处理方法研究

被引量 : 15次 | 上传用户:sprach
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际的数据挖掘问题中,由于种种因素的影响,待处理的数据常有某种程度的不完备,这些遗失的数据往往会影响随后的数据分析。在这种情况下,如何从不完备信息系统中获取知识,已经成为当前一个重要的研究课题。粗糙集理论是一种处理不完全、不精确和不确定信息的有效手段,它的特点是无需提供任何先验知识,而是从给定问题的描述集合直接出发,找出问题的本质特征和内在规律。因此,本文以粗糙集理论为对象,以不完备信息系统为背景,研究基于粗糙集的不完备信息处理方法。主要包括以下两个方面:一、介绍了目前不完备信息系统中填补缺失数据的主要方法,分析了各自的优缺点,尤其是其中填补效果较好的ROUSTIDA算法。在此基础上,提出了一种基于属性重要度的不完备数据填补算法(IDFAAI算法)。该算法独特性的考虑了属性重要度对于填补不完备信息系统缺失值的影响。通过实验证明,与ROUSTIDA算法相比,本文算法具有更高的补齐率和准确率。二、在基于容差关系的扩充粗糙集模型下,介绍了不完备信息系统的两种属性约简算法,分别是基于扩展区分矩阵的属性约简算法和基于信息熵的属性约简算法。在总结了以上算法的特点后,结合IDFAAI算法,我们提出了一种基于树的属性约简算法(ARAT算法)。该算法的特点是能够得到决策表的完备约简,而且具有较高的运算效率。最后,我们通过实例分析,验证了算法的有效性。
其他文献
李嘉诚在香港市民心目中形象的变化,昭示着香港民众对现状的满意程度的明显下降,不安和求变心理的滋生蔓延,以及从很大程度上解释了近年来香港社会日趋政治化的动向的根源。
随着经济全球化的演变,众多学者致力于研究为何有着相似或互补性的企业能够在空间上形成产业集群,以及这种产业集群形成的过程,特别是集群内成员相对固定所造成的知识锁定问
<正>世界上只有两座格拉斯小镇,一座在法国的普罗旺斯,一座在北京的温榆河畔。世界级醇美小镇落地京城放眼法国、英国、德国等西方古国,都拥有一座举世闻名的醇美小镇,成就着
在我国现行的刑法中,在人身伤害犯罪的定罪量刑方面,都是必须要依据伤情鉴定的具体意见作为标准的。然而,从世界范围上来看,为了深入地贯彻刑法中的罪刑相适应基本原则,在各
评价是英语教学的重要组成部分,如何科学地评价是实现新课程目标强有力的保证。英语课程评价应立足于《英语课程标准》,实施对英语教学全过程的有效监控。目前,我国英语教学
通过壁面旋转变径圆管内螺旋湍流流动特征的分析,确定其切向速度场内涡流区为微团旋转主导的椭圆形流动,外涡流区为微团变形主导且受壁面旋转影响的双曲形流动。进而利用张量
在上海城市更新与旧城改造的背景下,城市房屋动拆迁现象蔓延至城市各处。老城棚户区居民的动拆迁及后续安置问题更是值得关注和研究的重点。在正在进行拆迁的老城社区,笔者发
教育机构的安全保障义务是指在教育机构与学生之间的教育法律关系之中,教育机构对学生的合法权益依法所应承担的安全保障义务,教育机构一旦违反了这一义务,就需要承担相应的
目的:口腔颌面部IgG4相关性疾病、舍格伦综合征及慢性硬化性颌下腺炎在临床表现及部分实验室检查有诸多相似之处,容易在临床上造成误诊,将三者的临床特点进行比较,以协助临床
自上世纪30年代以来,工农业迅速发展,造成了大量污染物进入环境,导致环境质量严重恶化,尤其是农田土壤重金属污染,极为严重。由于重金属污染的多源性、累积性、隐蔽性等特点,已成为