邻域粗糙集的启发式属性约简算法研究

来源 :四川师范大学 | 被引量 : 4次 | 上传用户:shiguanglai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运用邻域粗糙集理论能够直接处理数值型、符号型以及混合属性型数据,已广泛应用于人工智能、模式识别与数据挖掘等研究领域.属性约简是邻域粗糙集理论的一种具体应用,在保持原始数据分类精度不降低情况下,通过删除数据集中的冗余属性,达到简化数据集的效果.通过属性约简不仅可以缩减数据集空间占用,还能够减少直接在原始数据集上进行决策中可能带来的决策错误.基于邻域粗糙集理论,本文将对相应属性约简算法进行深入研究.主要的工作内容如下:(1)用邻域关系矩阵表示邻域关系,将邻域关系间的集合运算转化为矩阵运算,探究了邻域关系矩阵的基本性质.基于排序、邻域关系矩阵对称性和近邻搜索思想,提出了计算单属性邻域关系矩阵算法SANRM(Single Attribute Neighborhood Relation Matrix algorithm),是对传统单属性下等价关系矩阵算法SAERM(Single Attribute Equivalence Relation Matrix algorithm)的有效改进.(2)针对邻域决策信息系统的属性约简问题,围绕邻域决策误差率最小化准则不能准确反映各类分布均匀情形下的样本邻域信息粒决策信息问题,结合样本邻域信息粒度及其决策分布状况,提出了一种能有效反映条件属性子集与决策属性相关性的新度量.证明了其粒化单调性,构建了基于邻域关系矩阵的启发式属性约简算法NRMAR(Neighborhood Relation Matrix-based Attribute Reduction).UCI数据集实验分析表明,NRMAR能够有效选择属性且保持或改善数据集分类能力.(3)利用分类任务的一致性假设,提出了类标准差邻域半径自适应取值法,并将其应用于NRMAR中.UCI数据集实验表明,自适应类标准差邻域半径取值方法比固定邻域半径法进行的属性约简结果更加合理,新方法能够高效地获得更小的约简属性子集且保持或改善数据集的分类能力.由此,邻域半径的取值不再根据主观经验随意确定,可以根据具有数据集的分布特征自适应获取,因此更具有一般性.
其他文献
目的了解影响听力损伤的相关因素,探讨降低听力残疾发生率的措施。方法应用畸变产物耳声发射测试(DPOAE)对1093例新生儿进行听力初筛、复筛,对筛查2次未通过者,建议至上级医院
“西伯利亚将会促进俄罗斯的强大”,这句家喻户晓的话是俄罗斯伟大学者米哈伊尔·罗蒙诺索夫的预言。但是,第一个把自己的名字与西伯利亚写在一起的人,是强悍的阿达曼人叶尔
大肠埃希菌是人类肠道的正常菌群,当人体免疫力降低或细菌入侵肠外部位时,可成为条件致病菌而引起感染。随着抗菌药物的大量使用,其检出率和耐药率逐年增长,给临床治疗带来困
目的 了解贫困山区居民卫生服务需要和利用情况。方法 随机抽取营山县的9个村的18岁以上的986名留守居民为调查对象,用自制问卷调查其健康状况及其卫生服务需要与利用状况。结
今年是红娘的流行年,不仅许多为大龄男女青年穿针引线的组织以红娘命名,有些为企事业单位联络奔走的同志也往往以红娘自居。《西厢记》里的红娘究竟是怎样一个人?为什么在群
可靠性研究在交通领域有着重要的意义,但综合交通系统可靠性研究并未广泛展开。建立了交通系统可靠性理论体系,论述了可靠性的相关概念及其相互关系;进一步结合各交通子系统的特
随着汽车工业的迅猛发展以及汽车消费的迅速普及,汽车终究会成为一种代步工具进入千家万户,就像冰箱、彩电一样成为我们生活的必需品、现在,会开车的人越来越多,可是要真正懂车可
目的探讨呼吸机螺纹管及部件简单易行的消毒方法。方法临床使用呼吸机后对呼吸机螺纹管及部件采用2%碱性戊二醛消毒液浸泡、高压蒸汽灭菌、环氧乙烷灭菌三种方法消毒灭菌并采
随着不可再生资源大量消耗,可再生资源的研究利用引起了人们广泛的关注,其中太阳能发电因其清洁性和可再生性成为了研究的热点之一。以太阳能为主要能源的电池的作用主要是将
【检测篇】情态动词是历年高考考查的重点项目之一。考查的重点通常在表示“推测和可能性”、“情态动词+完成式”结构以及shrill,should,can和must表示特定语气上。请同学先做