基于邻域粗糙集的属性约简方法研究

来源 :哈尔滨师范大学 | 被引量 : 0次 | 上传用户:suzhenzsyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论常被用来挖掘数据内部信息和数据提炼。属性约简是粗糙集领域的一个核心研究内容,属性约简是将数据中冗余属性排除,压缩数据样本并提升分类性能的过程。约简结果的好坏主要从分类性能和时间消耗两个维度进行衡量。本文首先从分类性能入手提出集成投票属性约简方法,提升约简结果的分类精度、解决实际需求;接着提出属性约简的三支加速方法,进一步降低了约简的时间消耗。为了提高约简结果的分类性能,众多研究者将目光聚集于局部视角。在此基础上发展出了集成属性约简,即将样本依据决策类别划分为多个决策系统分别计算。针对传统求解约简算法将所有样本作为一个整体,忽视了不同样本具有的决策类别不同,导致约简结果无法综合平衡各个决策类需求的这一情况。(1)本文提出了一种基于集成投票的约简求解算法。具体算法由三个步骤组成:1)将决策类相同的样本挑选出来组成多个新决策系统;2)在多个决策系统中分别计算局部属性重要度,找到每个决策系统中重要度最大的属性;3)依据上一步得到的局部重要度最大的属性,利用多数投票机制选择出合适的属性并将其放入潜在的约简集合中,直到其满足约束条件时为止。从计算约简的时间维度来看,传统的基于适应度函数的属性约简方法无论是站在全局视角还是局部视角,约简过程均存在着冗余计算,这会导致约简的时间消耗偏高。针对这一情况,本文将三支决策思想引入到属性约简的计算过程中,通过减少对冗余属性的计算,提高约简的计算效率,达到降低时间消耗的目的。(2)本文提出了一种基于序贯三支决策的属性约简加速方法。具体算法由三个步骤组成:1)计算决策系统中的属性重要度;2)将属性重要度的结果进行三分,重要度最大的属性划入到正域中,重要度为零的属性划入到负域中,其余属性划入到边界域中;3)循环计算边界域中属性的重要度并将结果继续三分,直至正域中的属性集合满足约简终止条件。为了验证所提集成投票方法与序贯三支加速方法的有效性,分别选取了8组UCI数据集,并将所提方法与传统方法在约简结果的分类精度和约简过程的时间消耗进行对比。实验结果表明:采用局部投票法得到的约简,能够有效提升分类器的分类性能;采用三支加速法可以进一步降低求解约简的时间消耗。
其他文献
<正> 一九五八年在党所提出的鼓足干劲,力爭上游,多快好省地建设社会主义总路线的光輝照耀下,中国科学院光学精密机械仪器研究所(以下簡称光机所)和全国工农业大跃进一样,在
<正>近几年高考全国I卷概率统计解答题具有以能力为立意、综合性强、思维量大等特点,尽管位于解答题前3题的位置,但实际背景新颖,对阅读理解、推理分析、数据运算的要求较高,
石鼓文献作为古籍的一种,其整理对于研究工作的开展有着巨大的意义.郭沫若在研究石鼓文的过程中,对石鼓文进行了系统整理,取得了巨大的成果.从文献整理的角度探讨郭沫若对石
为适应人们旅游观念和旅游方式的变化,2015年底,国家旅游局从区域整体发展的角度提出了“全域旅游”发展概念,试图引导旅游业跳出单纯的旅游发展框架,实现区域更广更深的整体
低温甲醇洗工艺在低温、高压下吸收CO2、H2S等酸性气体,而吸收CO2和H2S的富甲醇溶液经减压阀降至较低压力后进入再生系统,造成高压富液压力能的损失。采用液力透平泵,将压力
A100油膜轴承油的性能与进口油膜轴承油的性能相当,能够满足高速线材轧机的润滑要求。A100油膜轴承油也可以与进口油膜轴承油混合使用。
鲁迅的散文诗集《野草》创造了与现实世界对立的另外一个世界,其中的诗篇《风筝》就体现了这种对立的情况。《风筝》的两极教育功能包括:启发的两极教育功能,引导的两极教育
海上警察制度在当今世界海洋大国发挥着重要的作用,体现着一个国家对相应海域的主权。文章就外国主要国家的海上警察制度进行了考察,论证了在我国建立海上警察制度的必要性和
背景胃癌在目前所有恶性肿瘤中发病率位列第五,死亡率位列第三。我国的胃癌发病率和死亡率均处于世界较高水平,每年新发病例约40万例,占世界总发病例数的42%。早期发现、早期
智能手机成瘾是指由于对智能手机的过度使用且对该种使用行为无法控制而导致其社会功能受损、并带来心理和行为问题的一种新型的行为成瘾。已有研究表明,亲子科技干扰正向预