基于粗糙集属性约简的模糊规则提取及集成约简森林分类

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:SteveZou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维不确定性数据的规则提取和高维非平衡数据的分类问题是当代信息技术领域面临的重要挑战。属性约简作为一种常用的降维手段,是基于粗糙集的相关粒计算方法的主要研究内容之一,通过属性约简可以有效去除信息系统中存在的冗余成分,缩减知识空间,从而更好地服务于高维数据的模糊规则提取与非平衡数据分类等数据挖掘工作。本文以粗糙集属性约简为研究基础,研究了在高维模糊系统中获取单约简和应用二进制分辨矩阵动态获取多约简的两类方法,并将他们分别应用于无冗余模糊决策规则提取与脑功能连接多通路的获取上。最后,将这两类约简方法与随机森林相结合,构造集成约简森林,用于解决高维非平衡数据的分类问题。本文主要研究内容如下:(1)提出了一种区间二型模糊粗糙集单约简算法及其模糊规则提取算法。将高斯核函数引用到区间二型模糊粗糙集中构建模糊相似关系,定义了高斯核区间二型模糊粗糙集上、下近似和正区域等关键概念,并设计了相应的单约简算法。之后,证明了三个无冗余规则提取定理,保证了后续提出的模糊规则提取算法所提取决策规则的无冗余性。实验结果表明,算法在约简子集大小和分类正确率上都优于传统算法,并且可以提取无冗余决策规则。(2)提出了一种基于二进制分辨矩阵的动态多约简算法。通过证明约简等价性定理,保证了算法正确性,并通过引入动态更新机制,在属性约简过程中使二进制分辨矩阵的大小动态减小,减少了计算量。同时还将提出的多约简算法应用到脑数据分析上,成功从大脑认知功能核磁共振成像数据中获得了与文字-图像认知相关的三条脑功能连接通路。(3)提出了一种适用于非平衡数据分类的集成约简森林分类方法。将属性约简与随机森林相结合,以约简结果替换全部属性的同时,采用一种择优挑选策略以提高分类正确率和负类负分率。多约简结果的引入,使得集成约简森林可以从不同知识粒度空间的角度对数据进行分类,并结合SMOTE过采样算法,从算法和数据两方面同时提升集成约简森林的非平衡数据分类性能。在最终分类投票阶段,还提出了一种矫正性组合投票机制,以解决数据经SMOTE平衡化后可能造成的正确率降低问题。实验结果表明本文提出的集成约简森林分类方法较传统方法,在分类性能上具有显著提升。
其他文献
The effects of plasticizers,antioxidants and burning rate modifiers on the aging performance of the composite solid propellant based on hydroxyl‐terminated pol
菠萝是中国著名的热带水果,主要分布在广东、广西、海南等地,是中国南方的特色水果。菠萝营养价值高,果实汁多甜美。湛江市是菠萝生产大市,光照、土壤、降水等自然条件都很适
本文综述了NFRC和“能源之星”对门窗热工性能认证要求、热效标识和北美对采用节能门窗的激励措施。
线控转向系统(Steering-By-Wire,SBW)是电动汽车转向系统研究领域近期的热门研究课题之一,不仅节能环保还具有良好的性能。本文在研究了电动汽车线控转向系统的结构和工作原
目前,我国公路建设正处在高速发展阶段,随着经济的发展,山区公路也越来越多.在山区或山岭重丘区,深谷、大型冲沟、U形谷地众多,超高墩长联大跨连续刚构桥的应用将会越来越广
随着信息技术的发展,经济管理领域中产生并存储着大量的时间序列数据,运用数据挖掘算法可以挖掘出数据中潜在的、有价值的知识和信息以支持管理和决策活动。但这些时间序列数
汽车是我国国民经济的支柱产业之一,是集成最新前沿科技的工业产品。而汽车底盘性能是汽车内在产品品质的重要体现。无人驾驶汽车技术方兴未艾,当智能驾驶技术解放驾驶员的双
以巢湖油菜田优化施肥(YH)、秸秆施肥(JG)、习惯性施肥(CG)和不施肥(CK)4种施肥类型为研究对象,利用静态箱-气相色谱法测定了油菜生长期间的CH4的排放通量,同时对土温、土壤含水量和