多元信息粒化与属性选择方法研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:mrcena
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据收集、传输及存储技术的迅猛发展,我们对某一对象的描述更为丰富,刻画更为全面,记录更为长久,因而产生的数据往往表现出一种高维的典型特征。作为一种处理高维数据有效的数据挖掘与知识发现技术,属性约简得到了广泛的推广与应用。然而,大数据时代发展至今,数据越趋呈现多样化的复杂特性,其不仅仅局限于数据的高维度,更体现在弱监督、多尺度等问题上。正因如此,如何针对诸如此类的数据复杂性进行高效精准的分析与挖掘成为了传统属性选择方法的发展瓶颈所在。针对实际应用问题中数据的高维度、弱标签、多尺度等复杂特性,本文借鉴人类思考与解决复杂问题的粒化及分层认知模式,以多元视角进行目标解析,并在监督式信息粒化与融合、半监督粗糙数据分析、多粒度属性选择等方面展开了系统而又深入的研究与探讨,主要包括:发展了面向复杂数据的多元信息粒化与融合,多元集成的不确定性数据挖掘分析技术,构建了一整套多粒度视角下的属性选择算法框架,最终达到了能够有效提升复杂数据驱动下学习器的性能以及其问题求解的时间效率等目的。具体而言,本文的研究内容与创新成果主要涵盖以下几点。一、提出了双半径下多重监督邻域信息粒化策略。从粒计算的研究现状来看,实现信息粒化的方法大多属于无监督学习范畴,忽视了已有强监督信息的重要作用,因而缺乏在监督学习任务中的泛化性能。鉴于此,通过引入成对约束,参考样本的标签信息,在类与类之间进行样本的分割,并进一步地设计了类内类外双半径机制,分别对分割样本的相似度进行区别性地调控,指导性地给出了多重邻域信息粒化的监督式策略,过滤了信息粒化过程中易残留的不精确或不一致信息,有效地提升了信息粒化在属性噪声环境下的抗干扰能力。二、提出了半监督式多元集成的粗糙不确定性分析方法。从粗糙不确定性分析的研究现状来看,很多方法都着眼于标签完备的决策系统,过度依赖属性与标签的交互结果,而在处理标签缺失数据时就显得尤为棘手。此外,现有的分析手段往往过于单一,不足以充分挖掘隐含的深层知识与规律。鉴于此,详细剖析了当前粗糙不确定性分析方法在半监督问题上的症结所在,并进一步地提出了半监督环境下集成粗糙不确定性分析的新策略,在局部多元视角下观测属性空间,既赋予了半监督属性选择合理的语义解释,又拓宽了粗糙集方法在该问题上的应用前景。三、提出了多粒度视角下属性选择框架。从属性约简的研究现状来看,很多工作都仅考虑单个粒度层面上的约简求解,其面向由数据扰动造成的粒度变换问题时收效甚微。鉴于此,首先揭示了属性约简在粒度意义下的构造流程,并明晰了信息粒化与属性约简之间的内在关联机理。在此基础上,从信息融合的角度提出了多粒度属性约简的概念,并设计了一大类求解多粒度约简的高效算法框架,从而有效地解决了属性约简在多粒度视角下的局限性,并显著提升了约简求解的时间效率。
其他文献
对地光学遥感成像相机,是卫星的主要应用方向之一,对焦技术是相机成像系统中的核心技术之一。遥感相机在成像过程中易受到外界环境中温度、大气压力、成相距离变化等因素的影响产生离焦现象,因此需要在成像过程中设定对焦功能,确保系统成像质量。目前普遍应用的方式为根据地面成像效果通过计算的方式获取离焦量,进而通过人工设定对焦功能,因此需要发展自动对焦技术,简化对焦过程。迄今为止已有许多国内外学者,针对现有的自动
C02是地球上最丰富和廉价的C1资源,同时CO2的大量排放造成了温室效应,为了改善环境问题和缓解能源危机,急需开发能将CO2转化为高附加值产品的技术,其中催化转化是CO2转化的重要途径。在众多催化转化的产品中,甲醇是重要的化学深加工原料并且可作为汽油的优良替代品。因此,CO2催化转化制甲醇的研究倍受关注。CO2在热力学上是惰性的分子,因此研究的重点是开发出一款活性高的催化剂。在目前的CO2加氢制甲
人们对汽车操纵稳定性的要求不断提高。主动变结构悬架可以通过控制车辆的外倾角和前束角等来改善车辆的操纵稳定性。目前,主动变结构悬架多使用执行器对单个车轮定位参数进行调控,取得了良好的效果。为了提高主动变结构悬架效能,深入了解主动变结构悬架的性能潜力,本文探索了同时调整外倾角和前束角的主动变结构悬架的优化设计及协调控制,以改善车辆动力学性能。本文针对主动变结构悬架优化设计与控制策略进行研究,重点解决执
近年来,我国经济飞速增长的同时,环境问题也更加严峻,其中土壤重金属污染问题尤为突出。激光诱导击穿光谱技术(Laser induced breakdown spectroscopy,LIBS)具有近似无需对样品预处理、能够同时对多元素快速检测等优势,非常适合应用于土壤重金属检测的研究中。本文介绍了LIBS技术在土壤重金属检测方面的国内外研究现状以及存在的问题。系统的阐述了激光等离子体的相关理论,并根
三元硫族化合物在化学组分和能带结构上体现出更丰富的可调性。它们作为一类重要的半导体材料,在热电、光电以及催化等多个领域有着十分广泛的应用。然而由于组分的复杂性和
旋翼式无人机是由一个或多个旋翼组成的无人驾驶飞机,通过旋翼旋转带动机体在空中自主飞行,当改变旋翼的转速时,无人机会改变其运动轨迹与运动姿态。由于旋翼式无人机垂直起
表面增强拉曼散射(SERS),表面等离激元共振(SPR)传感器都是基于等离激元共振技术且拥有诸多优势:微型、无痕检测、携带方便、制备廉价、性能优越。可以应用于环境污染、农药残留、生物检测等等。随着技术的发展与进步SERS与SPR传感器的制备材料也在逐渐得到改善,生物材料(作为一种绿色,廉价,高性能的基底)与超材料(拥有独特的结构和光电特性,一般分为纳米柱阵列和多层结构)逐渐走进人们的视野,并且生物
在开发页岩气的过程中,井壁不稳定已经成为制约页岩气发展的重要因素之一。据现场资料显示,川渝页岩气开发过程中经常发生井壁垮塌钻井事故,造成了巨大的经济损失。本文对龙
多孔介质在生产生活中应用广泛。对于多孔介质力学行为的研究,在岩土工程、材料科学和生物与医学工程等领域都具有重要的研究价值和应用前景。当地震波在地壳中传播或其他饱
江西东南部出露的神山组、库里组和上施组为一套火山碎屑岩、碎屑沉积岩组合。中部库里组为一套火山碎屑岩、碎屑沉积岩组合。上部上施组和下部神山组夹燧石岩。各组间均为整合接触。它们长期被认为是新元古界地层,为南华裂谷海槽海底斜坡沉积。然而,随着一些新的年龄测定结果的提出,越来越多的学者认为,华夏是一个连续的沟弧盆体系,于古生代志留纪至今逐渐拼合。赣南于都-兴国地区神山组、库里组和上施组形成构造演化分析是华