【摘 要】
:
粗糙集可以从海量数据中高效地挖掘出有价值的信息。属性约简是粗糙集理论的一个核心研究内容,它可以有效的辨别冗余属性,减少不相关属性对分类性能的影响。为了解决基于经典粗糙集的属性约简不能直接处理连续型数据的问题,有学者提出邻域粗糙集模型。在邻域粗糙集中,往往通过给定的半径来约束的样本之间的相似性,然而,这种简单固定半径的邻域粒化方式通常不能提供令人满意的判别性能,约简后得到的属性质量不高。因此本文对邻
论文部分内容阅读
粗糙集可以从海量数据中高效地挖掘出有价值的信息。属性约简是粗糙集理论的一个核心研究内容,它可以有效的辨别冗余属性,减少不相关属性对分类性能的影响。为了解决基于经典粗糙集的属性约简不能直接处理连续型数据的问题,有学者提出邻域粗糙集模型。在邻域粗糙集中,往往通过给定的半径来约束的样本之间的相似性,然而,这种简单固定半径的邻域粒化方式通常不能提供令人满意的判别性能,约简后得到的属性质量不高。因此本文对邻域粗糙集中的邻域粒化方法和属性约简方法进行了深入研究,主要做了以下工作:(1)现有的方法采用固定半径的策略进行邻域粒化时,存在无法处理分布不均匀数据集、粒化不精确和参数选取困难的问题。针对这些缺陷,本文对邻域粗糙集中的邻域粒化方法进行分析,提出了动态邻域粒化机制。该粒化机制在粒化样本时,首先分别从局部样本分布和全局样本分布的角度出发,为样本初步计算出一个半径,接着通过属性间的关系对上一步求出的半径进行缩减,进一步提高了粒化的精确度。在此基础上,根据动态邻域粒化机制,构造了相应的动态邻域粗糙集模型。实验结果表明,所提粒化方法可以提高邻域粒化的精确度,更有利于区分出适宜分类的属性。(2)针对在动态邻域粒化机制下,邻域半径动态变化导致在属性约简的过程中下近似不单调的问题,本文对属性约简算法进行分析,基于样本淘汰的思想提出了在动态邻域粗糙集下的属性约简算法。首先在粗糙集理论下,采用一种累加和的方式重新定义了动态邻域粗糙集的上、下近似算子,保证了在属性约简的过程中下近似的单调性;接着,针对在属性约简的过程中出现的样本不一致的问题,本文将传统的基于依赖度的属性重要度评估与一致程度评估相结合,提出一种多准则属性重要性评估函数;最后设计了一种属性约简的停止条件,使用一种前向的启发式算法实现了约简求解。为了验证动态邻域粗糙集下属性约简算法的有效性,在12个来自真实世界的公共数据集上进行了仿真测试,对比其他粒化方式下的邻域粗糙集属性约简方法,实验结果表明,本文所提方法能删除冗余的属性,得到的约简可有效的提升分类准确率。
其他文献
知识图谱(Knowledge Graph,KG)是高度结构化的图数据库,借助资源描述框架(Resource Description Framework,RDF)将现实中的知识事实存储为三元组(Triple)形式,构成了大规模的语义网络。虽然KG在人工智能领域得到广泛应用,然而,KG大都由人工或通过半自动的方式构建,通常存在严重的数据缺失和数据稀疏等问题。现有的知识图谱补全工作主要着眼于单一三元组及
水下光学成像作为水下智能机器人环境感知的重要途径之一,所获取的图像质量直接影响了水下视觉系统的信息感知与辨识能力。然而,水下图像受水中介质的散射与吸收作用的影响,通常存在降质问题,呈现出蓝绿色偏严重、对比度低等特点,为后续水下目标检测等任务带来了极大困难。在解决上述问题时,传统的模型无关的增强方法未能充分考虑水下成像过程中的复杂影响因素,在处理图像时存在局限性;基于模型的水下图像增强方法由于现有模
近年来,深度学习在人工智能领域取得了显著的成果。然而深度学习模型的训练过程可能会导致个人隐私的泄露。在给定模型和目标个体的一些背景信息的情况下,攻击者可以推断出目标个体的敏感特征。差分隐私作为一种可以数学证明的严格隐私定义,已经证明可以运用到深度学习模型训练中,但由于其添加随机噪声的保护方式将较大地影响训练后模型的实用性。因此,如何在保证隐私的情况下,不过多地影响模型的实用性,即寻求更好的模型实用
清开灵治疗高热285例047500山西省潞成县中医院杨怀玉笔者自1990年3月以来,用清开灵治疗除癌性发热以外的各种原因所致的高热285例,获满意疗效,现报告如下:285例中,男190例,女95例;年龄最小1岁半,最大69岁;病程最短2天,最长45天...
互联网中海量服务为用户快速地找到符合需求的服务带来了挑战,用户如何从海量服务中选择满足需求的服务成为了一大难题。为解决此问题,服务推荐被提出,并且成为了非常热门的研究领域。目前服务推荐方法存在服务侧或用户侧辅助信息利用不充分、服务或用户特征表示不够准确,以及数据稀疏和冷启动导致的推荐准确率不高的问题。数据与信息是服务推荐的基础和依据,因此本文利用服务侧和用户侧的辅助信息,依托深度学习强大的特征表示
退热煮散治疗急性白血病高热22例276003山东省临沂地区人民医院庞德湘,赵海燕笔者近年来以退热煮散治疗急性白血病高热患者22例,疗效较好。现介绍如下。一般资料本组22例,男13例,女9例;年龄16—38岁,平均26.1岁;体温38.5—42℃,平均...
在信息爆炸时代,为了能够获取相关事物准确全面的知识,需要借助知识图谱技术进行知识融合。知识融合面向不同知识图谱解决信息交叉与缺失问题,而实体对齐技术作为其首要且关键的一步,是将知识图谱间存在的等价实体建立关联,从而为实体信息共享奠定基础。目前实体对齐相关研究大多只关注实体在知识图谱上的结构和关系知识,对实体的属性和其他多模态知识关注甚少。一方面忽略了知识图谱中实体相关的拓扑结构、属性、关系之间的语
“双高计划”为职业教育新一轮质量革命注入了新动力,对高职院校高质量发展具有非常重要的意义。为提升高职院校服务区域经济发展的能力,以高职院校在区域经济社会发展中社会价值的引领作用为立足点,以完善专业人才培养体系、校企共建教学资源平台、强化新型教师队伍建设的体制机制改革为着力点,以培养“创新创业型”人才、提升区域企业人员技能、加强教师团队参与校企合作为关键点;构建新时代高等职业院校深化教育教学综合改革