基于粗糙集技术的分类规则抽取方法

来源 :河北大学 | 被引量 : 0次 | 上传用户:king2xl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
归纳学习的核心问题是从给定的数据集中抽取分类规则,决策树归纳是一种典型的分类规则抽取方法,扩展属性的选择是决策树归纳的核心问题,基于离散化的连续值决策树归纳在选择扩展属性时,需要度量每一个条件属性的每一个割点的分类不确定性,并通过这些割点的不确定性选择扩展属性,计算时间复杂度高。针对这一问题,本文提出了一种基于相容粗糙集技术的连续值属性决策树规则抽取方法。该方法首先利用相容粗糙集技术选择扩展属性,然后找出该属性的最优割点,分割样例集并递归地构建决策树。另外,针对压缩近邻规则方法寻找一致子集计算复杂度非常高的问题,本文还提出了基于粗糙集技术的压缩近邻规则抽取方法。该方法分为三步:首先利用粗糙集方法求属性约简(特征选择),这样能将冗余的属性去掉;然后选取靠近边界域的样例,这样能将冗余的样例去掉;最后从选出的样例中计算一致子集。从理论上分析了本文提出的算法的计算复杂度并在多个数据集上进行了实验,实验结果及对实验结果的统计分析均表明本文提出的方法在计算复杂度和分类精度方面均优于其他相关方法。
其他文献
近邻规则是模式识别、机器学习、数据挖掘中广泛使用的一种基于样本实例的分类方法,该算法通过从训练集中寻找与待分类样本最近的样本来确定其类别。然而近邻规则的一个最大的
入侵检测作为一种主动防御技术已经是现代计算机网络安全系统不可或缺的组成部分,一直是现代网络安全领域研究的热点。支持向量机技术一直是入侵检测领域的重要研究内容,但是基
DeepWeb是指隐藏在Web数据库中而不能被传统搜索引擎索引到的那部分内容的集合。对于特定领域的Deep Web,不同的站点会提供不同查询能力的查询接口。集成查询接口可以达到访问
随着乳腺癌在全世界妇女中的发病率越来越高,乳腺外科门诊工作量不断的加大,研发一个既能辅助医生诊断疾病提高乳腺外科门诊工作效率、减少或者避免漏诊、误诊,又可以培养年
多维数据的近邻查询是多媒体数据处理领域最常用的基本操作之一,并长期都是研究的热点。然而已提出的索引大多面临高维、海量等问题的困扰。由于矢量量化技术具有较好的数据量
随着电子商务和电子政务迅速发展,越来越多的像银行账号之类的个人信息要求严格保密,所以,如何保证信息的安全性显得尤其重要。作为信息安全的核心技术之一,密码技术具有极为重要
智能监控中的运动目标识别分类技术是计算机视觉领域的一个研究热点,随着科技的进步、社会的发展,各行各业对视频监控的需求不断增强,使得视频监控系统不断朝着智能化的方向
植物是自然界的重要组成部分,因其种类繁多、结构复杂、形态万千,以计算机技术为中心,建立在植物学、计算机图形学、数理统计、可视化技术基础上的虚拟植物(VirtualPlants)研究
随着计算机网络的迅猛发展和网络业务类型的快速增加,网络管理日益复杂,传统的网络难以保证用户的端到端QoS目标。认知网络在感知当前环境的基础上,同时结合业务需求,对网络未来
在大型客机全球化协同研制过程中,需要与全球先进的制造企业进行深入地交流,在协同研制的过程中,经常涉及到双方信息资产安全等诸多问题。本文针对大型客机的全球信息化协同研制