非一致分类数据集的一致化与特征选择与算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:lixinjun678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用不一致性或含有冗余特征的样本数据集往往会降低分类的质量和效率。提出了一种将分类数据集一致化,并在此基础上选择最小特征变量集的方法。该方法首先根据贝叶斯公式,将非一致数据归为最可能的一类,使数据集一致化,然后在一致数据集上,定义类别区分矩阵,选择最小特征变量集,并给出了在类别区分矩阵上搜索最小特征变量集的启发式搜索策略。采用UCI标准数据集的实验结果表明,提出的方法可有效地删除数据集的不一致性,选择的最小特征变量集可准确区分各类数据并降低数据的维数。
其他文献
在连续3年的平缓增长之后,随着3G的启动在即和新兴应用的成熟使电信行业注定成为今后几个信息化建设的明星行业,电信行业信息化建设在2005年将迅速增长,并开始步入高速成长通
目的:探讨超声弹性成像组织弥散定量分析技术评估慢性肾功能损害程度的应用价值。方法:研究对象选自2014年6月至2015年12月就诊于大连大学附属中山医院的健康体检者及经临床
分析了网络信息过滤一般模型以及现有技术,研究了如何更准确地构建用户模板,提出了一种基于遗传算法的网络信息过滤系统模型,并且引入了遗传扩展操作和Boltzmann群体更新准则
通过分析近年来重要国际机构开展的若干农业和粮食系统的前瞻工作,系统研究情景分析法的应用情况,包括情景研究类型、情景分析流程及情景构建技术,并总结情景分析法在典型农
广东水利电力职业技术学院是我省唯一一所水利电力类公办全日制高等院校。学院前身是1952年10月成立的广州土木水利工程学校,历史上几经搬迁和改名,1999年7月经教育部批;隹,在原
国家环保总局将在四领域开展生态补偿试点,矿产资源开发的生态补偿是其中重要领域之一。将通过试点工作,建立重点领域生态补偿标准体系,探索多样化的生态补偿方法模式;推动相关生
由于医学类目繁杂,在实际分类工作中容易出现许多问题,本人就在图书馆工作中的实际经验,主要谈以下三个问题:新兴学科文献的分类问题;交叉学科文献的分类问题;藏医药文献的分
2019年5月30日,《山东女子学院学报》编委会换届会议在山东女子学院成功举办。编委会委员听取了《学报》最近四年的工作总结,并通过了《学报》新一届编委会委员名单。新一届
0 引言青海盐湖100万t钾肥项目是国家西部开发的首批十大重点工程之一,其中采输卤和盐田、老卤排放及相应的配套工程于2000年5月开工建设,2002年10月建成并投入运行。根据工程3
将红色传承融入语文教学中,培养学生的爱国主义精神和热爱家乡的情怀,帮助学生树立正确的世界观、价值观和人生观,对健全学生人格起到十分重要的推动作用,从而促进学生身心的