【摘 要】
:
特征选择是机器学习领域的重要课题,基于互信息的特征选择算法在多个领域得到了广泛应用.但是该类方法忽略了属性之间的相互作用对决策结果的影响,无法满足高维特征数据集的
【机 构】
:
重庆邮电大学 通信与信息工程学院,重庆400065重庆邮电大学 通信新技术应用研究中心,重庆400065;重庆信科设计有限公司,重庆401121;重庆邮电大学 通信与信息工程学院,重庆400065;重
论文部分内容阅读
特征选择是机器学习领域的重要课题,基于互信息的特征选择算法在多个领域得到了广泛应用.但是该类方法忽略了属性之间的相互作用对决策结果的影响,无法满足高维特征数据集的分类要求.针对这类问题,提出一种引入邻域判别指数的混合式特征选择算法NDI-RF.首先在特征过滤阶段,利用邻域判别指数作为判决指标,通过图论聚类思想去除冗余特征,获得相关联的代表特征集;然后通过改进随机森林封装器的特征分配机制,结合序列后项搜索策略评估各个特征子集的分类效果;最终通过逐次迭代选择最高分类准确率所对应的特征子集作为最优特征子集.在UCI数据集上的实验结果表明,NDI-RF算法相较于其他特征选择算法,能够有效地减少最优特征子集的大小,同时保证较高的分类准确率.
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
情感分类是自然语言处理领域的一个核心问题,其目的是判断评论文本的情感极性,并挖掘其蕴含的情感价值信息.为了提取评论文本中潜在的情感信息,提高分类精度,本文提出了多特
BLAKE2b算法是一种高性能、高安全性的64 位平台的哈希算法.在主流数字货币 zcash的 Equihash算法中,采用BLAKE2b算法生成220个200位的哈希数据,再按广义生日算法进行异或碰
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
时光荏苒,弹指一挥间,杂志走过了不平凡的50年.杂志50年的创立、成长与发展始终伴随着我国电子信息技术和信息产业的发展而壮大,知名度和影响力不断增强.在杂志创刊50周年之
玛雅人传说中的2012年,地球将难逃毁灭的命运。rn这一年的开端,有着2011年留下的大创小伤,互联网信任危机越演越烈,全球经济形势尚未探底的下滑……