基于类区分度的高维不平衡特征选择算法

来源 :科技通报 | 被引量 : 0次 | 上传用户:marticabi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统特征选择算法没有考虑特征之间的关联性,并且基于类别平衡假设,在不平衡问题上偏向多数类而忽略少数类。针对以上不足,本文综合考虑特征相关性与不平衡性,提出一种基于类区分度的高维不平衡特征选择算法CDHI,该算法通过k-means进行特征聚类,并计算簇中每个特征的类区分度,利用类区分度对聚类簇中特征进行重要性排序,然后选择各簇中类区分度较高的特征组成特征子集,达到去除高维特征冗余与处理不平衡数据的双重目的。实验结果表明,与传统特征选择方法相比,CDHI算法有效降低了特征空间的维度,提高了少数类的识别率。
其他文献
将变分Lyapunov函数方法和比较原理相结合,得到了具依赖状态脉冲积分微分系统新的比较原理,并利用这一比较原理得到了该系统的最终稳定性准则。
近期在各大连锁超市,红皮大葱(俗称红葱)的挂牌售价均在6~8元/千克,出现暴涨,"向前葱"再现。据超市店员介绍,春节前后,红葱价格出现暴涨,今年价格是近几年价格最高的一年,比
期刊
针对反辐射导弹(Anti Radio Missile,ARM)检测中存在载机信号干扰的问题,提出了一种基于观测信号频域滤波的FRFT检测方法。仿真实验结果表明,此方法在低信噪比条件下能够有效地
3月,受各地物流主干道逐步恢复常态、中储粮持续投放政策性粮源以及东北农户售粮开始增加等因素影响,国内玉米市场供给能力不断提升,其价格已经连续下跌。虽然一段时间东北局
基于连续体结构拓扑优化的SIMP材料插值模型,以叉指式微电容加速度计弹性梁和质量块的一阶固有频率最大化为目标函数,以体积比作为约束条件,建立了弹性梁和质量块的拓扑优化
当前,时代快速发展的同时,社会的生产力也发展也越来越快,这样一来,社会财富越来越多,与此同时给消防部队增加了灭火的任务。基于新形势的发展,在《消防法》中指出消防部队需
相比于同时期的当代作家来说,对汪曾祺先生的作品评价几乎没有分歧,这种原则上的一致,说明论述汪曾祺文学作品的思路还方法还具备很大的上升空间。本文根据以往工作经验,从主流文
本刊记者王淑民报道 2000年 7月 19日,由自治区科委、农业厅、农科院、新疆农业大学、新疆气象局等单位的专家组成的验收组,在自治区科技兴农项目领导小组办公室主持下,对《新疆
目前大多数高校大学英语课程设计与其人才培养目标的吻合度欠缺,且作为通识教育课程的大学英语课程不具备校本特色。本文以应用型本科院校北京联合大学应用科技学院为研究对