基于改进信息增益的特征选择方法研究

来源 :萍乡学院学报 | 被引量 : 0次 | 上传用户:bluedogdog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息增益是最有效的特征选择方法之一,但在处理不平衡数据集时其分类性能却急剧下降。针对这一不足,文章从三个方面对传统信息增益进行改进,提出一种改进的信息增益特征选择方法。首先,去除特征项不出现因子以降低对分类的干扰;其次,引入最大词频比因子以抑制低频词的干扰;最后,融入类内词频分布差异离散度和类间分布差异加权离散度因子以衡量特征项在类内和类间的分布差异。在不平衡数据集上的实验结果表明,改进的信息增益不仅可以从很大程度上改善少数类的分类性能,也使总体分类性能得到了明显提升。
其他文献
以苗期表现为耐铝性具有明显差异的10份大麦基因型为材料(耐铝和铝敏感基因型各5个),研究铝胁迫条件下生育后期植株生物量、铝和养分元素含量的差异.结果表明,铝胁迫抑制植株
发电机横差保护是装设于发电机双星形接线的定子绕组中,防止绕组匝间短路的一种保护。文章结合在小关子电站运行期间发生发电机横差保护动作的现象,着重阐述横差保护动作原因及
国际投资仲裁在解决投资者与东道国条约争端的各类方法中具有灵活性、自治性、高效性、中立性等优势。中国对外缔结的双边投资条约中对以国际仲裁方式解决投资争端的接受程度
根据2006年4月对黄海浮游植物分级叶绿素及初级生产力的调查,研究了黄海叶绿素及初级生产力的水平分布及粒级结构特征,并分析了其主要影响因素。黄海海域调查站位表层叶绿素a
首先对模拟退火算法进行改进,将遗传算法的群体、交叉、变异等概念引入其中,使得它能从多个初始点开始并行寻优,能以较快的速度找到全局最优解。然后基于有限元应力场,应用改
目的对促红细胞生成素在治疗心力衰竭的临床效果进行分析和研究,探讨其优势和不足。总结经验,以更好地指导临床应用。方法选择我院近3年来50例心力衰竭患者,采取随机分组的方法
目的评价不同护理模式干预对老年骨质疏松性股骨骨折患者的影响,为骨科护理提供参考。方法选择92例老年骨质疏松性股骨骨折患者,随机分为各46例的实验组、对照组。实验组综合
本着借鉴的出发点,作者采用“系统文献综述”的研究方法,对最近十年英文文献中述及的西方国家与高等教育资源配置相关的理论和议题,进行了系统分析和阐释。内容涵盖了西方国家有
在世界住房界,新加坡享有在困难条件下通过房改很好解决广大居民住房问题的美誉。因而在我国房改进程中,曾多次派团到新加坡考察访问,并学习借鉴了一些新加坡的房改经验。例
目的:分析CT脑灌注成像(脑CTP)和头颈部CT血管成像(头颈部CTA)诊断颈动脉狭窄性短暂性脑缺血(TIA)发作的临床意义。方法:选择2016年9月-2017年10月在我院接受治疗的颈动脉狭