基于扩展近邻SMOTE过采样的SVM分类器

来源 :现代计算机(专业版) | 被引量 : 0次 | 上传用户:songshuguiyu00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于SMOTE算法插值时没有对边界和噪声样本做差异性处理,提出将邻域分布应用在SMOTE算法上的改进算法E_SMOTE。其核心是将正类样本按K近邻信息分为安全集和非安全集。对安全集按照SMOTE插值;对非安全集,在插值前探察其K近邻候选点的M近邻分布(简称M扩展近邻),从而控制新样本的合成区域,提升平衡数据集的抗噪性。在6个UCI数据集上训练SVM分类器,与SMOTE和SMOTE_NCL算法相比,E_SMOTE算法取得更高的F_value和G_mean值,表明分类器的总体分类性能有明显提高。
其他文献
多囊卵巢综合征(polycystic ovary syndrome,PCOS)作为最常见的内分泌代谢性疾病一直是业内研究的热点,也是临床工作中的重点。但由于疾病表型的高度异质、不同年龄阶段的症
原发性中央性颌骨鳞癌(primary central squamous cell carcinoma of jaws)是一种罕见的恶性颌骨内肿瘤,目前病例报告较少,因而该疾病的流行病学、治疗方式、预后仍不清楚。本
针对某地区防洪救灾中物资的调运问题,利用图论中最短路的知识,根据问题实际,将物资的调运方案分成3个阶段。在每个阶段以费用最小或时间最短为目标,以各单位之间物资的供求平衡
为分析研究紫金山金铜矿露天岩质边坡稳定性,通过室内三轴剪切实验,揭示不同岩性岩体内部应力—应变变化规律,为边坡稳定性分析提供可靠基础数据。在其基础上,应用极限平衡的
从运动神经元病的中医病名、病因病机探究入手,认为脾肾肝三脏虚损是本病发病的内在原因,湿浊之邪是其重要的致病因素,毒邪侵犯是重要病因,瘀血既是病理产物又是致病因素,络
基于供应链风险和供应链绩效的模糊性和供应商选择问题的动态性,本文考虑供应链风险和供应链绩效作为模糊变量,讨论如何给生产商一个满意的动态多目标供应商选择方案,确定供
妇幼保健工作是我国卫生保健事业的重中之重,健康教育作为妇幼保健的六大功能之一,在妇幼保健工作中地位尤为重要。新形势下,随着健康教育与健康促进纳入公共卫生体系建设,妇
从1907年8月结神交社,到1909年11月虎丘雅集,南社创立经过了两年多的酝酿准备。宁调元在长沙狱中曾参与南社创立的准备活动:撰写《南社序》,与谋南社体例,提供诗文稿件,发展社
当下的中国合唱呈现出多元化的发展趋势。本文指出,改革开放带来的思想自由和民主意识和后现代文化思潮的冲击,是中国合唱走向多元化发展的主要原因。本文从当下中国合唱对传