改进SMOTE的非平衡数据集分类算法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:gwq939
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对随机森林和SMOTE组合算法在处理不平衡数据集上存在数据集边缘化分布以及计算复杂度大等问题,提出了基于SMOTE的改进算法TSMOTE(triangleSMOTE)和MDSMOTE(MaxDistanceSMOTE),其核心思想是将新样本的产生限制在一定区域,使得样本集分布趋于中心化,用更少的正类样本点人为构造样本,从而达到限制样本区域、降低算法复杂度的目的。在6种不平衡数据集上的大量实验表明,改进算法与传统算法相比,算法消耗时间大幅减少,取得更高的G-mean值、F-value值和AUC值。
其他文献
目的:研究分析骨内种植牙进行牙缺失修复治疗的临床效果。方法根据我院接收的378例骨内种植牙进行牙缺失修复治疗的患者来进行探讨分析,共有患牙562颗,我们为患者使用了CDIC生产
在国家实施《国家职业教育改革实施方案》和启动“1+X”证书制度的背景下,针对高职汽车专业领域“1+X”证书制度试点,文章从才培养方案制定、课程体系建设、课程实施方案等方
1月13日,得到水立方授权的“水立方”酒被茅台酒股份有限公司(以下简称贵州茅台)发往全国各地。$$    “水立方酒”的诞生也意味着作为奥运会场馆——水立方在完成奥运使命
报纸
目前我国的建筑行业十分的火热,响应国家城市化的政策,每个地方都进行了一定的建筑工程项目。但是随着建筑工程的持续进行,一些建筑问题也暴露了出来,质量安全问题是最重要的
文章构建了地方政府财政科技投入绩效评价体系,运用灰色系统理论对浦东新区财政科技投入进行绩效评价。研究表明:浦东新区财政科技投入与各绩效一级指标的作用强弱依次为经济
随着电子信息技术和互联网技术的快速发展,互联网第三方账户以其快速便捷的特征迅速被用户所接受。但是,互联网第三方账户作为独立于银行账户之外的虚拟账户,其弱透明性和弱
随着全球对保护环境问题的呼声越来越强烈 ,许多国家对农药安全性制定出的相关法规也越来越严格 ,而开发具有高安全性、高活性、高选择性、低残留等特点的农药新品种的成功率
从外来人口主要居住在边缘社区的实情出发,选取广西壮族自治区南宁市六个城区的部分边缘社区作为研究对象,采用问卷调查和统计分析的方法,对外来人口参与社区治理意愿及其影
走出校门,在外语专业学生的实习或留学过程中,跨文化交际方面会遇到很多问题,而到外国语言和文化环境中、直接接触外国人是学习外语、提高跨文化交际能力十分有效的方法,同时
目的分析脑卒中患者根据Brunnstrom分期采用针对性康复方案的康复效果。方法 100例脑卒中后接受康复治疗的患者,随机分为观察组和对照组,各50例。观察组予以针对Brunnstrom分