基于概率密度估计的SMOTE改进算法研究

来源 :南京师大学报(自然科学版) | 被引量 : 0次 | 上传用户:lifang877
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
类别不平衡问题是机器学习与数据挖掘领域中主要关注的问题之一,目前已有多种解决方法,而样本采样技术是其中最为简单有效、同时也是最为常用的一类方法.本文主要针对SMOTE(synthetic minority oversampling technique)这一最为流行的采样算法易于受到噪声样本影响及泛化能力差的缺点,提出了一种基于概率密度估计的改进算法.首先,假定各类样本均服从高斯混合分布,并采用高斯混合模型测得各样本的概率密度,针对各样本在类内与类间所测得概率密度间的排序比较关系来实现噪声信息的过滤.其次,
其他文献
【正】 一本书的销售情况和读者欢迎程度,主要决定于书的质量, 但是宣传推广工作也是不能忽视的。从目前情况看,这一工作还只是“应付门面”,并未引起有关部门的足够重视。一
按劳分配与按生产要素分配都是属于分配关系的范畴.按劳分配,在我们传统理解的涵义里是指按劳动力价值分配,劳动者通过生产劳动,从雇主那里取得维持自身及其家庭劳动力再生产
通过对杭州电子科技大学2007-2016年间获国家自然科学基金资助的数据分析发现,该校近年来国家自然科学基金的资助率有了快速增长,学校在基础研究和前沿学科上具有一定的实力,
对滨海相淤泥质软土钢板桩基坑扩坑施工中围护结构受力复杂,变形控制难度大的问题作了研究,通过有限元软件模拟基坑扩坑施工,分析了扩坑施工过程中围护结构的变形特征,分析指出扩
改革开放以来,中国经济增长迅速,2011年成为了全球第二大经济体至今。与此同时,我国金融业的市场化、国际化和多元化的改革在向纵深推进,各地金融业也步入了快速发展的轨道。
【正】 世界各国出版的大型百科全书对明初郑和下西洋都给予了很高的评价。如《美国百科全书》(国际版)认为郑和下西洋充分体现了中国人的航海技术,《苏联大百科全书》说明代
乡镇体制改革的关键就是要突破现行乡镇管理体制的基本框架,破解乡镇政府职、权、责不统一的"半官僚制".在这一过程中必须立足于当前农村社会服务、国家行政管理和社会控制等
多媒体是计算机支持下的多种媒体形式的交互,能够比较完整地描述空间知识及其关联特性,使人对地理实体的认识更加形象、生动、全面。本文针对黄河流域的地理环境特点,结合多媒体
在各个行业以及不同领域中,各种高新技术发挥着关键的作用及价值,其中自适应技术作为一种现代化的智能技术,在电子对抗之中获得了广泛的应用以及好评,因此本文立足于电子对抗
第20届国际技术哲学学会(SPT)会议于2017年6月14-17日在德国达姆施塔特理工大学成功召开。本次会议共提交论文200余篇,来自欧洲、美洲、亚洲、非洲等40多个国家和地区的近200