面向不均衡数据的融合谱聚类的自适应过采样法

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:xr6088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是模式识别领域中的研究热点,大多数经典的分类器往往默认数据集是分布均衡的,而现实中的数据集往往存在类别不均衡问题,即属于正常/多数类别的数据的数量与属于异常/少数类数据的数量之间的差异很大。若不对数据进行处理往往会导致分类器忽略少数类、偏向多数类,使得分类结果恶化。针对数据的不均衡分布问题,本文提出一种融合谱聚类的综合采样算法。首先采用谱聚类方法对不均衡数据集的少数类样本的分布信息进行分析,再基于分布信息对少数类样本进行过采样,获得相对均衡的样本,用于分类模型训练。在多个不均衡数据集上进行了大量实验,
其他文献
社区购买服务是一个多方主体互动博弈、合力推进的协同治理过程,购买者、承接者和使用者这三类主体在互动过程中确定服务需求、达成合作意向、形成服务对接,完成社区购买服务
硅肥是将微纳米技术与生物技术结合的一种优良植物调节性肥料,为了进一步验证“微纳米硅肥”在黑龙江省水稻种植生产上的提质增效效果,形成完整的水稻高产优质施肥方式,黑龙
目的:探讨静-动脉血二氧化碳分压差[P(cv-a)CO2]评价容量负荷试验的意义,以指导血流动力学治疗。方法:对我院重症监护病房内可能存在低血容量的48例患者进行容量负荷试验,在
新时期下,随着我国居民生活质量的显著改善,畜牧业获得快速发展与进步,奶牛养殖作为拉动农村地区经济增长的重要产业,其发展逐渐趋于标准化和规模化。本文主要针对奶牛标准化
<正> 1987年春,我市一养殖户从吉林省长春市郊外引进30只麝鼠,饲养半个月左右,先后有5只不同程度发生皮炎。养户用青链霉素治疗,效果不明显,死亡2只,根据症状、剖检和实验室
1944年5月17日凌晨五点,由史迪威将军总指挥,代号“威尼斯商人”的抗日大反攻战役在密支那打响,上百架战机向密支那投下754吨炸弹,威力强大的新式火箭炮也首次投入使用。中美
目的对子宫收缩乏力性产后出血的治疗进展进行探讨。方法选择在我院2011年11月-2013年11月住院分娩的40例出现子宫收缩乏力性产后出血的产妇进行临床资料的回顾分析。结果 40
介绍鹿寨县农业技术推广组织结构的基本情况及县级农业技术推广组织结构的特点和分类,分析鹿寨县农业技术推广体系的优点和缺点,提出发展建议,以稳定农技推广机构、增强农机
本文根据福建省城市污水处理市场化改革的实践,在深入分析福建省城市污水垃圾处理市场化改革必要性和可行性的基础上,对涉及城市污水处理市场化改革的厂区和管网的市场化问题及
习近平总书记指出:金融活,经济活;金融稳,经济稳。经济兴,金融兴,经济强,金融强,两者共生共荣。经济是肌体,金融是血脉。要深化金融供给侧改革,增强金融服务实体经济的能力。