结合马氏距离的smote改进算法研究

来源 :电脑知识与技术:学术版 | 被引量 : 0次 | 上传用户:shyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的smote算法应用于非平衡数据集研究领域,它可以将少数类样本按照一定的条件进行扩充,以达到让非平衡数据集中少数类样本和多数类样本达到平衡这一目的。但是它在对于边界元素的选择生成数据的时候具有盲目性,使得生成的新的数据降低少数类样本的质量。针对这种情况,提出了将马氏距离结合SMOTE算法的改进算法Maha-smote,让生成的新元素更加靠近样本集中心,提高生成的数据集的总体质量。本文分别使用传统SMOTE、Python的sklearn库中的SMOTE算法以及Maha-smote算法对所选用的3个不平衡
其他文献
【关键词】互联网+;党校;信息化  “互联网+”一词始提出于2015年时,李克强总理所作的政府工作报告。在这份政府报告中,明确提出了“制定‘互联网+’行动计划”,从此颇受青睐。“互联网+”代表的是一种全新的经济形态,体现了新时代先进的生产力,其核心要充分发挥互联网的作用,使生产要素通过互联网实现进一步优化和集成,并进一步将互联网的创新成果实现与经济社会各个领域进行深度融合,使实体经济更具创新能力和
在建筑工程领域中,桩基础技术的水平影响着建筑工程的性能和安全。桩基础是否稳固以及科学合理直接影响着后期建设的进度和效果。根据桩基础技术出现问题的源头提出相应的解
稻瘟病菌(Magnaporyhe grisea)引起的稻瘟病是危害我国水稻生产的重要病害,除了采用抗病品种和栽培措施防控以外,多年来一直使用三环唑(tebuconazole)、稻瘟净(kitazine)、克
在科学技术和信息经济迅猛发展的时代背景下,各种先进化的教学手段被广泛应用到教育领域。微课作为现如今课堂教学中广泛应用的教学辅助工具,实现了现代信息技术与教育理念的
随着互联网、BIM等信息技术的发展,智慧工地技术得到普及,在建设工程项目的前期策划、设计优化、成本管理、施工质量管理、安全管理、进度管控、物料管理、环境监测等方面发
[目的]降低儿科静脉药物调配中心(简称静配中心)建立初期的差错发生率。[方法]回顾性分析2019年1月—2019年4月儿科静配中心差错发生的原因,2019年5月—2019年8月(改进后)进
介绍了脉冲刷镀的工艺和机理。通过大量试验,优选出镀工作层时脉冲刷镀的较佳工艺参数。试验结果表明,常用镀液脉冲刷镀的最大可镀厚度相当于直流刷镀的5 ̄6倍,镀层的抗氧化性能平均
为了提高大型线性方程组的求解速率,在变参数H-GMRES(m)算法的基础上,利用不完全正交的Householder变换,提出了截断型的H-IGMRES(m)算法。对算法的收敛性进行了分析,用数值算
当今社会接纳人才的门槛不断提高,对此,深厚扎实的高中数学基础便成了一个加分项。众所周知,高中数学学科非常重要,良好的数学基础同时也决定着其他科目的学习效果,然而数学
本文主要从初三思想品德中考复习学生不会解题的原因入手,寻找有关初中思想品德单元复习有效性课堂研究的方向,探索对策。