【摘 要】
:
针对不平衡数据集的低分类效率,基于L-SMOTE算法和混合核SVM提出了一种改进的SMOTE算法(FTLSMOTE)。利用混合核SVM对数据集进行分类。提出了噪声样本识别三原则对噪声样本进
【机 构】
:
上海工程技术大学管理学院,上海工程技术大学数理与统计学院
【基金项目】
:
国家自然科学基金面上项目(No.11471211);上海市自然科学基金(No.14ZR1418900);全国统计科学研究项目(No.2018LY16);上海工程技术大学研究生科研创新项目(No.18KY0325)
论文部分内容阅读
针对不平衡数据集的低分类效率,基于L-SMOTE算法和混合核SVM提出了一种改进的SMOTE算法(FTLSMOTE)。利用混合核SVM对数据集进行分类。提出了噪声样本识别三原则对噪声样本进行精确识别并予以剔除,进而利用F-SMOTE和T-SMOTE算法分别对错分和正确分类的少类样本进行采样。如此循环,直到满足终止条件,算法结束。通过在UCI数据集上与经典的SMOTE等重要采样算法以及标准SVM的大量实验表明,该方法具有更好的分类效果,改进算法与L-SMOTE算法相比,运算时间大幅减少。
其他文献
患者,男,38岁。纤维结肠镜编号:94—693。该患者以肠道异物无法自行排出两周为主诉就诊。查体:左下腹可扪及一硬条索状物,稍凸向前腹壁,长约20cm。可左右活动,肛门指诊未能
1发病情况病例1:2007年4月8日,2岁京巴犬,雄性,因与一斗牛犬争斗,造成下颌骨双侧骨折。病犬就诊时,体温39.1℃,心跳116次/min,呼吸31次/min。该犬上下齿不能闭合,下颌下垂,舌头轻微脱出口
计算机网络是一把双刃剑,它能为人们日常生活带来诸多便利,同样,利用计算机网络能为英语教学起到很好的辅助效果。但是由于网络中存在着一些不安全因素、一些人不能很好地利
阻碍解救被拐卖、绑架的妇女、儿童犯罪若干问题的探讨林亚刚为坚决打击拐卖、绑架妇女、儿童犯罪活动,全国人大常委会于1991月9日4日通过了《关于严惩拐卖、绑架妇女、儿童的犯罪分
建立了绿藻中叶绿素a的导数同步荧光检测法。该方法快速、简便,不需要复杂的前处理。叶绿素a的线性范围为0.02~125μg/L,检出限为0.25μg/L,回收率为97.0%~103.8%。
随着车联网的发展,行驶在路上的车辆生成了海量的交通行为数据。这些数据通常有两种存在形式,一种是车牌自动识别数据,这种数据包含了车辆本身的信息和车辆与路网交互的信息
毕业生就业率反映了高校教育和培养工作与社会需求的适应程度,关系到高校的生存与发展,同时对考生、家长乃至整个社会都具有很大的影响。目前所公布的就业率,还不能被高校所
为解决因公租房融资过程复杂、融资风险高、不确定性因素多等特点,造成决策人员难以对公租房融资方案做出科学决策的难题,本文提出一种基于Shapley和灰色关联的公租房融资方
介绍现有BOPP生产线所用配料设备的原理、特点和精度,详述随着生产线向高速、宽幅、高产发展,对产品质量要求不断提高,失重计量给料设备将是这些生产线配料设备的最佳选择。
在上一期的讨论中,我们可以体会到Inventor工程图处理的几个特点,而这些特点有一个共同之处,那就是把原来由人考虑的事情,由软件完成了,这才能提高质量和效率.对于零件工程图