【摘 要】
:
支持向量机(Support Vector Machine,SVM)是一种公认有效的分类算法,在处理小规模二分类问题时表现出较好的性能,但在处理非平衡数据的分类问题时能力有限,针对非平衡数据的
【机 构】
:
太原学院计算机科学与工程系,山西太原,030032
论文部分内容阅读
支持向量机(Support Vector Machine,SVM)是一种公认有效的分类算法,在处理小规模二分类问题时表现出较好的性能,但在处理非平衡数据的分类问题时能力有限,针对非平衡数据的分类问题,文章提出一种基于划分融合的非平衡SVM算法(Imbalanced SVM Algorithm based Division Fusion,DFISVM).首先提取多类样本中的部分代表点与少类样本一起加入训练集进行训练得到初始分类器,再依次利用划分融合的方法选择最优的增量样本,加入训练集进行训练,依次更新得到最优分类器.通过提取多类样本中部分样本参与训练,减少了实际参加训练的多类样本的数据规模,又通过划分融合的方法使提取的样本更能代表原始数据,从而提高了非平衡数据分类的性能.在UCI标准数据集上的实验结果表明,新算法能有效提高非平衡数据的分类性能.
其他文献
深度神经网络可以极大地提高单图像超分辨率的质量,盲目地增加网络的深度不能有效地改善网络。文章针对单图像超分辨率任务提出了一种新颖的深度多尺度递归密集网络(multi-scale recursive dense network,MSRDN),首先构造一个浅层特征提取模块来初步提取粗糙特征,然后将粗糙特征输入到多尺度密集模块(multi-scale dense blocks,MSDBs)群中。每个MS
文章建立了一个考虑部分免疫和环境传播的肺结核模型.为得到该模型平衡点的稳定性,使用下一代矩阵法,并构造Lyapunov函数,研究结果表明,当基本再生数R0<1时,模型的无病平衡点
.Bell态测量是量子信息研究中的重要组成部分.之前的研究表明,只基于线性光学操作不能实现完全Bell态测量,但通过引入辅助光子对或多自由度,可以提高Bell态的区分效率.文章利
以钴螯合物为钴源制备的钴掺杂金属有机骨架(MOFs)为前驱体制备了一系列钴/氮共掺杂碳基多功能电催化剂,研究了碳化温度对材料氧还原反应(ORR)和析氢反应(HER)催化性能的影响
在有限群的特征标理论中,研究子群上特征标的不可约诱导是一个基本而重要的问题.Navarro证明了在奇数阶群中关于子群的π-特殊特征标的不可约诱导的三个定理,在Isaacs的π-理
聚类作为区间型数据挖掘的重要任务之一,在度量对象之间的相似度或距离方面面临着极大的困难.传统聚类方法扩展到区间型数据后,在度量对象之间的距离时往往只考虑到了区间型
文章采用范畴的观点,将特征标三元组视为基本的研究对象,定义了子三元组的正规性和次正规性,替代通常的幂零群条件,证明了特征标三元组的任意两个本原诱导子都有相同的次数,
结构流变是化学中熟知的现象,但人们对分子流变过程的成键本质尚认识不足.文章提出化学中的“流变键”(Fluxional Bonds,FBs)概念,并将其成功应用于平面、笼状和管状硼团簇及
文章采用超声化学法,选用2-巯基-5-苯并咪唑磺酸钠(简称MBISA)作为反应过程中的还原剂和保护剂,通过与二价铜盐作用生成水溶性、稳定性良好的红色荧光铜纳米簇(MBISA@CuNCs).
覆盖粗糙集是Pawlak粗糙集的一种推广,在覆盖粗糙集理论中,许多基本问题的研究都涉及最大、最小描述.文章在现有覆盖及覆盖粗糙集的矩阵表示基础上,通过重新定义矩阵中元素的