BOS:一种用于不平衡数据学习的边界过采样方法

来源 :四川大学学报(自然科学版) | 被引量 : 0次 | 上传用户:hezeliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不平衡数据遍布于现实生活中许多重要领域,而标准的分类学习算法应对不平衡问题有明显的性能缺陷.为了解决这一问题,提出一种新的少数类边界合成过采样方法BOS.BOS使用新定义的K广义Tomek连接(简称K连接)概念有效定位边界实例,进而基于少数类的K连接分布实现自适应地少数边界合成过采样.实验结果表明,BOS相比已有的几种典型过采样方法提供更优的接受者操作特性曲线下方面积值(AUC),F值(F-Measure)和几何平均值(G-mean).
其他文献
两温区气相输运合成ZnGeP2多晶,易发生化学计量比偏离,产生Ge、Zn3P2等杂相,在合成坩埚(石英安瓿)内壁凝聚一层ZnP2和P的沉积物.通过对合成设备、安瓿尺寸和工艺的改进,采用机
采用回流法制得前驱体粉体,用此前驱体粉体在流动氮气保护下、750℃下热处理10h制得碳包铁钴合金纳米颗粒.利用SEM、TEM、XRD、Raman和VSM对碳包铁钴合金纳米粒子进行了表征.结
运用弦模型研究含有粲夸克的D介子谱.通过引入自旋自旋以及自旋轨道相互作用,发现D介子谱能被很好的描述.当把这个模型用于奇异Ds介子谱时,预测存在质量为2516MeV的第一轨道激发
为解决异地数据容灾系统中多时间点备份对存储空间的浪费问题,提出一种基于存储动态映射的多时间点备份方法.通过元数据共享、写时动态映射实现共享数据的单实例存储和备份存储
利用量子化学计算方法,采用密度泛函理论(DFT)研究了大气环境中F与雷酸(HC-NO)分子反应的机理.在6—311++G“和6-311G“基组水平上,优化得到了反应物、过渡态、中间体和产物的几何构型
在局域密度近似的框架内(其中气体在每一点都可以看成是局域均匀的),得到谐振势中相互作用费米气体的能量密度.在这些表达式的基础上,研究了零温时约束气体的热力学稳定性条件,给出
本文讨论了一个带有参数的分子含有二次项的有理差分方程的奇点集和解的全局稳定性,证明了它的解由于参数的取值不同最终将收敛到0或非零不动点或二周期点或者是无界的,且在某
为探索本实验室从甘蓝型油菜中克隆到的BnRCH基因在植物耐盐中的作用,比较了NaCl胁迫下转基因与野生型拟南芥在萌发及幼苗生长的差异.结果表明:在100 mMNaCl处理下,BnRCH转基
对给定的可除剩余格L及a∈L,作者通过一个自然的构造使得主下集↓+a={x∈L|x≤a}成为一个可除剩余格La.进一步有,如果L是预线性的或者广义MV一代数,则La亦是.
应用最近建立的能正确预言双原子分子P线系高激发振转跃迁谱线的新公式,首次研究了TiF分子在次带G^4Ф_5/2。跃迁体系内(O,1)跃迁带的P支发射光谱.研究结果表明,该方法不仅可以精确