【摘 要】
:
类分布不均衡是导致分类算法效果不佳的主要原因之一.为提升不平衡数据分类精度,提出了数据相对平衡转换与SVM集成加权相结合的分类方法.一方面考虑到类间的平衡性,将不平衡
【基金项目】
:
黑龙江省自然科学基金资助项目(F201333),国家社会科学基金资助项目(19BGL24),黑龙江省教育厅基本科研业务费科研项目(135309471),齐齐哈尔大学研究生创新科研项目(YJSCX2019073).
论文部分内容阅读
类分布不均衡是导致分类算法效果不佳的主要原因之一.为提升不平衡数据分类精度,提出了数据相对平衡转换与SVM集成加权相结合的分类方法.一方面考虑到类间的平衡性,将不平衡数据转化为多个相对平衡数据集;另一方面利用SVM处理二分类的优势,使用SVM作为基分类器并进行集成训练,同时利用代价敏感的训练方式平衡数据之间的类关系.选取48组KEEL官网中的不平衡数据集进行性能评估,结果表明,本方法在不平衡数据上具有良好的分类效果,为不平衡数据分类研究提供了理论参考和实用价值.
其他文献
排放瓦斯应了解瓦斯的赋存状态,利用其平衡状态是动态的规律,通过气水冲击,来打破这种平衡状态,人工强制性疏排瓦斯,达到矿井安全通过石门揭煤的目的。研究瓦斯的成因及其赋存状态
<正> 产科DIC是一些重度产科合并症发展导致的病理生理过程,来势凶猛,早期诊断困难,母婴死亡率高。我院1988年10月至1991年2月成功抢救了6例产科DIC患者,临床分析如下。
中国古代王朝的教化传播是社会控制的重要手段,以拉斯韦尔提出的“5W”传播模式分析,它具有持久性、广泛性、渗透性及全员性等特点。就拉斯韦尔提出的“使社会遗产代代相传”的
通过对陕西、河南两省13个猪苓栽培地实际情况调查,详细了解了猪苓产量的影响因素,并研究了猪苓产量与栽培区的气候条件、土壤类型、海拔、坡向和栽种方法之间的关系,结果显
海红果树在生长过程中,常常遭受多种病虫害的危害,常见的病害有锈病、炭疽病和腐烂病等,主要的虫害有桃小食心虫、舟形毛虫和天幕毛虫等.结合测报,掌握海红果树重要几种病虫
循证护理(EBN)是伴随着循证医学的发展而出现的一种新的临床护理模式,它是在这种认识方式指导下为临床研究和实践提供科学的方法论。它包含了三个要素:可利用的最适宜的护理研究
检索经皮二氧化碳(TC-CO_2)监测在新生儿的应用的相关文献,探讨经皮二氧化碳(TC-CO_2)监测在新生儿的应用进展。尽管直接测量PaCO_2仍然是金标准,但它只提供了一个时间点的测量结
目的探讨p16INK4a蛋白在乳腺癌中的表达及其临床意义。方法收集2014年~2015年间手术切除的132例乳腺癌标本,采用罗氏全自动免疫组化染色仪进行免疫组织化学染色,检测ER、PR、H
影视广告对促进中国经济的发展起到了显著的作用,但并没有达到有效传播,而企业投巨资做广告最关心的是有效性。为了全力提升广告客户的投资回报,本文拟对提升中国影视广告传
岩层具有水平、直立、倾斜等产状,将其纳入三维空间坐标系中,就可以用平面方程ax+bx+cz+d=0,a^2+^2+c^2≠0将其表述;当z=0时其上方程为ax+bx+d=0,此时该方程表述了岩层的走向;平面方程法