一种不平衡数据集成分类方法

来源 :软件导刊 | 被引量 : 0次 | 上传用户:xiuxiumumu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不平衡数据在各个应用领域普遍存在。在处理不平衡数据时,破坏原始数据的分布特点和丢弃多数类样本的潜在信息都会降低分类精度,为此,提出一种不平衡数据集成分类方法。从多数类样本中依据计算得到的综合权重进行随机采样,并与少数类样本组成新的训练样本子集;为了保证基分类器的差异性,将投影得到的不同样本子集作为各个基分类器的训练样本,通过多分类器集成学习获得最终分类结果;在UCI数据集下进行实验。结果表明,该方法不仅能够提高少数类样本的分类性能,而且能够有效提高整体分类精度。
其他文献
报告1例因长期服用囊虫丸所致的砷角化症和多发鲍温病。患者男,54岁。手足角化性丘疹20年,全身皮肤色素异常伴暗红色斑,破溃5年。曾因“脑囊虫病”间断服用“囊虫丸”10年,皮肤科
这里论述了应用遥感图像和数字高程模型(DEM)的融合技术,对在西部高原区机场建设(昆明小哨机场)研究区进行三维可视化处理的技术方法。在3S(RS、GIS和GPS)技术支持下,对遥感图像进行
不平衡数据分类经常面临样本严重不平衡、少数类样本分类精度低的问题,随着数据规模增大,分类效率也成为了瓶颈问题.针对以上问题,本文结合spark高效的数据处理能力,提出了一
<正>随着现代化进程的加快,人们的生活理念在不断转变,对物质生活也有了更高的追求,其中最受关注的就是食品安全问题。作为人们的日常生活中的一种特殊商品,粮油与人们生活密
内容型激励是我国税务机构的一种常规激励方式,但激励功能远未得到充分发挥。税务人员组织公民行为在内容型激励对纳税服务质量的促进机制中存在着中介效应。经验性的分析揭
习近平总书记在全国宣传思想工作会议上深刻阐述了新形势下宣传思想工作的使命任务,即“举旗帜、聚民心、育新人、兴文化、展形象”。这为进一步抓好宣传思想工作指明了前进
目的 观察并探讨自我护理模式干预对糖尿病视网膜病变患者视功能生存质量的影响情况。方法 2014年1月—2016年12月期间,将该院眼科住院治疗的糖尿病视网膜病变患者作为研究对
黄曲霉毒素(Aflatoxins)是由某些存在于粮食和饲料上真菌产生的有毒代谢产物,是最常见的一类真菌毒素,它可引起家畜、动物和人类的多种疾病。1960年英国鸡场10万多只雏火鸡在几个月内死
目的探讨杂环齐墩果酸衍生物-阿司匹林缀合物对血清素合成的抑制活性以及促骨形成活性。方法采用高效液相色谱(HPLC)法、酶联免疫吸附测定(ELISA)试剂盒和荧光实时定量聚合酶链反
随着配额的取消,我国纺织品出口面临的竞争将会更加激烈。构成我国纺织企业走向后配额时代的最大内在隐忧在于,纺织业的产业结构的不合理,价低质次的恶性竞争,以及盲目扩张所导致