一种去冗余抽样的非平衡数据分类方法

来源 :山西大学学报(自然科学版) | 被引量 : 0次 | 上传用户:kekexil123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
欠抽样是一类常见的解决非平衡数据分类的技术.传统抽样方法(如Kennard-Stone抽样和密度保持抽样)只考虑保持数据分布.已有欠抽样方法侧重抽取分类边界附近的样本,这样抽取的样本可能改变数据的原始分布特征,从而影响分类效果.提出数据冗余度的概念,即如果一个多数类样本处于多数类的密集区且距离分类边界或少数类样本较远,则样本冗余度较高.去冗余抽样(Redundancy-removed Sampling,RRS)采用传统抽样规则去掉多数类中冗余度相对较高的样本.这样的样本子集尽量包含对分类最有帮助的样本和保持原始数据分布,且两类样本数量相对均衡.实验结果表明,经RRS抽样的分类结果的总体精度高于其他抽样方法,尤其在分类精度较低的数据集上.同时,少数类样本的判别精度也有所提高.
其他文献
我国的养老保险制度经历了不同的发展阶段,取得了一定成就,但潜在的问题也在不断地阻碍养老保险制度的发展。本文着重分析了我国城镇企业职工养老保险制度存在的问题及解决这
加入世界贸易组织从长远来看,无论如何都是顺应经济全球化大趋势的正确选择,是中国政府和中国人民在迈入21世纪门槛时的一件奠基之作。不仅可以使我国能够享受到在这个经济联合
【摘要】本文首先简介了土木工程施工技术的重要性和特点,然后介绍三种传统的施工方法和两种新型施工方法,指出新型施工方法的创新点,并分析了其特点,最后对土木工程施工技术的发展进行展望。  【关键词】土木工程 施工技术 新型技术  在土木工程施工技术中,工程实践经验先行于理论,因为有些客观情况过于复杂,很难如实反映室内实验或理论分析,另外只有进行工程实践才能揭示新的问题。土木工程不仅为人类生活、生产提供
目的:探讨不稳定型心绞痛患者通过冠状动脉介入与抗凝治疗的效果.方法:研究对象为我院2015年5月至2016年9月收治的80例不稳定型心绞痛患者,依据不同治疗方法分为对照组与观察
近年来,动漫产业迅速发展,发展动漫教育,培养出市场需求的动漫人才,是推动我国动漫产业前进的重要基石,实施工学结合的人才培养,让学生在做的环境中学,使得学生能更好的掌握
在备受关注的河南“两会”上,来自河南各行业的代表委员为河南发展、百姓利益积极建言献策,圆满完成了河南人民的重托。那么,在本次“两会”上,我们的代表委员提出了哪些关注发展、民生的务实建议?本刊记者选摘部分代表委员的建议和提案,以飨读者。禹宗本:提高新型职业农民素质培训,促进乡村振兴  新型职业农民是促进农业、农村、农民更好发展的强大动力;是实现农业提质增效、农民增收的践行者;是带动农业产业化发展的引
期刊
拉菲尔·以色列利(Raphael Israeli)是近年来对中国穆斯林研究关注颇多的一位以色列犹太学者。在其代表作《穆斯林在中国:文化冲突研究》(Muslims in China:A Study in Cultura
编者按:在深化粮改的进程中,国有粮食企业面对激烈的市场竞争和诸多困难,有的束手无策。坐以待毙,有的盲目出击,四处碰壁。而虎林市绿都集团却以改革为机遇。充分利用有关政策,选准
【摘要】焊接如今已经被广泛应用于钢结构的制作和安装工艺之中。而钢结构焊接的技术水平直接关乎工程的质量。因此必须对焊接技术进行全面分析,并采取有效的焊接技术,以确保不断提高生产效率和钢结构工程质量,降低企业生产成本。  【关键词】钢结构;焊接;技术  钢结构由于具有自重轻、建设周期短、适应性强、外形丰富、维护方便等优点,因此在工程建设中其应用范围广泛。焊接作为构建钢结构的一种主要连接方法,在众多工程
改革开放以来,我国的财政管理事业取得了长足的发展,建立了适应社会主义市场经济要求的财税体制框架,基本形成了一个比较稳定的财政收入增长机制,而财政资金支出管理发展相对