基于不平衡数据样本特性的新型过采样SVM分类算法

来源 :控制与决策 | 被引量 : 0次 | 上传用户:lzm8020117
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统采样方式准确率与鲁棒性不够明显,欠采样容易丢失重要的样本信息,而过采样容易引入冗杂信息等问题,以UCI公共数据集中的不平衡数据集Pima-Indians为例,综合考虑数据集正负类样本的类间距离、类内距离与不平衡度之间的关系,提出一种基于样本特性的新型过采样方式.首先对原始数据集进行距离带的划分,然后提出一种改进的基于样本特性的自适应变邻域Smote算法,在每个距离带的少数类样本中进行新样本的合成,并将此方式推广到UCI数据集中其他5种不平衡数据集.最后利用SVM分类器进行实验验证的结果表明:在6类不平衡数据集中,应用新型过采样SVM算法,相比已有的采样方式,少(多)数类样本的分类准确率均有明显提高,且算法具有更强的鲁棒性.
其他文献
党的民族政策,是不断总结完善的自始自终一贯推行的符合中国国情的一项基本政策,它充分体现了党的民族平等、民族团结、共同繁荣、共同富裕的基本思想,实行民族优惠政策,也是
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
高科技的时代发展方兴未艾,其带来的影响是双向的,未来会是一个风险社会,高层次分工合作的各个职业背后依赖的是从业者必须高度负责的履行注意义务和提高注意能力,一旦其疏忽大意或过于自信而违背了业务职责或者业务规范要求,由业务过失犯罪引起的各种重大事故就会严重危害社会。总则没有对业务过失犯罪系统定义,在分则中设置了部分罪名,但司法实务中业务过失犯罪应如何认定并没有形成统一的标准。因此,对比业务过失犯罪的相
近年来,在住房政策日益严控的形势下,原本涌入住房市场的投资需求一部分分流到投资商业地产,商业地产终于等到了难得的发展机遇。但是,与普通住宅相比而言,商业地产在资金、
建立以提高专业素质,培养学习能力,加强沟通以及团队协作能力为目的的新教学模式是目前妇产科学教学改革的目标。通过PBL教学案例的选择、Seminar课堂设计来构建PBL教学与Sem
刺榆(Hemiptelea davidii)是荨麻目榆科的一种单属植物,为我国濒危植物。刺榆不仅是优良的固沙和防护林先锋树种,对区域生态系统功能的维护和生物多样性保护的保护也具有重要意义。然而,刺榆分布范围较为局限,仅在我国东北、华北等省区少量分布,在科尔沁沙地内形成群落。同时,盐碱土区的不断扩大将对植物生长生理造成不同水平的破坏。这些不利条件对刺榆的种植和推广造成了巨大的困扰。为了可持续利用这一
我国社会发展状态在经济全球化的趋势下逐渐呈现出动力不足的现象,特别是作为国民生产重要支柱的工业企业,面临着巨大的发展困难和挑战。因此,本文针对工业企业管理创新的新
为确保中医诊断的正确性,除了要求单诊信息的准确性和客观性外,更重要的是四诊合参。中医四诊信息客观采集和分析系统的研究不断取得突破,为开展四诊客观信息的融合研究奠定
将零售商的公平偏好行为引入到供应链定价决策模型中,针对零售商存在不利的不公平分配和有利的不公平分配两种情形,并且每一种情形又分为制造商考虑和不考虑零售商公平偏好这两
目的 探讨Seminar教学法联合案例教学法在重症医学规范化培训中的应用效果。方法 选取103名在新疆医科大学第一附属医院重症医学科进行住院医师规范化培训的学员,将其随机分