权重润饰和改进的分类对不平衡数据的处理

来源 :计算机应用与软件 | 被引量 : 34次 | 上传用户:seed_sg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不平衡数据集是指某类样本数量明显少于其它类样本数量的数据集,传统的分类算法在处理不平衡数据分类问题时会倾向于多数类,而导致少数类的分类精度较低。针对文本数据的不平衡情况,首先采用权重润饰(Weight-retouching)的方法进行特征提取,然后采用欠取样(Under sampling)的支持向量机SVM(Support Vector Machine)方法进行文本分类。通过实验发现,使用权重润饰和欠取样的SVM方法可以提高处理不平衡数据的分类精度。
其他文献
目的:通过对急诊手术患者心理状况的了解,有针对性地对患者实施护理干预措施。方法:选取本院2013年5月至2014年5月收治的急诊手术患者198例,对患者手术期各阶段存在的不良心理因
A.O.史密斯,全球优秀的热水器制造商和家庭中央热水潮流领导者,用他长达130年的发展历程证明了重视研发是企业成功发展的原动力。130年来,A.O.史密斯正是凭借着对技术的笃信,
鉴于AIMD算法与TCP良好的兼容性,并考虑到流媒体传输的对流速率变化的平稳性要求。本文在AIMD的算法基础上引入分层多播机制,提出了一种基于RTP/RTCP协议的分层多播拥塞控制算法,从而扩展了AIMD的应用。
俗话说病从口入,前一段时间PVC保鲜膜致癌、天绿香事件闹得满城风雨,人人自危。环视家中,还有什么危机潜伏在不知名的角落虎视眈眈?从厨房到客厅, 除了各种各样的食物以外,几
作为一个特殊的患者群体,老龄患者在临床治疗过程中,经常需要进行麻醉处理,但由于老龄患者身体素质较差,很容易引发多种并发症,影响患者的生命安全。本文主要阐述了老龄患者临床麻
目的:B超引导下经皮穿刺引流在胰腺假性囊肿治疗中的应用价值,方法:选取本院胰腺假性囊肿48例,将其随机分为研究组和对照组,每组24例,对照组患者采用常规手术方法治疗,研究组患
第一条 为了规范内部审计人员对组织内部控制中的风险管理状况进行审查与评价,根据《内部审计基本准则》制定本准则。
目由勺:分析术中胆道造影在胆道手术中的应用价值。方法对120例胆道手术患者术中均进行胆道造影,其中采取方法一造影90例,方法二造影20例,方法三造影10例。结果:方法一显示胆道残
目的:探讨紫杉醇联合顺铂化疗方案在晚期食道癌治疗中的临床应用价值.方法:本次研究的84例晚期食道癌患者均为我院在2013年9月到2015年2月期间收治,将其按照化疗方案的不同分为
语法制导方法、技术和系统的研究对软件工程研究产生了重要影响。本文详细讨论了面向Java语言的语法制导编辑器JSDE的理论基础、组成结构、基本功能和原型设计 ,本文结果为进一步研究Java语言增量开发环境提供了有价值的参考材料。