基于类权重的模糊不平衡数据分类方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户：x_men_123

【摘要】

：

针对现有分类算法通常对不平衡数据挖掘表现出有偏性，即正类样本（通常是更重要的一类）的分类和预测性能差于负类样本的分类和预测性能，提出一种不平衡数据分类方法。该方法通过一

【作者】

：

薛贞霞张素玲刘三阳

【机构】

：

西安电子科技大学应用数学系,河南科技大学数学系,焦作大学基础部

【出处】

：

计算机科学

【发表日期】

：

2008年11期

【关键词】

：

不平衡数据类加权模糊隶属度分类算法 Imbalanced data set Weighted-class Fuzzy membership Clas

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对现有分类算法通常对不平衡数据挖掘表现出有偏性，即正类样本（通常是更重要的一类）的分类和预测性能差于负类样本的分类和预测性能，提出一种不平衡数据分类方法。该方法通过一个超球面将两类数据以最大分离比率分离，并且引入类权重因子和样本模糊隶属度，同时考虑了不同类的重要性和不同样本对该类的不同贡献，从而提高了不平衡数据中正类的分类和预测的性能以及整体的推广能力。分别在人造数据和UCI真实数据上进行了实验，结果验证了该方法的有效性。

其他文献

买蔬菜禽类的食品安全常识

白菜、青菜、鸡毛菜、黄瓜、芥菜、甘蓝、菜豆等易出现农药残留量超标现象，而青椒、番茄、葱蒜、洋葱、豆角类等蔬菜不易出现农药残留量超标。小麦、大豆和玉米容易积累重金属

期刊

安全常识蔬菜农药残留量食品禽类超标现象吸收积累重金属

中国成立技术服务机构应对国际贸易技术壁垒

首批19家“出口商品技术服务中心”6月6日在京挂牌成立，专门负责跟踪、分析国际市场的最新技术准入条件，帮助国内企业跨越国际贸易技术壁垒并就国际贸易规则的制定向政府提供建

期刊

贸易技术壁垒国际市场服务机构中国国际贸易规则服务中心出口商品最新技术国内企业

《计测技术》2008年第28卷第3期目次

期刊

面向内容的三维模型数据库设计及其检索系统的实现

目前,对基于内容的三维模型检索的研究主要集中在检索过程所涉及到的算法方面,而对三维模型库的设计研究较少。为此,详细分析了面向内容的三维模型库的建立过程,重点论述三维

期刊

三维模型库分类表三维模型检索面向内容3D model database Classification hierarchy 3D model retr

一种基于虚拟日志的数据复制解决方案

本文从实际应用的角度出发，为数据库系统设计并实现了一种基于虚拟日志的高可用性的复制解决方案。采用一主多从模式（Single Master，Multi Slaves），使用异步分发技术，实行延迟远程

期刊

数据复制一主多从模式异步分发虚拟日志Data replicationSingle masterMulti slavesAsynchronousV

基于混合遗传算法的工作流重构研究

随着知识抽取、数据挖掘等技术的兴起，基于日志的企业流程重构引起了学术界和工业界的高度重视。本文针对目前重构算法大都采用本地策略因而无法保证最优挖掘以及算法对噪声不

期刊

活动依赖关系度量工作流重构模拟退火混合遗传算法Activity dependency metric Workflow reconstruction

计算机技术在药品检验管理中的应用

随着计算机技术的飞速发展及信息时代的来临,计算机在管理工作中的应用越来越普及。药品检验所是国家对药品质量实行技术监督检查的法定机构,是国家药品监督保证体系的重要组

期刊

计算机药品检验应用

达梦数据库Web服务技术研究

本文提出了一种将数据库同Web服务技术相结合的方法，一方面使得数据库可以将其存储的数据以Web服务的形式提供给外部使用，另一方面也可以在数据库内部直接使用SQL语句或存储过

期刊

WEB服务数据库面向服务体系结构Web service Database management system Service oriented arc

动态服务聚合流程定义元模型及其应用

适应Web服务的动态变化性是流程驱动的服务聚合研究的一个重要内容，传统的工作流建模思想必须加以改进以适应这一新的应用需求。本文引入了服务结点和服务群的概念，从服务聚合

期刊

动态服务聚合流程建模流程定义元模型扩展工作流网WSCP/R-netDynamic Web services composition Process

单体型组装问题计算模型的比较与分析

单体型检测在遗传病基因的定位、药理反应的研究、个体识别等方面有极其广阔的应用前景。单体型组装问题指如何利用个体的基因测序片断数据,根据不同的优化准则确定该个体单体型的计算问题。对MSR,MFR,MEC,WMLF,MEC/GI等单体型组装模型做了详细的分析比较,得出了如下结论:在没有引入测序误差情况下,上述模型的重构精度基本一致。随着测序误差的增加,MEC/GI模型的容错性最好,重构精度最高;MSR

期刊

单核苷酸多态性基因型单体型NP难问题Single-nucleotide polymorphismsGenotypeHaplotype NP-har

基于类权重的模糊不平衡数据分类方法

其他学术论文