分类中的类重叠问题及其处理方法研究

来源 :管理科学学报 | 被引量 : 0次 | 上传用户:csy355
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
类重叠问题是数据挖掘与机器学习领域的瓶颈问题之一.如果其中还存在类不均衡问题时,情况变得更加复杂.有鉴于此,本文在已有文献基础上归纳了三种类重叠学习算法及提出一种新的方法:分隔法,并首次将支持向量数据描述算法用于实际数据的重叠样本识别,对类重叠问题及其与类不均衡问题的相互影响进行了系统研究.在真实数据上采用五种分类器的实验结果表明:1)多数情况下“分隔法”是表现最佳的类重叠学习算法;2)分隔法通常对基于分界面而非规则的分类器更为有效;3)分隔法在类不均衡问题中表现很好,当基础分类器为支持向量机时尤为突出.
其他文献
目的探究非小细胞肺癌(NSCLC)病人癌组织中反义长链非编码RNA RAB11B⁃AS1(lncRNA RAB11B⁃AS1)的表达水平及其临床意义。方法选取2014年9月至2017年3月在湖南省直中医医院进
目的:探讨MRC矫治器治疗安氏Ⅱ类一分类替牙期错合畸形的治疗效果和临床应用。MRC矫治器将肌功能矫治和错合畸形矫治的理论相融合。通过口周肌群的重新训练和破除口腔不良习
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
[案例]“设计容积最大的纸盒”教学片段教学活动课上,教师出示了这样一道题:用一张长40厘米,宽2喱米的长方形硬纸板,做一只深5厘米的长方体无盖纸盒,这个纸盒的容积最大可能
文章概述了当下政治领导人话语领域知识资源的建设现状,在数字人文视域下提出了一个基于时空场景语义的政治领导人话语文本资源框架,详细描述了该框架的4个层次和具体功能,并
合金材料是近年应用比较多的材料,钴镍合金具有很多优良的性能.本文对其进行制备和性能的测试,以期得到新的应用.以乙酸钴和乙酸镍的水合物为原料,按一定的配比用还原法制备钴镍合
通过对宁夏高职院校图书馆数字资源建设情况及数字阅读服务现状的调查,分析了宁夏地区高职图书馆数字阅读服务开展的情况及面临的问题,探讨了高职图书馆今后数字阅读服务的路
目的:分析非布司他联合别嘌醇治疗痛风性肾病的临床效果。方法:将我院收治的66例痛风性肾病患者随机分为对照组与观察组各33例,对照组采用别嘌醇治疗,观察组给予非布司他联合
在我国,地下水作为重要饮用水水源深受重视,地下水中硝酸盐和铬盐污染物共存现象十分常见,严重影响到人类饮用水安全。目前针对硝酸盐和铬盐的研究主要集中在两种污染物单独