基于成对分解策略的层次型多分类算法研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:seanstarseanstar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘等领域的主要研究内容之一,很多问题(如金融证券、临床诊断等)的解决均以它为基础。在现实生活中,许多分类问题中都包含多个类别,但是从设计算法的难易程度来看,二元分类算法更加容易实现,因此,科学研究和生产实践中更多利用此类算法解决多分类问题。该思想不仅可以拓宽二元分类算法的应用领域,而且对于具体的问题,可供选择的算法更加丰富,所以受到人们的广泛关注。文章基于层次结构的集成方法,以“一对一”(One vs.One,Ov O)分解方法为基础,主要对决策有向无环图(Decision Directed Acyclic Graphs,DDAG)、有向二叉树(Directed Binary Trees,DBT)和自适应有向无环图(Adaptive Directed Acyclic Graphs,ADAG)三种主流的层次型多分类算法进行了多角度分析对比,并在此基础上提出一种改进的DBT多分类算法和一种新的节点度量标准。主要研究内容如下:(1)论文从模型结构特征、分类准确率以及运行时间三个角度,对上述三种模型进行对比研究,并得出如下结论:DBT结构灵活,分类准确率高,在类别个数相对较小时性能最为突出,而当类别个数较大时,模型训练时间相对最长;DDAG虽然执行时间最快,但较强的节点部署机制使其性能相对最差;ADAG虽分类准确率和执行时间相对居中,但模型结构的可控性较差。最后,通过在UCI标准数据集上的实验,验证了上述分析结果的正确性。(2)针对DBT模型构建过程中,因二元分类器选择不合理而导致模型分类效果差的现象,本文提出一种基于不平衡因子的有向二叉树改进算法。通过综合考虑样本平衡性和类间隔对二元分类器性能的影响,利用不平衡因子权衡二者之间的比重关系以便适应于数据集中样本分布不均的情形,最终构建出更合理的二元分类器度量标准。经实验验证,利用不平衡因子确定的度量标准可构建出错误率更低、分类效果更优的DBT模型。(3)提出了一种基于Hellinger距离矩阵的新的节点度量标准。Hellinger距离具有计算简单、不易受数据分布不均影响等特点,可作为类别间重叠性的衡量。依据类别间重叠性越小,其可分性越强的节点选择方法,利用该距离可构建出分类性能更优的层次模型,并用实验结果验证了该方法的有效性和可行性。
其他文献
微小液滴在固体表面的动态及热力学行为被广泛应用于微电子散热、防雾、防尘、防霜等领域。近年来,微电子产品和微执行器件飞速发展,一般认为,材料表面的微观特性对液滴的热
饭店行业是我国旅游服务业的重要部分,是我国与国际接轨且开放步伐最快的行业之一。随着我国第三产业比重越来越大,推动了饭店业的快速发展,作为饭店管理者也意识到饭店业之间的竞争归根结底就是人才大战,在高流失率的行业背景下如何拥有稳定且高效率的员工是行业管理者一直都在探索的问题。随着越来越多的女性步入职场,除了能实现经济上独立之外,工作中的成就感也使这部分职业女性赢得尊重与自信。饭店是人力资源密集型产业,
研究目的:应用三维有限元方法,分析牙本质肩领对桩核冠修复下颌第一前磨牙应力分布的影响,探讨完整及不同部位残留的不完整牙本质肩领的患牙进行纤维桩树脂核全瓷冠修复后,余留牙体组织、粘接剂层及纤维桩内部的应力分布情况。研究方法:收集标准下颌第一前磨牙进行CBCT扫描,将采集数据导入Mimics软件进行三维重建,Geomagic Wrap软件处理后通过Solidworks软件建立下颌第一前磨牙纤维桩树脂核
木槿(Hibiscus syriacus L.)是一种集观赏应用、食用和药用为一体的实用价值很高的园林植物。世界上的木槿资源非常丰富,我国大多数品种都是来源于外来引种,缺乏系统的整理,造成同物异名,同名异物的现象很严重。本文对校园中7个木槿品种进行了为期一年的物候期观测,与此同时,针对来自河北、山东、上海、嘉兴四地共41份木槿资源的34个表型性状进行了相关性和多样性分析,并对各个品种资源进行了聚类
环番类化合物的研究工作开展于20世纪50年代,因其独特的几何构型及特殊的性质而被很多化学家关注并进行了广泛的研究,先后报道了含有芳香环的环蕃类、吡啶类、吡嗪蕃类化合物
随着公路建设事业的迅速发展,复杂地质条件下的软土地基沉降现象普遍发生,对车辆行驶的安全性和舒适性造成严重影响的同时也还增加了运营成本和公路及构造物的养护维修费用,
背景自然界中的生命体,大多是由多种分工不同的细胞构成的,群体水平的研究数据会掩盖细胞个体间的差异,错失生命过程中的关键分子机制。如肿瘤干细胞学说认为,肿瘤细胞的转移
2012年,AlexNet在斯坦福大学举办的ImageNet竞赛上取得了远超传统方法的成绩,并以此开启了深度学习的浪潮。时至今日,深度学习已经在各种任务上取得了巨大的进步。在计算机视
本实验选择采用γ-纳米氧化铝对贵金属铑进行分离富集,考察了γ 纳米氧化铝在不同pH值、吸附时间、吸附剂用量和温度条件下对铑的吸附行为并对其吸附机理进行了探讨,确定了最
梯度矢量流模型或者广义梯度矢量流模型在图像应用中被广泛使用,如降噪滤波、边缘增强、边缘提取等,特别是活动轮廓模型和图像分割。而且它在医学图像处理应用中也尤其广泛。