基于尺度化凸壳的最大间隔分类方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:leonontop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以SVM为代表的最大间隔机器学习方法,因为具有简洁的数学形式、直观的几何解释和良好的泛化能力,在模式分类、数据挖掘等领域受到越来越多的关注。本文受压缩凸壳思想的启发,提出了一种新的用最大间隔思想构造线性不可分问题分类器的方法——尺度化凸壳(Scaled Convex Hull,简记为SCH)方法。该方法可以把求解线性不可分问题转化为求解两类样本分别生成的SCH间的最近点对的问题。通过使用核技巧,该方法还可以用于解决非线性分类问题。首先,给出了SCH的定义,证明了与其相关的一些性质,这些性质从理论上保证了在采用SCH构造分类器时的推广能力。SCH的大小是由尺度因子控制的,因此,通过不断地减小尺度因子,两个SCH不断缩小直至可分。然后,就可以通过计算几何中已有的成熟的最近点对算法,求解SCH间的最近点对,把垂直平分连接最近点对线段的超平面作为线性不可分问题的分类超平面,其对应的分类器称为基于SCH的最大间隔分类器。这种构造分类器的思想和用压缩凸壳构造SVM最大间隔分类器的思想是一致的,因此,该方法也可以看成是一种变形的SVM方法。SCH方法改进了压缩凸壳方法的不足之处,这是因为SCH与原凸壳有相同数量的顶点,这就给求解最近点对提供简单的方法,并且求解最近点对的复杂度与尺度因子无关。此外,SCH的形状不随尺度因子的变化而变化,这也是称之为尺度化凸壳的原因。其次,介绍了求解最近点对的三种计算几何算法,即Gilbert算法、SK算法和MDM算法,把这三种算法应用到SCH最近点对的求解中去。并与压缩凸壳的情形下的三种算法进行了计算复杂度的对比分析,说明了SCH方法的优点。再次,SCH方法还可用于解决类不平衡问题。一般地,对于类不平衡问题,正类样本数较少,生成的凸壳相对也较小,而负类点生成的凸壳较大,在这种情况下,得到的分类面会倾向于误分正类样本。而利用本文提出的SCH方法,通过不同程度的缩小两个凸壳,则可以解决这个问题。即对于负类点的凸壳,赋予小的尺度因子,而正类点的凸壳,则赋予大的尺度因子,这样得到的正类SCH和负类SCH大小基本一致,然后把垂直平分两个SCH的超平面作为分类面。用类似的方法,通过赋予不同的SCH以不同的尺度因子,本文提出的方法还可以解决代价敏感问题。最后,通过建立SCH和最小闭球问题之间的关系,本文把求解SCH分类器的问题转化为求解最小闭球问题。然后,利用现有的求解最小闭球的快速算法,可以求解大规模的SCH分类问题。
其他文献
以国家示范性(骨干)高职院校内涵建设为契机,在“工学研融合”高职技术技能人才培养体系创新的背景下,对“专业导师制”教育教学改革开展深入研究与实践。通过分析“工学研融合”
欧洲议会全体会议于日前通过了一项非立法性决议,反对承认中国市场经济地位.对此,中国商务部立即回应,根据《中国加入世贸组织协定书》第15条规定,世贸组织成员应于2016年12
描述逻辑是一种基于对象的知识表示的形式化工具,在众多知识表示的形式化方法中,它越来越受到人们的特别关注,尤其是随着本体和语义Web研究的不断升温,作为本体语言和语义Web
乳腺癌是女性最常见的恶性肿瘤之一,其发病率在全球呈上升趋势,每年以0.2%~8%的幅度上升,并有年轻化趋势。肿瘤的转移和复发是导致患者死亡的主要原因。当肿瘤局限在乳腺中时,其治愈
先天性鱼鳞病(congenital ichthyosis)是一组常染色体隐性或显性遗传性皮肤脱屑性疾病,临床表现为皮肤发硬和脱屑,组织学上表现为表皮增生和角化过度,有的类型出现颗粒样皮层。在
自复方维生素注射剂应用于临床以来,鲜有严重不良反应见诸报道。笔者科室近年来在临床上使用复方维生素注射剂(本科使用药商品名为若维,系江西钟山药业生产,分别为不同批号)静脉滴
目的建立中药龙齿中有效成分CaCO3含量测定的方法。方法利用络合滴定法(配位滴定法)乙二胺四乙酸二钠(EDTA)与钙离子的反应。结果以此测定方法对龙齿的含量进行测定,平均含量为90.9
日前,国家发改委、国家能源局印发《能源技术革命创新行动计划(2016-2030)》(以下简称《行动计划》),明确我国能源技术创新的总体目标和主攻方向,提出15项重点任务,同时发布的《
一排排标准化的猪舍里,一头头皮红毛亮的生猪正在争食着定量供应的黄心菜,待黄心菜点滴不剩时,调换胃口的颗粒状饲料接着上来了。这是笔者在正阳县油坊店乡贺寨村计生协会副会长
自开展大检修以来,锦州石化对中间罐区实行升级管理,按在线运行标准严格管控,加强监督检查,以确保大修期间罐区安全平稳运行.大检修期间,因罐区仪表断电,操作间无法显示罐区