多核分类器性能优化方法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:zhouxiaoqing1003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类器的核化构造了一个特征空间,在这个特征空间中,原本线性不可分的样本更容易被正确分类。特别是多核的引入,使得分类器从多个不同的角度对数据进行刻画。相比单核分类器,多核分类器对异构数据的描述更加全面,对核参数的敏感度更低,因此,更容易得到较好的识别率。但是,核化过程通常是一个从低维空间到高维空间的映射过程,因此,时间和空间复杂度一直是多核分类器两个棘手的问题。本文的研究重点是多核分类器性能优化,旨在尽量不损失分类精确度的同时降低多核分类器的时空复杂度。在文中提出了两种不同的多核优化算法,约简型多经验核分类器(Reduced multiple empirical kernel learning machine, RMEKLM),该算法基于经验核映射,通过对映射函数进行降维达到性能优化的目的;代价敏感的多视图分类器(Cost-sensitive multi-view learning machine, CMVLM),该算法基于隐性核映射,从多分类器组合的角度优化多核分类器的时空复杂度。本文的贡献主要归纳为以下几点:1. RMEKLM将数据集从输入空间映射到由一组标准正交基构成的正交子空间中。相较于原特征空间,该子空间的几何结构直观,降低了映射维度,从而降低了时空复杂度。另外,RMEKLM使用高斯消元法提取原特征空间的一组基,该方法能最大限度地保留原特征空间的信息,并且收敛速度快。2. CMVLM提出了一种新的代价——视图代价(即核空间代价),与现有的类依赖代价和样本依赖代价不同,这个代价是视图的计算代价。通过将每个视图的代价与其判别散度结合,CMVLM可以度量它们对最终组合分类器的贡献。最后只保留代价较低,判别散度较大的视图进行训练和测试,从而有效地降低了时空复杂度。另外,这个方法可以被广泛应用到多种多核模型中,而不局限于本文所使用的多核模型。在实验中,本文将这两个算法与几种较成熟的多核和单核分类器进行了分类精度和时空复杂度的对比,验证了所提算法的有效性和高效性。
其他文献
物理不可克隆函数(Physical Unclonable Function,PUF)是一种新型硬件安全原语,它利用生成制造中的工艺偏差产生的随机物理特性形成由激励到响应的函数,因而具有生产制造前难以
数据库蕴含着大量信息,可以用来作出各种智能的商务决策。作为新兴的知识发现技术——数据挖掘以及辅助决策工具——决策支持系统已越来越受到人们的关注,它们为人们从大量数据
随着网络技术的迅速发展,越来越多的数据管理系统采用B/S三层架构模式取代传统C/S模式。本课题设计与实现了一个气象数据发布平台,该管理平台实现气象数据的采集,发布,增加,删除等
本超声波测距系统用于移动探雷机器人的探雷框离地高度自动控制。机器人要实现在不确定环境下操作,具备越障功能或自动导航,传感器起着关键的作用。本系统除了要测量探雷框离地
随着互联网的飞速发展,信息安全成为影响互联网应用最严重的问题之一。入侵检测是信息安全防护体系中的一个关键环节,研究网络入侵模式分析对促进网络技术的进步、进一步提高网
高速缓存一致性协议是弥补多处理机计算机系统中处理机和存储器速度差距的有效方法。随着片上多处理机(ChipMulti-Processor)或多核处理机(Multi-core Processor)结构的出现,
当半导体技术进入0.25um工艺节点时,IC设计流程第一次走在了工艺的前面.从那时起,设计开始逐步掌控着集成电路工业发展;随着工艺的摩尔定律持续进步,要求芯片最小特征尺寸按等比例
心血管疾病是威胁人类生命健康的重要疾病之一,其患病率和死亡率呈逐年上升趋势。80%以上心血管病人伴随并发性心律失常现象,而心律失常是诱发心脏病和心脏猝死的一个高危风
在实际的软件开发过程中,由于受到时间、成本、资源等方面因素的限制,往往不能实现所有客户需求,因此必须从客户需求中选出一部分来实现。需求优先级排序能有效地帮助项目经理解
随着经济的发展和信息科技的进步,电子商务逐渐成为当今业务贸易的趋势。快递行业作为近来新兴的行业,更是得到了飞速的发展,其对信息处理的要求也越来越高[1]。然而,快递行业的