基于聚类与流形正则化的分类方法研究

被引量 : 0次 | 上传用户:Green__lucky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类器设计一直是模式识别领域研究的重要课题之一。近十年来,随着统计学习和核函数理论的深入研究,涌现出许多新方法。这些理论和方法较好地解决了模式分类中的局部最优、过拟合以及维数灾难等问题。然而,在以支持向量机为代表的核分类方法的基础上,近年来又涌现出了一些新的研究热点,这些新的热点往往是传统模式分类方法存在的弊端,例如,海量高维数据的分类、类重叠和噪声干扰下的数据分类、多标记数据分类、类不平衡数据的分类、非线性分类中的核函数(矩阵)优化以及非线性快速分类等等。在此背景下,本文主要从快速鲁棒聚类算法、不平衡样本的分类、核优化、基于流形正则化的快速半监督分类等几个方面进行深入研究,提出了解决类不平衡、核优化以及快速分类的新方法。论文的主要研究工作包括以下四个方面的内容:(1)针对实际应用中样本重叠以及噪声干扰问题,提出了一种基于样本加权的可能性模糊聚类算法和一种鲁棒可能性模糊核聚类算法。第一种聚类算法主要解决近似线性可分问题,算法通过为孤立点或噪声点赋予较小的权重缩小典型值的收敛范围,减小其对聚类的影响。在分析算法收敛性的基础上,证明了其具有比传统IPCM(Improved Possibilistic C-Means)算法更快的收敛速度,在有效降低时间复杂度的同时能够取得较好的聚类准确率。第二种聚类算法主要解决线性不可分问题,同时,为解决无监督条件下的核函数参数选择问题,提出了一种核函数参数优化方法。因此,所提出的聚类算法不仅可以同时处理线性不可分和部分重叠数据集,而且具有更强的鲁棒性,在噪声干扰下能够取得较好的聚类准确率。(2)针对实际应用中正负样本数量分布不平衡分类问题,基于两种鲁棒聚类算法,建立了可能性模糊支持向量机(Possibilistic Fuzzy Support VectorMachine,PFSVM)模型,提出了基于可能性模糊聚类的不平衡数据分类方法。所设计的分类器较好地解决了分类中的类不平衡、孤立点和噪声干扰问题,通过鲁棒聚类算法为训练样本分配模糊隶属度和典型值,减小了孤立点和噪声对SVM的分类精度以及泛化能力所造成的影响。(3)针对多核学习效率较低以及需要预先定义一组核函数等缺陷,建立了无监督非参数核学习模型,该模型易于拓展至有监督学习。提出了非参数核学习分类方法。该方法通过对多核学习优化问题进行放松,使其可以转化为一系列的稀疏特征值分解子问题,每次迭代中只需进行闭合解的计算,从而提高了核学习的性能和效率。所建立的模型通过把谱核学习和间隔最大化标准进行有机结合,充分利用了数据的低维流形结构,增强了决策函数的光滑性,同时可以有效利用未标记数据进行最大间隔分类。实验验证了非参核学习的有效性,在有监督和无监督情况下,提出的非参核学习方法的性能均优于多核学习方法。(4)为解决半监督快速学习问题,建立了扩展的流形正则化框架E-MR(Extended Manifold Regularized Framework),提出了推广的决策函数表示定理、单输出极速学习机与流形正则化框架关系定理和多输出极速学习机与流形正则化框架关系定理。这些定理为快速半监督分类模型和算法的提出提供了理论依据,表明所建立的流形正则化极速学习机模型(Manifold Regularized ExtremeLearning Machine, MRELM)是E-MR框架的一个特例,其本质是随机地离散化核函数。因此,所提出的算法是传统核分类的近似算法。MRELM继承了ELM无需调整模型参数的优点,能够为不同的学习任务提供统一的解析解。实验结果验证了MRELM算法的有效性。本文研究的内容主要涉及到了不平衡数据分类方法、基于非参数核优化的分类方法以及快速半监督分类方法三个方面的相关研究内容。在研究了相关前期工作的基础上,建立了多种分类和学习模型,提出了新的学习算法,并使用标准数据集和多个人脸数据集对算法进行了测试。通过和相关算法进行对比,进一步验证了本文提出算法的有效性。本文的研究成果将丰富分类问题的解决途径,具有一定的理论意义和较好的应用前景。
其他文献
随着社会经济的迅速发展,我国能源供给不足与环境污染问题日益凸显。因此地下水源热泵这种绿色节能的空调技术应运而生。该项技术虽然在我国的起步较晚,但发展较为迅速。鉴于它
《缺席的人》和《老无所依》两部电影是美国著名导演科恩兄弟不同年代的作品,也是尽展黑暗元素、充满幽暗意识的黑色电影。然而因导演不同的叙事风格和视觉诉诸导致两部电影
近年来市政道路非开挖施工技术发展的很快,但是小尺寸(600 mm以下)非开挖钻孔技术存在着诸多问题。文章基于仿生学原理,通过对穿山甲开挖空洞作用机理的研究,研究构建了一
<正> 十多年来我们在临床上采用半夏白术天麻汤加减化裁,治疗结核性脑膜炎,收到了满意的效果。现将随访观察治愈后五年以上者7例,简介于后。一、一般资料:(附表)患者姓名初诊
借鉴建筑结构火灾损伤评估的研究成果,根据钢筋混凝土桥梁自身特点,综合运用一些常用的检测手段,提出了一套合理的混凝土桥梁火灾损伤鉴定和修复的方法,以某在建悬索桥为例,
在全球变暖、能源短缺、环境污染等问题愈演愈烈的背景下,低碳经济这一绿色经济发展模式引来了越来越多的关注,如何适应低碳经济的要求成为了各个国家、企业所面临的一个重要研
为了满足诸多工程应用对时间间隔测量多通道、大量程、高精度的要求,研究了多通道精密时间间隔测量和量程扩展的方法,研制了多通道精密时间间隔测量系统,对系统做了误差分析和校
油田结垢问题随着油田含水的增加和注水强度的提高变得越来越突出。油田结垢不仅影响油田的原油产量、运转寿命,也影响油田安全生产。通过对纯梁采油厂梁南管理区的集输管线垢
伴随多媒体技术和数字信号处理技术的迅猛发展,以及对心理声学研究的不断深入化,人们在对视频回放效果要求达到逼真的同时,对音频回放效果也提出了更高要求,“临场感”倍受关注,虚
城市快速路是城市道路网的主骨架和主动脉,并且以其“快速”大容量的交通功能满足城市持续发展,但是近几年来快速路交通拥挤问题日益突出,严重影响了城市交通效率的发挥。造成快