核矩阵低秩分解与核空间信息能度量研究及应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:konashu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式分类中的核方法在实际应用中获得了较为成功的应用,其良好的性能在于不仅能高效地对数据间存在的非线性关系进行模式分析,而且核方法本身建立在严格的统计分析基础之上,与线性统计分析方法一样有坚实的理论基础。但是核方法在处理大规模数据分类任务时存在如下问题:一方面,核方法的计算复杂度较高,其算法的设计和求解与训练样本个数有关,且常见的经典算法采用凸二次优化策略,对于大规模数据集,需要较高的时间和空间复杂度;另一方面,由于核空间为高维甚至无限维,其间样本具有多模式、多态性,因此相似性不便于描述。针对上述问题,本文主要探讨了核矩阵的低秩分解和核空间的相似性测度。一是从特征选择和矩阵分解的角度考虑如何学习较优的低秩近似核矩阵。二是从基于距离的度量来考虑核空间中高维数据的特性。在此基础上,结合已有算法分别进行了比较分析,用基于核矩阵低秩分解与信息能度量的核方法实现高维多模式对象的特征提取和模式分类,实验结果验证了算法的有效性。总的来说,本文的主要工作包括如下五个方面:1.针对核矩阵分解算法时间复杂度较高的问题,研究了如何对核矩阵进行低秩分解。常用的矩阵低秩分解算法均可以视为无监督算法,本文通过分析核矩阵中行/列与类别的相关性,结合已有的矩阵分解运算,提出了有监督的核矩阵低秩分解方法,最后给出核矩阵低秩近似误差界的期望值。实验证明核矩阵分解过程中,行/列的选取对分类效果有较大影响,在保证分类性能的前提下,本文算法能在一定程度上提高核机器学习效率,为大规模数据集中的应用奠定了良好的基础;2.核方法在低维数据中已经取得了较为成功的应用,然而在高维数据中,由于数据包含更为丰富的内在结构,因此常用的相似性测度如欧氏距离面临分类效果较低的困境。通过研究非距离的度量问题,提出了新的信息能度量,该方法满足距离的度量公理,且不仅适用于低维数据,同时可以有效挖掘高维数据中的相似性结构,实验结果验证了该相似性测度的正确性;3.研究了核空间中的特征提取问题。基于提出的信息能度量,结合梯度上升方法,提出了新的特征提取算法。该算法在应用于大规模数据集时,可以采用核矩阵的低秩近似分解来有效降低运算复杂度,且无须预先进行特征选择。同时信息能的梯度信息可以描述特征的聚集趋势,有利于指导分类任务;4.基于提出的信息能度量,通过研究已有的最近邻算法和其核化形式,对其进行改进,提出了新的核k-最近邻算法。该算法有效结合了近邻法和核方法的特性,有较好的物理意义,且能由此模型推出经典的互信息度量,因此具有良好的理论基础和推广能力;5.对已有的细胞表型图形态差异学习算法进行核化,提出新的基于信息能度量的核形态差异学习算法,并设计了一系列最优参数选择方案,保证了实验效果,为核方法在该领域的进一步应用奠定了基础。
其他文献
空气净化器主要有3种运行工况——试验工况、引入新风的循环工况和室内自循环工况。分析表明,洁净空气量作为空气净化器的常用评价指标,不能准确反映这些工况下的净化能力,会
王玉池先生是河北省辛集市人,1931年生。1956年入中央工艺美术学院学习装饰绘画。1962年到中国美术研究所从事美术理论研究工作。1974年随中国美术研究所合并至中国艺术研究
<正>1病例患者,男性,26岁,农民。因控制不住想不必要的事情,不能摆脱3月余,于2012年10月11日就诊。患者于2012年7月无明显诱因地出现失眠,反复想不必要的事情,明知没有必要,
为了研究指标无量纲化方法对熵权法评价结果的影响,以期刊学术影响力评价为例,采用熵权TOPSIS法,对比分析了标准化和均值化两种方法对评价结果的影响。结果显示,两种方法所得
目的:探讨舒适护理在腹腔镜胆囊切除术(LC)患者围手术期中的应用效果。方法:对160例LC患者随即分为试验组与对照组各80例,分别给予舒适护理与传统护理,比较两组患者的舒适度及护
1 病历摘要病例1:患者,男,22岁,司机。开卡车与树相撞,造成左小腿严重骨折和大片皮肤撕脱、胫前肌肉碎烂,到沈阳某医院用外固定架固定,小腿肌肉和皮肤清理后缝合。之后出现软组织坏
融资融券由于具有做空功能成为市场期盼的一大利好,证监会将于近期启动证券公司融资融券业务试点工作。本文从融资融券业务的背景,利好与利空,风险管控角度对其展开论述。
在图像分割领域中,图像中噪声的压制、弱边界的有效识别和拓扑变化的处理至关重要。基于曲线演化理论的测地线活动轮廓(Geodesic Active Contour-GAC)是当前流行的技术方案之