基于可鉴别图嵌入的降维方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:lipurple
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实应用中,高维数据大量增长,因此如何处理高维数据成为模式识别、机器学习中的一个热门研究领域。一方面在现实应用系统中,直接处理高维数据,导致计算复杂度高和存储空间大,甚至会带来潜在的“维度灾难”和过拟合问题;另一方面在高维数据中存在大量不相关、冗余的特征会影响数据的分类。上述两方面说明对高维数据进行降维处理是十分有必要的。降维的目的是找到高维数据的低维表达,其中研究表明图嵌入是降维的有效方法之一。本文提出了三种特征提取方法处理高维数据,主要研究工作和创新如下:(1)在已有的图嵌入方法中几乎没有直接考虑每个样本的几何分布来表示邻接图的权重。事实上,数据特征空间中的每个样本都有不同的几何分布,邻接图中的权重应该由样本的几何位置来确定。为了克服已有方法中存在的不足,提出了一种新颖的方法称作可鉴别全局与局部保持图嵌入方法(Discriminative Globality and Locality Preserving Graph Embedding,DGLPGE)。在DGLPGE中,在构造全局和局部邻接图时,充分考虑了样本的可鉴别性信息和几何分布,目的是保存样本固有的几何结构和可鉴别结构。其中为了进一步提高异类之间的模式鉴别,区分的定义了邻接图的权重。通过邻接图刻画几何保持离散度,采用最大间距准则来构造目标函数,以此保持全局与局部几何离散度更具有可鉴别性。(2)受基于表示的图嵌入方法的启发,分别提出了基于协作表示的局部保持投影(Collaborative Representation-based Locality Preserving Projections,CRLPP)和基于概率协作表示的几何保持图嵌入(Probabilistic Collaborative Representation-based Geometry Preserving Graph Embedding,PCRGPGE)两种方法。在CRLPP中,假设相似的样本经过协作表示重构之后有相似的重构关系,相似的数据经过重构之后在投影子空间中有相似的低维表达。CRLPP使用协作表示进行重构每个训练样本,同时构造包含样本局部结构的邻接图,然后得到目标函数,从而获得高维数据的低维表达。在PCRGPGE中,主要思想是把基于概率协作表示的数据样本重构与构造包含数据鉴别信息和几何信息的全局邻接图相结合,然后得到目标函数,从而在子空间中获取高维数据的低维隐含结构信息。CRLPP和PCRGPGE通过与相关图嵌入方法的实验对比,结果表明是有效的方法。(3)设计并实现了基于可鉴别图嵌入的图像分类原型系统。系统包括需求分析,概要设计和详细设计与实现三个阶段并采用Java及其系列开源框架开发完成,系统主要包括登录、算法选择执行和算法结果展示页面。
其他文献
癌症已经成为威胁人类生命健康的主要疾病之一,高效的基因选择方法可以有效识别和分析基因表达谱中的致病基因,为癌症的预防和治疗提供重要的参考。基因表达谱具有高维度、小
随着工业机器人在各行业的普及应用,机器人编程的质量和效率对提高工作效率越来越重要。在打磨抛光领域,传统的人工示教效率低、难以保证打磨质量,传统的离线编程要求工件一
药物间相互作用(Drug-drug Interactions,DDIs)是指患者服用多种药物,药物的作用可能被其他药物增强或减弱,或发生严重的药物不良反应(Adverse drug reactions,ADRs),是生物
消费群体可能受到不利于企业生产经营的网络虚假信息的影响而放弃购买企业生产的产品,这对企业会造成一定的消极影响。如何降低网络虚假信息对企业的消极影响就显得尤为重要,
经济的快速发展始终建立在企业生产安全的基础之上。行为安全科学具有复杂性的特点,安全问题受到“人、物、管、环”多方面的影响,其中人作为安全问题的主体和客体,其安全意
不可再生化石能源的大量使用,不仅造成了严重的环境污染,而且引发了能源危机。因此新型的可再生能源及能量存储技术逐渐成为材料科学领域的研究热点。超级电容器作为一种通过双电层电容和氧化还原赝电容进行电荷存储的新型储能装置,由于具有高功率密度、优异的循环寿命和快速充放电等优点,而受到研究者的广泛关注。然而,较低的能量密度仍是制约超级电容器大规模应用的瓶颈问题。本论文提出以化学气相沉积(CVD)生长的垂直碳
随着电网规模增加和智能化程度提高,变电站运行管理和控制逐步向集约管控和智能化方向发展,利用巡检机器人来部分或全面代替人工巡检已成为变电站设备巡检的必然趋势。本研究
吸收式动力循环可高效回收利用低温余热及低温热能,吸收器是其核心的部件之一。强化吸收器的传热传质过程可提高吸收式动力循环系统的性能。本文对吸收式动力循环吸收器管内降膜吸收传热传质特性进行数值模拟,主要的研究内容如下:基于CFD软件ANSYS FLUENT,采用VOF模型和CSF模型,研究了不同氨水溶液进口温度、质量浓度,溶液的进口质量流量、冷却水进口温度、液膜与壁面的接触角等操作参数对垂直光管内降膜
精细化天气预报已经成为当前天气预报业务的重点发展方向,数值预报技术的发展带来了空间和时间分辨率都更高的数值预报产品,这为精细化预报的发展提供了必要条件,但精细化预报常常意味着模型复杂且计算量大。温度作为天气预报的基本要素,研究其精细化预报释用方法具有重要的参考价值。为了应对越来越复杂的气象服务需求,必须建立起一个简单且时间分辨率高的单站温度预报释用模型,充分利用数值天气预报产品和观测数据本身的有益