基于矩阵的2D度量学习和空间结构化欧拉核的研究与应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户：yuwenhuaji11987

【摘要】

：

度量是机器学习领域中的热点问题之一,很多机器学习算法的性能都严重依赖于数据的度量(如KNN算法)。度量学习作为一种学习与特定任务以及数据相关的度量方法已被广泛用于分类

【作者】

：

刘爽

【机构】

：

南京航空航天大学

【出处】

：

南京航空航天大学

【发表日期】

：

2016年期

【关键词】

：

2D算法 2D度量学习核方法空间结构信息欧拉核图像欧氏距离

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

度量是机器学习领域中的热点问题之一,很多机器学习算法的性能都严重依赖于数据的度量(如KNN算法)。度量学习作为一种学习与特定任务以及数据相关的度量方法已被广泛用于分类、聚类和信息检索等领域。随着机器学习理论的发展和学习任务的复杂化、多样化,度量学习也取得了众多成果并形成了一个庞大的框架。但这些算法大多是基于向量的1D算法,当处理具有结构的矩阵数据时也要将其向量化后进行处理,这就忽略了矩阵数据内在的空间结构信息。为了利用数据内在的空间结构信息,最直接的方法是直接使用矩阵数据进行计算,即基于矩阵的2D算法。自Yang等人将向量主成分分析(1D-PCA)推广至面向图像的2D-PCA以来,众多基于向量的1D形式算法已经被相继推广到其对应的2D形式。虽然从宽泛的角度上来说已经出现了一些2D的度量学习算法,但这些已有的2D算法并不具有通用性,而且度量学习中比较经典的基于成对约束的全局度量学习算法仍然没有其相应的2D形式。本文在基于成对约束的全局度量学习算法的基础上提出2D度量学习算法。其主要特点是利用矩阵数据进行计算,并通过结构化的度量矩阵体现矩阵数据的空间结构信息,并通过实验证明,其在处理图像数据时获得了较原1D方法更好的性能。另一方面,相比传统1D算法,尽管2D算法在处理矩阵数据时取得了较好的结果,但仍有其不足。主要表现在：(1)2D算法几乎都是线性的,因此对非线性数据处理的能力有限；(2)2D算法的空间结构信息利用仍不够充分。本文针对不足(1),通过核方法进行改进,但相对于1D算法,2D算法因难以利用表示定理而导致核化困难,因此本文绕过表示定理,通过改变度量获得一个简洁的核化方法。本文针对不足(2),通过在核空间对空间结构信息进行补偿的方式来缓解。但这需要在核空间中描述矩阵数据的空间结构,如果使用隐式核进行核化会导致矩阵数据空间结构可能的扭曲,从而使对空间结构信息的描述和利用变得困难；如果使用显式核进行核化,会导致维数灾难而失去隐式核的优势。因此本文采用一个显式、等维且各分量非耦合的映射,从而自然地描述出矩阵数据在核空间中的结构。并且幸运的是存在众多符合以上要求的显式核(如1Bellinger核和欧拉核)和隐式加性核(如Intersection核、JS核和χ2核)的近似显式形式。本文以欧拉核作为样例,首次尝试将矩阵的核化及其在核空间的空间结构信息补偿。尽管存在若干空间结构信息的补偿方法：空间结构信息约束,图像距离度量等,本文围绕现有的图像欧氏距离加以阐释,从而为矩阵数据构建出对应的空间结构化欧拉核。并通过实验证明其有效性。

其他文献

基于机器学习的microRNA基因预测

microRNA是一种单链的非编码小分子RNA,长约20-24个核苷酸,它由长度约为70个核苷酸的microRNA前体(pre-microRNA)经过具有RNaseIII活性的Dicer和Dicer-like-1内切核酸酶加工

学位

microRNApre-microRNA支持向量机蚁群算法分类

基于计算机协同设计(CSCD)的建筑设计管理平台的研究与实现

随着CAD技术的不断发展，以网络化、多媒体化和智能化为特征的现代信息技术在勘察设计领域的广泛应用，基于计算机的系统工作(Computer SupportedCooperative Work，CSCW)，引起了工

学位

计算机协同设计建筑设计任务分配图纸资源管理AutoCAD二次开发管理平台

高职院校图书馆知识服务的数据挖掘设计与实现

21世纪是信息和知识的世纪，进入21世纪以来出现了以知识为主题的新研究方向，推动了网络信息技术向更高层次发展。目前，数据挖掘和知识发现已成为计算机科学和应用技术科学的一个

学位

高职院校图书馆知识服务数据挖掘聚类算法

多模态特征选择及其在脑疾病分类中的应用研究

最近几年,随着医学影像技术的成熟和发展,基于这些神经影像技术的图像数据提取人脑的全脑结构与功能连接模式,用于脑疾病的预测和诊断,已经成为新的研究热点。通过运用机器学

学位

脑疾病多任务特征选择多模态分类判别性正则化组稀疏正则化有效距离

面向QoS保证的软件定义网络资源管控技术研究

随着网络规模的急剧膨胀和网络业务类型的日益多元化发展,一些新型网络应用如视频会议、VoIP、远程教育等对网络资源的需求越来越高,现有的网络体系架构在满足应用请求的同时

学位

QoSSDNOpenFlow路由算法网络资源虚拟化

基于OLAP的物流公司业务数据分析构建

物流行业作为一个新兴的行业，正处于蓬勃发展的时机。物流公司的业务支撑系统中逐渐累积了大量的数据，简单报表工作已经无法满足公司管理层对于数据分析的需求。公司管理层迫切

学位

数据仓库联机分析处理业务数据分析系统物流公司

基于.NET的开放教育课程管理信息系统的设计与实现

在开放教育这种分散式的学习模式下，教学管理工作是保证良好教学质量最重要的一个环节，教学管理是否到位直接关系着教学的质量。为配合中央电大“课程超市”的服务理念、提高天

学位

开放教育课程管理管理信息系统.NET技术

基于模糊聚类的数据库空值估计研究

随着数字时代的来临,数据的存储和处理工作越来越得到重视。数据挖掘技术作为一种数据处理方法需要对数据进行有效的预处理,而预处理过程中对存储在数据库中的缺失数据进行推

学位

关系数据库模糊聚类空值表间关联信息多元线性回归

嵌入式操作系统的实时性分析与研究

嵌入式操作系统已经被广泛的应用于各种嵌入式设备,由于嵌入式设备有着数据实时采集、现场控制、高危环境等特殊应用背景,嵌入式操作系统对实时性都有一定的要求。随着嵌入式

学位

嵌入式操作系统实时性LSF调度算法抢占阈值重要度参数云模型

普适计算下多智能体的通信与协作机制的研究

自二十世纪90年代以来，关于Agent和多Agent的系统已经得到许多人的关注和研究。当前对于智能Agent主体，已经由传统的BDI(信念-愿望-意图)逻辑发展到了社会概念的BDI逻辑，这使得A

学位

智能汽车空间多智能协作机制普适计算

基于矩阵的2D度量学习和空间结构化欧拉核的研究与应用

与本文相关的学术论文