混杂和多输出数据的度量学习方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:z178933143
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的快速发展,医疗保健、多媒体检索和科学研究等领域的混杂和多输出数据量快速增长。由混杂和多输出数据构成的聚类,分类或回归等任务面临着巨大的挑战,有效利用混杂鱼多输出数据的特征计算样本之间的距离或相似性是至关重要的。本文围绕着混杂与多输出数据分类任务的需求,沿着混杂数据度量学习方法和多输出数据度量学习方法展开研究,其主要工作和创新点如下。(1)提出了混杂数据的多核几何平均度量学习。该方法通过不同的核函数分别将数值型数据和符号型数据映射到可再生核希尔伯特空间,同时,将度量学习问题转化为求黎曼流形上的两个点的中心点的问题.为避免过度拟合,优化目标通过对称化的LogDet分歧进行调整。基于几何平均的多核度量学习算法能得到一个封闭形式的解,该算法在精度和效率两方面均优于已存的度量学习方法。(2)提出了一种用于数值型和符号型数据混杂的的支持向量度量学习框架。几乎所有现有的算法都侧重于定义新的距离度量标准,而不是学习混杂数据的有判别性的度量算法。该方法为混杂数据定义了样本对核,然后将度量学习转换为样本对分类问题。所提出的模型可以通过标准的支持向量机求解器有效地解决。为了考虑数值和符号数据的重要性,开发了多核学习模型来学习混合数据的加权度量。混杂数据上的实验验证了提出的度量学习模型的可靠性能。(3)提出了一种新的核回归度量学习框架。由于大多数现有的度量学习方法致力于依赖样本对之间的相似和不相似关系来学习相似度或距离度量。然而,在许多现实应用中,不能简单地将样本对定义为相似或不相似,例如,多标签学习,标签分布学习和具有连续决策值的任务。由于两个样本的关系可以通过决策值的差异程度来衡量,根据样本关系在特征空间和决策空间中的一致性,我们提出的回归度量学习利用决策空间中的样本关系来指导在特征空间中的度量学习。通过这种方式,我们的回归度量学习方法将度量学习作为核回归问题。我们对单标签分类,多标签分类和标签分布学习任务进行了多次实验,实验证明我们的方法对照最先进的方法取得了良好的性能。
其他文献
光学特性参数在模拟精度上起着关键性作用,决定了激光照射过程中薄膜上能量沉积的量.本文采用三种不同的描述激光和材料相互作用过程中金薄膜光学参数的模型对室温状态下金膜
随着经济的发展,环境污染问题日趋突出,构成了对公众健康越来越大的威胁,环境污染对公众健康的影响已成为公众关注的焦点问题。深入研究环境污染对公众健康的影响,对公众健康价值
针对目前广式腊肠中二八肠(肥丁:猪瘦肉,质量比)存在口感粗糙的技术问题,利用亲水性胶体与蛋白质相互作用改善其质构特性。鉴于亲水性胶体的保水性能,存在影响广式腊肠烘烤过
伴随互联网技术的飞速发展,媒体产业积累的数字资产越来越多,媒体资源管理(DAM)成为媒体行业的一个研究热点。作为媒体资源管理的一个重要功能,基于内容的多媒体内容检索逐渐
贵州广播电视台超高清全媒体转播车旨在打造一个集传统手段和新兴技术于一体的、全方位、多平台的信息化、立体式全媒体技术支撑平台。系统整体技术架构上,依托IP领域的先进
随着4G时代的到来,短视频的发展势如破竹。以智能移动终端为载体并借着4G网络普及的东风,让我们真正进入到了一个"全民拍客"的时代。本文将以时下较为常用的几款短视频软件为例
基于河南经济平稳快速发展的现状,以及商务英语专业成立以来的发展情况,本文针对当前河南高校商务英语专业建设中存在的问题,提出适应河南省经济发展和商务英语专业人才培养
介绍了黟县香榧品种资源和栽培技术,主要包括建园和栽培管理(土肥水管理、整形修剪、病虫害方法)等。
BT模式,即Build(建设)和Transfer(移交)形式,意即“建设--移交”,是政府利用非政府资金来进行非经营性基础设施建设项目的一种融资模式。自20世纪80年代我国第一个BOT(build-