非负低秩组稀疏矩阵分解及其图像检索应用

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：wyf1233

【摘要】

：

大数据时代,人类在生产、生活中积累了大量的数据,但是真正有用的信息却相对较少,急需发展大数据挖掘技术。国家“互联网+”战略的推进,将更为广泛的积累数据,尤其是互联网上

【作者】

：

吴叔義

【机构】

：

国防科学技术大学

【出处】

：

国防科学技术大学

【发表日期】

：

2015年期

【关键词】

：

非负矩阵分解非负低秩组稀疏矩阵分解增广拉格朗日方法旋转尺度不变性基于内容的图像检索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大数据时代,人类在生产、生活中积累了大量的数据,但是真正有用的信息却相对较少,急需发展大数据挖掘技术。国家“互联网+”战略的推进,将更为广泛的积累数据,尤其是互联网上传播的音视频、图片、网页等,呈爆炸式增长趋势,大数据挖掘将这些数据转化成可资人使用的信息。人类基因组计划、蛋白质组计划和脑计划的推进,生物数据迅速积累,大数据挖掘利用微观世界的数据协助医疗、促进健康。在求解大数据挖掘难题中,机器学习技术的发展给人类带来了曙光。近年来,深度学习技术尤其引人瞩目!但是,深度学习技术需要大量的样本训练模型,对少量的样本做推理和预测,这种约束过于苛刻。传统的机器学习技术对训练数据的规模约束较轻,不失为目前最流行的深度学习技术的有益补充。因此,本文探讨传统机器学习技术在大数据挖掘中的应用。传统的机器学习技术琳琅满目,如支持向量机、线性判别分析、K-均值聚类等,它们在处理高维数据时因为冗余特征而性能受损,因此需要发展数据降维方法从冗余的高维数据中提取关键特征。主成分分析是一种典型的数据降维方法,虽然它性能优异,但是在处理非负数据时,非负矩阵分解因提取局部特征而性能更优。非负矩阵分解(Non-negative Matrix Factorization,NMF)受到国内外研究人员的广泛重视和广泛应用,然而它不能在捕捉样本数据类内关系的同时保持不受异常值的影响。本文提出一种新的非负矩阵分解方法,即非负低秩组稀疏矩阵分解(Non-negative Low-rank and Group-sparse Matrix Factorization,NLRGS),主要工作归纳如下:1)低秩表达稀疏分解可以从被污染的观测数据恢复数据的低秩部分同时捕捉散点,也就是稀疏成分。为了获得样本类内关系、识别出异常值和保留NMF的非负性和基于部分的表达特性,NLRGS在NMF基础上加入低秩约束和组稀疏约束。2)NLRGS的目标函数是非凸的,不易求解,包含多个等式约束以及低秩约束和组稀疏约束,本文提出用增广拉格朗日方法去除等式约束为无约束的算法求解问题,对目标函数进行优化求解,构造NLRGS的求解算法。3)将NLRGS用于基于内容的图像检索应用中的聚类步骤,并针对NLRGS求解过程改进图像检索的编码方式。4)为了解决大规模图像检索问题,提出并行化NLRGS并将使用旋转尺度不变性特征的图像检索流程并行化。数值实验结果表明,NLRGS的图像聚类性能不仅在人脸数据上优于传统NMF方法,图像检索中效果也优于传统的基于K-均值的图像检索方法。

其他文献

通用PXA270嵌入式开发平台设计与实现

XScale系列处理器位于ARM家族中的高端,它广泛的应用于手持式设备、机顶盒、小型网络设备等场合。本文的主要工作是以XScale PXA270处理器为核心,构建一个完整的全定制的嵌入

学位

嵌入式系统XScalePXA270LinuxBootloaderLCD

基于RSSI的无线传感器网络定位算法的研究

作为一种全新的信息获取和处理技术，无线传感器网络在军事、环境检测、空间探索等许多领域得到了广泛应用。无线传感器网络的定位技术是进行目标识别与跟踪、网络路由、落区控

学位

无线传感器网络定位算法RSSI技术广播消息认证信息过滤机制鲁棒性

基于LPC2378的嵌入式控制系统的设计

近年来嵌入式系统的应用领域在广度和深度上飞速发展,与传统的台式机环境下的开发不同,嵌入式系统是直接面向应用的软硬件结合的系统。应用的多样性使得硬件平台常常各不相同

学位

嵌入式系统ARMLPC2378硬件调试

3G OMC网络性能测试系统的优化设计

随着电信产业的迅速发展,电信设备的复杂性和所提供的功能也在不断地增加和更新。如何管理和控制它们,使之能够稳定高效地运行就是一个很重要的问题。中兴通讯公司依照电信管

学位

电信管理网网络性能数据操作维护中心马尔科夫测试

关于复杂网络演化过程中鲁棒性的研究

真实世界中广泛存在着各种十分重要的复杂系统,包括蛋白质作用网、基因调控网、Internet网络、万维网(WWW)、电力网络和交通网络等。这些网络的正常工作对于自然界和人类社会

学位

鲁棒性布尔网络吸引子网络演化随机图无尺度网络

基于本体的知识检索框架的研究

随着计算机的广泛应用和互联网技术的迅猛发展,众多的信息检索系统被开发出来,方便用户获取其感兴趣的内容。数字化的信息资源一方面为人们的工作和生活带来了帮助,另一方面,

学位

知识检索语义检索语义网本体框架

支持Mashup的数据集成技术研究与应用

Mashup是一种新型的基于Web的数据集成应用程序,利用从外部数据源检索到的内容创建全新的创新式服务,组合多个数据源的内容,创造出增值的服务。Mashup具有第二代Web应用程序

学位

数据集成数据源查询策略个性化资源定制

基于复杂理论的MoSoSo系统中路由关键问题研究

信息技术是一个快速更新和迅猛发展的领域,新技术和新思想层出不穷,系统模式和系统架构日新月异,项目管理、软件工程和系统开发设计方法等也都不断地推陈出新。随着互联网的

学位

移动社会性软件迁移路由蚁群算法移动Agent复杂网络

医学图像三维可视化体绘制技术研究

科学计算可视化是当前计算机图形学研究的重要方向,它将大量抽象的数据或计算结果用图形或图像形象、直观地表示出来,应用领域十分广泛。医学图像三维可视化是可视化技术在医

学位

三维可视化体绘制三维数据场光线投射法

小型无人机地面站电子地图子系统研究与设计

地面站是小型无人机飞控系统的重要组成部分,研究小型无人机地面站软件的实现方案、设计开发技术及关键技术问题的解决方法,对设计开发满足工程应用需求的小型无人机飞控系统

学位

小型无人机地面站电子地图瓦片

非负低秩组稀疏矩阵分解及其图像检索应用

与本文相关的学术论文