基于组稀疏的高维特征选择及图像标注研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:skang08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,图像中存在纹理、颜色和形状等全局特征以及SIFT和LBP等局部特征,不同视觉特征在表示特定高层语义时所起重要程度不同,正确的特征选择对于图像标注来说具有十分重要的意义。由于这些异构特征之间存在明显的组效应,即同一种类型视觉特征可自然归属为一组(如SIFT特征归属为一组,而颜色直方图归属为另一组),因此可充分利用这种“异构特征成组”先验知识 来加强高维特征表达,使得图像异构特征在表达时能充分利用这种结构性组效应。本文根据图像异构特征之间所存在的结构组效应,对基于组稀疏的高维特征选择方法及其在图像标注中的应用进行了研究。  首先,根据图像异构特征之间所存在组效应,应用组lasso以及Logistic回归构造了适合图像处理的异构特征选择机制(GroupLassowithLogisticRegression,简称GLLR),从而对图像进行标注。此外,从现实世界中所获得数据中提取的高维异构特征往往分布在复杂非欧氏空间且线性不可分,为了将这种线性不可分的数据变得线性可分,以便于分析理解,本文将核学习的方法应用到图像标注中,提出了一种基于组稀疏和多核学习的图像异构特征选择方法(MultipleKernelLearningwithGroupSparsity,简称MKLGS)。由于MKLGS无法对组内的特征进行稀疏选择,为了加强特征的组稀疏效应,本文提出了一种结合组稀疏和组合核学习的图像标注算法(CompositeKernelLearningwithGroupStructure,简称CKLGS)。区别与MKLGS,CKLGS可以同时在特征组内和组间进行选择,使得异构特征的选择更具稀疏性及可解释性。  接着,本文提出了一种结合组稀疏的半监督跨域学习图像标注算法(Semi-supervisedCross-domainLearningwithGroupSparsity,简称S2CLGS),利用目标域中未标注数据的流形结构信息以及辅助域中的标注数据来增强图像标注的性能,在最小化目标域和辅助域的图像分布差异同时,根据图像数据的结构组稀疏特征选择机制,选择最具区别性特征子集,进而训练该语义的分类模型,实现半监督的跨域图像标注机制。该方法的特点在于同时利用了半监督判别分析,跨域学习以及组稀疏结构特性。  随后,本文提出了一种基于非凸正则化因子的组群稀疏方法(NOn-conVexgroupspArsity,简称NOVA),引入非凸的正则化因子使得基于特征组群结构属性的特征选择方法具有连续、无偏差和稀疏等“Oracleproperty”,能够保证特征选择结果的一致性。通过在模拟数据上进行的实验对比,证明了NOVA收敛于正确的模型(truemodel),通过在真实数据集上进行的大量对比实验,本文证明了NOVA优于其他特征选择算法。  最后,本文提出了一种基于非凸组稀疏的多核学习图像标注算法(MultipleKernelLearningwithNOn-conVexgroupspArsity,简称MKL-NOVA),以此来克服高维数据线性不可分问题以及凸正则化因子的选择结果不一致问题。考虑到图像多标注之间的关联性,从压缩感知理论出发,提出了一种基于典型相关性分析和l1-范数的稀疏表达算法来提升基于非凸的多核学习图像标注算法性能。该算法利用典型相关性分析得到多标注之间的关联关系,利用l1-范数正则化因子使预测的标注结果具有稀疏性,即使得相关的标注同时出现。
其他文献
学位
随着计算机网络的飞速发展,使用无线局域网(WLAN)的用户也日益增多,面向WLAN的网络安全研究也受到越来越多的重视。入侵检测和防御技术作为网络安全防护的重要手段,在传统有线网
随着计算机网络及通信技术的发展,以分布性、并发性、异构性和互操作性等为主要特征的并发分布式计算已成为计算机研究中的主流方向。确保并行分布式系统进行安全交互的结构
随着语义互联网观念的慢慢演化,自然语言处理,信息检索,知识表示,知识管理等领域得到飞速的发展。其中,自然语言处理已经成为计算机科学的一个重要研究课题,越来越多的学者投入到自
学位
学位
无线传感器网络是由大量的传感器节点通过自组织方式形成的网络,具有广泛的应用前景。由于无线传感器网络一般部署在环境恶劣、无人值守的地方,且其本身的脆弱性,导致网络易
图像分割是图像处理中的一项关键技术,在计算机视觉和图像处理中是一个十分重要的研究方向。伴随着信息技术的发展,医学图像分割在医学应用领域发挥着越来越重要的作用。研究高
网络虚拟化技术基于对底层网络资源的抽象、封装与隔离的核心思想,将网络服务提供与基础设施提供两大功能相分离,并根据用户的业务需求,以构建虚拟网的方式为用户提供网络服务,是
随着Internet信息数量和网民数量的大规模增多,人们对网络中多媒体信息的需求也呈现指数级的增长。以IPTV为代表的多媒体应用已成为互联网界公认的"killer-application",人们